Содержание к диссертации
Введение
1. Обзор литературы 9
1.1. Коммуникативное значение устной речи 9
1.2. Речь и речеобразование 10
1.2.1. Механизмы речеобразования 10
1.2.2. Звуки речи 12
1.2.3. Спектральные признаки гласных звуков. Восприятие звуков речи 14
1.3. Звукопродукция в раннем возрасте 19
1.3.1. Строение голосового аппарата детей 19
1.3.2. Доречевые этапы развития у детей 22
1.3.2.1. Первые звуки новорожденных 22
1.3.2.2. Период новорожденности 23
1.3.2.3. Особенность вокализаций детей в период гуления 24
1.3.2.4. Значение гуления в доречевой период 25
1.3.2.5. Стадия лепета 27
1.3.2.6. Значение лепета для речевого развития 29
1.3.2.7. Звуковая имитация 30
1.3.2.8. Стадия первых слов 32
1.3.3. Физические и фонетические характеристики вокализаций детей 34
1.3.4. Нарушения доречевого развития 37
1.4. Биологические и социальные факторы в речевом развитии 40
2. Методика и условия эксперимента 46
2.1. 3апись и анализ звуков детей 46
2.1.1. Характеристика обследуемых детей 46
2.1.2. Процедура регистрации звуков 46
2.2. Запись и анализ гласных звуков взрослой речи 47
2.3. Аппаратурное обеспечение 49
2.4. Процедура инструментального анализа 51
2.5. Фонетическая оценка 56
2.5.1. Подбор звуков для фонетической оценки 56
2.5.2. Порядок предъявления звуков аудиторам 56
2.6. Объем выборки 57
2.7. Процедура изменения амплитуды спектральных максимумов гласноподобных звуков 58
3. Результаты 59
3.1. Общая характеристика анализируемых звуков 59
3.2. Фонетическая характеристика звуков детей 61
3.3. Инструментальный анализ звуков 72
3.3.1. Характеристика частоты основного тона у детей 72
3.3.2. Спектральная характеристика гласных взрослой речи 79
3.3.3. Формантная характеристика гласноподобных звуков у детей первого года жизни 81
3.3.4. Формантная характеристика гласноподобных и гласных на втором и третьем году жизни 85
3.3.5. Сравнительная характеристика соотношений амплитуд спектральных максимумов для гласноподобных и гласных звуков детей и соответствующих гласных взрослой речи 94
3.3.6. Влияние соотношения амплитуд на фонетическую оценку гласноподобных звуков 105
4. Обсуждение 109
Выводы 121
Литература
- Коммуникативное значение устной речи
- Спектральные признаки гласных звуков. Восприятие звуков речи
- 3апись и анализ звуков детей
- Общая характеристика анализируемых звуков
Введение к работе
Речь является одной из форм коммуникации людей и обеспечивает формирование, передачу и восприятие информации. Это пластичная, комплексная и высоко адаптивная система, свойственная человеку, определяется биологическими, психологическими, социальными и культурными факторами. Понимание психофизиологических основ речи невозможно без знания общих закономерностей и индивидуальных особенностей ее развития у ребенка, так как знание функционирования любой системы организма не может быть полным без изучения ее развития (Орбели, 1949).
Интерес к проблеме раннего детства далеко не случаен, так как первые годы жизни являются периодом интенсивного физического и психического развития, и одним из наиболее интригующих процессов в формировании ребенка представляется становление речи. Ее развитие в период детства происходит необычайно быстро — в течение первого года жизни увеличивается звуковое разнообразие и, преимущественно с начала второго года, начинает формироваться словарный запас.
Развитие речи, являющееся одной из сторон общего формирования молодого организма, проходит со строгой закономерностью, и характеризуется у разных детей одними и теми же чертами (Lenneberg, 1967; Эймас, 1985; de Boysson-Bardies et al., 2001; Nazzi et al., 2000). Это подтверждает мысль о том, что усвоение языка определяется такими общими психофизиологическими закономерностями, которые действуют единообразно у всех людей. Согласно современным данным можно считать бесспорным наличие врожденных основ речи. Однако, речь нельзя рассматривать только как генетически заданную способность (Хомски, 1972), так как ее дальнейшее развитие возможно только при стимулирующем и модифицирующем влиянии окружающей языковой среды (Savage-Rumbaugh et al., 1993; Lotto et al., 1997). Этому находится множество подтверждений, полученных в ходе изучения процессов становления речи в норме и патологии, особенностей развития детей с нарушенным
слухом, а также после вынужденной лингвистической депривации (Lenneberg, 1967; Trehub, Rabinovitch, 1972; Trehub, 1973; Бауэр, 1979; Legerstee et al., 1980; Эймас, 1985; de Boysson-Bardies et al., 1989, 1991, 2001; Андреева и др., 1997, 1999; Куликов и др., 1998; Куликов, 2003; Nazzi et al., 2000). Полагают, что доречевое развитие является важным подготовительным этапом в освоении речи (McCathern et al., 1999; MacNeilage, 1999; Bates et al., 1999; McCune et al., 2001), и в это время закладываются предпосылки к формированию коммуникационного поведения (Ковшиков, 1994; Bates et al., 1999; Bates, 2000; Meltzoff, 2002 b; Meltzoff, Moore, 2002).
До недавнего времени данные по звукопродукции детей, развивающихся в русскоязычной среде, были представлены лишь в работах Р.В. Тонковой-Ямпольской (Тонкова-Ямпольская, 1962; 1964 а, б), в которых представлены результаты спектрального и интонационного анализа вокализаций детей первого месяца жизни. Это явилось одной из причин, обусловивших проведение данной работы по становлению речи у детей, начиная с ранних этапов их развития и до начала словесного периода. Изучение биологических основ языковой общности и взаимосвязи доречевого и речевого этапов развития, проводимое на кафедре высшей нервной деятельности и психофизиологии в лаборатории физиологии сенсомоторных систем Санкт-Петербургского государственного университета, предусматривает исследование звуков, генерируемых детьми, начиная с первых недель их жизни, в течение всего доречевого и раннего речевого периодов развития (Андреева и др., 1997, 1999, 2001; Куликов и др., 1997 а, 1998; Куликов, 2003).
Цель исследования. Целью исследования явилось определение общих и (или) отличительных характеристик гласноподобных и гласных звуков, произнесенных детьми в доречевой период и на стадии первых слов.
Задачи исследования.
Провести анализ характеристик звукопродукции детей в доречевой и ранний речевой периоды с помощью методов спектрального анализа.
Осуществить сравнительный анализ гласноподобных звуков вокализаций и гласных, включенных в первые слова детей, с соответствующими звуками взрослой речи. Выявить общие и отличительные признаки для звуков, произнесенных детьми и взрослыми.
Исследовать роль энергетических отношений составляющих спектра в фонетической оценке гласноподобных звуков детей.
Основные положения, выносимые на защиту.
Результаты исследований физических характеристик звукопродукции детей на протяжении первых трех лет жизни свидетельствуют в пользу преемственности речевого развития, начиная с раннего доречевого периода, то есть со стадии гуления.
Наряду с невозможностью разделить гласноподобные звуки вокализаций, а также гласные из ранних слов и звукоподражаний детей на основе особенностей распределения формант (признака, значимого для взрослой речи), для фонетически различных звуков, произнесенных как детьми, так и взрослыми выявляется специфический характер распределения по частоте составляющих спектра и их относительный амплитуды. Это означает, что для звуков [а], [у], [и] распределение составляющих спектра по амплитудным и частотным характеристикам различается, а для одинаковых по звучанию гласных, независимо от произнесения их детьми или взрослыми, указанный признак оказывается сходным. Выявленные стабильные признаки, а именно соотношение амплитуд составляющих спектра являются перцептивно значимыми.
Обнаруженные специфические характеристики гласных и гласноподобных звуков (распределение составляющих спектра и их относительной амплитуды) позволяют предположить, на основе каких признаков оказывается возможным, во-первых, сопоставление ребенком при имитации собственных звуков с теми, которые используются в языковой среде; во-вторых, отнесение взрослыми аудиторами гласноподобных и гласных звуков детей к определенным фонетическим категориям.
Научная новизна результатов. На основе полученных сведений о физических характеристиках гласноподобных звуков доречевого и раннего речевого периодов развития детей, воспитывающихся в русскоязычной среде, оказалось возможным сделать вывод о связи довербального и словесного этапов развития. Это проявляется в сходстве гласноподобных звуков не только лепета, но и гуления, с соответствующими звуками первых слов по значениям частот основного тона, положения спектральных максимумов, относительной амплитуде спектральных составляющих.
Впервые при помощи психоакустического эксперимента показана роль относительных амплитуд составляющих спектра в фонетической оценке гласноподобных звуков детей. Выявленные признаки, а именно особенности расположения по частоте наиболее выраженных составляющих спектра, включая и
соответствующие частоте основного тона, и отношение их амплитуд,- являются стабильными характеристиками гласноподобных и гласных [а], [и], [у], и могут определять категориальную принадлежность данных звуков. Именно данными признаками можно объяснить рано обнаруживаемую способность ребенка к имитации звуков речи, в то время как на основе обратной звуковой связи коррекция ребенком формантных характеристик собственных звуков соответственно звукам взрослой речи оказывается невозможной.
Научно-практическая ценность работы. Полученные данные вносят вклад в понимание закономерностей и особенностей протекания доречевого и раннего речевого развития, что оказывается важным как для изучения физиологии нормального онтогенеза человека, так и для расширения знаний в области медицины, акустики, фонетики, а также может способствовать решению вопроса о специфичности речевой функции у человека. По материалам системного анализа создана база данных звукопродукции детей первых трех лет жизни, развивающихся в русскоязычной среде. Результаты сравнительного анализа спектральных характеристик звуков детей в периоды ранних вокализаций, лепета и первых слов свидетельствуют в пользу точки зрения о преемственности речевого развития, начиная с ранних довербальных этапов. Результаты исследования могут оказаться полезными при сравнительном анализе развития здоровых малышей и детей, у которых отмечаются различные патологии, проявляющиеся в нарушении речевого развития. Выявленные характеристики гласноподобных и гласных звуков детей позволяют дополнить представления о признаках, значимых для восприятия речи.
Апробация диссертационной работы. Материалы работы были представлены на: V Международной конференции «Ребенок в современном мире. Право на здоровье» (СПб., 1998), Медико-биологической конференции «Человек и его здоровье» (СПб., 1998), Студенческой конференции «Психология XXI века» (СПб., 1998), 9-й международной конференции молодых ученых «Человек. Природа. Общество. Актуальные проблемы» (СПб., 1998), VI Международной конференции «Ребенок в современном мире. Открытое общество и детство» (СПб., 1999), Международной студенческой конференции «Психология XXI века» (СПб., 1999), Конференции «Психофизиологические основы социальной адаптации ребенка» (СПб., 1999), Международной студенческой конференции «Психология XXI века» (СПб., 2000), VII Международной конференции «Ребенок в современном мире. Детство и творчество» (СПб., 2000), XXX Всероссийском совещании по проблемам высшей нервной
деятельности (СПб., 2000), Конференции "Образование и психология" (СПб., 2001), Всероссийской с международным участием молодежной конференции «Мозг и поведение» (СПб., 2001), XI сессии Российского акустического общества (М., 2001), VIII Международной Конференции «Ребенок в современном мире. Ребенок и город» (СПб., 2002), XII сессии Российского акустического общества (Нижний Новгород, 2002), Симпозиуме с международным участием «Акустика детской речи» (СПб., 2002), Конференции "Ананьевские чтения - 2002" (СПб., 2002), X Международной Конференции «Здоровье детей как ценность культуры» (СПб., 2003), XIII сессии Российского акустического общества «Акустика речи. Медицинская и биологическая акустика» (М., 2003), 3-ей Всероссийской конференции «Физиология слуха и речи» (СПб., 2003).
Выполнение данной работы было поддержано грантом Американского акустического общества (RXO-1210, 2001), индивидуальными грантами для студентов, молодых ученых и аспирантов в категории дипломный проект (М99-2.6Д-498, 1999), в категории кандидатский проект (М00-2.6Д-395, 2000; М01-2.6К-437, 2001; М02-2.6К-250, 2002; М03-2.6К-222, 2003), стипендиями Соросовский аспирант (А651-03, 2003) и президента Российской Федерации (№ 3645, 2003). Осуществлялась поддержка грантами: Университеты России-2000 (№ 992616, 2000-2001), РГНФ (№ 96-03-04144, 1996 - 1998; № 01-06-00185а, 2001-2003), Министерства образования РФ (№ 98, 1996-1998; № 92, 1998-1999; № Г00-1.7-130, 2001-2002; Г02-1.7-412, 2002-2003; Е02-6.0-131, 2002-2003), РФФИ (№ 02-06-80275, 2002-2004).
Коммуникативное значение устной речи
Особый интерес к звуковой речи основывается на том, что она, во-первых, преимущественно рассматривается как сугубо человеческая способность, во-вторых, дает обширное поле деятельности для различных наук: физиологии, акустики, психологии, лингвистики, философии и других. Первый тезис относительно специфичности речи дискутируется и до сих пор (Hopkins et al., 1991; Черниговская, 1996; Lotto et al., 1997; Nowak, Komarova, 2001; Nowak et al., 2001; Nowak et al., 2002), однако неоспоримым является тот факт, что только у человека звуковая речь приобрела такое особое коммуникативное значение. Это объясняется как физиологией звуковоспроизводящего аппарата (Lieberman et al., 1969; Lieberman, 1977), так и многими психическими функциями (Хомски, 1972), которые, как полагают, развились вследствие языковой коммуникации людей (Леонтьев, 1983).
Следует сразу уточнить, что речь может рассматриваться как часть более широкого понятия - язык. При этом, под языком подразумевается орудие (средство) общения, а речь является производимый этим орудием вид общения (Лингвистический энциклопедический словарь, 1990). Однако, понятия «язык» и «речь» могут использовать как синонимы, так как зачастую трудно отделить собственно языковые механизмы от взаимодействующих с ними механизмов речевой деятельности (Кодзасов, Кривнова, 2001). Различные определения понятия «речь» сводятся к тому, что это знаковая форма коммуникации людей (Энциклопедический словарь, 1964; Словарь физиологических терминов, 1987; Кодзасов, Кривнова, 2001) и, в частности, устная речь осуществляется с помощью звуковых символов. Поэтому необходимой частью данного вида коммуникации представляется речевой сигнал.
Основная особенность речевого сигнала - сегментно-просодическая организация (Галунов, Родионов, 1988), то есть, с одной стороны, наличие дискретных элементов -гласных и согласных звуков (Diehl et al., 2004), с другой - целостность, достигаемая благодаря мелодике, ритму и т.п. (Кодзасов, Кривнова, 2001). Сами по себе звуки речи не несут смысловой нагрузки (Чистович и др., 1976), однако именно они формируют речевой сигнал и, вместе с просодической организацией, устная речь приобретает коммуникативное значение (Галунов, Родионов, 1988). Для решения многих вопросов, связанных с познанием речи необходимо изучение механизмов формирования и восприятия речевого сообщения, а также свойств и характеристик самого звука речи.
Речевую коммуникацию невозможно рассматривать отдельно от производящих и воспринимающих ее субъектов, так как, несмотря на то, что существуют врожденные механизмы речевого поведения (Lenneberg, 1967; Андреева, 2001; Куликов, 2003; Куликов и др., 1998; Nazzi et al., 2000), востребованной она является в социальной среде, и ее развитие возможно только при наличии уже имеющейся речевой среды (Savage-Rumbaugh et al., 1993; Lotto et al., 1997). Полагают, что предпосылки к коммуникации начинают формироваться еще в период доречевого развития детей (Ковшиков, 1994; Bates et al., 1999; Meltzoff, 2002 b; Meltzoff, Moore, 2002). Таким образом, полное представление любой функции, в том числе и речевой, было бы невозможным без знания процессов ее формирования.
Устная речь является одной из форм коммуникационного поведения, специфичных для человека. Она зависит от физиологических основ генерации звука и его восприятия. Поэтому познание процесса речи опирается на изучение характеристик речевого сигнала и тех механизмов, которые обеспечивают формирование речи и ее восприятие. Акустический речевой сигнал возникает в результате сложной, координированной работы органов, совокупность которых представляет собой речевой аппарат.
В речевом аппарате человека выделяют центральную и периферическую части. К центральной относят отделы мозга, отвечающие за организацию устной речи и ее слухового восприятия (Лурия, 1970, 1975; Вартанян и др., 1988; Fitch et al., 1997; Jakobson, 1968). Периферический речевой аппарат состоит из дыхательного, голосового (гортань с находящимися в ней голосовыми складками) и артикуляционного (язык, губы, верхняя и нижняя челюсти, твердое и мягкое небо, альвеолы) отделов (см.: Гельфанд, 1984; Крылов и др., 1984; Борзяк и др., 1993; Honda, 1996; Jurgens, 2002). Взаимодействие и согласованная работа указанных и многих других структур, наличие моторных и слуховых обратных связей, - все это обеспечивает речепроизводство (Вартанян и др., 1988; Вартанян, Черниговская, 1990).
Проблему формирования речи рассматривают с различных позиций. Существуют подходы, основанные на изучении процессов речеобразования и слухового восприятия, исследовании акустических признаков звуков речи и разработке технических методов анализа и синтеза речевых сигналов (Галунов, Родионов, 1988; Златоустова и др., 1986). Необходимость комплексного подхода к данной проблеме вытекает из сложности процессов речеобразования и речевосприятия.
Звукам речи присущи ряд характеристик, например, длительность, громкость, мелодичность, интенсивность, наличие спектральных компонентов и т.п. (Daniloff et al., 1980). Координация артикуляторных движений и фонации при речевой продукции обеспечивает наличие таких составляющих речи как гласные, согласные, слоги, а также интонация, паузы, ритм, являющихся специфичными для различных языков.
При речеобразовании выделяют три источника звука: голосовой и шумовые -турбулентный и импульсный (Бондарко, 1998; Кодзасов, Кривнова, 2001). Турбулентный источник образуется при сужении в каком-либо месте речевого тракта при прохождении по нему воздушной струи. С турбулентным источником шума образуются все шумные щелевые согласные. Импульсный источник шума формируется при резком раскрытии смычки произносительных органов, в результате чего возникает короткий и резкий щелчок. Так образуются взрывные согласные. Голосовой источник образуется в результате колебания голосовых связок, при этом звук содержит основную частоту и гармоники. С голосовым источником образуются, например, все гласные.
Находящиеся внутри полости гортани голосовые складки благодаря своему натяжению, а также действию подсвязочного давления, создаваемого дыхательной системой, приходят в колебательное движение, в результате происходит смыкание и размыкание их с определенной частотой. Степень натяжения голосовых складок и величина подсвязочного давления, создаваемая дыхательной системой, регулируют частоту основного тона (F0) - важнейшую характеристику голосового источника. Для мужских голосов область изменения частоты основного тона соответствует 80-150 Гц, для женских она более высокая - 120-400 Гц (Фланаган, 1968; Чистович, Кожевников, 1972). Изменение частоты основного тона во времени определяет интонацию голоса, индивидуальные и эмоциональные особенности речи (Чистович, 1976). В дальнейшем звуковое колебание подвергается многократной модуляции под влиянием изменения объема полостей речевого тракта, представляющего собой систему резонансов и антирезонансов (Чистович, Кожевников, 1972; Чистович и др., 1976; Деркач и др., 1983).
Спектральные признаки гласных звуков. Восприятие звуков речи
Устная речь с физической точки зрения представляет собой звуковые волны, то есть слабые механические возмущения, распространяющиеся в упругой среде, которые, воздействуя на органы слуха, способны вызывать слуховые ощущения (Линдсей, Норман, 1974; Яворский, Детлаф, 1990; Бернштейн, 1996). Слуховая система обладает крайне широким диапазоном чувствительности к звуку, что определяется особенностями ее строения и функционирования (Цвикер, Фельдкеллер, 1971; Гельфанд, 1984; Яворский, Детлаф, 1990). Характеристику слуховой чувствительности, выраженную как функцию частоты и интенсивности, представляют в виде графика — аудиограммы, которая дает представление о взаимодействии частоты и интенсивности звука.
Многие свойства слуха можно объяснить, лишь выявив взаимосвязь между его избирательной способностью и способностью интегрировать звуки при их одновременном воздействии. Слуху присуща способность интегрировать определенные частотные области в так называемые частотные группы (Цвикер, Фельдкеллер, 1971; Линдсей, Норман, 1974; Чистович, 1976; Гельфанд, 1984; Schneider et al., 1990). Восприятие одновременно предъявляемых тонов характеризуется особой психоакустической единицей - критической полосой частот (КП). Величина критических полос зависит от частоты маскируемого тона: чем последняя выше, тем больше ширина критической полосы. Считают, что у человека ширине КП соответствует расстояние 1-2 мм вдоль базилярной мембраны (Гельфанд, 1984).
Безусловно, речь по своему физическому характеру более сложна, чем, например, чистые тоны. Поэтому слуховое описание звуков речи основывается на выделении слухом значимых акустических характеристик, как самих звуков, так и в их связи с другими звуками речевого потока. Несмотря на варианты звучания одних и тех же фонем, произносимых различными голосами (Бондарко, 1998; Мясников, Мясникова, 1970), их относят к одной и той же фонетической категории. Естественно возникает вопрос о тех общих спектральных признаках звуков, которые позволяют воспринимать их как один и тот же звук, а также обусловливать дифференциацию его от других (Морозов, 1966; Ito et al., 2001).
Исследования физических признаков, важных для описания речевого сигнала ведутся до сих пор. Предлагаются различные методы, которые могли бы являться максимально приближенными к системе признаков, используемых слуховой системой для описания речевого сигнала. Существуют различные способы описания, например: полной спектральной огибающей, полосный, формантный (Чистович, Кожевников, 1972; Zahorian, Jagharghi, 1993; Johnson, 1998). Каждый из них, при наличии собственных определенных преимуществ, может быть адекватным при описании речевого сигнала (Zahorian, Jagharghi, 1993).
Согласно классическим представлениям (Peterson, Barney, 1952; Фант, 1970; Фланаган, 1968; Hillenbran., Gayvert, 1993; Hillenbrand et al., 1995) решающее значение для распознавания звуков речи имеет распределение по частотному диапазону максимально выраженных спектральных областей - формант, которые регистрируются в спектре гласных и некоторых согласных. В качестве формант рассматривают резонансные пики, проявляющиеся в картине спектра и соответствующие набору собственных частот речевого тракта (Чистович и др., 1976). Согласно другому определению, форманты - это энергетически выраженные частотные области в спектре звука (Гельфанд, 1984; Большой энциклопедический словарь, 1999). Первые две-три форманты рассматриваются как «ключевые» признаки, определяющие категориальную принадлежность гласных (Фланаган, 1968; Фант, 1970; Чистович и др., 1972, 1976). Третья, четвертая и другие высокочастотные форманты, как полагают, определяют тембровые характеристики (Tom et al., 1999). На двухформантной плоскости, по осям которой представлены частоты первой и второй формант (F1 и F2 соответственно), русские гласные взрослой речи располагаются в определенных областях (рис. 1.3). Это также характерно для гласных фонем других языков (SedlaSkova, 1967; Фонология речевой деятельности, 2000; Кодзасов, Кривнова, 2001).
Между артикуляционными и акустическими характеристиками существует, безусловно, связь, которую можно определить как зависимость частот формант от ряда и подъема гласного (рис. 1.4). Считается, что частота F1 связана с подъемом гласного: у открытого гласного частота F1 выше, чем у закрытого. Частота F2 связана с рядом гласного: передним гласным соответствуют высокие значения частоты F2, задним -низкие (Бондарко Л.В., 1998; Фонология речевой деятельности, 2000; Кодзасов, Кривнова, 2001). Качество гласного по месту артикуляции (передне-заднее) может определяться не только частотными значениями F2, но и амплитудными и они могут оказаться эффективными для определения места артикуляции гласного (Ito et al., 2001). Более того, в экспериментах показано, что в значительной степени лингвистическая характеристика звука может формироваться не только при артикуляции, но еще на выходе из гортани (Галунов, 2003).
Однако достаточность первых двух-трех формант для описания качества гласного никогда не принималась безоговорочно. Так, Г. Фант замечал, что недостаточно ограничиваться формантной характеристикой при рассмотрении различных гласных звуков в разговорной речи (Фант, 1970). Кроме того, трудности в определении значений формант могут возникнуть при высокой частоте основного тона (F0) (Фант, 1964), а также при произнесении одних и тех же гласных разными дикторами, что существенно сказывается на формантной картине (Варшавский, Литвак, 1955). Исследование физических характеристик гласных, произнесенных разными дикторами, показало, что форма кривой, огибающей составляющие спектра, различна для разных дикторов (Варшавский, Литвак, 1955).
3апись и анализ звуков детей
Регистрация звуковых реакций детей осуществлялась в интервале между кормлениями. Запись проходила в домашних условиях, что обусловлено необходимостью изучения развития речи в естественном для ребенка окружении. Адекватность этого подхода подтверждают исследования В. Леведага с соавторами (Lewedag et al., 1994), в которых было показано, что в домашних условиях по сравнению с лабораторными дети продуцируют больше вокализаций и речеподобных звуков, при этом вокализации, записанные дома и в лаборатории, имеют сходные фонетические характеристики.
Обстановка комнат (наличие мягкой мебели, ковровых покрытий на стенах и полу) обеспечивала малое время реверберации, что создавало хорошие акустические условия для проведения записи. Во время регистрации сигналов по возможности исключались все посторонние шумы. При этом обязательно учитывались все требования, предъявляемые к работе с записывающим устройством.
Наблюдение, как правило, длилось 1—2 часа. Рядом с ребенком одну часть времени находился кто-либо из родителей, другую часть времени он оставался вдвоем с экспериментатором. Такое общение позволяло оценить, как малыш откликается на обращенную к нему речь. В то время, когда младенец произносил звуки, осуществлялась запись на магнитофон. При длительных паузах запись приостанавливалась. Общая продолжительность записей при каждом наблюдении составляла, как правило, 15-25 минут. Заполнялся протокол наблюдений, в котором отмечалась не только ситуация, побуждающая ребенка к звуковым реакциям, но и обстановка в целом. В протокол или на магнитную ленту шел комментарий о состоянии младенца (например: мокрый или сухой; его реакция на предметы: улыбается или нет; к кому обращает свою «речь», с какими игрушками играет и т. д.). Отмечали также, являются ли произносимые звуки плачем или они издаются в спокойном состоянии; адресованы ли они окружающим или относятся к «спонтанным», т.е. не побуждаемые и не обращенные к окружающим (по мнению наблюдателей - родителей, экспериментатора). В период появления слов регистрировали, являются произносимые ребенком звуки словами или вокализациями. В случае болезни ребенка (например, респираторные заболевания и др.) запись переносилась на время его полного выздоровления, а в протоколе отмечались причины, вызвавшие отсрочку.
С целью сравнения физических характеристик гласноподобных звуков детей и гласных взрослой речи осуществлялась запись образцов взрослой речи. Необходимость записи взрослой речи была продиктована тем, что кроме значений частот спектральных компонентов, многократно описанных в литературе, нужно было набрать базу данных по их амплитудным соотношениям. Для этого были подобраны дикторы и разработан специальный перечень звукосочетаний. Участвовало 6 русскоязычных дикторов3 - трое мужчин и три женщины, — речь которых не имеет нарушений в произношении. Возраст испытуемых составлял от 18 до 26 лет; на момент записи они являлись студентами СПбГУ.
Для уменьшения вероятности появления ошибок при идентификации формант была разработана процедура записи звуков взрослых. Гласные звуки дикторов записывали не из потока речи, что в дальнейшем могло привести к значительной трудности в определении формант, а предлагали произнести специальный текст. Перед началом записи звуков каждому из участников была представлена инструкция по произнесению текста и проведено предварительное ознакомление с самим текстом. Дикторы должны были произносить слова четко, громко, не искажая их и ставя правильные ударения. Между словами выдерживалась пауза приблизительно в 2 с. В случае, когда слова были произнесены дикторами нечетко или ставилось неправильное ударение, они не включались в анализ.
При разработке перечня звукосочетаний, предлагаемого дикторам, исходили из следующих соображений: 1. Отбирались слова, в которых присутствовали изучаемые звуки, а не сами звуки в отдельности, так как известно, что слоги, слова и предложения могут изолированно произноситься и изолированно восприниматься как цельные и естественные для носителей языка единицы речи (Зиндер, 1982; Фланаган, 1968). 2. Слова должны быть знакомы для дикторов и не вызывать трудности в произношении. 3. Изучаемые гласные должны находиться в ударном положении. 4. Спектрально-временная характеристика гласных не должна подвергаться сильному искажению в связи с местоположением между другими звуками (Бондарко, 1998; Holt et al., 2002), то есть при наличии переходных участков на границе гласный согласный, должен присутствовать стационарный участок, где частоты первых двух формант не изменяются.
Общая характеристика анализируемых звуков
Число детских звуков, подвергшихся фонетическому анализу, равнялось 4076. В соответствии с условиями произнесения было выделено семь типов звукопродукции: «плач», «хныканье», «кряхтенье», «спокойные», «радость» и «песня». «Плачем» были названы эмоционально отрицательные звуки ребенка, произносимые в некомфортном состоянии (боль, голод и др.). Под «хныканьем» рассматривали звуковые реакции эмоционально отрицательного характера, представляющие собой короткие вокализации или состоящие из повторяющихся компонентов звуковые реакции, которые предшествовали плачу или произносились в перерывах между плачем. «Кряхтеньем» были названы невокализованные звуки, сопровождающие движения и различные вегетативные реакции ребенка. К спокойным относили эмоционально нейтральные звуки, «спонтанные» или издаваемые в ответ на обращение взрослого. Радостными назвали эмоционально положительные звуки. В качестве «песни» рассматривалась мелодичная звукопродукция ребенка, произнесенная в комфортном состоянии, характеризующаяся изменяющимся во времени спектром и имеющая большую длительность в сравнении с другими видами эмоционально положительных и нейтральных звуков.
Инструментальный анализ будет касаться только спокойных звуков, то есть тех, которые произнесены детьми в эмоционально нейтральном состоянии (период спокойного бодрствования). Это продиктовано, во-первых, тем, что звуки детей, произнесенные при разных эмоциональных состояниях, характеризуются не одинаковыми спектральными составляющими, например, различны по значениям частот основного тона, других спектральных максимумов (Андреева, 2001; Павликова, Новикова, 2002; Scheiner et al., 2002). Во-вторых, звуки детей сравнивались со звуками взрослой речи, произнесенных дикторами в эмоционально спокойном состоянии.
Проведен инструментальный анализ 2670 одиночных звуков детей. Среди них -572 относятся к простым и 2098 к сложным звукам. В последних выделено 7432 фрагмента, исходя из особенностей спектра и звучания. Данные для первого года представлены в таблице 1, для второго и третьего - в таблице 2; возраст детей указан в месяцах.
В целом, число сложных звуковых сигналов в значительной мере превышает число простых на протяжении всего периода регистрации (таблицы 1, 2). Сложные
звуковые сигналы могли содержать в себе от двух до двадцати фрагментов с разным звучанием и спектральной картиной.
При рассмотрении типов спектров руководствовались классификацией К. Ксай с соавторами (Xie et al., 1996) и Г.А. Куликова с соавторами (Куликов и др., 1998). В настоящую работу включены данные только для тех простых и фрагментов сложных звуков, которые характеризуются типами спектров (рис. 2.3): плоский (тип 2), гиперфонация (тип 7) и удвоение гармоник (тип 4).
Были рассмотрены вокализации и фрагменты сложных звуков, длительностью не менее 50 мс. В целом, длительность вокализаций варьирует в широких пределах. Так, для сложных звуковых сигналов её диапазон составляет 80 - 7197 мс, а для простых вокализаций 42 - 500 мс. Длительности фрагментов сложных сигналов также изменялись в значительных пределах: от 40 до 500 мс.
При фонетическом анализе простые и фрагменты сложных звуков из вокализаций детей были разделены на пять групп: 1. «Определенные гласноподобные» звуки, описываемые с помощью гласных фонетического алфавита. Например, [а]-подобные. 2. «Неопределенные гласноподобные» звуки, воспринимаемые как гласные, но фонетическая интерпретация которых вызывала затруднения. 3. «Согласноподобные», описываемые с помощью согласных фонетического алфавита. Например, [к], [h]. 4. «Неопределенные согласноподобные» звуки, сходные с согласными звуками речи, однако описание их затруднено. 5. «Неречеподобные» звуки, которые невозможно было отнести ни к одной из групп. Например, «щебет», «свист».
В различные разделы работы вошли данные анализа по четырем представленным группам звукопродукции детей.
В данной части работы фонетическую оценку проводили для гласноподобных звуков. Это связано с тем, что по звуковому составу в доречевой период первыми регистрируются гласноподобные (Nakazima, 1975; Андреева и др., 1997, 1999; Андреева, 2001), и их развитие можно проследить, начиная с самого раннего возраста детей. Описание фонетического анализа проводится для определенных гласноподобных звуков. Описание звуков осуществлялось с помощью транскрипции основных гласных русского языка (Бондарко, 1998).
Запись вокализаций в наиболее раннем возрасте (две недели) была проведена для П.Д. и Т.М. В это время у младенцев кроме плачей, кряхтений, регистрируются и спокойные («спонтанные») звуки. Фонетический анализ эмоционально нейтральных звуков показал наличие в вокализаций ребенка П.Д. в возрасте двух недель лишь гласноподобного [е] (рис. 3.1. А). Звук, обозначенный как [е] подобен первой гласной в слове "about", в соответствии с фонетическими символами, принятыми в подобных исследованиях (Sedladkova, 1967). Состав гласноподобных звуков у младенца Т.М. более обширный. У него в этом возрасте в вокализациях присутствуют звуки [е], [а], [ы], причем преимущественно регистрируются [е]-подобный звук, а [ы]-подобный составляет небольшое число (рис. 3.1. Б). В дальнейшем у данных малышей происходит расширение звукового состава: в вокализациях девочки П.Д. в возрасте одного месяца регистрируются гласноподобные [а], [ы], [у], причем [а]-подобные звуки являются преобладающими (рис. 3.1. А), а у мальчика Т.М. репертуар вокализаций дополняется [у]-подобным звуком. У монозиготных близнецов - девочек Т.Д. и Т.И. - с возраста одного месяца регистрируются те же [а]- и [е]-подобные звуки (рис. 3.1), а у Т.Д. отмечается в вокализациях небольшое число гласноподобных звуков [ы].