Содержание к диссертации
Введение
1. Обзор литературы 10
1.1. Особенности вокального обучения у певчих воробьиных и попугаев 10
1.1.1. Акустическая коммуникационная система 10
1.1.2. Развитие песни певчих воробьиных 12
1.1.3. Формирования контактных сигналов у попугаев 16
1.1.4. Особенности организации вокальных центров 17
1.1.5. Пересмешничество 20
1.2. Восприятие звуковых сигналов человеком и птицами 24
1.2.1. Характеристики слуха человека и восприятие речевых звуков 24
1.2.2. Характеристики слуха певчих воробьиных и попугаев и восприятие ими видовых сигналов 28
1.2.3. Восприятие птицами звуков человеческой речи 35
1.3. Механизмы звукогенерации у человека и птиц 38
1.3.1. Строение и функционирование голосового аппарата человека 38
1.3.2. Строение и функционирование голосового аппарата певчих воробьиных и попугаев 41
1.3.3. Генерация птицами звуков человеческой речи 47
1.4. Заключение 53
2. Методика и условия эксперимента 55
2.1. Условия регистрации речеподобных звуков говорящих птиц 55
2.2. Процедура инструментального анализа записей 57
2.3. Обработка данных 60
2.4. Аудиторский анализ 61
2.5. Процедура модификации спектральных компонентов 62
3. Результаты 65
3.1. Характеристика имитационного репертуара различных птиц 65
3.2. Сравнительная характеристика акустической структуры имитаций речи различными птицами 69
3.3. Особенности идентификации различных категорий гласноподобных звуков говорящих птиц 78
3.4. Анализ значений частоты и амплитуды двух наиболее выраженных спектральных компонентов 83
3.5. Анализ значений всех спектральных компонентов 95
3.6. Сравнительная характеристика гласных звуков человека и обучаемой им птицы 105
3.7. Особенности идентификации гласноподобных звуков при их модификации 114
4. Обсуждение 129
Выводы 139
Список литературы
- Особенности вокального обучения у певчих воробьиных и попугаев
- Характеристики слуха человека и восприятие речевых звуков
- Условия регистрации речеподобных звуков говорящих птиц
- Сравнительная характеристика акустической структуры имитаций речи различными птицами
Введение к работе
Актуальность проблемы распознавания и восприятия речи человеком, отражена в большом количестве работ, посвященных разработке этих вопросов. В последнее время интерес многих исследователей сконцентрировался вокруг мозговой организации речевой функции: разработке теорий распознавания речи, особенностей, связанных с распознаванием речи правым и левым полушарием, а также функциональном картировании мозга, при решении им различных задач (Вартанян И.А. и др., 1988; Вартанян И.А., 1988; Бехтерева Н.П., 1999; Черниговская Т.В., 2004; Chernigovskaya Т., 1994; Pulvermueller F., 1999). Однако, несмотря на длительное исследование, до сих пор многие аспекты восприятия и распознавания речи остаются невыясненными, например, каким образом человек отличает звуки одной фонетической категории от другой. Возникшая в 60-х-70-х годах теория речеобразования (Фланаган Дж., 1968; Фант Г., 1970) считается классической. Согласно этим представлениям ключевыми признаками различных фонетических категорий гласных звуков являются частоты первой, второй и, иногда, третей формант. Для каждой категории гласного значения частот первой и второй формант являются стабильными, и их значения не пересекаются со значениями формант звуков другой категории. Однако почти одновременно с возникновением этой теории, были выявлены многочисленные факты ее не подтверждающие. Среди них, большое количество несоответствий значений формант категорий звуков,
произносимых различными людьми, с определенными в лабораторных условиях (Варшавский Л.А., Литвак И.М., 1955). Форманты звуков с высокой частотой основного тона (выше 300 Гц), присутствующих в гласноподобных вокализациях младенцев и звуках вокальной речи, также не попадают в границы, определенные для звуков речи взрослого диктора. Тем не менее, проблем с определением фонетической категории у подобных гласных не возникает (Куликов Г.А. и др., 1999; Андреева Н.Г., Куликов Г.А., 2003). Для решения проблемы разделения категорий гласных звуков предлагаются различные дополнения к основной формантной теории, в том числе предлагающие учитывать не только частотные, но и амплитудные значения формант, или же всю огибающую спектра (Куликов Г.А. и др., 1999; Андреева Н.Г., Куликов Г.А., 2003; Ito М. et al., 2001). Однако, пока не получено доказательств универсальности какого-либо из предлагаемых признаков для разделения категорий гласных звуков независимо от условий их генерации.
В связи с этим, особенно интересной представляется способность некоторых видов птиц имитировать человеческую речь. Ведь для этого птице необходимо, несмотря на индивидуальные различия голосов окружающих её людей и характеристики своей слуховой системы, настроенной на особенности видоспецифических сигналов, выделить те акустические признаки, на основании которых она создаст копию звука, слова или фразы. Так как звуки речи, имитируемые птицами, адекватно распознаются человеком, естественно предположить, что в них сохраняются акустические признаки, позволяющие отнести звук к той или иной категории.
В серии работ было показано, что некоторые виды птиц различают фонетические категории звуков речи. Для восприятия ими категорий гласных существенное значение имеют частотные значения формант (Hienz R.D. et al., 1981), а согласных - время включения основного тона
(Dooling R.J. et al., 1989) и изменение значений частот формант (Dooling R.J. et al., 1995). Это позволяет предположить, что частотные и временные характеристики, ключевые для различных фонетических категорий, могут восприниматься некоторыми видами животных несмотря на то, что акустические особенности их видовой системы коммуникации отличны от характеристик речи. В частности, основной частотный диапазон видоспецифических вокализаций птиц составляет 2-4 кГц. Однако частоты формант большинства звуков речи, генерируемых человеком, не превышают 2 кГц.
Обратная ситуация, а именно восприятие человеком звуков, имитируемых птицами, также удивительна. Многие акустические особенности звуков речи связаны со строением звукогенерирующего аппарата человека. Частоты формант отражают резонансные характеристики гортани, глотки, ротовой и носовой полости. Частота колебания голосовых складок определяет частоту основного тона, на слух воспринимаемую как высота голоса. Более короткие голосовые складки у женщин по сравнению с мужчинами приводят к более высокому голосу. Строение звукогенерирующего аппарата птиц существенно отличается от человеческого, и, следовательно, его резонансные характеристики не могут быть такими же, как у человека. Более того, некоторые виды птиц используют при звукогенерации два источника звуковых колебаний. В немногочисленных работах по исследованию акустической структуры звуков, имитируемых различными птицами были получены противоречивые данные (Силаева О.Л., 1998; Ильичев В.Д. и др., 1999; Banta Lavenex P., 1999; Klatt D.H., Stefanski R.A., 1974; Patterson D.K., Pepperberg I.M., 1994). В работе по исследованию речеподобных звуков из имитационного репертуара серого попугая (Patterson D.K., Pepperberg I.M., 1994) было выявлено, что различные категории гласных английского языка, имитируемые этой птицей, невозможно разделить на основании
значений первой и второй формант. Однако, свидетельств использования при генерации звуков попугаем более чем одного источника основного тона получено не было. И, так как, было зафиксировано, что произнесение различных гласных связано с изменением птицей положения языка, авторы предположили, что попугай использует механизмы звукогенерации и модификации акустической картины звуков, сходные с человеческими.
В последнее время появились данные, свидетельствующие о том, что у волнистых попугайчиков, также хорошо известных имитаторов (Banta Lavenex P., 1999), акустическая структура имитаций речи и их видовых сигналов, в значительном количестве случаев, является следствием работы двух нелинейно связанных источников звуковых колебаний. Их местоположение, на данный момент, обсуждается. Вместе с этим существенных отличий анатомии сиринкса в группе попугаев не выявлено (Gaban-Lima R., Hofling Е., 2006). Это позволяет предположить, что подобный способ звукогенерации возможен и у более крупных представителей группы попугаев.
Помимо попугаев имитировать речь способны некоторые виды птиц, относящиеся к певчим воробьиным, например, вороны и скворцы. В нижней гортани птиц этого подотряда присутствуют два независимых источника колебания - по одному в каждом бронхе. Тем не менее, для имитаций речи некоторыми из этих видов характерно высокое сходство с человеческим голосом.
Таким образом, остается неясным, каким образом птицы могут имитировать речь звукогенерирующим аппаратом отличным от человеческого, и на основании чего человек различает гласные, имитируемые птицами, которые не имеют различительных признаков, соответствующих классической теории речеобразования. Это позволяет предположить, что особенности фонетических категорий гласных выходят за рамки значений первой и второй формант.
Цель исследования. Целью исследования являлось: определение акустических характеристик гласных звуков различных фонетических категорий, имитируемых различными птицами; выявление общих акустических признаков для звуков одной фонетической категории, генерируемой птицами разных видов и человеком.
Задачи исследования.
Осуществить спектральный анализ акустических характеристик гласноподобных звуков «говорящих» птиц различных видов.
Провести внутри- и межвидовое сравнение акустических характеристик гласноподобных звуков, произносимых различными птицам.
Сравнить акустические характеристики гласных, произносимых попугаем и обучающим его человеком.
Путем модификации спектральных компонентов, выявить их значимость для идентификации фонетической категории звука, имитируемого птицей.
Основные положения, выносимые на защиту.
У «говорящих» птиц независимо от способа звукогенерации и четкости произнесения, фонетические категории имитируемых гласных звуков невозможно разделить на основании признака, стабильного для различных категорий гласных звуков человека.
Характер огибающей спектра позволяет разделить фонетические категории звуков, имитируемые каждой из исследованных птиц.
Выявленные особенности огибающей спектра различных фонетических категорий гласных звуков, имитируемых птицами, характерны также и для гласных звуков человека.
Научная новизна результатов. В работе впервые проведен детальный спектральный анализ различных категорий гласных звуков русского языка «говорящих» птиц разных видов. В результате сравнительного анализа
этих звуков с гласными звуками человека были выявлены особенности, характеризующие фонетические категории гласных независимо от способов генерации. А в результате психоакустического эксперимента была показана роль спектральных компонентов, находящихся в различных частотных диапазонах, для фонетической оценки звуков.
Научно-практическая ценность работы. В результате исследования были выявлены акустические признаки фонетических категорий гласных общие для исследованных птиц и человека. Полученные данные могут иметь существенное значение для понимания психофизиологических основ восприятия фонетических категорий гласных как людьми, так и животными. Знание универсальных особенностей фонетических категорий звуков может способствовать развитию систем автоматического распознавания речи.
Апробация диссертационной работы. Материалы работы были представлены на: XII и XIII международных совещаниях по эволюционной физиологии (СПб, 2001, 2006), конференции «Мозг и поведение» (СПб, 2001), молодежной конференции «Человек и его здоровье» (СПб, 2002), международной конференции «Акустика детской речи» (СПб, 2002), XIII и XVI сессиях Российского Акустического Общества (Москва, 2003, 2005), конференциях «Физиология слуха и речи» (СПб, 2003, 2005).
Выполнение исследований было поддержано стипендиями президента Российской Федерации (2005-2006) и Американского акустического общества (2006 - RX0-121-XX-03); персональными грантами для студентов, аспирантов и молодых специалистов за 2002 и 2003 года (№ М02-2.6Д-485 и № М03-2.6Д-227); персональным грантом для аспирантов Федерального агентства по образованию за 2004 год (№ А04-2.12-631); федеральной целевой программой «Государственная поддержка интеграции высшего образования и фундаментальной науки» на 1997-2000
годы; программой Минобразования «Университеты России», №992616, 2000-2001 гг.; грантом Российского Фонда Фундаментальных исследований, № 02-06-80275, 2002-2004 гг.; ведомственной научной программой Минобразования России «Развитие научного потенциала высшей школы» №4727, 2005 г.
1. Обзор литературы
Способность к имитации человеческой речи обнаружена у некоторых видов птиц, относящихся к певчим воробьиным и попугаям. Возникает вопрос, связана ли эта способность с наличием у данных видов неких особенностей, отсутствующих у других птиц.
Певчие воробьиные являются наиболее распространенной и высокоорганизованной группой среди птиц (Ильичев В.Д., 1972). К этому подотряду относится около 4000 современных видов птиц из известных 9000 (Биологический энциклопедический словарь, 1995). По уровню элементарной рассудочной деятельности некоторые виды воробьиных ставятся наравне с низшими приматами (Крушинский Л.В., 1986; Зорина З.А., Полетаева И.И., 2001). Относительный объем мозга и объем конечного мозга у птиц этой группы является наибольшим в своем классе (Iwaniuk A.N. et al., 2005). Высокий уровень элементарной рассудочной деятельности и достаточно крупный мозг также характерен для попугаев. Однако, в отличие от певчих птиц, к этому отряду относится только 316 видов (Биологический энциклопедический словарь, 1995).
Из всех групп животных к данному моменту только у нескольких обнаружена необходимость постнатального обучения видовым сигналам. Сюда входят китообразные, морские львы, летучие мыши, певчие воробьиные, попугаи, колибри (Scharff С, White S.A., 2004) и человек.
Особенности вокального обучения у певчих воробьиных и попугаев
Видовая сигнализация птиц считается одной из самых сложных в мире животных и уже давно подвергается активным исследованиям. Попытки классифицировать их акустические сигналы проводились неоднократно, но до сих пор единой системы не существует (Кречмар Е.А. и др., 2001). Например, в «словаре» птиц могут выделяться такие категории сигналов как ювенильные, агрессивные, стайные, пищевые, гнездовые, территориально-защитные, сигналы тревоги, бедствия, спаривания и т.д. (Ильичев В.Д., 1972). В рамках большинства категорий птица может иметь несколько вариантов сигналов, которые будут издаваться в зависимости от ситуации. Различные сигналы тревоги могут отражать вид хищника и близость опасности (Ильичев В.Д., 1972). Вместе с тем, различные ситуации могут сопровождаться сходной голосовой реакцией. В этом случае сигнальное значение будут иметь не дискретные звуки, а их последовательность в течение определенного промежутка времени. То есть, акустическая сигнализация может быть организована как по принципу «дискретности» (определенный сигнал - соответствующая ситуация), так и «непрерывности», когда сигнальное значение приобретает комплекс вокализаций, издаваемых на протяжении значительного времени (Тихонов А.В. 1986).
В результате акустического обучения, характерного для воробьиных и попугаев коммуникационные сигналы различных популяций птиц одного вида могут отличаться по своему звучанию. У каждой группы формируется так называемый локальный диалект (Ильичев В.Д., Никольский Н.Д., 1977; Wright T.F., Dorin М., 2001; Wilbrecht L., Nottebohm F., 2003b; Wright T.F., Leischer R.C., 2005). В некоторых случаях (при отсутствии миграции), с течением времени сигналы птиц различных популяций могут стать «непонятными» друг для друга. Вместе с этим, некоторые сигналы могут распознаваться несколькими различными видами, если они живут в одном биотопе (Ильичев В.Д., 1971). Диалектные особенности у певчих воробьиных касаются их песни, а у попугаев выявлены для нескольких типов позывов и песни.
Песня певчих воробьиных является необходимым компонентом полового и территориального поведения. Звуковые элементы, образующие песню, организованы по иерархическому принципу. Низший уровень занимают ноты, из них формируются слоги, слоги комбинируются во фразы (мотив), фразы образуют строфу, строфы образуют песню (Todt D., 2004). В качестве элементарной единицы песни может рассматриваться элемент - нота или же слог (при экспериментальном прерывании пения зебровой амадины (Taeniopygia guttata), птицы практически всегда останавливаются на межслоговом интервале (Супх J., 1990)). Порядок слогов во фразе может быть фиксированным или меняться. Изменение их порядка осуществляется по определенным правилам, которые иногда называют синтаксисом песни. Некоторые виды (напр. зебровая амадина) формируют в течении жизни единственную песню (Marler Р., 1970; Todt D., 2004). А у других видов (напр. певчий воробей (Melospiza melodia)) вариантов песни несколько. Количество вариантов песни у обыкновенной канарейки (Serinus canaria), скворца (Sturnus vulgaris) и соловья (Luscinia ъ megarhynchos) может достигать многих десятков (Todt D., 2004).
Коммуникационная система попугаев изучена крайне слабо. Из всего ; вокального репертуара этих птиц наиболее исследованным является контактный сигнал, который наиболее часто издается попугаями различных видов (Dooling R.J. et al., 1987b; Wright T. F., 1996). Характеристики этих сигналов строго индивидуальны и являются персональным идентификатором каждой особи. В репертуаре попугаев могут присутствовать несколько типов контактных сигналов, отличающихся по характеру изменения частотных составляющих. Однако чаще всего птица издает контактные сигналы, относящиеся к одному типу.
Характеристики слуха человека и восприятие речевых звуков
Человек воспринимает частоты в диапазоне от 16-20 Гц до 20 000 Гц. Наибольшая чувствительность, то есть восприятие частот с наименьшей амплитудой, приходится на диапазон 1-4 кГц (Альтман Я.А., 2003).
Для некоторых людей характерна способность к абсолютному узнаванию высоты тона и привязке ее к соответствующему обозначению при отсутствии звука сравнения - феномен абсолютного слуха (Альтман ЯЛ., 2003). Многокомпонентный звук слуховая система раскладывает на отдельные составляющие, и он воспринимается как многовысотный, кроме ситуации, когда компоненты пропорциональны друг другу, то есть звук гармонический. В этом случае воспринимается высота, соответствующая частоте первой гармоники. В случае если компоненты близки по частоте и не выходят за пределы критической полосы, то воспринимается высота, соответствующая средней частоте (Альтман Я.А., 2003).
В случае маскировки звука другим звуком, для обнаружения первого требуется повышение его амплитуды по сравнению с той, которая требуется для его обнаружения в тишине. Максимальный эффект маскировки наблюдается если частоты маскируемого звука и маскера близки. Кривые маскировки имеют асимметричный характер с наклоном в сторону высоких частот до 280 дБ на октаву, а в сторону низких наклон составляет до 60 дБ на октаву. Исследование маскировки позволило выявить особенность слуховой системы человека, характеризующую ее частотно-избирательные свойства - критические полосы (Fletcher Н., 1940). Было установлено, что при маскировании тона узкополосным шумом расширение полосы частот маскера приводит к возрастанию эффекта маскировки только до определенной ширины полосы. Ширина такой полосы маскирующего шума была названа критической. Чем высота маскируемого звука выше, тем критическая полоса шире. Ширина критических полос минимальна на низких частотах, а с их повышением увеличивается. Таким образом, в диапазоне 100-500 Гц ширина критической полосы составляет около 100 Гц, а к 4000 Гц - достигает 1000 Гц.
Человек лучше воспринимает амплитудно-модулированный звук с частотой модуляции 4-8 Гц. Ребенок 7-8 лет воспринимает модуляцию только на этих частотах. С возрастом, с увеличением слухового опыта, повышается чувствительность к более низким и более высоким частотам (Черниговская Т.В., 1976). При стимуляции левого уха человек лучше распознает звуковые импульсы с низкой несущей частотой (250 Гц) предъявляемые с низким ритмом (20 Гц), при стимуляции правого - звуки с высокой несущей частотой, предъявляемые с высоким ритмом (60 Гц) (Вартанян И.А., Черниговская Т.В., 1993).
Восприятие звуков речи имеет определенные особенности. Слуховой спектр речевого звука, то есть спектр, сконструированный на основании информации о кодировании в слуховом нерве, отличается от физического тем, что в нем происходит подчеркивание формантной картины звука, гармонических составляющих и изменений частотной картины во времени (Чистович Л.А. и др., 1986). При восприятии гласных слуховая система интегрирует частоты спектральных максимумов если расстояние между ними меньше трех - трех с половиной критических полос (Chistovich L.A., Lublinskaya V.V, 1979).
На данный момент не выявлены нейроны-детекторы звуков речи (Вартанян И.А., 1990). Однако речевые звуки, произнесенные разными голосами, то есть имеющие различные спектральные характеристики, относятся аудиторами к одной и той же фонетической категории (Бондарко Л.В., 1998; Мясников Л.Л., Мясникова Е.Н., 1970). Выявление физических признаков, важных для распознавания различных категорий фонем ведутся до сих пор, но считается, что наиболее существенным из них является значения частот формант (Peterson G.E., Barney H.L., 1952; Фант Г., 1970; Фланаган Дж., 1968). Формантами считаются резонансные частоты речевого тракта, конфигурация которого меняется при генерации различных звуков (Чистович Л. А., 1976). Наиболее выраженные энергетические области в спектре звука могут или соответствовать резонансным частотам речевого тракта, или быть к ним более или менее приближенным в зависимости от частоты основного тона звука. Было показано, что идентификация категории звука человеком, осуществляется на основании приближенного значения форманты, то есть определяется частота наиболее выраженного спектрального максимума (Чистович Л.А., Шупляков B.C., 1971). Для восприятия согласных, генерация которых обеспечивается сложной артикуляцией, важна временная картина работы звукогенерирующих органов, а также наличие и место смычки, работа шумового или голосового источника.
Условия регистрации речеподобных звуков говорящих птиц
Исследовались имитации речи семи птиц: трех серых попугаев (Psittacus erithacus) (отряд попугаеобразные, сем. попугаи, подсемейство настоящие попугаи), двух волнистых попугайчиков {Melopsittacus undulatus) (отряд попугаеобразные, сем. попугаи, подсемейство настоящие попугаи), скворца-майны (Gracula religiosd) (отряд воробьинообразные, подотряд певчие воробьиные, сем. скворцовые) и обыкновенной канарейки {Serinus canaria) (отряд воробьинообразные, подотряд певчие воробьиные, сем. вьюрковые). С целью сравнения акустических характеристик имитаций слов птицами с речью человека была осуществлена аудиозапись хозяев волнистых попугайчиков.
Сигналы серого попугая Ромы, самца, принадлежащего В.Р. Дольнику регистрировались в домашних условиях при нашем участии. Во время записи птица находилась в своей клетке. Запись проводилась два раза в дневное время с помощью магнитофона SONI WM-D6C (неравномерность частотной характеристики + 3 дБ в диапазоне 40-15000 Гц). В первом случае использовался узконаправленный электретный микрофон DAK UEM-83R закрепленный на расстоянии 1,5 метра от клетки. Запись проводилась полтора часа. Во втором случае использовался динамический микрофон EAG MD-14N закрепленный на штативе на расстоянии 0,3 метра от клетки ниже уровня жердочки, на которой чаще всего находилась птица. Запись проводилась три часа без перерыва.
Запись вокализаций серого попугая Кузи, предположительно самки, принадлежащего А.А. Тихомирову, была проведена на магнитофон SONY TC-D5 Pro II (неравномерность частотной характеристики + 3 дБ в диапазоне 40-17000 Гц) с микрофоном AKG D310 в домашних условиях. Микрофон был закреплен на расстоянии 1,5 метра от клетки на уровне жердочки, на которой сидела птица. Запись проводилась три часа. Птица находилась в комнате одна.
Записи вокализаций серого попугая Киры, предположительно самки, принадлежащего Олегу и Ольге Алексеевым, проводились на протяжении 2002-2004 годов восемь раз. Регистрация звуков осуществлялась от полутора до трех часов. Птица была приобретена птенцом (в возрасте около полугода). Первые имитации проявились через четыре месяца. С этого момента была начата запись ее вокализаций. Регистрация осуществлялась с помощью магнитофона Marantz PMD222 и микрофона Sennheiser Е855. Микрофон находился на расстоянии около метра от попугая.
Запись вокализаций волнистого попугайчика Геши, самца арлекинового окраса, также принадлежащего Олегу и Ольге Алексеевым, осуществлялась в тех же условиях, что и Киры. Микрофон находился на расстоянии 0,3 м от центра клетки. Процедура регистрации осуществлялась пять раз в течение 2002 года в обычных условиях (в присутствии экспериментатора, семьи, остальных животных) по три часа. Только две записи содержали значительное количество имитаций и в дальнейшем анализировались. Речь хозяина Геши записывалась однократно в двух ситуациях: при разговоре с другим человеком и при разговоре с попугаем.
Наиболее обширный объем аудиозаписей был получен в результате регистрации вокализаций зеленого волнистого попугайчика Эрика, самца, принадлежащего автору данного исследования. Запись осуществлялась с момента приобретения птицы птенцом (полтора-два месяца) в 2002 году. Использовались магнитофоны с микрофонами: Marantz PMD222 и Sennheiser Е855, Marantz PMD670 и АТ3031. В дальнейшем фрагменты полученного материала использовались только для сравнения акустических характеристик произнесений с имитациями другого волнистого попугайчика. Полученная запись обычной речи хозяина Эрика и при взаимодействии с попугаем использовалась только для выявления изменения частоты основного тона человека в различных условиях.
Оцифровка полученных аудиозаписей осуществлялась с использованием 16-разрядной звуковой карты Creative Labs AVE 64 и Aardvark DirectMix USB с частотой дискретизации 44100 Гц. В случае использования цифрового магнитофона Marantz PMD670 аудиозапись производилась в формате РСМ, 16 бит, моно, с частотой дискретизации 44100 Гц.
Материал по скворцу-майне Чике и канарейке Пинчи был любезно предоставлен сотрудниками кафедры зоологии позвоночных И.В. Ильинским и Е.А. Кречмаром из фонотеки голосов животных. Записи были проведены А.С. Мальчевским в октябре 1969 года на магнитофон «Репортер-3» с микрофоном Д-55.
Сравнительная характеристика акустической структуры имитаций речи различными птицами
В работах по исследованию акустической структуры имитаций речи различными птицами было выявлено, что имитации серого попугая (Patterson D.K., Pepperberg I.M., 1994) и скворца-майны (Klatt D.H., Stefanski R.A., 1974) имеют периодическую структуру, а у волнистого попугайчика - квази- и непериодическую (Banta Lavenex P., 1999). С целью выявления индивидуальных отличий был проведен анализ акустической структуры гласноподобных звуков различных особей вышеперечисленных видов птиц.
Наиболее энергетически выраженные спектральные составляющие вокализаций серых попугаев занимали полосу в среднем до 4 кГц. Гласноподобные звуки попугая Ромы могли иметь периодическую структуру (рис. 9, al, 61, ві), но также квази- и непериодическую (рис. 9, а2, 62, в2). В некоторых случаях на коротком временном участке различные типы акустической структуры сменяли друг друга.
Гласноподобные звуки попугая Кузи чаще всего не имели периодической структуры (рис. 10, al, 61, ві) или были квазипериодическими (рис. 10, а2, 62, в2). Модулирующая частота колебалась от 100 до 500 Гц и могла быть определена только в 43 % звуков. Несущая частота составляла 2-2,5 кГц в 41% звуков, и 3-3,5 кГц в 27%. В остальных случаях она была ниже, или не определялась (длительность периодов несущей не была одинаковой). Часть вокализаций Киры имели четкую периодическую структуру с частотой основного тона 150-250 Гц (рис. 11, а2, 62, в2), также присутствовали квази- (рис. 11, al, 61, ві) и непериодические участки.
У волнистого попугайчика Геши практически все звуки были квазипериодическими (рис. 12, 61, 62). Модулирующая частота была определена в 95% сигналов и составляла 90-140 Гц. Несущая частота у 54% звуков составляла 3-3,5 кГц, и у 32% - 2,5 кГц. В оставшихся случаях она была ниже, и изредка вообще не определялась. В спектре большинства гласноподобных звуков присутствовали спектральные компоненты с частотой от 2 до 5 кГц, по амплитуде равные или превышающие все остальные компоненты с более низкими частотами (рис. 12, в1, в2).
У майны Чики энергетически выраженные спектральные компоненты имитаций слов попадали в диапазон 200-4000 Гц (рис. 13а). Имитировались слова произнесенные женским и мужским голосами. Гласноподобные звуки могли иметь периодическую структуру с частотой основного тона от 150 до 400 Гц (рис. 13, 61, в1), но на низких частотах длительность периодов основного тона могла приобретать неравномерный характер. Структура некоторых звуков была квази- и непериодической (рис. 13, 62, в2).
Основные спектральные компоненты имитаций канарейки Пинчи попадали в диапазон 2,5-4,5 кГц (рис. 14а). Все гласноподобные элементы имели 2-4 спектральных максимума с высокой амплитудой, частота которых могла быть подвержена сильному изменению (до 500 Гц) в течение произнесения (рис. 14, а2). Все гласноподобные звуки были квазипериодическими (рис. 14, 61, 62), частота амплитудной модуляции составляла в среднем от 600 до 1100 Гц.
Таким образом, у серых попугаев и скворца-майны звуки могли быть периодическими, квазипериодическими и непериодическими. Квазипериодическая структура преобладала у гласных волнистого попугайчика Геши, модулирующая частота была низкой, и у канарейки, в имитациях которой модулирующая частота была высокой. То есть у крупных представителей исследованных птиц (серые попугаи, скворец) акустическая структура имитационных звуков могла быть различной, у каждой особи соотношение периодической, квази- и непериодической структуры различалось. У мелких птиц (волнистый попугайчик, канарейка) имитационные звуки в основном были квазипериодическими.