Электронная библиотека диссертаций и авторефератов России
dslib.net
Библиотека диссертаций
Навигация
Каталог диссертаций России
Англоязычные диссертации
Диссертации бесплатно
Предстоящие защиты
Рецензии на автореферат
Отчисления авторам
Мой кабинет
Заказы: забрать, оплатить
Мой личный счет
Мой профиль
Мой авторский профиль
Подписки на рассылки



расширенный поиск

Исследование слуховых механизмов анализа высоты сложных звуков Колоколов Александр Сергеевич

Исследование слуховых механизмов анализа высоты сложных звуков
<
Исследование слуховых механизмов анализа высоты сложных звуков Исследование слуховых механизмов анализа высоты сложных звуков Исследование слуховых механизмов анализа высоты сложных звуков Исследование слуховых механизмов анализа высоты сложных звуков Исследование слуховых механизмов анализа высоты сложных звуков Исследование слуховых механизмов анализа высоты сложных звуков Исследование слуховых механизмов анализа высоты сложных звуков Исследование слуховых механизмов анализа высоты сложных звуков Исследование слуховых механизмов анализа высоты сложных звуков Исследование слуховых механизмов анализа высоты сложных звуков Исследование слуховых механизмов анализа высоты сложных звуков Исследование слуховых механизмов анализа высоты сложных звуков
>

Данный автореферат диссертации должен поступить в библиотеки в ближайшее время
Уведомить о поступлении

Диссертация - 480 руб., доставка 10 минут, круглосуточно, без выходных и праздников

Автореферат - 240 руб., доставка 1-3 часа, с 10-19 (Московское время), кроме воскресенья

Колоколов Александр Сергеевич. Исследование слуховых механизмов анализа высоты сложных звуков : ил РГБ ОД 61:85-5/4426

Содержание к диссертации

Введение

1. Общая характеристика диссертации 5

2. Структура диссертации 9

Глава I. Обзор литературы 13

1.1. Психофизические факты по восприятию высоты сложных звуков 13

1.2. Обработка и кодирование акустического сигнала в периферическом слуховом анализаторе 39

1.3. Современные теории восприятия высоты сложных звуков 50

Выводы 62

Постановка задачи 63

Глава 2. Модель восприятия высоты сложных звуков 64

2.1. Описание модели 64

2.2. Моделирование на ЭВМ 76

2.3. Результаты моделирования 85

Выводы 106

Глава 3. Проверка модели с помощью психофизических экспериментов 108

3.1. Методика и аппаратура 108

3.2. Проверка предсказания модели относительно области существования тонального резидуума 112

3.3. Исследование роли спектральных механизмов в восприятии высоты звуков 122

3.4. Исследование временного механизма измерения высоты звука 125

3.5. Исследование фазовых эффектов при восприятии резидуальных сигналов 130

Выводы 133

Глава 4. Методы обработки периодических сигналов, искаженных аддитивным шумом 136

4.1. Нелинейный метод коррекции периодических сиг налов , искаженных аддитивным шумом 136

4.1.1. Описание метода 137

4.1.2. Исследование метода на ЭВМ 141

4.1.3. Результаты исследования 143

4.2. Модифицированный метод автокорреляционного анализа периодических сигналов, искаженных аддитивным шумом 162

4.2.1. Описание метода 162

4.2.2. Исследование метода на ЭВМ 164

4.2.3. Результаты исследования 166

Выводы 176

Заключение 178

Литература 180

Приложение 192

П.І. Описание программы выделения контура основного тона речевого сигнала 192

П.2. Документы, подтверждающие внедрение результатов работы 194

Введение к работе

В настоящее время при создании систем обработки информации и человеко-машинных систем приобретают большое значение задачи, связанные с обработкой, анализом и автоматической классификацией звуковых сигналов с помощью ЭВМ. В число таких задач входят: распознавание речи; идентификация и верификация диктора; контроль эмоционального состояния оператора по голосу; акустическая медицинская диагностика; анализ и классификация акустических сигналов, искаженных шумами. Однако, несмотря на значительное развитие методов обработки звуковых сигналов и усложнение обрабатывающих программ, многие из перечисленных задач человек решает успешнее, чем ЭВМ. Причина этого, по-видимому, состоит в том, что слуховая система человека располагает адекватным набором информативных параметров, характеризующих свойства широкого класса звуков, а также механизмами, обеспечивающими эффективное выделение этих информативных параметров. В связи с этим при исследовании слуховой системы возникают две главные задачи: I) определить, что собой представляют субъективные параметры восприятия; 2) установить, каким образом эти субъективные параметры извлекаются слуховой системой, т.е., какие слуховые механизмы формируют акустическое сенсорное пространство человека.

Для выявления механизмов выделения субъективных параметров наиболее перспективным представляется комбинированный подход, сочетающий разработку модели процесса восприятия с психофизическими исследованиями восприятия. Попытка использования такого комбинированного подхода для выявления механизмов выделения субъективных параметров в слуховой системе предпринята в настоящей диссертационной работе.

Психофизические факты по восприятию высоты сложных звуков

Проблема восприятия человеком высоты сложных звуков относится к числу традиционных проблем психофизики слуха. Интерес к исследованию процесса восприятия высоты звука обусловлен, с одной стороны, универсальностью высотного анализатора, заключающейся в его способности описывать широкий класс звуков, значительно различающихся по своим физическим характеристикам, например, спектральным составом, фазовыми спектрами, длительностью и т.д., в терминах единого параметра - высоты звука. С другой стороны, устойчивостью высотного анализатора к аддитивным шумам и к частотным искажениям звуков, возникающим вследствие фильтрующих свойств среды или технического канала связи, в которых передается звук [55, 78, I00J .

Приведем определение высоты тона (звука, обладающего явно выраженной высотой), содержащееся в Международном электротехническом словаре (Группа 08 Акустика, Ш проект от 15 апреля 1968г.). "Высота тона есть качество слухового ощущения, которое определяет положение звука по музыкальной шкале. Высота тона зависит главным образом от частоты звукового стимула, но также и от его формы волны и громкости. Она может быть выражена через частоту чистого тона той же громкости, который слушатели со средним нормальным слухом оценивают как занимающий то же положение по музыкальной шкале, что и данный звук".

Ощущение высоты возникает при прослушивании широкого класса акустических сигналов. Простейшими из них являются синусоидальные сигнале (чистые тоны), высота которых однозначно связана с их частотой. С помощью исследования восприятия чистых тонов удалось оценить ряд важных характеристик слуха: пороговую чувствительность, дифференциальную чувствительность по частоте 15, 19, 28, 47 J , характер зависимости воспринимаемой высоты от частоты тона [б, 15J и т.д. Однако чистые тоны позволили получить весьма ограниченную информацию о механизмах восприятия высоты в сравнении с акустическими сигналами со сложным спект - 15 ральным составом. Именно последние сыграли выдающуюся роль в исследовании высотного восприятия.

Рассмотрение особенностей восприятия высоты сложных акустических сигналов начнем с периодической импульсной последовательности из коротких импульсов длительностью "tw с периодом =l/f tn , в спектре которой содержатся частотные составляю-щиеПІІ(П=І,2,... ) , т.е. основной тон ifQ и ряд последовательных высших гармоник. Согласно [55, 95] периодическая импульсная последовательность воспринимается как слитный слуховой образ с высотой, равной частоте основного тона fQ , несмотря на то, что содержит и более высокие частотные составляющие 2f0 , зф , 4 ,... . Такой способ совместного восприятия группы гармоник, составляющих сложный сигнал, получил в литературе название синтетического способа восприятия высоты и наблюдается при прослушивании музыкальных звуков и вокализованных фрагментов речевых сигналов, содержащих широкий спектр обертонов. Причем выяснилось, что изменение в определенных пределах относительных интеясивностей обертонов не сопровождается изменением высоты звука и проявляется лишь в изменении тембра его звучания.

Последующие исследования восприятия периодических импульсных последовательностей [74, 77 J показали, что при определенной тренировке испытуемых и специальных условиях (последовательном прослушивании импульсной последовательности и чистого тона с частотой равной или отличной от частот ее гармоник), создающих концентрацию внимания к гармоникам периодической импульсной последовательности, возможно изолированное выслушивание гармоник. При этом выяснилось, что в периодической импульсной последовательности могут изолированно выслушиваться только 7-9 первых гармоник, а выслушивание гармоники затрудняется с возрастанием ее номера. Этот факт свидетельствует об ограниченной разрешающей способности слухового анализатора по частоте и находится в согласии с оценками частотной избирательности слухового анализатора, полученными при измерении критической полосы слуха [24,2б], а также данными по одновременной Г 26, 27, 32] и прямой маскировке [77 J .

Выполнение слуховым анализатором частотного анализа с ограниченным разрешением предполагает возможными временное и спектральное представление звука в слуховой системе. Их иллюстрирует рис.1.1. На нем вдоль вертикальной оси схематически изображены частотные характеристики фильтров слухового частотного анализатора с резонансными частотами от 160 до 6300 Гц. Справа внизу - периодическая импульсная последовательность, являющаяся стимулом, действующим на входе слухового анализатора. Рассмотрим форму колебаний на выходах фильтров. Пять первых гармоник вызывают почти синусоидальные колебания в фильтрах, настроенных на их частоты. В полосу пропускания каждого из высокочастотных фильтров попадает несколько гармоник, что приводит к появлению на их выходах периодически повторяющихся быстро затухающих колебаний с периодом, совпадающим с периодом следования стимулирующих импульсов.

Проверка предсказания модели относительно области существования тонального резидуума

Как уже отмечалось в разделе 2.3, в процессе исследования модели мы обнаружили противоречие ее предсказания с психофизическими данными Ритсмы [82J по области существования тонального ре зидуума. Это противоречие состояло в следующем. В соответствии с данными Ритсмы, у резидуальных сигналов, номер нижней гармоники которых больше 25, не может восприниматься высота, соответствующая периоду сигнала (см. рис.1.8). В то же время, согласно предсказанию модели, при прослушивании таких сигналов должна выслушиваться высота, соответствующая периоду сигнала. Действи тельно, из-за ограниченной разрешающей способности частотного анализатора модели группа последовательных гармоник резидуаль-ного сигнала попадает в полосу пропускания одного из его фильтров. В результате отклик этого фильтра будет представлять собой периодическую функцию времени и ее период (величина, обратная высоте) элементарно находится нашей моделью.

Проанализировав возможные причины расхождения предсказания модели с данными Ритсмы, мы пришли к выводу, что оно,. по-видимому, обусловлено следующим обстоятельством. В экспериментах Ритсмы испытуемые выносили решение о том, является прослушиваемый резидуальный сигнал тональным или атональным, с помощью сравнения его с эталонным резидуальным сигналом, высота у которого была отчетливо выражена. Поэтому при такой процедуре рези-дуальные сигналы со слабо выраженной высотой могли оцениваться ими как атональные. Для проверки этого вывода мы провели собственные психофизические эксперименты. В этих экспериментах наличие у резидуальных сигналов высоты определялось с помощью сравнения по высоте двух последовательных резидуальных сигналов с приблизительно одинаково выраженными высотами по методике, изложенной в разделе 3.1.

Эксперимент 3.2.1. В качестве эталонных и тестовых сигналов использовались резидуальные сигналы (3.1). У эталонных сигналов частоты основных тонов fo3 принимали значения 100,110 и 120 Гц. Частоты основных тонов тестовых сигналов выбирались на малую терцию ниже и выше fQ3 согласно темперированной музыкальной шкале и определялись из соотношений где ol-2 .У всех стимулов фазы гармоник гу)-0 , а значения номеров нижних и верхних гармоник Г\{ и П были выбраны равными 90 и ПО. При таком выборе И і и П ширина спектра стимулов Af = (П -ПІ) приблизительно равнялась критической частоте слуха Af кр на центральных частотах стимулов fQ-( 2+ )10/2, что гарантировало яевбзможность разрешения гармоник используемых стимулов слуховым частотным анализатором. Вследствие выбора нулевых фаз у гармоник стимулов они представляли собой последовательности радиоимпульсов с частотой заполнения fc , следующих с периодом I =VTO ССМ- рис.3.1).

Результаты эксперимента показали, что все испытуемые уверенно различали эталонные и тестовые стимулы по высоте, а их суждение о том, выше или ниже тестовый сигнал по отношению к эталонному, совпадали с изменениями частоты основного тона в среднем в 98,3% случаев ( Q =0,71, доверительный интервал 98,11 - 98,49 при доверительной вероятности Р = 0,95). Кроме того, после прослушивания тестовой серии все музыканты сообщили, что, как правило, сравниваемые сигналы различались по высоте на малую терцию.

Однако из-за того, что номера нижних и верхних гармоник П-1 и ҐІ2 У всех стимулов, используемых в эксперименте, были одинаковыми, пропорционально частоте основного тона изменялись частоты гармоник стимулов. Следовательно, не исключалась возможность, что испытуемые основывали свои суждения о высоте стимулов не на сравнении их периодов, а на сравнении их спектральных характеристик, например, положения- спектрального максимума или спектральных границ. Поэтому мы провели дополнительный эксперимент, в котором исключалась возможность использования испытуемыми какой-либо спектральной информации при сравнении стиму - 116 лов по высоте.

Эксперимент 3.2«2, Сигналы, используемые в этом эксперименте, отличались от сигналов в эксперименте 3.1.I только значениями номеров нижних и верхних гармоник Г\ и П . Причем у всех сигналов Hj и П% выбирались так, чтобы их частотные компоненты flf0 (П= Hj.,.„,П2 располагались в спектральной области 9-II кГц, а компоненты П fQ и Dafo были максимально близки к граничным частотам этой спектральной области. Таким образом, при сравнении стимулов по высоте исключалась возможность использования испытуемыми каких-либо спектральных признаков.

В результате проведения эксперимента выяснилось, что фиксация спектральных границ резидуальных сигналов практически не повлияла на суждение испытуемых. Все испытуемые надежно различали стимулы по высоте, а их суждение о том, ниже или выше тестовые стимулы эталонных, совпадали с изменениями частоты основного тона в среднем в 97,5% случаев ( Q =0,96, доверительный интервал 97, 25-97, 75 при Р =0,95). При этом, как и в эксперименте 3.2.1, после прослушивания тестовой серии все музыканты сообщили, что, как правило, сравниваемые сигналы различались по высоте на малую терцию.

Исследование временного механизма измерения высоты звука

Выбор в предложенной нами в разделе 2.1 модели восприятия высоты сложных звуков временного механизма измерения высоты, основанного на построении гистограмм межимпульсных интервалов разрядов волокон слухового нерва, требует экспериментального обоснования. Его необходимость обусловлена тем обстоятельством, что имеется другая возможная версия временного механизма измерения высоты, основывающегося на вычислении функций автокорреляции импульсных последовательностей, генерируемых волокнами слухового нерва. Поэтому для подтверждения справедливости сделанного нами выбора мы провели специальные психофизические эксперименты с ре-зидуалышми стимулами с двумя пиками огибающей на периоде и с различной шириной пиков огибающей.

Эксперимент 3.4.1. В качестве эталонного сигнала использовался сигнал с двумя пиками огибающей на периоде (см. рис.3.4а), сформированный из резидуального сигнала S(t) » определяемого (3.1), с параметрами: Р0 = 100 Гц, П{ = 90, 10,,= по» П Величина задержки ATQ составляла 1/(3fо) » т»в- /3 пеРи-ода S(t) . В качестве тестовых сигналов использовались рези-дуальные сигналы (3.1) с Фп-0 (см. рис.3.46). Частоты основных тонов Р у тестовых сигналов принимали восемь возможных значений 83, 100, 120, 150, 180, 250, 300 и 360 Гц. Благодаря этому можно было проводить сравнение по высоте эталонного сиг нала с двумя пиками огибающей на периоде с резидуальными тестовыми сигналами, у которых периоды Т были меньше, равны или больше, чем . Наконец, значения ГЬ и КІ2, У всех тестовых сигналов выбирались такими, чтобы частоты нижних и верхних гармоник эталонных и тестовых сигналов отличались минимально, чем достигалась фиксация спектральных областей, занимаемых сравниваемыми сигналами. Результаты эксперимента сведены в таблице 3.3, где Og - проценты случаев, в которых используемые тестовые сигналы оценивались испытуемыми выше эталонного сигнала. Из таблицы 3.3 следует, что равенство высот эталонного и тестового стимула, соответствующее 0$ =50$ при нашей методике проведения экспериментов, имеет место при частоте основного тона тестового сигнала f0 приблизительно равной 150 Гц.

Это означает, что высота сигнала с двумя пиками огибающей на периоде определяется максимальным интервалом между пиками огибающей І , а не периодом огибающей Т . Таким образом можно сделать вывод, что механизм, оценивающий высоту звука, основан на измерении временных интервалов между пиками волны, а не на ее автокорреляционном анализе, так как в последнем случае равенство высот эталонного и тестового стимулов имело бы место при равенстве их периодов. Этот вывод подтверждают гистограмма межимпульсных интервалов и автокорреляционная функция, представленные на рис.3.5, вычисленные по огибающей сигнала Ч і) ПРИ (Ц » 300. Легко видеть, что пик на % = Т , соответствующий высоте, выслушиваемой у сигнала тОы с двумя пиками огибающей на периоде, может быть выделен из гистограммы межимпульсных интервалов (см. рис.3.5,а), в то время как в автокорреляционной функции преобладает пик и на Т = Т (см. рис.3.5,б), соответ Таким образом, с помощью эксперимента 3.4.1 мы подтвердили гипотезу о том, что механизм измерения высоты звука основан на измерении координат главных пиков в гистограмме мекимпульс-ных интервалов. Второе подтверждение этой гипотезы было получено с помощью эксперимента, в котором исследовалось сравнение по высоте резидуальных сигналов с различной шириной пиков огибающих.

Эксперимент 3.4.2. Из резидуальных сигналов (3.1) с различным числом частотных компонент К , отличающихся шириной пиков огибающих, было образовано шесть пар сигналов. Эталонные сигналы у всех пар были одинаковыми и состояли из 21 последовательной гармоники с частотой основного тона f0 = 100 Гц.

Исследование фазовых эффектов при восприятии резидуальных сигналов

В разделе 3.2 мы установили, что восприятие высоты резидуальных сигналов, гармоники которых располагаются в частотной области выше 8 кГц, связано с анализом слуховой системой временных особенностей их огибающих. Основываясь на этом и очевидном факте, что огибающая резидуального сигнала может значительно изменяться при варьировании его фазового спектра, мы пришли к выводу, что изменение фаз гармоник у резидуальных сигналов может существенно повлиять на результаты их сравнения по высоте. Для подтверждения этого вывода мы провели следующий эксперимент.

Эксперимент 3.5.1. В этом эксперименте использовались те же сигналы, что и в эксперименте 3.2.2, с одним единственным исключением - фазы гармоник Фп у каждого из сигналов устанавливались случайным образом в диапазоне от 0 до 2 JT . Результаты эксперимента подтвердили наш вывод и показали, что рандомизация фаз гармоник резидуальных сигналов действительно приводит к снижению процента высотных сравнений, совпадающих с изменениями частоты основного тона, с 97,5$ до 64$ ( 6 = 4,8, доверительный интервал 62,75 - 65,25 при доверительной вероятности 0,95). Анализируя возможные причины столь резкого снижения процента высотных сравнений, следующих изменениям частоты основного тона, мы пришли к выводу, что определенные фазовые соотношения у гармоник резидуальных сигналов могут приводить к значительным изменениям воспринимаемой высоты. Для проверки этого вывода был проведен следующий эксперимент.

Эксперимент 3.5.2. Испытуемых просили сравнивать по высоте последовательно предъявляемые резидуальные сигналы Sift) и $%({) вида (3.1) длительностью 300 мс, разделенные паузой 200 мс. Оба сигнала имели одинаковые амплитудные спектры: f0 « 100 Гц, Пі =90, П = НО, но различались фазами гармоник. У сигнала Si() Фп= 0,0,0,... , а у сигнала S i) Фп=оЖо,ЯУг,.... Вследствие этого огибающие сигналов различались. Их различие состояло в том, что интервал между пиками огибающей у сигнала S2(t) был-вдвое меньше, чем у сигнала SiCfc) (см. рис.3.7). В результате прослушивания испытуемыми St(і) и S Ot) выяснилось, что все они оценивали Sg/l) выше Si(i) , а музыканты в дополнение к этому сообщили, что сигналы различаются по высоте на октаву. Полученный результат с очевидностью следует из рассмотрения огибающих сигналов и элементарно объясняется моделью.

Таким образом, полученные в экспериментах 3.5.1 и 3.5.2 факты позволяют заключить, что высота резидуальных сигналов может существенно изменяться при изменении фаз их гармоник. Это заключение не противоречит экспериментальным данным [69, 73, ИЗ] , свидетельствующим о независимости высоты резидуальных сигналов от фаз их гармоник, так как последние были получены на резидуальных сигналах с существенно другими параметрами.

В наших экспериментах использовались узкополосные резиду-альные сигналы, составленные из высокочастотных гармоник и с высокочастотной тонкой временной структурой, изменяющейся с частотой около 10 кГц. Вследствие этого сравнение таких сигналов по высоте могло основываться только на анализе слуховой системой их огибающих, но никак не на анализе их тонкой временной структуры. А так как форма огибающей сигнала зависит от фаз гармоник резидуальяого сигнала, определенные изменения фаз гармоник сопровождались изменениями высоты.

В экспериментах [б9, 73, ИЗJ параметры резидуальных сигналов были такими, что информация об их высоте могла извлекаться слуховой системой с помощью анализа их тонкой временной структуры, период которой не зависит от фазового спектра резидуальяого сигнала. Поэтому воспринимаемая высота при прослушивании таких сигналов не изменялась при изменении фаз их гармоник.

Похожие диссертации на Исследование слуховых механизмов анализа высоты сложных звуков