Содержание к диссертации
Введение
1 Обзор состояния проблемы 9
1.1 Общие понятия об антенных решетках 9
1.2 Проблема дистанционного сбора речевой информации 11
1.3 Принципы построения микрофонных решеток 15
1.4 Современные микрофонные решетки зарубежных компаний 21
1.5 Обзор состояния проблемы в гидроакустике и гидролокации. 24
1.6 Обзор состояния проблемы в радиолокации. 29
1.7 Выводы по первой главе. 32
2 Разделение сигналов при заданных направлениях на источники 34
2.1 Расчетные соотношения 34
2.2 Моделирование 39
2.3 Влияние собственных шумов микрофонной решетки на выходное отношение сигнал / шум 2.3.1 Один источник узкополосного сигнала 48
2.3.2 Один источник широкополосного сигнала 51
2.3.3 Два источника широкополосного сигнала.. 52
2.4 Выводы по второй главе 56
3 Определение направлений на источники сигналов 58
3.1 Метод Кейпона 58
3.1.1 Определение направлений на источники узкополосных сигналов с помощью метода Кейпона 58
3.1.2 Влияние собственных шумов решетки на точность определения направлений прихода сигналов по методу Кейпона. 60
3.2 Модификация метода Кейпона для широкополосных сигналов 67
3.2.1 Определение направлений с помощью модифицированного метода Кейпона 67
3.2.2 Моделирование модифицированного метода Кейпона 67
3.2.3 Влияние собственных шумов решетки на точность определения направлений прихода сигналов по модифицированному методу Кейпона..70
3.2.4 Влияние собственных шумов решетки на степень подавления мешающего сигнала по модифицированному методу Кейпона 78
3.3 Натурный эксперимент 84
3.3.1 Модифицированный метод Кейпона 85
3.3.2 Пространственное разделение сигналов 87
3.4 Выводы по третьей главе 88
4 Статистические испытания модели микрофонной решетки 89
4.1 Нахождение оптимального значения порога весового коэффициента 89
4.2 Заметность мешающего сигнала при ошибочной настройке решетки 99
4.3 Чувствительность микрофонной решетки к допускам изготовления микрофонов
4.3.1 Влияние неидентичности микрофонов на ослабление собственного шума решетки 107
4.3.2 Влияние неидентичности микрофонов на подавление мешающего сигнала.. 109
4.4 Выводы по четвертой главе 113
Заключение 115
Список литературы
- Принципы построения микрофонных решеток
- Влияние собственных шумов микрофонной решетки на выходное отношение сигнал / шум
- Определение направлений на источники узкополосных сигналов с помощью метода Кейпона
- Чувствительность микрофонной решетки к допускам изготовления микрофонов
Введение к работе
Актуальность
В системах радио- и гидролокации используются антенны с явно выраженными диаграммами направленности. Сканирование основного луча антенны в пределах ± 900 позволяет обнаружить исследуемый объект с целью определения его параметров, в частности его местонахождения, направления и скорости движения, геометрических параметров и т.д. До середины двадцатого века сканирование осуществлялось механическим способом, путем вращения тела антенны. В настоящее время процесс сканирования обеспечивается неподвижными антеннами, называемыми антенными решетками. Они представляют собой множество приемников, взвешенная сумма сигналов на выходе которых образует сигнал с заданной диаграммой направленности. Электронный способ управления весовыми коэффициентами позволяет отказаться от механического перемещения антенны.
Успехи, достигнутые в теории и практике систем радио- и гидролокации, позволяют использовать разработанные и апробированные принципы построения этих систем в задачах обработки речевого сигнала. Согласно классификации, предложенной М.Б. Столбовым, к этим задачам относятся:
– выделение речи (повышение разборчивости) целевого диктора в шумах;
– дистанционный сбор речевой информации;
– дистанционное распознавание речи (например, для голосового управления
устройствами);
– дистанционная идентификация дикторов;
– разделение речи дикторов, выделение речи целевого диктора в голосовом
коктейле;
– определение положения и трассировка положения источников звука;
– анализ акустической эмиссии источников звука;
– системы автоматического распознавания речи и речевого управления в
автомобиле;
– информационные киоски с речевым сервисом в общественных местах;
– слуховые аппараты.
Теория антенных решеток, используемых в системах радио- и гидролокации, базируется на предположении об узкополосности сигнала, принимаемого и обрабатываемого антенной решеткой. Однако речевой сигнал, занимающий полосу частот от нескольких десятков Герц до нескольких килогерц, является широкополосным. Алгоритмы обработки широкополосного речевого сигнала, используемые в микрофонных антенных решетках, в литературе практически не освещены.
Адаптация методов построения антенных решеток применительно к задаче выделения речи целевого диктора из шумов и смеси голосов составляет содержание данной диссертации.
Таким образом, наличие практической потребности в обработке речевого сигнала и существующее состояние вопроса обработки микрофонными решетками широкополосного речевого сигнала обусловили необходимость и актуальность решения задач, рассматриваемых в диссертации.
Цель диссертационной работы состоит в разработке методов построения микрофонных антенных решеток применительно к задаче выделения речи целевого источника из шумов и смеси голосов с учетом факта широкополосности речевых сигналов.
Для достижения указанной цели в диссертационной работе необходимо было решить следующие задачи:
-
Провести анализ существующих и перспективных алгоритмов работы антенных решеток;
-
Предложить и обосновать методику обработки широкополосного речевого сигнала в микрофонной антенной решетке;
-
Разработать метод ориентации микрофонной антенной решетки;
-
Разработать и реализовать метод статистических испытаний для оценки допустимых искажений полезного речевого сигнала;
-
Провести математическое моделирование микрофонной антенной решетки.
Методы исследования. Теоретические и экспериментальные исследования базируются на использовании аппарата дискретного
преобразования Фурье, методов вычислительной математики, методов статистического анализа, методов математического моделирования. Научная новизна диссертационной работы состоит в следующем:
-
Сформулирована общая методика обработки микрофонной антенной решеткой широкополосного речевого сигнала, позволяющая осуществить ориентацию микрофонной антенной решетки по модифицированному методу Кейпона и пространственное разделение широкополосных речевых сигналов с помощью взвешенного суммирования спектров сигналов с комплекснозначными частотно зависимыми весовыми коэффициентами.
-
Получены в замкнутой аналитической форме выражения для весовых коэффициентов микрофонной антенной решетки, используемых в задаче пространственного разделения широкополосных сигналов.
-
Получены теоретические и экспериментальные зависимости, связывающие степень подавления микрофонной антенной решеткой мешающего сигнала с отношением сигнал/шум (ОСШ).
-
Предложен и обоснован статистический метод определения таких параметров микрофонной антенной решетки, которые гарантируют допустимые искажения полезного речевого сигнала и связывают степень подавления мешающего сигнала с допуском на параметры микрофонов.
Практическая значимость
Результаты данной работы позволяют производить выделение речи целевого источника из шумов и смеси голосов, осуществлять дистанционный сбор речевой информации. Применение разработанных методов обработки речевых сигналов позволило установить численные значения допусков на отличие чувствительностей микрофонов. В частности, установлено, что для подавления мешающего сигнала на 30 дБ допуск на отклонение чувствительностей микрофонов составляет 0,25 дБ (3%).
Личный вклад автора состоит в следующем:
- получение замкнутых аналитических выражений для весовых
коэффициентов сумматора сигналов;
- разработка алгоритма настройки микрофонной антенной решетки;
- проведение и обработка результатов статистического испытания модели микрофонной антенной решетки.
Положения, выносимые на защиту
-
В отличие от методов обработки узкополосных сигналов во временной области, используемых в системах радиолокации, при выделении широкополосного речевого сигнала из смеси голосов, обработку речевых сигналов следует производить в частотной области.
-
Для обработки широкополосных речевых сигналов с помощью микрофонной антенной решетки следует использовать взвешенное суммирование сигналов с комплекснозначными частотно зависимыми весовыми коэффициентами, полученными из решения линейных уравнений, связывающих выходные речевые сигналы решетки и сигналы на выходе каждого из микрофонов.
-
Следует ограничить значения модулей весовых коэффициентов для устранения заметных, субъективно оцениваемых искажений выделенного речевого сигнала, возникающих вследствие подчеркивания шумовых составляющих при пространственном разделении сигналов.
-
Для решения задачи ориентации микрофонной антенной решетки, т.е. определения направлений на источники широкополосных речевых сигналов, необходимо рассчитывать функции Кейпона и значения направлений, доставляющих максимум этой функции, для каждой частотной компоненты с последующим усреднением этих направлений.
-
Для определения оптимальных параметров микрофонной антенной решетки необходимо оценить качество сигнала, прошедшего обработку при разных пороговых ограничениях на весовые коэффициенты решетки, выбрав то пороговое значение, при котором субъективно оцениваемые искажения классифицируются, как малозаметные.
Реализация и внедрение результатов исследований.
Результаты исследований использованы при проведении работ в ООО НПП «ПРОЭЛ» (имеется акт о внедрении), а также внедрены в учебный процесс по кафедре радиотехники и информационных технологий СПбГИКиТ
при изучении магистрантами дисциплины «Устройства приема и обработки сигналов».
Апробация работы. По материалам данной работы были сделаны доклады на Межвузовском научно-практическом студенческом форуме в рамках «Недели науки и творчества», СПб, СПбГУКиТ, 21-25 апреля 2014 года, на X Международной научно-практической конференции «Прикладные научные разработки – 2014», Прага, Чехия, организация “Education and Science”, 25 июля - 5 августа 2014 года, на VI Международной научно-практической конференции: «Современные концепции научных исследований», Москва, «Евразийский Союз Ученых "EUS"» 26-27 сентября 2014 года, на XLIV научной и учебно-методической конференции молодых ученых, СПб, СПбГУИТМО, 3-6 февраля 2015 года, на IX Международной научно-практической конференции "Научные перспективы XXI века. Достижения и перспективы нового столетия", Новосибирск, Международный Научный Институт "Educatio", 13-14 марта 2015 года, на Межвузовском научно-практическом форуме студентов, аспирантов и молодых ученых «Неделя науки и творчества», СПб, СПбГИКиТ, 20-27 апреля 2015 года, на Международной научно-практической конференции «Общество в условиях современного медиапространства», СПб, СПбГИКиТ, 28-29 мая 2015 года.
Публикации. Основные материалы диссертации изложены в 9 статьях, 4 из них опубликованы в журналах из списка ВАК.
Структура и объем диссертации. Диссертация состоит из введения, четырех глав, заключения, списка литературы, включающего 78 наименований. Общий объем диссертации 124 страницы, в том числе 48 рисунков и 7 таблиц.
Принципы построения микрофонных решеток
Дистанционный сбор речевой информации имеет важное значение в сфере телекоммуникаций, технологий автоматического распознавания речи, работе правоохранительных органов и многих других приложениях. В [20] рассмотрены средства дистанционного сбора речевой информации, применяемые в акустической разведке: направленные микрофоны и лазерные акустические системы. Например, если в выделенном помещении открыта (или даже приоткрыта) форточка или фрамуга, то для прослушивания ведущихся в нем разговоров могут использоваться направленные микрофоны: параболические (рефлекторные), трубчатые (интерференционные), устройство и принцип действия которых подробно описаны в [21]. Разведка может вестись из соседних зданий или автомашин, находящихся на автостоянках, прилегающих к зданию.
Если же окна и форточки в выделенном помещении будут закрыты, возможно прослушивание разговоров с использованием лазерных акустических систем разведки (ЛАСР), иногда называемых «лазерными микрофонами» (рис. 1.3). В основе работы простейшего ЛАСР лежит закон отражения света. Луч лазера падает на стекло окна под некоторым углом. На границе стекло-воздух происходит модуляция луча звуковыми колебаниями, создаваемыми говорящими людьми внутри помещения. Отраженный луч улавливается фотодетектором, и осуществляется амплитудная демодуляция отраженного излучения. Несмотря на простоту работы, такое устройство на практике используется довольно редко, поскольку оно требует тщательной юстировки: детектор должен быть расположен строго на оси отраженного луча [20].
Другой способ, использующий сплиттер (делитель) пучка, несколько сложнее, но он позволяет совместить лазер и детектор. Применение сплиттера позволяет свести падающий и отраженный луч в одну точку, в связи с чем отпадает необходимость в тщательной юстировке системы. Однако применение таких систем возможно только в том случае, если луч лазера отражается в направлении его источника. Для этого ЛАСР и облучаемое окно должны находиться на одной высоте, и оконное стекло должно располагаться перпендикулярно лучу лазера. Во всех остальных случаях в направлении на детектор отражается незначительное количество диффузно рассеянного излучения и дальность ведения разведки резко снижается [20].
Отметим недостатки упомянутых ранее направленных микрофонов. В [7] указывается, что системы наподобие «Супер Уха – 100», описанные в [20], не способны в городских условиях привести к существенному увеличению дистанций сбора речевой информации, поскольку вместе с усилением речевого сигнала усиливается и шум окружения, являющийся одной из основных причин снижения разборчивости и качества речи. Кроме того, дистанция приема направленного микрофона ограничивается такими факторами, как многолучевое распространение звука, рассеивание высокочастотных компонент звука, ветер и др. [22]. Также при записи звука одним микрофоном утрачиваются пространственные свойства звука. По этой причине звук, который мы слышим в шумном или реверберирующем помещении, значительно отличается от того же звука, записанного через один микрофон и воспроизводимого с помощью акустической колонки или головных телефонов [7].
Для примера оценим приблизительную дальность разборчивой речи в различных условиях по известным оценкам громкости нормальной речи и уровня шума [23]. Критерием разборчивости будем считать отношение сигнал/шум (ОСШ): ОСШ (дБ) = Нормальная речь (дБ) – Шум (дБ) Та дистанция, на которой уровень шума начинает превышать уровень речевого сигнала (ОСШ 0 дБ), будет являться предельной дальностью разборчивой речи.
В качестве исходных данных для расчета примем оценку интенсивности нормальной речи 90 дБ при телефонном разговоре (микрофон телефона на расстоянии 3 см) [21]. Считаем, что увеличение дистанции между диктором и микрофоном в 2 раза приводит к уменьшению на 6 дБ интенсивности звука речи, воздействующего на микрофон. При этом уровень окружающих шумов остается постоянным, и происходит уменьшение ОСШ до критических для разборчивости речи значений 0…-6 дБ [21, 23].
Улица с интенсивным движением, 60 - 80дБ 30 18 6 0 -6 15 Как следует из данных таблицы, даже в тихом учреждении на дистанциях 819 м ОСШ принимает критические для разборчивости речи значения. Для шумного учреждения предельная дальность разборчивой речи сокращается до 0,51 м. Однако нормальная слышимость речи на больших дистанциях может быть гарантирована при условии, что интенсивность речевого сигнала составляет 40-60 дБ. Для этого звук с дистанций более 10 м должен быть усилен. 1.3 Принципы построения микрофонных решеток Как известно [21], ненаправленные микрофоны по отдельности дают электрические сигналы одинаковой мощности для звука, приходящего с любого направления. Совместная обработка этих сигналов с выходов микрофонов позволяет выделить звук, приходящий с заданного направления. Если в решетке используются направленные микрофоны, то диаграмма направленности решетки, в соответствии с теоремой умножения [6], может быть найдена произведением диаграммы направленности одного микрофона на диаграмму направленности гипотетической решетки, состоящей из ненаправленных элементов. В дальнейшем обзоре и при проведении расчетов будем считать приемники акустического сигнала ненаправленными.
Влияние собственных шумов микрофонной решетки на выходное отношение сигнал / шум
Для проверки выдвинутой гипотезы был проведен модельный эксперимент по определению максимального порогового значения, при котором еще не слышны вносимые искажения звука (свист и шипение). Эксперимент показал правильность выдвинутой гипотезы и существование порогового значения весового коэффициента wпорог , удовлетворяющее требованию отсутствия искажения звука. Одновременно оказалось, что если пороговое значение выбрать слишком маленьким, то в самом речевом сигнале возникают искажения, проявляющиеся в ухудшении слышимости согласных звуков.
При проведении моделирования был выбран диапазон поиска порогового значения от 100 до 0,5. По результатам моделирования было выбрано значение, лежащее внутри диапазона и равное 1,5. Выбор определялся отсутствием шипения и свиста с одной стороны и субъективным оцениванием слышимости согласных звуков с другой стороны. Теперь рассмотрим случай, когда источники широкополосного акустического сигнала расположены на небольшом угловом расстоянии, например, (р = 5 , (р " = — 5 . Построим график абсолютных значений весовых коэффициентов, оставляя неизменными прочие параметры (рис. 2.5).
Как видно из рисунка 2.5, в области слышимых частот присутствует только один всплеск, он приходится на низкие частоты. Результаты субъективной оценки показывают, что в области всплеска не возникает вносимых искажений (шипения и свиста). Однако если использовать такое же пороговое значение весового коэффициента, как и в предыдущем случае, то становятся заметными искажения голоса. Разборчивость речи не ухудшается, но голос диктора становится неестественным, как если бы он воспроизводился через громкоговоритель телефона (следствие завала низких частот [21]). На основании проведенного моделирования было принято решение разделить диапазон слышимых частот на две области и использовать два пороговых значения весового коэффициента. В первую область попадает первый всплеск, соответствующий частотам, близким к нулю, во вторую область попадают остальные критические частоты. Граница областей (то есть значение частоты, разделяющей области) численно равна половине значения частоты затухания второго всплеска. Как следует из (2.13), /граи = -ГТ -1/2 (2.15)
Пороговое значение весового коэффициента в первой области должно быть выше, чем во второй. Выбор значения весового коэффициента в первой области определялся с одной стороны отсутствием тембральных искажений голоса и с другой стороны отсутствием перегрузки звукового сигнала на низких частотах, которая приводила к снижению общего уровня сигнала при его прохождении через тракт. По результатам моделирования было выбрано пороговое значение, равное 100.
Так для случая (р = 90 ,(р"= —90 (источники максимально разнесены по направлениям прихода сигналов) получаем следующий график частотной зависимости модуля весового коэффициента с учетом двух пороговых ограничений (рис. 2.6).
В соответствии с (2.15), граница областей /гран =1700 Гц, на рисунке отмечена пунктиром. Прочие параметры равны: - скорость звука c = 340 м/с; - расстояние между микрофонами d = 5 см = 0,05 м.
Зависимость модуля весового коэффициента от частоты для максимального угла между направлениями на источники сигналов после процедуры порогового ограничения Как видно из рисунка 2.6, в первой области порог не достигается, во второй области порог равен 1,5.
Для случая ф =5 0 ,(р"=-5 0 (источники находятся близко друг от друга) при сохранении прочих параметров второй и последующие всплески оказываются за верхним пределом диапазона слышимых частот, граница областей /гран =19505 Гц. На рис. 2.7 приведен в крупном масштабе график частотной зависимости модуля весового коэффициента в первой области с учетом порогового ограничения на частотах, близких к нулю.
По аналогии были проведены модельные эксперименты для произвольных значений углов (р и (р". При этом использовались два постоянных пороговых значения весовых коэффициентов (100 для первой области, 1,5 для второй области), изменялась только граница областей соответствии с (2.15).
Таким образом, прямая адаптация построения микрофонной антенной решетки применительно к широкополосному речевому сигналу приводит к искажению речевого сигнала. Для минимизации искажений проведены модельные эксперименты, по результатам которых даны рекомендации по выбору весовых коэффициентов в частотной области, используемых для получения взвешенного сигнала на выходе микрофонной решетки. Эти рекомендации сводятся: 1) к определению границы между двумя областями слышимых частот, которым соответствуют два пороговых значения весовых коэффициентов; 2) к необходимости установления пороговых значений весовых коэффициентов. Эти пороговые значения должны одновременно удовлетворять требованиям отсутствия шипения и свиста в сигнале, отсутствия ухудшения слышимости согласных звуков и отсутствия тембральных искажений. Окончательные рекомендации получены по результатам экспертных статистических испытаний, подробно описанных в четвертой главе.
Как показано в [16], антенная решетка (АР), принимающая узкополосный сигнал, обладает свойством увеличивать отношение мощности полезного сигнала к средней мощности шума. Рассмотрим некоторые математические соотношения.
Пусть S = \S1,S2,...,SN) - нормированный вектор комплексных амплитуд сигналов на выходах приемников решетки, возбужденных монохроматической волной от одного источника. Для частного случая эквидистантной линейной решетки из N приемников, принимающей плоскую монохроматическую волну (рис. 2.8), вектор S имеет вид [16]:
Определение направлений на источники узкополосных сигналов с помощью метода Кейпона
Как следует из рисунков, графики разрешающих функций имеют такую же форму, как и полученные ранее графики разрешающих функций при теоретическом анализе влияния собственных шумов (рис. 3.1-3.4). Во-первых, точки максимума разрешающих функций близки по своим значениям к истинным направлениям на источники сигналов. Во-вторых, с уменьшением ОСШ максимумы разрешающих функций сначала становятся менее выраженные, а затем смещаются вплоть до “слипания” в одну точку.
Отметим принципиальные отличия разрешающих функций для реального широкополосного речевого сигнала от теоретических разрешающих функций. Во-первых, как уже отмечалось в пункте 3.2.2, при отсутствии шума теоретические разрешающие функции имеют вид импульсных всплесков, а разрешающие функции для реального сигнала – более размытый вид. Во-вторых, для каждого ОСШ минимумы разрешающих функций для реального сигнала оказываются больше, чем минимумы соответствующих теоретических разрешающих функций (то есть для каждого ОСШ максимумы разрешающих функций реального сигнала менее выраженные, чем максимумы теоретических разрешающих функций). Для более подробного анализа следует рассмотреть графики зависимостей ошибки в определении направления прихода широкополосного сигнала одного из источников от ОСШ на разных частотах (рис. 3.14), полученные также с помощью серии модельных экспериментов.
Как уже было сказано при анализе теоретических разрешающих функций и теоретических зависимостей А "( ) (рис. 3.5-3.7), для всех частот уменьшение ОСШ приводит к увеличению ошибки в определении направления прихода сигнала. Для низких частот ошибка появляется при больших значениях ОСШ и при уменьшении ОСШ быстрее возрастает. Эти утверждения остаются справедливыми и для зависимостей, представленных на рис. 3.14.
Разрешающие функции для частоты 2500 Гц Анализируя полученные графики, мы снова убеждаемся в том, что точки максимума разрешающих функций близки по своим значениям к истинным направлениям на источники сигналов. Однако с уменьшением ОСШ максимумы разрешающих функций сначала становятся менее выраженные, а затем смещаются в один максимум. Характерно, что для случая близкого расположения источников “слипание” двух максимумов разрешающей функции в один происходит при большем ОСШ, чем для случая их разнесения по направлениям. Теперь обратимся к графикам зависимостей ошибки в определении направления прихода широкополосного сигнала одного из источников от ОСШ на разных частотах (рис. 3.19), полученным с помощью серии модельных экспериментов для случая близкого расположения источников = —5 , (р" = 5 . Рисунок 3.19 - Зависимости ошибки в определении направления прихода сигнала от ОСШ для углов ф = — 5 , (р" = 5 По представленным зависимостям можно сделать следующие выводы. 1. Для всех частот уменьшение ОСШ приводит к увеличению ошибки в определении направления прихода сигнала. 2. Ошибка в определении прихода сигнала на низких частотах оказывается более явно выраженной, то есть низкочастотные компоненты более чувствительны к воздействию шума.
В пункте 3.1.2 отмечалось, что ошибка в определении направления прихода сигнала влечет за собой неточную настройку решетки, что, в свою очередь, приводит к неполному подавлению мешающего сигнала при пространственном разделении. Выведем зависимость степени подавления мешающего сигнала от угла расстройки решетки (то есть от ошибки в определении направления на источник).
Обратимся к полученным в главе 2 формулам для расчета весовых коэффициентов при пространственном разделении сигналов (2.12 а), (2.12 б). Пусть на решетку из двух идентичных ненаправленных микрофонов снова воздействуют два источника широкополосных акустических сигналов с плоскими волновыми фронтами (см. рис. 2.2). Первый источник (источник полезного сигнала) находится под углом (р , точно совпадающим с углом настройки решетки. Второй же источник (источник мешающего сигнала) находится под углом, отличающимся от угла настройки решетки ср" и равным ср"+А(р". При условии точного совпадения угла настройки решетки с направлением на источник полезного сигнала гарантирован прием полезного сигнала без искажений. В этом случае отклик решетки на источник полезного сигнала с точностью до постоянной будет равен отклику первого микрофона на источник полезного сигнала. Поэтому при дальнейшем выводе формул рассмотрим процесс обработки только мешающего сигнала. Пусть -V (0 _ составляющая сигнала на выходе первого микрофона от источника мешающего сигнала, X yjco) - ее спектр, x2"(t) - составляющая сигнала на выходе второго микрофона от источника мешающего сигнала, X2"(jco) - ее спектр. Для принятой модели сигналов, в соответствии с (2.4), имеем:
Чувствительность микрофонной решетки к допускам изготовления микрофонов
Одна из главных проблем в достижении и обеспечении требуемых параметров микрофонной решетки - несоответствие между характеристиками каналов, вызванное разбросом параметров микрофонов. Алгоритмы формирования диаграммы направленности микрофонной решетки подразумевают согласованность (идентичность) каналов микрофонов [26, 28]. Даже для простейшего алгоритма задержки и суммирования при неидентичности каналов снижается эффективность обработки сигнала. Специализированные алгоритмы тем более оказываются чувствительными к неидентичности каналов [63].
Обеспечение согласованности каналов является сложной и дорогой процедурой, особенно при обработке широкополосного сигнала. Известные способы обеспечения идентичности каналов следующие: калибровка каждой пары микрофон-предусилитель [64], выбор микрофонов с близкими по значению параметрами, калибровка с помощью программного обеспечения [65-67], в том числе процедура автокалибровки в режиме реального времени [68].
В [63] предлагается методология расчета и результаты анализа чувствительности параметров формирователя диаграммы направленности к конструкционным допускам, применяемым при производстве микрофонов. В частности, имитируются отклики микрофонов с различными параметрами на тестовый сигнал с применением метода Монте-Карло и исследуется ослабление собственного шума решетки в зависимости от различий в АЧХ и ФЧХ микрофонов (рис. 4.5, а и б соответственно).
Результаты испытаний в [63] показывают более высокую чувствительность параметров формирователем ДН к различиям в АЧХ, чем к различиям в ФЧХ, из чего заключается, что в ряде случаев для обеспечения приемлемого шумопонижения корректировка ФЧХ каналов может не требоваться.
Исследуем проблему неидентичности каналов применительно к задаче пространственного разделения сигналов, то есть подавления мешающего сигнала при выделении полезного сигнала. Выведем зависимость степени подавления мешающего сигнала при использовании микрофонов, имеющих различные чувствительности.
Рассмотрим процесс прохождения мешающего широкополосного сигнала с плоским волновым фронтом через микрофонную решетку, состоящую из двух микрофонов (см. рис. 2.2, б). Источник полезного сигнала, находящийся под углом (р , считаем выключенным. Пусть X1"yjco) и X2"(jсо)- спектральные плотности сигналов на выходах, соответственно, первого и второго микрофонов от источника мешающего сигнала. Следуя теории линейных систем [19], запишем соотношения для принятой модели сигналов и геометрии их распространения: - если микрофоны идентичны (см. (2.4)): X (jco) = v Из (4.7) следует, что в частном случае, при полной идентичности микрофонов, т.е. при P(jco,cp") = 1, отклик решетки на мешающий сигнал будет равен нулю. Если же степень неидентичности микрофонов отлична от единицы, то отклик настроенной решетки будет содержать не только полезный, но и ненулевой мешающий сигнал.
Заметим, что если и полезный, и мешающий сигналы, воздействующие на решетку, имеют одинаковые мощности, то степень подавления мешающего сигнала, то есть отношение мощности мешающего сигнала на входе решетки к мощности мешающего сигнала на выходе решетки, можно интерпретировать, как выходное отношение мощностей полезного и мешающего сигналов.
Оценим количественно теоретический диапазон значений величины Л ЭБ " Поскольку нас интересует степень подавления мешающего сигнала как функция неидентичности микрофонов ААдБ"(/?), то для упрощения расчетов будем считать, что степень неидентичности /3 не зависит от частоты со и угла прихода мешающего сигнала ср". Верхний диапазон значений ААдБ"(р) соответствует случаю, когда знаменатель в (4.8) принимает по абсолютной величине наибольшее значение, равное 2: Для исследования влияния разницы в чувствительностях микрофонов на степень подавления мешающего сигнала было проведено моделирование в среде Матлаб. В качестве мешающего сигнала был создан речевой сигнал в формате звукового файла “wav” со следующими параметрами: длительность 25 секунд, частота дискретизации 48 кГц, разрядность 16 бит на отсчет. Далее задавались разные значения разности чувствительностей микрофонов (5 как в децибелах, так и в относительных единицах и имитировался процесс воздействия этого сигнала на вырожденную микрофонную решетку под углом р" = 40 . Расстояние между микрофонами было выбрано равным d = 0,05 м, скорость звука с = 340 м/с. Для перехода в частотную область был применен метод выборок (окно Ханна, 2048 отсчетов, перекрытие 50%, временной период 42,7 мс) и использовано дискретное преобразование Фурье (частота дискретизации 48 кГц, шаг по частоте 23,4 Гц).
При расчете весовых коэффициентов в (2.12) помимо угла "=40 был произвольно задан угол прихода фиктивного полезного сигнала р = -40 . полное подавление мешающего сигнала, приходящего по направлению р" = 40 , и выделение полезного сигнала с минимальными искажениями, приходящего по направлению р = -40 . Поскольку при проведении моделирования отсутствовал полезный сигнал, то выполнялось только подавление мешающего сигнала. Поэтому степень подавления мешающего сигнала рассчитывалась, как отношение энергий воздействующего на решетку и прошедшего обработку сигналов для каждого значения (5 .
На рисунке 4.6 изображены: пунктирными линиями 1 и 2 - границы теоретического диапазона значений Д4ж"(/?), соответствующие минимальному и– экспериментальная зависимость степени подавления мешающего сигнала от разницы в чувствительностях микрофонов. Рисунок 4.6 – Зависимость степени подавления мешающего сигнала от степени неидентичности микрофонов. В соответствии с рисунком 4.6, экспериментальная кривая 3 попадает в теоретический диапазон значений, границы которых определяются кривыми 1 и 2. По кривой 3, исходя из требований психоакустики [21, 69] к степени подавления мешающего сигнала, звучащего на фоне полезного сигнала, может быть определена допустимая степень неидентичности микрофонов. Соответственно, микрофонная решетка должна быть укомплектована микрофонами, удовлетворяющими рассчитанной степени неидентичности.