Электронная библиотека диссертаций и авторефератов России
dslib.net
Библиотека диссертаций
Навигация
Каталог диссертаций России
Англоязычные диссертации
Диссертации бесплатно
Предстоящие защиты
Рецензии на автореферат
Отчисления авторам
Мой кабинет
Заказы: забрать, оплатить
Мой личный счет
Мой профиль
Мой авторский профиль
Подписки на рассылки



расширенный поиск

Компьютерная оценка качества передачи звуковых вещательных сигналов Хрянин Евгений Анатольевич

Компьютерная оценка качества передачи звуковых вещательных сигналов
<
Компьютерная оценка качества передачи звуковых вещательных сигналов Компьютерная оценка качества передачи звуковых вещательных сигналов Компьютерная оценка качества передачи звуковых вещательных сигналов Компьютерная оценка качества передачи звуковых вещательных сигналов Компьютерная оценка качества передачи звуковых вещательных сигналов Компьютерная оценка качества передачи звуковых вещательных сигналов Компьютерная оценка качества передачи звуковых вещательных сигналов Компьютерная оценка качества передачи звуковых вещательных сигналов Компьютерная оценка качества передачи звуковых вещательных сигналов Компьютерная оценка качества передачи звуковых вещательных сигналов Компьютерная оценка качества передачи звуковых вещательных сигналов Компьютерная оценка качества передачи звуковых вещательных сигналов
>

Диссертация - 480 руб., доставка 10 минут, круглосуточно, без выходных и праздников

Автореферат - бесплатно, доставка 10 минут, круглосуточно, без выходных и праздников

Хрянин Евгений Анатольевич. Компьютерная оценка качества передачи звуковых вещательных сигналов : Дис. ... канд. техн. наук : 05.12.04 : Москва, 2003 210 c. РГБ ОД, 61:04-5/770-5

Содержание к диссертации

Введение

Глава 1 Обзор искажений сигналов звукового (СЗВ) вещания в каналах передачи ... 11

1.1 Искажения СЗВ в аналоговых трактах 11

1.2 Искажения СЗВ в цифровых трактах с ИКМ 16

1.3 Искажения СЗВ в цифровых трактах с компактным представлением ЗС 18

Выводы по главе 1 21

Глава 2 Аналитический обзор методов оценки качества передачи СЗВ 22

2.1 Субъективные методы оценки (субъективно-статистические испытания) 22

2.2 Объективные методы оценки 26

2.3 Психоакустические методы оценки 32

Выводы по главе 2 40

Глава 3 Методика анализа искажений СЗВ на основе статистических распределений их параметров 41

3.1 Выбор информативных параметров СЗВ и введение в метод комплексного статистического оценивания 41

3.2 Алгоритмы нахождения статистических параметров СЗВ 82

Выводы по главе 3 86

Глава 4 Анализ искажений СЗВ по методу Комплексного статистического оценивания ... 88

4.1 Выбор музыкального материала 88

4.2 Создание фильтров и моделей для анализа 95

4.3 Разработка программного обеспечения 104

4.4 Анализ изменений энергетических параметров 105

4.5 Анализ изменений спектральных параметров 110

4.6 Анализ изменений параметров формы 116

Выводы по главе 4 118

Глава 5 Составление таблиц соответствия изменений статистических параметров СЗВ результатам субъективно-статистических испытаний ...119

5.1 Таблицы соответствия по критерию заметности 119

5.2 Таблица соответствия по критерию балльной оценки 122

5.3 Таблица соответствия по критерию предпочтительности 123

5.4 Методика проведения процедуры оценивания качества передачи СЗВ 129

Выводы по главе 5 135

Заключение...—...136

Список литературы... 138

Введение к работе

Исследования и практические разработки в области оценки качества звукопередачи ведутся с момента появления звукового вещания как отрасли. Однако в настоящее время интерес к ним увеличился. Это вызвано острой конкуренцией на новом рынке услуг, открывшимся с переходом от централизованного малопрограммного вещания к децентрализованному многопрограммному, внедрением техники передачи, обработки и кодирования сигналов в цифровой форме, а также результатами последних исследований в области анализа звуковых сигналов и звуковосприятия.

Эффективность систем вещания и связи, их конкурентоспособность, технико-экономические показатели во многом определяются степенью согласования параметров канала передачи не только со свойствами сигнала, но и с особенностями восприятия звукового сигнала абонентами — слушателями. Эффективность такого согласования, в конечном итоге, определяет качество передачи сигнала по каналу звукового вещания.

Качество передачи и методы его оценки определяются соответствующими нормативными документами. В нашей стране это ГОСТ 11515-91. Однако в связи с бурным развитием и внедрением технологий адаптивной психоакустической обработки вещательного сигнала, существующие методики оценки качества передачи с использованием малокомпонентных тестовых сигналов оказываются малоэффективными. Такое положение приводит к появлению в каналах звукового вещания трактов и звеньев, контроль которых возможен только с использованием субъективно-статистических испытаний (ССИ). Основным недостатком ССИ является их высокая трудоемкость и необходимость выведения канала из эксплуатации на длительное время.

Таким образом, актуальность диссертационной работы обусловлена необходимостью выявления и оценки ненормируемых искажений СЗВ в существующих адаптивных трактах. Для этого необходим переход к нормированию искажений в каналах и трактах на основе статистических свойств реальных вещательных сигналов. Все вышесказанное определило цель данной работы — разработка методики объективной оценки качества передачи вещательного сигнала по современным адаптивным каналам и трактам, а также обоснование и выбор технических решений, обеспечивающих возможность объективной оценки качества передачи реального вещательного сигнала без вывода канала из эксплуатации.

В качестве методов исследования в работе использовались элементы теорий звуковосприятия и звукообразования, методы математической статистики, спектрального и корреляционного анализа, а также методы оценки качества вещательного сигнала. Все эксперименты выполнены с использованием современной вычислительной техники и доработанного автором программного обеспечения, созданного научной группой кафедры РВ и ЭА.

Проблемам анализа звуковых сигналов посвящены работы ученых В. В. Фурдуева, Л. В. Шитова, В. А. Нюренберга, С. Л. Мишенкова, Б. Р. Левина, А. А. Харкевича, А. В. Никонова, Л. 3. Папернова, 3. Н. Резвякова, В. С. Саватеева, Дж. Беллами, М. А. Сапожкова. Вопросы оценки качества передачи сигнала вещания и связи рассмотрены в работах И. Е. Горона, Г.Б. Аскинази, С. Л. Мишенкова, В. П. Гученко, Ю. А. Ковалгина, М.Л. Сурова, И. Г. Дрейзена.

Работа является естественным продолжением исследований, которые проводились и проводятся на кафедре РВ и ЭА под руководством и при участии таких ученых и специалистов, как: И. Г. Дрейзен, И. Е. Горон, В. А. Нюренберг, Л. 3. Папернов, М. А. Сапожков, С. Л. Мишенков, О. Б. Попов, С.Г. Рихтер, Г. А. Донцова, С.А.Литвин.

Научная новизна диссертационной работы заключается в следующем:

1. Показано, что существующее метрологическое обеспечение не позволяет осуществлять объективный контроль качества передачи вещательного сигнала, прошедшего тракты с адаптивной обработкой, включая компактное представление. Отобраны наиболее информативные параметры реального вещательного сигнала, формируемые на коротких временных интервалах и позволяющие использовать изменение интегральных статистических распределений параметров для формирования объективной оценки качества передачи, коррелированной с субъективной оценкой.

2. Разработана шкала соответствия между изменением предложенных интегральных статистических распределений параметров вещательного сигнала и заметностью изменений сигнала, которая позволила ограничить набор используемых параметров тремя группами: энергетической, спектрально-кепстральной и группой параметров формы аналитической огибающей вещательного сигнала. Предложено энергетические параметры вычислять на длительности 200 мс, спектрально-кепстральные параметры — на длительности 20 мс, а параметры формы оценивать на длительности 2 мс, что совпадает с временем интеграции слуха по громкости, частоте и с порогом восприятия изменения огибающей сигнала, соответственно.

3. Разработан способ повышения точности спектральной оценки, учитывающий особенности вещательных сигналов, включающих звуковые объекты ограниченной длительности порядка 40 мс. Способ основан на быстром преобразовании Фурье комплексно-представленного многократно транспонированного в пределах бина сигнала с точностью 0,5 дБ по амплитуде, 1,5 Гц по частоте, 8° по фазе, что позволяет приблизиться к возможностям периферического слухового анализатора. Предложенный способ позволяет производить оценку АЧХ тракта и выявлять нелинейные искажения на реальном вещательном сигнале.

4. Предложены дополнения к существующим нормативным документам в виде разработанной методики комплексного статистического оценивания качества передачи сигналов звукового вещания, позволяющие контролировать современные адаптивные каналы и тракты на реальном сигнале без вывода их из эксплуатации, с автоматизацией процесса формирования оценки по критерию заметности искажений, балльной оценки качества передачи. Определен также оптимальный диапазон значений предложенных в работе статистических параметров вещательного сигнала по критерию предпочтительности для информационно-музыкальных программ.

Практическая значимость работы заключается в следующем:

1. Разработана методика оценивания качества передачи СЗВ в трактах с адаптацией параметров к передаваемому сигналу, позволяющая формировать объективную оценку качества передачи в каналах, заведомо не обеспечивающих сохранение формы сигнала и контролируемых только с использованием ССИ. Предлагаемая методика позволяет проводить оперативную оценку на реальном вещательном сигнале, обеспечивая результаты оценки близкие к результатам ССИ.

2. Разработано и внедрено программное обеспечение, позволяющее реализовать автоматизированную аппаратную оценку качества передачи вещательного сигнала без вывода тракта передачи из эксплуатации.

3. Создана база «критических» звуковых сигналов и часовых фрагментов реальных радиовещательных программ для оценки качества передачи по каналам и трактам звукового вещания, использующим адаптивные алгоритмы обработки сигнала.

Положениями, выносимыми на защиту, являются следующие:

1. В настоящее время все каналы и тракты звукового вещания являются адаптивными. В то же время существующая нормативная база, контролирующая сохранение формы в каналах передачи, не обеспечивает объективную оценку качества передачи по современным адаптивным аналоговым и цифровым каналам, не предполагающим сохранение формы сигнала. В настоящее время оценка качества таких каналов возможна только с использованием трудоемких ССИ, что сужает область применения существующей нормативной базы.

2. Объективная оценка качества передачи в каналах, коррелированная с субъективной оценкой, может быть сформирована на основе комплексного анализа изменений статистических параметров вещательного сигнала по критериям заметности его изменений, балльной оценки и по критерию предпочтительности звучания. При формировании оценки используются энергетические, спектральные, кепстральные параметры, а также параметры формы аналитической огибающей вещательного сигнала, вычисляемые на длительностях, соизмеримых с временем интеграции слуха по громкости (200 мс), частоте (20 мс) и временем порогового восприятия огибающей сигнала (2 мс).

3. Повышение точности спектральной оценки на основе результатов быстрого преобразования Фурье комплексно представленного многократно транспонированного в пределах бина сигнала, позволяет приблизить точность оценки спектральных составляющих к возможностям периферического слухового анализатора: 0,5 дБ по амплитуде, 1,5 Гц по частоте, 8° по фазе. Применение способа позволяет производить оценку АЧХ тракта нереальном вещательном сигнале и выявлять нелинейные искажения.

4. В задачах сравнительного анализа дискретизированных сигналов возникает необходимость предварительного нормирования исследуемых сигналов, которое, как правило, осуществляется по пиковому уровню. При анализе звуковых сигналов нормирование по вероятности превышения заданного уровня предпочтительнее нормирования по максимальному значению, что согласуется с физикой звуковосприятия. В сочетании с повышением точности спектрального анализа это позволяет приблизить результаты анализа изменений статистических параметров вещательных сигналов к результатам ССИ. 

Искажения СЗВ в цифровых трактах с ИКМ

В эксплуатируемых цифровых трактах существуют несколько причин появления искажения сигнала: переход от одного закона компандирования к другому и передискретизация.

Если говорить о компандировании, то переход от 16-битного кодирования к 13 битному (8 бит информации), распространенному в Европе (А-Law compressing или CCITT standard G.711), с последующим возвратом к 16-битному кодированию приводит к появлению шумов с уровнем до - 32 дБ. При этом шумы компандирования имеют характерный равномерный спектр («белый шум»). Это и шумы на фоне сигнала, и модуляция низкоуровневых сигналов высокоуровневыми, аналогичная модуляции в однополосных системах шумоподавления (DNL).

Если передискретизация выполняется без преобразования цифрового сигнала в аналоговую форму, то для получения новой совокупности отсчетов используется процедура интерполяции. Однако и в этом случае возникают искажения, связанные с погрешностью преобразования и наложением спектров (при уменьшении частоты дискретизации). При многократной передискретизации шумы накапливаются. В качестве примера ошибки рассмотрим пример снижения частоты дискретизации с 48 кГц к 32 кГц, затем возврат к исходной частоте 48 кГц (рис. 1.3), смоделированный нами в звуковом редакторе Cool Edit. Из рисунка видно, что уровень разностного сигнала достигает -13 дБ относительно уровня исходного сигнала. На рис. 1.4 представлен спектр сигнала ошибки.

Тезис о том, что «человеческий слуховой анализатор не требует идеального сохранения сигнала», развитый Цвиккером и Фельдкеллером [4], [5], положил начало бурному развитию систем компактного представления, то есть алгоритмов устранения избыточности в сигнале. Естественно, что подобные алгоритмы, активно воздействую на сигнал, вносят изменения в него (насколько они оправданы — тема отдельной работы). Особенность всех таких алгоритмов является их высокая сложность и неоднозначность вносимых ими искажений. Из основных замеченных изменений, вносимых в цифровой сигнал можно отметить: огрубление цифрового описания сигнала за счет снижения точности представления сигнала в каждой полосе, отбрасывание части информации, не воспринимаемой из-за частотной и временной маскировки в слуховом анализаторе, затягивание фронтов, близкое по продолжительности к величине задержки сигнала при обработке и др. При этом, фиксируемые на слух отличия обработанного сигнала от эталонного, скорее всего, будут связаны с изменениями динамики (вследствие затягивания фронтов) и пик-фактора (гром-костного динамического диапазона) компрессированного сигнала, что наиболее ярко должно проявляться на звуковых фрагментах, содержащих атаки. Изменения спектра сигнала за счет огрубления его цифрового описания неизбежно приводят к неоднозначному изменению характера звучания, придавая звуку новые (отсутствующие в оригинале) отличительные признаки. Здесь же мы лишь предлагаем качественно рассмотреть эти изменения в целом.

На рис. 1.5 представлен один и тот же часовой звуковой фрагмент радиопередачи на входе и выход алгоритма МРЗ. Для наглядности третий рисунок представляет разностный сигнал, то есть непосредственно "шум" алгоритма MPEG. Здесь два сигнала нормированы по мощности. Уровень разностного сигнала составляет —9,3 дБ по отношению к уровню исходного сигнала. Очевидно, что изменения в сигнале значительны и требуют нормировки. На рис. 1.6 представлен спектр сигнала ошибки. Очевидно, что он широкополосен.

Объективные методы оценки

В статье [18] Cabot так оценивает отношение субъективных и объективных методов анализа ЗС: «Звук — это область тесного переплетения искусства и науки. В конечном счете все решает субъективное восприятие звучания слушателем. Но разработка звуковой аппаратуры требует быстрого и повторяемого метода оценки качества. К сожалению, ССИ не удовлетворяют ни тому, ни другому требованию. А объективные измерения, даже не будучи идеальными и полностью законченными, способны помочь «отделить зерно от плевел».

До начала 1960-х годов обычно довольствовались оценкой качества работы звукового оборудования по результатам периодически проводимых измерений и непрерывного контроля на слух. Действительно объективные методы оценки качества ЗС появились как способ оперативной оценки искажений ЗС в тех случаях, когда на ССИ нет времени. Однако скоро стало ясно, что на грамотно проводимые ССИ почти никогда нет времени (см. п.2.1), и объективные методы оценки качества ЗС стали основными, тогда как к ССИ прибегали в случае необходимости тестирования принципиально новой звуковой аппаратуры.

Объективные методы оценки качества ЗС в чистом виде — это измерение параметров ЗС (как акустического, так и электрического сигналов). Проводить оценку можно на основе тестовых и реальных сигналов.

Определенное повышение интереса к объективным методам оценки качества каналов и трактов ЗВ в нашей стране пришлось на 60-е годы XX века. Это фундаментальная работа под руководством И.Е.Горона [19], а позже работы под руководством В.А.Нюренберга [20], [21]. В результате этих исследований была разработана стройная система объективного контроля качества каналов и трактов ЗВ, сведенная в ГОСТ 11515-65 "Каналы и тракты звукового вещания. Основные параметры качества. Методы измерений". За три с лишним десятилетия этот ГОСТ [1] несколько раз пересматривался, обогащался новыми параметрами. Стали более конкретными требования к междугородним каналам звукового вещания, введены и нормированы специфические параметры низкочастотных и высокочастотных трактов трехпро-граммного проводного вещания, упомянуты некоторые параметры цифровых вещательных трактов. Кроме того, сегодня разработаны компьютерные системы оценки качества каналов и трактов на основе ГОСТ 11515-91. Здесь можно отметить «Измеритель звуковых каналов» (ИЗК)1 разработанный в Научно-техническом комплексе (НТК-18) «ИМОС» при НИИ Телевидения, позволяющий проводить автоматизированное измерение параметров каналов звукового вещания (ЗВ) и тональной частоты (ТЧ) в соответствии с ГОСТ 11515-91, ГОСТ 21655 и рекомендациями MKKTT(j21, J23, G 712). Сюда же относится и «Аудиоанализатор компьютерный» АК-1, разработанный научно-производственной фирмой НИИР-КОМ1. Согласно рекламе2 «Аудиоанализатор компьютерный АК-1 осуществляет прецизионные цифровые измерения и непрерывный контроль параметров сигналов звукового моно- и стереовещания и каналов их передачи в соответствии с ГОСТ 11515, "Нормами на электрические параметры каналов звукового вещания, организованных в радиорелейных системах передачи на поднесущих частотах и в спутниковых системах передачи", "Правилами технической эксплуатации средств вещательного телевидения", Рекомендациями МСЭ».

Нормативные документы, подобные ГОСТ 11515-91, существуют и в других странах. Параметры качества и нормы на них для каналов звукового вещания приведены в рекомендациях международных организаций МККР и МККТТ. В МККР рекомендации по определению параметров качества и норм на них входят в том XII, а в МККТТ - в том III. Кроме того, следует упомянуть, немецкий DIN 45-500 (для бытовой аппаратуры). Рекомендации МККР и МККТТ пересматриваются один раз в 4 года со сдвигом в 2 года между пленарными совещаниями этих организаций. По перечню характеристик каналов ЗВ (параметров качества и норм на них) соответствующие рекомендации МККР и МККТТ совпадают. В рекомендациях МККР (1990 г.) и МККТТ (1988 г.) рассматриваются следующие типы каналов: 1. Канал звукового вещания с полосой частот 15 кГц. Этот тип канала рекомендуется для передачи монофонических программ ЗВ высокого качества и стереофонических программ ЗВ. Характеристики канала звукового вещания, обеспечивающие передачу высококачественных монофонических и стереофонических программ, определяются в Реко- фонических программ, определяются в Рекомендации 505-4 МККР и J.21 МККТТ. 2. Канал звукового вещания с полосой частот 10 кГц. Этот тип канала рекомендуется для передачи монофонических программ (Рек. J.22 МККТТ). 3. Узкополосные каналы ЗВ (с полосами частот 5 и 7 кГц). Характеристики этих каналов изложены в Рекомендациях J.23 МККТТ и МККР. Эти типы каналов рекомендуются для организации большого числа временных международных или национальных каналов ЗВ, предназначенных для передачи комментариев и репортажей о событиях, представляющих широкий интерес, а также для постоянных каналов ЗВ, используемых в основном для передачи речи или в качестве соединительной линии между студиями радиодомов и KB, СВ, ДВ радиовещательными передатчиками. Возвращаясь к ныне действующему ГОСТ 11515-91 [1], можно отметить основные принципиальные его недостатки (частично этот вопрос был затронут в предыдущей главе данной работы). 1. Привязка к тестовым сигналам, что упрощает методику оценки каче-ства, но сужает диапазон фиксируемых искажений. 2. Использование методики измерений при отключенной аппаратуре обработки динамического диапазона (компрессоры, экспандеры, шумопода-вители, АРУРы). Существующие трудности в оценке искажений ЗС с использованием тестовых сигналов заставили специалистов в области звука искать другой подход. Тенденция усложнения тестовых сигналов для оценки все новых искажений привела к идее использования реальных вещательных сигналов, которые применяются при тех же ССИ. Именно с музыкальных и речевых сигналов начиналась работа под руководством И.Е. Горона, результатом которой стал ГОСТ 11515.

Алгоритмы нахождения статистических параметров СЗВ

Оценка качества передачи вещательного сигнала включает следующие основные операции : 1. АЦП исходного и прошедшего канал передачи сигналов. 2. Нормализацию сигналов по уровню, превышаемому в течение 98% времени. 3. Синхронизацию сигналов. 4. Анализ сигналов в соответствии с МКСО, который предполагает вычисление статистики ряда параметров и их изменений на основе сравнения прошедшего обработку и исходного сигналов. 5. Формирование комплексной оценки изменения сигнала в процессе передачи, а также АЧХ канала на реальном вещательном сигнале. Вывод данных на экран, на печать и сохранение в базе данных. Анализируется следующая группа статистических характеристик: 1) Энергетические характеристики (относительная средняя мощность в двух разновидностях, отличающихся способом нормирования:ОСМс и ОСМк). 2) Характеристики формы (анализ на интервалах нарастания и спада фильтрованной Гильбертовской огибающей сигнала): 3)

Результатом анализа каждой группы параметров являются нормированные статистические частоты появления значений (НЧПЗ) параметра. На основании полученных НЧПЗ находится интегральное отклонение (ИО) НЧПЗ как усредненное значение абсолютных отклонений частот появления значений параметров сигналов до и после прохождения канала. Для случая спектральных характеристик дополнительно выводятся графическое представление АЧХ канала, найденной по мгновенным амплитудным спектрам и данные о среднеквадратичном отклонении (СКО) от идеальной АЧХ. Сохранение базе данных Алгоритмы нахождения отдельных статистических параметров сигнала представлены ниже. Алгоритм нахождения энергетических параметров включает в себя проведение следующих операций для обработанного и исходного сигналов: сегментации сигнала на интервалы, соответствующие времени интеграции слуха (200 мс); вычисления на каждом из интервалов средней мощности; нормирование средней мощности к квадрату значения номинального уровня (ОСМк) или квадрату значения уровня, максимального на интервале (ОСМс); разбиения полученного вариационного ряда значений ОСМ на N интервалов (N 100); подсчета НЧПЗ ОСМ в каждом из N интервалов; сведения вместе статистических данных исходного и искаженного сигналов и расчета ИО НЧПЗ ОСМ на всем диапазоне появления значений. На последнем этапе производится сравнение статистических характеристик ОСМ для обработанного и исходного сигналов. Алгоритм нахождения параметров формы включает в себя проведение следующих операций для исходного и обработанного сигналов: вычисления огибающей сигнала (на основе преобразования Гильберта); НЧ фильтрации огибающей; сегментации НЧ огибающей на интервалы, соответствующие атакам и спадам сигнала; вычисления крутизны огибающей на интервалах нарастания и спада; разбиение диапазона значений крутизны огибающей на N интервалов (N 100); подсчета НЧПЗ крутизны в каждом из N интервалов; сведения вместе статистических данных исходного и искаженного сигналов и расчета ИО НЧПЗ крутизны атак и спадов на всем диапазоне появления значений. На последнем этапе производится сравнение статистических характеристик формы огибающей для обработанного и исходного сигналов. Используемый алгоритм формирования оценок мгновенного амплитудного спектра (MAC) сигнала вещания предполагает: наложение оконной функции на исходный сигнал; вычисление аналитического сигнала на основе преобразования Гильберта; умножение полученного колебания на набор комплексных синусоид для получения промежуточных оценок спектра (формирование транспонированных по частоте сегментов сигнала); БПФ-анализ полученных последовательностей; формирование суммарной оценки мгновенного спектра; прореживание суммарной оценки по локальным максимумам амплитудного спектра. В целом, методика анализа спектральных параметров включает следующие операции: вычисление МАС на интервалах, соответствующих времени интеграции периферического слухового анализатора по заметности изменения спектрального состава сигнала; вычисление среднестатистической тенденции изменения мгновенных спектров сигнала после обработки — «средней АЧХ»; вычисление СКО «средней АЧХ» от идеальной АЧХ канала; вычисление квантилей (0.1 , 0.2, 0.3, 0.4, 0.5, 0.6, 0.7, 0.8, 0.9) и дисперсии изменения мгновенных спектров сигнала после обработки; вычисление кепстра по имеющемуся амплитудному спектру путем логарифмирования и повторного БПФ и получение вариационного ряда значений кепстра, распределенных по длительности звукового сигнала; вычисление вариационного ряда пик-фактора кепстра; подсчета НЧПЗ пик-фактора кепстра; расчета ИО НЧПЗ пик-фактора кепстра. На последнем этапе производится сравнение спектральных статистических характеристик для обработанного и исходного сигналов.

Создание фильтров и моделей для анализа

Все необходимые устройства для внесения искажений и анализа параметров сигналов создавались программным путем либо использовались как готовый программный продукт. Основным рабочим программным пакетом является звуковой редактор Cool Edit 2000 компании Cintrillium Software Corporation. Эксперимент основан на внесении в музыкальные фрагменты искажений, максимально идентичных вносимым искажениям в работе [19]. Это важно, поскольку в дальнейшем для анализа мы используем данные субъективно-статистических испытаний тех лет. Ограничение полосы частот Использовались фильтры на основе Cool Edit 2000. Были выбраны фильтры «быстрого преобразования Фурье» (БПФ) с длиной окна 8196 точек. Уровень ограничения не менее -90 дБ. Для анализа влияния ограничения частотного диапазона снизу были отобраны пять жанров с наиболее значительным спектральным составом в области НЧ: оркестр, рояль, симфонический оркестр, бас и орган. Соответст 96 венно, в эксперименте с ограничением частоты сверху была использованы пять жанров с наиболее значительным спектральным составом в области ВЧ: оркестр, сопрано, скрипка, хор, симфонический оркестр (см. спектры фрагментов). Подобный подход согласуется с работами И.Е. Горона [19]. Двусторонние спады на краях частотного диапазона Фильтры строились на основе БПФ фильтров редактора Cool Edit 2000 с размером окна в 8196 точек. Все спады — плавные1, т.е. спад к указанному уровню (3 дБ) за 3-4 октавы. В соответствие с [19], были построены 9 фильтров. Их амплитудно-частотные характеристики приведены в Приложении 2 (рис.П2.1-П2.9). При анализе влияния двусторонних спадов были использованы все восемь жанров для каждого вида ограничения полосы частот, что дало усреднение для каждой точки графиков по восьми значениям.

В качестве фильтров использовались встроенные фильтры БПФ редактора Cool Edit 2000. Длина окна фильтрации - 8192 точки. При фильтрации использовалось окно Блэкмана-Харриса. Аналогично работе [19] при имитации пиков АЧХ тракта использовались «широкие» (раствор 50% от центральной частоты) и «узкие» (раствор 15% от центральной частоты) пики. Изучалось влияние пиков трех уровней: 5,10 и 15 дБ [19].

Работа с тестовым (синусоидальным) сигналом 1. Формируется синусоидальный сигнал длительностью 30 с, а = 44100 Гц, 16 бит/отсчет. 2. Исходный (эталонный) сигнал ограничивается по мгновенным значениям (вносятся искажения) в редакторе Cool Edit 2000, подобно тому, как это делалось в работе Горона [19]. В данном случае безынерционное ограничение производилось: S для получения нечетных гармоник - превышалась разрядность представления отсчетов по амплитуде на 102, 104,.... 120%. Это приводило к двустороннему ограничению, что, как известно [19], дает искажения в виде нечетных гармоник. Зависимость КНИ от степени превышения максимально допустимого уровня квантования представлена на рис.4.5. S для получения и четных, и нечетных гармоник - производилось одностороннее безынерционное ограничение с использованием функции Distortion редактора Cool Edit на 0,5...4,5 дБ .

В том же редакторе вычисляется усредненная амплитуда искаженного сигнала (RMS). Алгоритм вычисления RMS известен [18]: возведение значений отсчетов в квадрат, арифметическое усреднение на длительности временного окна (рекомендуется 200 мс [18]), взятие квадратного корня из полученного значения для возвращения к размерности амплитуды («средне 100 квадратическое усреднение»). Далее весь полученный ряд RMS усредняется в среднеарифметическом смысле.

Далее из искаженного сигнала по дискретным отсчетам вычитается исходный синусоидальный сигнал (это эквивалентно удалению первой гармоники из искаженного сигнала)

Все характеристики заметности искажений, приведенные в [19], относятся не к тестовому, но к вещательному сигналу. Действительно, нет смысла требовать от слушателя оценивать уровень заметности искажений на синусоиде, если в дальнейшем он эту синусоиду в канале, возможно, больше никогда не услышит. Однако, внесение нелинейных искажений путем безынерционного ограничения уровня вещательного сигнала и дальнейшая оценка этих искажений сопряжены с некоторыми трудностями. Основная трудность — это сильные различия временных диаграмм различных звуковых сигналов, зависящие как от жанра, так и от длительности выборки. Канал, обладающий определенным КНИ, измеренным на тестовом сигнале, может вносить вполне слышимые НИ в один сигнал и абсолютно незаметные НИ в другой сигнал той же длительности.

Похожие диссертации на Компьютерная оценка качества передачи звуковых вещательных сигналов