Электронная библиотека диссертаций и авторефератов России
dslib.net
Библиотека диссертаций
Навигация
Каталог диссертаций России
Англоязычные диссертации
Диссертации бесплатно
Предстоящие защиты
Рецензии на автореферат
Отчисления авторам
Мой кабинет
Заказы: забрать, оплатить
Мой личный счет
Мой профиль
Мой авторский профиль
Подписки на рассылки



расширенный поиск

Метод объективной оценки качества звуковых трактов мобильных устройств Пахомов Михаил Олегович

Диссертация - 480 руб., доставка 10 минут, круглосуточно, без выходных и праздников

Автореферат - бесплатно, доставка 10 минут, круглосуточно, без выходных и праздников

Пахомов Михаил Олегович. Метод объективной оценки качества звуковых трактов мобильных устройств: диссертация ... кандидата Технических наук: 05.12.04 / Пахомов Михаил Олегович;[Место защиты: ФГАОУ ВО «Санкт-Петербургский государственный электротехнический университет «ЛЭТИ» им. В.И.Ульянова (Ленина)»], 2017

Содержание к диссертации

Введение

Глава 1. Методы оценки качества аудиоаппаратуры 10

1.1. Введение 10

1.2. Традиционные методы объективной оценки качества 11

1.3. Перцепционные методы объективной оценки качества 13

1.4. Слуховая система 16

1.5. История реализации методов объективной оценки качества 20

1.6. О применимости существующих ПМООК 26

1.7. Постановка задачи и цель диссертационной работы 29

Глава 2 . Разработка метода объективной оценки качества звучания мобильных устройств 29

2.1. Общие сведения 29

2.2. Искажения сигналов в звуковых трактах мобильных устройств 30

2.3. Выбор метода объективной оценки искажений звуковых сигналов, воспроизводимых мобильными устройствами 34

2.4. Слышимость и величина нелинейных искажений 39

2.5. Разработка метода создания многотонального сигнала 44

2.6. Разработка метода выделения сигнала искажений и оценка порога маскировки 51

2.7. Алгоритм вычисления выходных переменных модели для оценки нелинейных искажений в акустическом сигнале мобильного устройства 65

2.8. Оценка частотных искажений в акустическом сигнале мобильного устройства 61

2.9. Оценка искажений динамического диапазона 68

2.10. Усреднение результатов анализа искажений вносимых в сигнал звуковыми трактами мобильных устройств 71

2.11. Выбор функции отображения для перехода к обобщенной оценке качества звучания 73

2.12. Обобщенный алгоритм объективной оценки качества звуковых трактов мобильных устройств 75

2.13. Выводы 83

Глава 3. Реализация метода объективной оценки качества звучания мобильных устройств 85

3.1. Введение 85

3.2. База данных референсных фонограмм 88

3.3. Формирование базы референсных устройств 90

3.4. Библиотека МООК 91

3.5. Программа оценки качества AQuA (Audio Quality Assessment) 97

3.6. Порядок работы при оценке качества нового устройства 111

3.7. Заключение 114

Глава 4. Тестирование 116

4.1. Введение 116

4.2. Испытания 116

4.3. Результаты тестирования 134

4.4. Выводы 137

Заключение 138

Литература 141

Приложения 150

Введение к работе

Актуальность темы диссертации. Использование мобильных устройств занимает все более возрастающую роль в социальной жизни современных людей, при этом использование этих устройств вышло далеко за рамки коммуникации, сейчас это и проводник во всемирную сеть, и мобильный секретарь, и партнер для досуга. Все это приводит к тому, что качество воспроизведения звука через громкоговоритель мобильного устройства стало выходить на главные роли – далеко не всегда пользователь использует головные телефоны. Это означает, что при выборе между двумя похожими аппаратами пользователь учитывает и звучание мобильного телефона, что иногда даже может стать решающим фактором.

Для того, чтобы повысить качество воспроизведения, необходимо сравнивать разные варианты звучания мобильных телефонов, выбирая из них лучшие. При стандартном методе оценки качества звучания звуковых трактов (ЗТ) мобильных устройств происходит прослушивание аппаратов специально обученным экспертом. Так как ранжирование проходит по целому ряду характеристик такой метод оценки имеет ряд недостатков, относящихся к человеческому фактору: высокая стоимость работы квалифицированного эксперта; ограниченное время проведения экспертиз вследствие усталости эксперта; сложность количественной оценки качества при малых различиях между тестовыми сигналами; разница между оценками у разных экспертов. Замена эксперта на комплекс аппаратно-программного обеспечения, позволяющего выставить объективную оценку звучания, коррелирующую с субъективной экспертной оценкой, является перспективной задачей.

До конца 80х годов прошлого столетия проблема инструментальной оценки качества
звучания решалась путем измерения таких характеристик, как отношение сигнал-шум,

коэффициент гармоник, неравномерность АЧХ и т.п. После перехода к цифровым технологиям стали развиваться методы, основанные на учёте психоакустических свойств слуховой системы человека, наиболее важными из которых являются эффекты маскировки. Таким образом, исследования в психоакустике позволили разработать новые методы объективной оценки качества систем звуковоспроизведения различного назначения.

Из отечественных ученых наиболее существенный вклад в развитие методов
объективной оценки качества звучания внесли И.А.Алдощина, Ю.А.Ковалгин, С.Л.Мишенков,
О.Б.Попов, С.Г.Рихтер. Следует отметить также работы, выполненные М.В.Зыряновым,

С.А.Литвиным, Е.А.Хряниным.

Разработанные к настоящему времени методы оценки качества, такие как PEAQ (Perceptual Evaluation of Audio Quality), DIX (Disturbance Index), NMR (Noise-to-Masked-Ratio), OASE (Objective Audio Signal Evaluation), PAQM (Perceptual Audio Quality Measure), PERCEVAL (PERCeptual EVALuation), POM (Perceptual Objective Measurement) и прочие в основном специализированы на оценке заметности разницы между оригинальным и оцениваемым сигналами. Наиболее хорошо они подходят для оценки искажений, вносимых в оригинальный сигнал компрессией цифровых аудиоданных, поскольку уровень таких искажений сравнительно невелик. Попытки использовать эти методы для объективной оценки качества звучания звуковых трактов мобильных устройств показали их низкую достоверность при сравнительно высоком уровне искажений в оцениваемом сигнале.

Такое состояние дел в области оценки качества ЗТ мобильных устройств привело к необходимости создания универсального, информативного и достоверного метода объективной оценки качества (МООК) воспроизведения звуковых сигналов мобильными устройствами. Этот метод должен позволять организовывать оперативный контроль качества, а его результаты должны с необходимой точностью совпадать с результатами, полученными с помощью субъективно статистических экспертиз (ССЭ).

Таким образом, актуальность диссертационной работы обусловлена необходимостью разработки удобного в использовании метода объективной оценки качества воспроизведения звука мобильными устройствами, позволяющего не только осуществлять оперативный контроль качества такого оборудования, но также и достоверно оценивать эффект от изменений, вносимых в настройки ЗТ.

Объект исследования: звуковые тракты мобильных устройств.

Предмет исследования: методы объективной оценки влияния искажений на качество звучания, воспроизводимого звуковыми трактами мобильных устройств.

Соответствие паспорту специальности.

Содержание работы соответствуют следующим пунктам паспорта специальности 05.12.04–Радиотехника, в том числе системы и устройства телевидения:

пункт 7. Разработка методов и устройств передачи, приема, обработки, отображения и хранения информации. Разработка перспективных информационных технологий, в том числе цифровых, а также с использованием нейронных сетей для распознавания изображений в радиотехнических устройствах;

пункт 9. Разработка научных и технических основ проектирования конструирования, технологии производства, испытания и сертификации радиотехнических устройств;

Цель работы и задачи исследований. Целью диссертационной работы является разработка метода объективной оценки качества ЗТ мобильных устройств и создание на его основе программного обеспечения, позволяющего организовывать оперативный контроль их качества.

Для достижения поставленной цели необходимо:

1. Провести анализ искажений звуковых сигналов, возникающих при
воспроизведении их мобильными устройствами. Классифицировать и оценить их степень
влияния на субъективную оценку. Выделить наиболее значимые с точки зрения влияния на
качество звучания. Провести анализ современных перцепционных методов оценки качества
звуковых сигналов, стандартов и рекомендаций ITU, посвященных данной проблеме; оценить
эффективность моделирования свойств слуховой системы человека, учитываемых при
разработке этих методов; сформулировать научные и прикладные требования, предъявляемые к
разрабатываемому методу объективной оценки качества звучания мобильных устройств;

2. Разработать метод объективной оценки качества звуковых трактов мобильных
устройств: сформулировать концепцию и выбрать критерии оценки влияния величин и видов
возникающих при этом искажений на частные и обобщённую оценки качества
воспроизводимого аудиосигнала;

  1. Сформулировать требования к создаваемой программе объективной оценки качества звучания и на их основе разработать концепцию, структуру и интерфейс программы оценки качества. Разработать и отладить программу оценки качества звуковых трактов мобильных устройств;

  2. Обосновать способ проверки достоверности результатов, получаемых с помощью разработанной программы оценки качества, и провести испытания. Обработать результаты и сделать заключение о степени достоверности полученных объективных оценок качества и правильности выбора тех или иных научно-исследовательских и прикладных решений.

Методы проведения исследований. Для решения поставленных задач использовались методы цифровой обработки звуковых сигналов, программирование на языках С и С++, программное обеспечение «Adobe Audition» и Microsoft Excel, математическая статистика, математический анализ и субъективно-статистические экспертизы.

Научная новизна и новые полученные результаты. В существующих методах не уделяется достаточного внимания проблеме комплексной оценке качества звуковых трактов мобильных устройств.

На основе выполненных в диссертационной работе исследований закономерностей слухового восприятия разработаны перцепционные методы объективной оценки влияния различных типов искажений на качество ЗТ мобильных устройств, в частности:

1.Метод оценки нелинейных искажений объединивший в себе процедуры построения референсного многотонального сигнала, выделения сигнала нелинейных искажений, дифференцированной оценки отдельных характеристик сигнала нелинейных искажений, а также их совокупного влияния на обобщённую оценку качества;

2.Методы оценки частотных и динамических искажений, учитывающие различия
энергетических спектров и воспринимаемой громкости референсного и оцениваемого

сигналов;

3.Метод перехода от оценки слуховой заметности отдельных видов искажений к обобщенной оценке качества звуковых трактов мобильных устройств одним числом с использованием для получения весовых коэффициентов модели множественной регрессии.

Достоверность полученных результатов и выводов. Основой разработанного метода
объективной оценки качества (МООК) являются научные труды ведущих отечественных и
зарубежных ученых в данной области, корректное применение математического аппарата,
обсуждения результатов работы на научных российских и международных конференциях,
публикации в рецензируемых научных журналах и трудах общества аудиоинженеров AES,
положительными результатами его проверки в лабораториях LG Electronics. Высокая

корреляция как отдельных характеристик качества так и обобщенной оценки с результатами субъективно-статистической экспертизы (ССЭ) подтверждает достаточность набора выходных переменных и правильность учета закономерностей слухового восприятия различных типов искажений.

Научные положения, выносимые на защиту.

На основе выполненных в работе исследований закономерностей слухового восприятия разработаны перцепционные методы объективной оценки влияния различных типов искажений на качество звучания ЗТ мобильных устройств:

1. Метод оценки нелинейных, частотных и динамических искажений музыкальных
сигналов, возникающих в звуковых трактах мобильных устройств, позволяющий на основе
психоакустического моделирования получить для каждого из них критерии, дающие
результаты адекватные их слуховой заметности. Разработанный метод обеспечивает
корреляцию субъективной и объективной оценок качества > 0,85.

2. Метод обобщенной оценки качества звуковых трактов мобильных устройств,
основанный на переходе от частных оценок величин нелинейных, частотных и динамических
искажений с помощью метода множественной регрессии, позволяющий получить результаты,
совпадающие с данными субъективно-статистических экспертиз с требуемой для практики
точностью.

Практическая значимость работы заключается в следующем:

  1. Сформирован набор специальных звуковых сигналов, необходимых для выявления и последующей количественной оценки каждого типа искажений, вносимых звуковыми трактами мобильных устройств;

  2. Разработанная и реализованная в диссертации программа оценки качества звуковых трактов мобильных устройств позволяет осуществлять оперативный контроль качества звучания тестируемых устройств и с достаточной для практики точностью (не превышающей доверительный интервал ССЭ) предсказывать результаты ССЭ, а также использовать её для проведения дальнейших научных исследований в данной области;

3. Разработано программное обеспечение, позволяющее организовывать
автоматический поиск наилучших с позиций слухового восприятия настроек звуковых трактов
тестируемых мобильных устройств;

4. Проведены испытания, подтверждающие достоверность получаемых с помощью разработанной программы результатов оценки качества.

Реализация и внедрение результатов исследований.

Результаты исследований и созданный аппаратно-программный комплекс

используются в процессе настройки звуковых трактов мобильных устройств (мобильные телефоны, ноутбуки, планшетные компьютеры и пр.), производимых компанией LG Electronics, что подтверждено соответствующим актом внедрения от 24 апреля 2017 года.

Результаты диссертации внедрены также в учебный процесс в Санкт-Петербургском государственном университете телекоммуникаций им. проф. М.А. Бонч-Бруевича при выполнении научно-исследовательских и выпускных квалификационных работ магистров, обучающихся по направлениям (акт внедрения в учебный процесс):

-11.04.02 – «Инфокоммуникационные технологии и системы связи» профиль «Системы и сети радиосвязи, радиовещания и радиодоступа» при изучении дисциплины «Аудиотракты систем радиосвязи, радиовещания и радиодоступа» и

-11.04.01 – Радиотехника, профиль «Аудиовидеосистемы и медиакоммуникации» при
изучении дисциплины «Формирование, передача и воспроизведение аудиоконтента в

медиакоммуникациях».

Апробация результатов работы и публикации.

Полученные в работе результаты докладывались и обсуждались на: VI-ой Международной научно-технической и научно-методической конференции «Актуальные проблемы инфотелекоммуникаций в науке и образовании», СПб., СПбГУТ им. проф. М.А. Бонч-Бруевича, 3-4 марта 2015 года; 139-ой конференции общества аудио инженеров (139th AES Convention) в Нью-Йорке, 29 октября 02 ноября 2015 года; 141-ой конференции общества аудио инженеров (141st AES Convention) в Лос Анжелесе, 29 сентября 2016 года.

Публикации. По тематике диссертационной работы опубликовано 6 печатных работ, из которых 3 в журналах из Перечня ВАК, 3 работы в материалах международных научных конференций.

Личное участие автора в получении научных результатов.

В исследованиях, результаты которых приведены в диссертационной работе, автору принадлежит определяющая роль. Диссертант лично разрабатывал психоакустические модели, методы и критерии объективной оценки различных типов искажений, обрабатывал результаты ССЭ, выполнял анализ и обобщение полученных результатов. Научным руководителем д.т.н., профессором Ю.А.Ковалгиным, осуществлялся контроль и обсуждение получаемых результатов.

Структура и объем диссертационной работы.

Работа состоит из введения, четырех глав, заключения, списка принятых сокращений, списка литературы и приложения.

Объем диссертации 149 страниц текста, 60 рисунков, 9 таблиц, список литературы из 98 наименований, приложение на 6 страницах.

История реализации методов объективной оценки качества

Решением задачи количественной оценки качества звучания начали заниматься с середины прошлого столетия. В 40х-50х годах вышли работы H. Fletcher [64], D.K. Gannet [65] и W.B.Snow [86] в которых изучались вопросы необходимой ширины полосы частот для качественного воспроизведения звучания определенных музыкальных инструментов, мужского и женского голоса; чувствительность слуховой системы человека к изменению воспроизводимого диапазона частот, восприятие нелинейных искажений и пр. К недостаткам этих работ можно отнести недостаточную полноту исследований восприятия искажений в случае их одновременного присутствия в оцениваемом сигнале и влиянию на субъективную оценку качества. В 60-е годы НИИ связи СССР совместно с профильными кафедрами ведущих институтов связи были проведены одни из первых полноценных работ в области оценки слышимости искажений аудиосигналов. Эти работы проводились под научным руководством профессора И.Е. Горона [23]. Целью указанных исследований было установление связей между количественными характеристиками искажений различных типов, возникающих в звуковых трактах, и их восприятием на основе субъективных тестов прослушивания. Результаты исследований легли в основу обоснованных норм допусков на качественные показатели звуковых трактов, как целиком, так и для составляющих частей. К достоинствам этой работы можно отнести четкую формализацию методологии оценки величин, отвечающих за заметность каждого типа искажений, вносимых звуковыми трактами в звуковые сигналы, а к недостаткам невозможность одновременного учета влияния искажений различных типов, присутствующих в сигнале на оценку качества звучания и невозможность проведения контроля качества аппаратуры в режиме передачи.

В рамках диссертационной работы Ж. Я. Дубовик было исследовано явление дребезжания диффузорных электродинамических громкоговорителей, предложен и протестирован метод объективного аппаратного определения количественных характеристик этого явления [26]. Суть предложенного метода заключается в сравнении измеренного коэффициента дребезжания тестируемого громкоговорителя с его пороговым значением. Если измеренное значение меньше или равно порогового значения, громкоговоритель считается пригодным к использованию.

Данная научная работа представляет собой пример реализованной разработки и внедрения объективного метода оценки качества, позволяющего заменить субъективное тестирование. Недостатком метода можно считать крайне узкую область учитываемых искажений.

В 1983 г. В.И. Ремизов [38] представил диссертационную работу посвященную разработке метода контроля нелинейных искажений, возникающих в звуковых сигналах при прохождении через акустические тракты. Целью представленной работы было создание и проверка метода объективной оценки качества, позволяющего получать результаты хорошо коррелирующие с результатами субъективных тестов прослушивания. Было представлено теоретическое обоснование метода оценки нелинейных искажений музыкальных на основе анализа уровня искажений в области низких частот, установлена и подтверждена связь субъективных оценок качества с результатами объективных измерений. Однако, как и в работе Ж. Я. Дубовик, предложенный метод объективной оценки качества звучания специализирован только для учета нелинейных искажений и непригоден для комплексной оценки качества сигналов.

В диссертационной работе Н.И. Веселовой (1987 г.) [20] описаны метод и средства оперативного контроля качества работы звуковых трактов. Суть метода, предложенного автором, заключается в использовании гильбертовой огибающей для тональных измерительных сигналов. Предложенный метод позволяет проводить оценку нелинейных и частотных искажений вносимых в сигнал звуковым трактом и представляется более удобным в использовании, чем аналогичные способы, предложенные ранее. Данный метод дополняет процедуру оценки нелинейных и частотных искажений [23], но также позволяет решить задачу оценки качества звучания аудиосигналов в случае одновременного присутствия сильных искажений различных типов.

Также стоит отметить диссертационную работу А.С. Галембо (1994 г.) целью которой является исследование и оценка качества звучания музыкальных инструментов. В представленной работе [21] вводится термин интонационной ясности, обозначающий отчетливость ощущения высоты звука. Так, например, белый шум представляет собой случай интонационной неясности, а тональный сигнал – полной интонационной ясности. Исследования проводились на основе анализа субъективных оценок качества звучания фортепиано. В рамках работы были выявлены основные причины снижения субъективных оценок качества звучания и предложен способ их количественного описания. Полученные результаты представляют большой интерес для производителей музыкальных инструментов и, поэтому, имеют узкоспециализированный характер, направленный на повышение качества изготовления фортепиано, что также не позволяет использовать результаты работы для оценки качества существенно искаженных сигналов.

В диссертационной работе В.Д. Грибова [22] проводится исследование и разработка метода оценки качества звуковоспроизведения в кинотеатрах. Основу работы представляет разработка методик получения субъективной обобщенной оценки качества звуковоспроизведения в кинотеатрах. В работе предложены статистические методы проведения тестов прослушивания как эффективный способ получения комплексной оценки качества звуковоспроизведения, обеспечивающий достоверность, сравнимую с методом многомерных экспертиз. Предложена и подтверждена результатами экспериментов полиномиальная модель обобщенного показателя качества. Данная работа может служить основой для создания новых методов получения обобщенных показателей качества звучания.

Первые исследования, посвящённые изучению восприятия человеком искажений акустических сигналов, относятся к первой трети двадцатого столетия. Первой работой, в которой делалась попытка оценить качество звучания с учетом процессов восприятия звука была работа W. Jankovsky “Audibility of distortion”, опубликованная в 1929 году.

Первая публикация, описывающая создание подобного метода относится к 1979 году [82]. Авторы (M.R. Schrder и J.L. Hall) представили алгоритм измерения громкости шума -Noise Loudness (NL), в основе которого лежит идея оценка громкости шумов, вносимых в сигнал методами компрессии речевых сигналов. Схема предложенного метода приведена на рис. 1.1. Из недостатков метода следует отметить отсутствие итогового значения, характеризующего распределение заметности шумов по длительности сигнала.

Через пять лет M. Karjalainen опубликовал свой метод [13] оценки с использованием ряда идей и решений, предложенных M.R. Schrder. Автор назвал свой способ оценки качества Метод Слышимой Спектральной Разницы (method of Auditory Spectral Difference (ASD)). В этом методе обобщенная оценка качества сигнала также не вычислялась.

Первой попыткой реализовать оценку качества аппаратными средствами в режиме реального времени можно считать метод «Отношение шум к маске» (NMR), предложенный K. Brandenburg в 1987 году [58]. Разработанный метод применялся для улучшения алгоритма кодирования акустических сигналов.

В работе B. Moore [75] представлена оригинальная психоакустическая модель слуха, основанная на использовании банка фильтров, однако методики получения оценки воспринимаемого качества звучания акустических сигналов в данной работе не приводилось.

Слышимость и величина нелинейных искажений

Рассмотрим основные причины возникновения нелинейных искажений в мобильных устройствах.

Амплитуда смещения диффузора головки громкоговорителя при равной подаваемой мощности зависит от частоты сигнала. Разница в величине смещения обусловлена наличием резонанса в МКС и зависит от ее добротности [17]. На рисунке 2.5 представлены зависимости амплитуды смещения диффузора головки громкоговорителя FSD 15х11х3,0 в составе акустического модуля объемом 0,6 см3.

Напомним, что величина смещения диффузора головки громкоговорителя при равной вынуждающей силе убывает пропорционально квадрату частоты. Следовательно, нелинейные искажения, связанные с функциями, зависящими от величины смещения диффузора, будут в основном определяться спектральными составляющими, лежащими вблизи и ниже резонанса МКС.

С ростом амплитуды и частоты колебаний МКС растет объем воздуха прокачиваемого через фазоинверторы и прочие отверстия, что приводит к росту коэффициента затухания, а это, в свою очередь, приводит к увеличению фазового сдвига между смещением и сигналом.

На рисунке 2.6 приведены зависимости между амплитудой сигнала и величиной смещения диффузора в положительную (а) и отрицательную (б) стороны. Параметром каждой кривой является значение частоты в герцах.

В зависимости от частоты, участок линейной зависимости смещения от величины сигнала составляет от 30% до 60% от его максимального значения.

Таким образом, мы имеем два типа нелинейности – нелинейная зависимость амплитуды смещения диффузора головки громкоговорителя от частоты при одинаковой мощности и нелинейная зависимость амплитуды от мощности при одинаковой частоте. Как показывает опыт, спектр сигнала искажений меняется нелинейно с ростом амплитуды сигнала и, зачастую, раздражающий шум появляется задолго до критических величин смещения диффузора.

Нелинейные искажения по-разному влияют на субъективную оценку качества в зависимости от своей природы. Так, гармоники высоких порядков при очень незначительном энергетическом вкладе в сигнал искажений имеют определяющее значение при прослушивании.

Для определения зависимости характеристик нелинейных искажений от амплитуды сигнала на вход звукового тракта подается последовательность тональных сигналов с линейно увеличивающейся амплитудой (рисунок 2.7). Мощность усилителя подобрана так, чтобы тональный сигнал уровня 0 dBFS подавался на громкоговоритель с электрической мощностью, равной максимальной кратковременной мощности Pshort.

В режиме реального времени для воспроизводимого сигнала мобильного устройства рассчитывается коэффициент нелинейных искажений (КНИ). С помощью триангуляционного лазерного датчика происходит определение текущего значения амплитуды и при достижении максимального допустимого значения происходит остановка и переход к следующей частоте. С помощью данной процедуры для каждой частоты определяется уровень допустимой мощности для «линейного» диапазона смещений диффузора головки громкоговорителя и величина максимального диапазона смещений диффузора в зависимости от подводимой мощности.

В интервале смещений диффузора, относящихся к линейному диапазону, уровень КНИ незначителен и составляет несколько процентов. Для громкоговорителя, используемого в тестировании линейный диапазон смещений диффузора составляет 30%-40% от максимального. Это графически подтверждается данными, представленными на Рисунок 2.8. При этом уровень мощности, на котором сигнал достигает границ этого диапазона, зависит от частоты. Также можно заметить, что, начиная с некоторой величины амплитуды сигнала, смещение диффузора становится несимметричным относительно положения покоя.

Одним из первых проявлений выхода из линейного диапазона является рост амплитуды четных гармоник, обусловленных несимметричной упругостью подвеса диафрагмы, несимметричным магнитным полем в зазоре магнитной системы громкоговорителя, а также зависимостью коэффициента демпфирования от направления движения диффузора головки громкоговорителя. При дальнейшем увеличении величины смещения диффузора рост нелинейных искажений ускоряется.

На левом снимке (рисунок 2.8) громкоговоритель работает в линейном режиме. На центральном - с высокими гармоническими искажениями, но их уровень еще считается допустимым. На правом рисунке уже отчетливо слышен высокочастотный шум. Рост уровня высокочастотных гармоник и негармонического шума обычно носит взрывной характер и на различных громкоговорителях мобильных устройств может быть обусловлен несколькими причинами:

- достижением величины смещения диффузора максимального значения, обусловленного физическими ограничениями (сверху защитной решеткой, снизу магнитом). Момент возникновения такого шума означает достижение предельного смещения в одном из направлений. При дальнейшем увеличении подаваемой мощности громкоговоритель быстро выйдет из строя;

- трением катушки громкоговорителя о магнит при деформации мембраны (эффект, известный как Rub & Buzz).

Для определения зависимости величины нелинейных искажений от амплитуды сигнала предлагается использовать три метрики: традиционную метрику оценки величины нелинейных искажений – КГИ (2.1), коэффициент гармоник высоких порядков КГВП (2.2), и коэффициент «Rub&Buzz» (2.3).

Обобщенный алгоритм объективной оценки качества звуковых трактов мобильных устройств

Разработку МООК можно условно разделить на 2 части. В первой части проводится отбор устройств, звуковые тракты которых удовлетворяют установленным требованиям (прежде всего в отношении к классу мобильных устройств) и представляют весь спектр субъективного диапазона качества. Отобранные устройства формируют референсный набор, на базе которого будет проводиться субъективно-статистическая экспертиза (ССЭ), результаты которой используются для обучения искусственной нейронной сети.

Далее проводится отбор музыкальных фонограмм для проведения ССЭ. Характеристики отбираемых фонограмм должны обеспечивать максимальное допустимое возбуждение всех составляющих тестируемых звуковых трактов для всей слышимой полосы частот. Сформированный набор фонограмм используется при проведении ССЭ.

Для сокращения времени тестирования отбирается репрезентативная выборка музыкальных фрагментов, на основании которых создается набор референсных фонограмм. Для выделения и анализа нелинейных искажений по оригинальному алгоритму, представленному в разделе 2.5, создается искусственный многотональный сигнал. Также в набор референсных фонограмм входят линейно-частотно модулированный сигнал, сигнал шума постоянной и переменной амплитуды. Более подробно о референсных фонограммах будет рассказано в главе 3. Референсные фонограммы, пропущенные через исследуемый звуковой тракт и записанные микрофоном, становятся тестовыми фонограммами. Таким образом, имеется один набор референсных фонограмм и отдельный набор тестовых фонограмм для каждого исследуемого звукового тракта.

Во второй части создания МООК проводится реализация алгоритмов анализа звуковых сигналов и вычисление выходных переменных модели (MOV – model output variables). Подробно о методах расчета выходных переменных было рассказано выше (см. 2.7 – вычисление выходных переменных модели для нелинейных искажений, 2.8 – для частотных искажений, 2.9 – для динамических искажений). Вычисленные MOV представляют собой входные данные для искусственной нейронной сети (ANN).

Укрупненная схема разработанного МООК представлена на рисунке 2.22, детализированные схемы блоков обработки и анализа сигналов искажений приведены на рисунках 2.26, 2.27, 2.28. В набор входных параметров входят имена референсных и тестовых фонограмм, а также некоторые настройки алгоритмов обработки, например границы частотных диапазонов.

Следует отметить вспомогательные функции, используемые при реализации блока обработки и анализа (БОА): функция вычисления громкости сигнала (рисунок 2.23) и функция синхронизации референсной и тестовой фонограмм. Здесь сохранены все обозначения, принятые ранее.

На заключительном этапе второй части проводится обучение ANN (рисунок 3.24). Для этого часть результатов ССЭ, отобранных случайным образом, и выходные переменные модели, рассчитанные для соответствующего набора звуковых трактов, используются для обучения ANN, оставшаяся часть субъективных оценок и объективных характеристик используется для верификации работы метода. Результатом работы процедуры верификации является рассчитанный коэффициент корреляции Пирсона между оценками, полученными в результате ССЭ и не вошедшими в выборку, использующуюся в модели множественной регрессии для вычисления весовых коэффициентов и объективными оценками качества, рассчитанными с помощью разработанного метода.

Библиотека МООК

Библиотека МООК содержит в себе набор подпрограмм, осуществляющих обработку звуковых сигналов и вычисление выходных переменных модели оценки качества. Обобщенная схема библиотеки МООК приведена в разд. 2.12, Рисунок 2.23. Программный интерфейс библиотеки разработан таким образом, чтобы максимально упростить работу с ней пользовательского приложения, и представляет собой набор команд для запуска алгоритмов обработки сигналов.

Каждый алгоритм обработки сигналов реализован в виде функции с набором входных и выходных параметров. Внутри каждой функции осуществляется запуск определенной последовательности вспомогательных подпрограмм, результатом работы которых являются вычисленные значения соответствующих выходных переменных модели.

На первоначальном этапе каждая функция обработки осуществляет загрузку соответствующих референсных и тестовых фонограмм с жесткого диска с помощью специальной функции ReadAudioFile(), на вход которой подается имя файла, хранящего требуемую фонограмму. Данные записываются в динамические массивы, указатели на которые передаются в функции, осуществляющие непосредственный анализ фонограммы.

В МООК предполагается разделение выходных переменных на две группы по типу сигнала, на основе которого рассчитывается та или иная выходная переменная. Первую группу образуют выходные переменные, рассчитываемы на основе МРФ, а вторую, соответственно, переменные, рассчитываемые на основе СРФ.

Всего разработано 5 функций вычисляющих стандартные выходные переменные и 3 функции-агрегатора в которых осуществляется вычисление выходных переменных на основе МРФ. Ниже приведено описание функций вычисления MOVs. Их вызов осуществляется из специального интерфейса ПОК AQuA (раздел 3.5). Вычисление стандартных выходных переменных

В данном разделе будут описаны функции вычисления выходных переменных модели оценки качества с помощью стандартных референсных фонограмм, описанных в разделе 3.2.2.

CalcFrequencyResponse() – функция расчета амплитудно-частотной характеристики тестируемого звукового тракта. Входными данными функции являются референсная и тестовая фонограммы СБШ, а также границы частотных диапазонов для расчета MOV. Для расчета частотных искажений определяется средний уровень звукового давления тестового сигнала по 1/3 октавным полосам в анализируемом диапазоне частот (100 Гц – 14 кГц), вычисляются отклонения АЧХ от среднего уровня в установленных полосах частот и неравномерность АЧХ в этих полосах. В результате вычисляются 8 выходных переменных: отклонение АЧХ от среднего значения на низких, низких средних, средних, высоких и ультравысоких частотах, а также неравномерность кривой АЧХ в низких средних, средних и высоких областях частот.

CalcTHD() – функция расчета коэффициента гармонических искажений (КГИ). Входными данными функции являются референсная и тестовая фонограммы ЛЧМС. В результате получаем зависимость величины КГИ от частоты.

CalcIMD() - функция расчета коэффициента интермодуляции (КИ). Входными данными функции являются референсная и тестовая фонограммы ДТС. В результате получаем зависимость величины КИ от частоты.

CalcInOutResponse() - функция расчета характеристик динамического диапазона оцениваемого ЗТ. Входными данными функции являются референсная и тестовая фонограммы ИСБШ. В результате получаем кривую зависимости амплитуды выходного сигнала от амплитуды входного.

CalcSharpness() – функция расчета характеристики резкости сигнала (2.48). Входными данными функции являются референсная и тестовая фонограммы СБШ, результатом является величина разницы в резкости между референсным и тестовым сигналами.

Вычисление выходных переменных на основе МРФ В данном разделе описаны подпрограммы вычисления выходных переменных модели оценки качества, вычисляемых с помощью музыкальных референсных фонограмм, описанных в разделе 3.2.1. В соответствии с разделом 2.12 реализация вычисления выходных переменных на основе МРФ разделена на три блока-подпрограммы, каждый из которых работает со своим референсным сигналом (таб. 3.1):

- CalcBalance(): подпрограмма реализации блока обработки и анализа частотных искажений;

- CalcNMR(): подпрограмма реализации блока обработки и анализа нелинейных искажений;

- CalcDynamic(): подпрограмма реализации блока обработки и анализа динамических искажений;

Подробное описание подпрограмм приведено соответственно в разделах 3.4.2.2, 3.4.2.3, 3.4.2.4.

Данные подпрограммы включают в себя вызовы дополнительных функций для вычисления промежуточных характеристик и совершения вспомогательных действий, основные из которых описаны в разделе 3.4.2.1.

Вспомогательные функции

Поскольку старт записи тестовой фонограммы может не совпадать с началом воспроизведения референсной фонограммы, они должны быть подвергнуты процедуре синхронизации, что обусловило необходимость ее автоматизации. С этой целью был разработан специальный алгоритм синхронизации, обеспечивающий автоматическую синхронизацию эталонных и исследуемых сигналов с помощью специальных синхро-вставок (добавленных в начало и в конец каждой референсной фонограммы) (рис.3.2).

Для корректной работы блока анализа нелинейных искажений необходимо, обеспечить синхронизацию во времени референсного и соответствующего ему тестового многотонального сигнала с точность до 24 отсчетов (500 мкс). Процедура синхронизации реализуется на основе поиска максимума функции взаимной корреляции для участков сигнала, содержащих синхро-вставки.