Электронная библиотека диссертаций и авторефератов России
dslib.net
Библиотека диссертаций
Навигация
Каталог диссертаций России
Англоязычные диссертации
Диссертации бесплатно
Предстоящие защиты
Рецензии на автореферат
Отчисления авторам
Мой кабинет
Заказы: забрать, оплатить
Мой личный счет
Мой профиль
Мой авторский профиль
Подписки на рассылки



расширенный поиск

Разработка методики оценки качества восстановления речи на фоне шумов, коррелированных с речевым сообщением Пчелинцев Алексей Викторович

Разработка методики оценки качества восстановления речи на фоне шумов, коррелированных с речевым сообщением
<
Разработка методики оценки качества восстановления речи на фоне шумов, коррелированных с речевым сообщением Разработка методики оценки качества восстановления речи на фоне шумов, коррелированных с речевым сообщением Разработка методики оценки качества восстановления речи на фоне шумов, коррелированных с речевым сообщением Разработка методики оценки качества восстановления речи на фоне шумов, коррелированных с речевым сообщением Разработка методики оценки качества восстановления речи на фоне шумов, коррелированных с речевым сообщением Разработка методики оценки качества восстановления речи на фоне шумов, коррелированных с речевым сообщением Разработка методики оценки качества восстановления речи на фоне шумов, коррелированных с речевым сообщением Разработка методики оценки качества восстановления речи на фоне шумов, коррелированных с речевым сообщением Разработка методики оценки качества восстановления речи на фоне шумов, коррелированных с речевым сообщением
>

Данный автореферат диссертации должен поступить в библиотеки в ближайшее время
Уведомить о поступлении

Диссертация - 480 руб., доставка 10 минут, круглосуточно, без выходных и праздников

Автореферат - 240 руб., доставка 1-3 часа, с 10-19 (Московское время), кроме воскресенья

Пчелинцев Алексей Викторович. Разработка методики оценки качества восстановления речи на фоне шумов, коррелированных с речевым сообщением : диссертация ... кандидата технических наук : 05.13.17.- Москва, 2003.- 106 с.: ил. РГБ ОД, 61 03-5/3483-1

Содержание к диссертации

Введение

Глава 1. Обзор методов цифровой передачи речи, сопровождаемых коррелированными с речевым сообщением шумами 7

1.1 Шумы квантования при ИКМ 7

1.2 Шумы квантования при АДИКМ 11

1.3 Шумы при прерывистой передаче речи в сотовых системах 18

1.4 Шумы, коррелировашіьіе с речевым сообщением 21

1.5 Основные выводы и результаты 23

Глава 2. Методы определения акустических шумов 25

2.1 Характеристики помех 25

2.2 Методы определения акустических шумов применительно к мобильным системам связи 31

2.3 Основные выводы и результаты 36

Глава 3. Модели речевого сообщения 38

3.1 Моделирование речевого сообщения 38

3.1.1 Рекомендуемый ITU-T источник звука 38

3.1.2 Искусственный голос 38

3.2 Характеристики речевых сигналов 40

3.3 Спектральная плотность мощности 43

3.4 Основные выводы и результаты 53

Глава 4. Оценивание качества по критерию отношения сигнал/шум для коррелированных и некоррелированных шумов при прерывистой передаче речи 55

4.1 Методика оценивания качества 55

4.2 Влияние процедуры RPE на качество передачи речи 59

4.3 Влияние экстраполяции потерянного речевого кадра на качество передачи речи 71

4.4 Комплексная оценка качества ...74

4.5 Основные выводы и результаты 75

Глава 5. Оценка качества по критерию разборчивости 77

5.1 Виды разборчивости 77

5.2 Оценивание качества прерывистой передачи речи 81

5.3 Аналитическая оценка качества кодеков G.711 84

5.4 Основные выводы и результаты 93

Заключение 95

Список литературы 99

Введение к работе

В настоящее время явно определилась тенденция перехода от классической телефонии, к передаче речевых сообщений по сетям передачи данных с использованием, например, протоколов семейства ЕР (TCP, UDP) и др. Такой переход становится возможным при снижении требований к ширине полосы пропускания канала в результате применения кодеков современных типов, например, удовлетворяющих рекомендациям ГГО-Т стандарта Н.323 серии G.

Сказанное естественно относится и к применениям в цифровых сетях железнодорожного транспорта фиксированных и подвижных.

При оценивании качества восстановления речи с использованием кодеков, необходимо учитывать коррелированные и некоррелированные с сообщением шумы, которые имеют различную природу происхождения -акустические, процедур квантования и дискретизации, цифрового вокодерного преобразования, канальные и др.

В данной диссертационной работе рассматриваются вопросы аналитической оценки качества восстановления речи на фоне различной природы шумов, в том числе коррелированных с речевым сообщением. В условиях преимущественного использования в настоящее время субъективных методов оценивания качества восстановления речи актуальность оценки аналитической достаточно высока.

Цель работы состоит в развитии теории восстановления подвергнутых обработке речевых сообщений, в разработке методики и математического аппарата аналитического оценивания качества речи, при ее обработке в современных кодеках, что имеет существенное значение для анализа и рационального проектирования использующих эти кодеки цифровых систем.

Реализуется следующая последовательность их решения:

Обзор и анализ методов цифровой передачи речи, сопровождаемых коррелированными с речевым сообщением. Шумы квантования при ИКМ.

Разработка методов определения акустических шумов, в том числе применительно к мобильным системам.

Выбор модели речевого сигнала и его основных вероятностных характеристик (прежде всего спектральных).

Разработка методики комплексной оценки прерывистой передачи речи. по критерию отношения сигнал/шум.

Совершенствование методики оценивания качества восстановления речи по критерию разборчивости и ее применение к анализу кодеков, в том числе кодеков, используемых при прерывистой передаче и кодеков G.711. Диссертация основывается на результатах: фундаментальных работ теории информации В. А. Котельникова, Н. Винера, К. Шеннона и др. теоретических и прикладных исследований по обработке и передаче речи Дж.Беллами, Л.И.Величкипа, М.Д.Вепедиктова, Г.В.Вемяиа, В.Н.Гордиепко, Г.В.Горелова, А.Г.Зюко, Г.В. Кузнецова, М.В. Назарова, А.Ф. Фомина и др. теоретических и прикладных исследований цифровых средств и систем передачи информации Л.А. Баранова, И.А. Лозового, А.П.Мановцева, Н.И.Пилипчук, В.П.Яковлева и др.

На защиту выносятся следующие основные положения и результаты исследования:

Методика аналитического оценивания по критерию разборчивости качества восстановления речи на фоне различной природы шумов, в том числе коррелированных с речевым сообщением.

Аналитические модели процесса передачи речи в сети при применении кодеков современных типов, например, удовлетворяющих рекомендациям ITU-T стандарта Н.323 серии G.

Результаты оценивания качества передачи речи в сети с использованием разработанных методики и моделей.

В работе использованы методы теории вероятностей, математического анализа, теории массового обслуживания.

Научная новизна определяется разработкой методики и результатами аналитического оценивания качества передачи речи в сетях при применении кодеков рекомендованных стандартом Н.323 ГШ-Т, в частности -предложенными моделями процессов восстановления речи на фоне различной природы шумов и моделей потоков отсчетов сообщения (в том числе - моделью с распределением Парето интервала в потоке отсчетов).

Практическое значение заключается в том, что разработанный аналитический аппарат предоставляет возможность получения объективных оценок (по критерию разборчивости) качества восстановления речи в современных сетях и может быть использован при анализе качесгва восстановления речевых сообщений.

Шумы при прерывистой передаче речи в сотовых системах

Аппаратура передачи речевого трафика в телекоммуникационных (прежде всего - мобильных) сетях включает в себя систему прерывистой передачи (Discontinuous Transmission — DTX), которая отключает передатчик в паузах и по окончании разговора. Рассмотрим компоненты такой системы [15,23,24]. 1. Система DTX управляется блоком определения речевой активности - обнаружителем речи OP (VAD - Voice Activity Detector). Технология VAD используется совместно с большим числом речевых кодеков. Использование в телефонном шлюзе блока определения речевой активности приводит к экономии полосы пропускания при некотором ухудшении разборчивости речи. Недостатком является то, что не все телефонные шлюзы позволяют регулировать порог срабатывания определителя речевой активности и в ряде устройств порог имеет фиксированное значение, выбранное, исходя из особенностей речи англоязычных пользователей, и равное 30%. 2. Формирование комфортного шума осуществляется в паузах активной речи. Например, в стандарте GSM при прекращении разговора передатчик остается включенным в течение следующих пяти речевых кадров. В течение первых четырех кадров оцениваются характеристшси фонового шума путем усреднения коэффициента усиления и коэффициентов фильтра-анализатора линейного предсказателя LPC. Усредненные значения передаются в пятом (SID) кадре, несущем информацию о комфортном шуме. 3. Экстраполяция потерянного речевого кадра, как правило, производится путем повторения предыдущего фрагмента. При значительных по продолжительности перерывах предьшущий фрагмент более не повторяется и сигнал на выходе декодера постепенно заглушается, чтобы указать абоненту на разрушение канала. Та же процедура производится при потере Sro кадра.

Во многих кодеках используются такие процедуры, как RPE - LPC (Regular-Pulse Excitation/Linear Predicative Coding) - линейное предсказание с возбуждением регулярной последовательностью импульсов и долговременным предсказанием (LTP-Longerm Prediction). В стандарте GSM этими тремя процедурами достигается уменьшение скорости с 104 кбит/с до 13 кбит/с.

При кодировании RPE-LPC сигнал нарезается на сегменты по 160 отсчетов длительностью по 20 мс (всего 2080 бит на сегмент). Далее производится взвешивание каждого из сегментов окном Хэмминга и определение для каждого из сегментов параметров фильтра краткосрочного линейного предсказания - 8 коэффициентов фильтрации фильтра-анализатора LPC. Сигнал фильтруется решетчатым фильтром-анализатором, и по остатку предсказания определяются параметры долговременного предсказания. При этом сегмент в 160 отсчетов разбивается на четыре равных блока (по 40 отсчетов, 5 мс). Выход фильтра-анализатора долговременного предсказания формирует параметры сигнала возбуждения отдельно для каждого из блоков. Импульсы каждого блока разбиваются на три последовательности (в первой - 1-й, 4-й,..., 37-й отсчеты; во второй - 2-й, 5-й, ... , 38-й и в третьей - 3-й, 6-й, ..., 39-й; сороковой отсчет отбрасывается.). В качестве сигнала возбуждения выбирается та из последовательностей, энергия которой больше. Таким образом, для одного 20-миллисекундного сегмента речи передается 260 бит информации (параметры фильтров краткосрочного и долговременного предсказания и параметры сигнала возбуждения), т.е. кодер речи осуществляет сжатие информации почти в пять раз (1280:260 = 4,92). Восемь коэффициентов фильтра-анализатора LPC и параметры фильтра-анализатора LTP кодируются и передаются со скоростью 3,6 кбит/с. Параметры сигнала возбуждения передаются со скоростью 9,4 кбит/с. Общая скорость передачи составляет 13 кбит/с.

В декодере речевой сигнал восстанавливается двухступенчатым (LTP и LPC) фильтром-синтезатором по принятым параметрам регулярного импульсного возбуждения. Теоретически время задержки речевого сигнала в кодеке равно длительности сегмента, то есть 20 мс. Реальное время, с учетом операций канального кодирования, перемежения, и с учетом физического выполнения рассмотренных операций, составляет 70-80 мс.

Анализ качества прерывистой передачи речи обычно производится методами имитационного моделирования или экспертных оценок. В диссертации применяются аналитические методы.

Функционирование каждого из элементов системы прерывистой передачи речи связано с внесением шумов, коррелированных или некоррелированных с передаваемым речевым сообщением. Речевое сообщение на участках активного состояния будет описываться случайным процессом x(t), стационарным, цептрироваппым, с мощностью а\, корреляционной функцией RX(T ), спектральной плотностью мощности Sx(a ). В рассматриваемой системе прерывистой передачи речи реализуется метод, аналогичный используемому в полосном вокодере, при котором спектр передаваемого речевого сообщения делится полосовыми фильтрами на частотные составляющие, огибающие которых, полученные путем амплитудного детектирования, передаются по радиолинии [7]. Для определенности будем полагать, что огибающие остаются неизменными в пределах полосы б ,,в м. Их уровень At может определяться, например, значением составляющей Sx((a t,(oM)/2) на средней частоте полосы. Такого рода аппроксимация спектра приводит к шуму, мощность которого а\ определяется в виде где Fcp - частота среза фильтра нижних частот, осуществляющего предварительное ограничение спектра передаваемого речевого сообщения. Интерполяция утерянных в канале фрагментов речи заключается в следующем. Если утерян только один речевой кадр, то вместо него используется предыдущий принятый кадр. В случае же потери двух и более кадров речевого сообщения предыдущий речевой кадр больше не повторяется, и сигнал на выходе речевого декодера постепенно заглушается, чтобы показать пользователю, что канал разрушается. Такой метод интерполяции потерянных фрагментов речи при прерывистой передаче в цифровых сотовых системах применяется наиболее часто, как, например, в стандарте GSM. Такого рода замена приводит к возникновению шумов в речевом канале. Характеристики таких шумов, а также их влияние на качество передачи и приема речевого сигнала более подробно рассмотрены в главах 4 и 5.

Методы определения акустических шумов применительно к мобильным системам связи

При рекомендации какого-либо типа "искусственного рта" для объективных телефонометрических измерений и моделирования вообще, предполагается, что эксперимент должен проводиться при использовании одной формы сигнала для определения амплитудно-частотной характеристики (зависимость чувствительности от частоты) передающего устройства, независимо от типа применяемого микрофона.

Желательно также дополнить модель имеющимися данными по реальному человеческому голосу. Источник звука должен допускать настройку микрофона на небольших расстояниях. При правильно выбранном расстоянии от источника звука до микрофона акустические параметры должны быть близки к соответствующим параметрам человеческого голоса (рта). При проведении измерений с несколькими источниками звука, прежде необходимо решить, какие параметры будут использованы для сравнения, а какие будут являться промежуточными. ITU считает, что расстояние 25 мм от плоскости рта (губ) является наиболее приемлемым. Предполагается также, что источник звука должен оказывать звуковое давление не менее 90 дБ (2x10 Па) в частотном диапазоне 200-4000 Гц. (В диапазоне 100-8000 Гц желательно звуковое давление 100 дБ.) [9]. Описанный выше сигнал, воспроюводящий характеристики звучания человеческого голоса, применим для описания линейных и нелинейных телекоммуникационных систем, предназначенных для пересылки звуковых сигналов. Искусственный голос - это сигнал, который может быть определен математически (задан в аналитическом виде) и который воспроизводит временные и спектральные характеристики речевого сигнала, что важно при моделировании и проектировании передающих систем. Учитываются следующие характеристики: - усредненный за длительное время спектр, - мгновенное амплитудное распространение, - формы голосовых и неголосовых сигналов, - слоговая разборчивость. Искусственный голос предназначен для воспроизведения характеристик звучания реального голоса в полосе 100 Гц - 8 кГц. Он может применяться для исследования различных устройств, таких как микрофоны, телефонные громкоговорящие устройства, нелинейные кодеры, слоговые компандеры и др. Конечно, в каждом конкретном случае при исследовании необходимо внести корректирующие поправки в посьшаемый сигнал. Искусственный голос может являться как электрическим, так и звуковым сигналом - тип выбирается исходя из того, какие параметры необходимо измерить в исследуемых системах (каналы передачи речи, кодеры, микрофоны). Различные варианты применения искусственного голоса показаны па рис.3.1 [9]. Искусственный голос, рассматриваемый как электрический сигнал, применяется для исследования и тестирования каналов передачи речи, а также других электрических устройств.

Сигнал, воспроизводимый искусственным ртом, является звуковым или акустическим искусственным голосом. Он применяется для выравнивания амплитудно-частотной характеристики рта говорящего путем регулирования уровня электрического сигнала в различных частотных полосах.

Как уже было отмечено, искусственный голос должен обладать характеристиками реального человеческого голоса. Более подробное рассмотрение параметров искусственного голоса, в частности, аппроксимации спектральной плотности интенсивности звука, нормированной спектральной плотности приведено ниже, в разделе 3.3. Там же приводятся таблицы с результатами расчетов и графические материалы.

При нормальных условиях передачи суммарный уровень громкости речевых сигналов у рта говорящего принимается равным 97 дБ, что соответствует звуковому давлению примерно 2 Па. Как указывалось выше, уровни громкости речевых сигналов диспетчеров и других оперативных работников железнодорожного транспорта изменяются в течение их рабочего времени, что объясняется реакцией нервной системы на нагрузку. На рис.3.2 показано характерное изменение уровня громкости речевых сигналов поездного диспетчера и дежурных по станциям в течение 12-часового дежурства (кривая 1). Наибольшие отклонения АВР от среднего значения ВРср=\00 дБ приходятся на часы максимальной нагрузки оперативных работников [19,20].

Оснащение рабочих мест диспетчеров, дежурных по станциям и других оперативных работников дополнительными устройствами, обеспечивающими информацию об оперативной обстановке на перегонах, станциях и других объектах не только повышает эффективность деятельности работников, но и улучшает условия их труда. Это сказывается и на изменениях уровня речевого сигнала. В качестве примера, подтверждающего сказанное, на рис.3.2 приведена кривая 2 изменения уровня громкости речевого сигнала диспетчера при оборудовании его участка диспетчерским контролем. Сравнивая кривые 1 и 2, видно, что во втором случае наблюдаемые колебания уровня громкости речевого сигнала значительно меньше. Спектральная характеристика речи определяется зависимостью среднего в течение длительного времени уровня громкости речевых сигналов ВР(рис.3.3) от частоты [19,20]. При расчете разборчивости используется спектр формант (рис. 3.3, кривая ВР). Значения ВР для 20 расчетных равноартикуляционных частотных полос даны в табл.3.1.

Влияние экстраполяции потерянного речевого кадра на качество передачи речи

Мерой разборчивости является величина, определяемая отношением числа правильно принятых по испытываемому тракту элементов речи (звуки, слоги, слова или фразы) к общему числу передаваемых элементов и выражающаяся в процентах.

Разборчивость телефонного тракта можно определить экспериментально или рассчитать. Чаще всего определяют слоговую разборчивость, т.е. разборчивость звукосочетаний, не имеющих смыслового значения. Слоги составляют по определенным правилам и передают в виде таблиц по 100 слогов в каждой. В качестве примера можно привести следующую из слоговых артикуляционных таблиц: лир, луч, чтел, жась, лень, нет, свар, лась, кеш, маф. Для получения достаточно достоверных результатов необходимо передать по испытываемому тракту не менее 2000 слогов при участии специально подготовленных операторов. Процент или доля правильно принятых слогов называется коэффициентом слоговой разборчивости S и служит критерием качества телефонной передачи. Качество испытываемого тракта считают удовлетворительным при слоговой разборчивости S = 40 - 55 %, хорошим - при S= 55 - 80 % и отличным - при S 80 %. Между разборчивостью слогов и других элементов речи существует определенная зависимость: зная слоговую разборчивость, можно определить разборчивость звуков D, слов W и фраз /. При одинаковых условиях разборчивость фраз / выше разборчивости слов и звуков.

Процесс определения разборчивости может быть автоматизирован с помощью специальной аппаратуры для передачи и приема тональных сигналов, соотвегствующих по уровням передачи речевым сигналам.

Разборчивость телефонного тракта можно рассчитать аналитическим методом расчета разборчивости формант. Сущность этого метода заключается в следующем. Частотный диапазон канала или тракта делится на 20 полос, не одинаковых по ширине, но с равной долей формант Д =0,05 в каждой из них (табл.5.1) [10]. При передаче спектра частот из 20 полос суммарная разборчивость формант [10]

Величину ЕФК для средней частоты k-й форматной полосы можно определить по упрощенной формуле, дБ: где ВФК- интенсивность формант в передаваемой полосе частот; аФК - затухание электроакустического тракта для частоты /СРк; Вш - спектральная составляющая результирующего шума в пункте приема на частоте /СРк. Эффективный уровень ощущения формант вычисляют для средней частоты /СРк каждой расчетной полосы, после чего по графику (см.рис. 5.1) находят соответствующие значения Рк и по формуле (5.1) вычисляют суммарную разборчивость формант А. На основании полученного результата по графику (рис.5.2, кривая 1 - русская речь, кривая 2 -английская) определяют значение слоговой разборчивости S, а по графикам (рис.5.3) определяют значение разборчивости звуков Д слов W и фраз 1 [10]. Метод разборчивости (артикуляция) был использован для определения полосы частот, необходимой и достаточной для передачи речи. Исследования показали, что на значение коэффициента разборчивости не влияет исключение спектра частот ниже 300 Гц и выше 3400 Гц. Это объясняется тем, что разборчивость речи зависит прежде всего от восприятия формант, большинство которых лежит в области частот до 3400 Гц.

На разборчивость речи оказывают влияние различные факторы: громкость звука, шумы, ширина полосы частот, затухание тракта и др. Слишком тихая или очень громкая речь становится неразборчивой. С ростом затухания телефонного тракта разборчивость речи снижается. В то же время воздействие на ухо слушателя слишком громкого звука приводит к возникновению искажений речи и понижению разборчивости.

По нормам ITU качество связи считается удовлетворительным, если слоговая разборчивость не меньше 40 %, т.е. S 40 %. Так, удовлетворительное качество связи будет иметь место при разборчивости формант Л=25-35%, слогов 5=40-55%, слов W=S7-90%, фраз 7=95-97% и чисел #=92-95%.

Оценивание качества прерывистой передачи речи

Полученные аппроксимации нормированных спектральных плотностей звукового давления могут быть использованы и для описания спектральной плотности интенсивности, спектральной плотности мощности первичного (на выходе микрофона) электрического сигнала, порождаемого акустических шумами, и т.п. характеристик.

При определении нормированных спектральных плотностей устранены неточности представления исходного материала, присутствующие в рекомендации [8] ITU. 3. С использованием представленных рекомендациями Р.51 ITU [9] данных о спектральной плотности звукового давления (долговременного спектра) искусственного голоса предложена аппроксимация спектральной плотности интенсивности звука. Получено выражение нормированной спектральной плотности, применимое как для описания спектральных плотностей акустического речевого сообщения (звукового давления и интенсивности звука), так и для описания спектральной плотности мощности речевого сигнала, являющегося результатом линейного преобразования в микрофоне. При определении нормированных спектральных плотностей устранены неточности представления исходного материала, присутствующие в рекомендации [9] ITU. Определена степень соответствия известной и предложенной в диссертации моделей нормированной спеїсгральнои плотности мощности речевого сигнала. 4. Для используемых в системе прерывистой передачи речи методов цифрового вокодера (например, метода линейного предсказания с возбуждением регулярной последовательностью импульсов RPE-LPC) предложена модель полосного вокодера, с линейным интерполированием в каждой подполосе спектра сообщения. В рамках такого моделирования определена мощность шума вокодера в общем виде и для предложенной в диссертации модели нормированной спектральной плотности сообщения. Сделан вывод о коррелированности с речевым сообщением шума вокодера Определено отношение мощности сигнала к мощности шума вокодера. 5. Для используемых в системе прерывистой передачи речи методов экстраполяции фрагментов сообщения, потерянных из-за ошибок в канале (замена потерянного кадра предьщущим при потере одного кадра, постепенное заглушение сигнала на приемной стороне и воспроизведение "комфортного" шума при потере подряд двух и более кадров), определены аналитические оценки мощностей соответствующих шумов, в том числе, с учетом искажений, вносимых вокодером. 6. Для используемых в системе прерывистой передачи речи методов цифрового вокодера и экстраполяции разработана методика комплексного аналитического оценивания качества, в том числе, основанная на предложенной в диссертации модели спектральной плотности мощности сообщения и учитывающая наличие корреляции с сообщением тех или иных составляющих шума. Например, при числе полос разбиения 11, длительности речевого кадра 20 мс, входном отношении сигнал/шум 30 дБ, вероятности потери кадра 0,001, при потере подряд двух или более речевых кадров сигнал на выходе речевого декодера заменяется шумом, эквивалентным шуму на входе передатчика, можно получить значение эквивалентного ОСШ на выходе равное 23,54 дБ. 7. Предложена методика аналитической оценки качества прерывистой передачи речи по критерию разборчивости, учитывающая шумы, коррелированные и некоррелированные с передаваемым сообщением и основанная на предложенных в работе моделях. 8. Получила развитие методика аналитической оценки по критерию разборчивости качества кодеков G.711, нашедших широкое распространение прежде всего в цифровых сетях стационарной связи. Для оценки качества передачи речи использованы модели рекуррентных потоков отсчетов с гиперпричинным и пуассоновским распределением вероятностей интервала. Предложена модель рекуррентного потока отсчетов с распределением вероятностей интервала по усеченному (в результате нормирования, проведенного в диссертации с целью учета конечности значения интервала) закону Парето. В отличие от большинства используемых с той же целью моделей потока отсчетов она позволяет практически в неограниченных пределах изменять значение коэффициента вариации интервала в потоке. Рассмотрен ряд практически важных примеров аналитической оценки качества кодеков, использующих представление отсчетами: в штатном режиме, при изменении тактовой частоты, при отбраковке отсчетов, при дрожании фронтов тактовых импульсов и т.п.

Аналитическое моделирование позволяет получать сравнительные оценки качества в весьма сложных условиях, позволяет относительно просто изменять условия функционирования кодека в процессе анализа его качества. Например, задаваясь интенсивностью дискретизации, отвечающей условиям функционирования первичной ЦСП (условиям теоремы В.А.Котельникова), и фиксируя динамический диапазон изменения интервала в потоке (4,48 дБ в табл.5.6), можно моделировать характер нерегулярности потока отсчетов, изменяя параметр усеченного распределения Парето, меняя тем самым значения коэффициента вариации интервала (в табл.5.6 от 0,24 до 0,008), получая при этом оценки качества, проходя все его градации: от неудовлетворительного до отличного (в табл.5.6 значения ОСШ от 6,73 до 779,57 дБ).

Похожие диссертации на Разработка методики оценки качества восстановления речи на фоне шумов, коррелированных с речевым сообщением