Электронная библиотека диссертаций и авторефератов России
dslib.net
Библиотека диссертаций
Навигация
Каталог диссертаций России
Англоязычные диссертации
Диссертации бесплатно
Предстоящие защиты
Рецензии на автореферат
Отчисления авторам
Мой кабинет
Заказы: забрать, оплатить
Мой личный счет
Мой профиль
Мой авторский профиль
Подписки на рассылки



расширенный поиск

Вероятностные характеристики сообщения устной казахской речи Бахтиярова, Елена Ажибековна

Вероятностные характеристики сообщения устной казахской речи
<
Вероятностные характеристики сообщения устной казахской речи Вероятностные характеристики сообщения устной казахской речи Вероятностные характеристики сообщения устной казахской речи Вероятностные характеристики сообщения устной казахской речи Вероятностные характеристики сообщения устной казахской речи Вероятностные характеристики сообщения устной казахской речи Вероятностные характеристики сообщения устной казахской речи Вероятностные характеристики сообщения устной казахской речи Вероятностные характеристики сообщения устной казахской речи Вероятностные характеристики сообщения устной казахской речи Вероятностные характеристики сообщения устной казахской речи Вероятностные характеристики сообщения устной казахской речи
>

Диссертация - 480 руб., доставка 10 минут, круглосуточно, без выходных и праздников

Автореферат - бесплатно, доставка 10 минут, круглосуточно, без выходных и праздников

Бахтиярова, Елена Ажибековна. Вероятностные характеристики сообщения устной казахской речи : диссертация ... кандидата технических наук : 05.13.17.- Москва, 2007

Содержание к диссертации

Введение

1. Аналитические модели речевого сообщения 10

1.1. Аналитическое моделирование речевого сообщения 10

1.2. Характеристики аналитических моделей речевого сообщения 12

1.3. Спектральная плотность мощности и корреляционная функция речевого сообщения 15

1.4. Одномерная плотность распределения вероятностей речевого сообщения 36

1.5. Основные выводы и результаты 37

2. Экспериментальное определение характеристик сообщения казахской речи 39

2.1. Сведения об используемых реализациях 39

2.2. Сведения об используемом аппарате определения характеристик сообщения 39

2.3. Оценки спектральной плотности мощности и корреляционной функции 40

2.4. Оценка плотности распределения вероятностей 47

2.5. Основные выводы и результаты 50

3. Аналитическое моделирование речевого сообщения устной речи на казахском языке 52

3.1. Аналитические модели спектральной плотности мощности и корреляционной функции речевого сообщения устной речи на казахском языке 52

3.2. Аналитические модели плотности распределения вероятностей речевого сообщения устной речи на казахском языке 57

3.3. Основные выводы и результаты 61

4. Учет специфики речевого сообщения устной речи на казахском языке при оценке качества стохастической цифровой передачи речи 62

4.1. Критерии и методы оценки качества передачи речи 62

4.2. Качество передачи речи при статистическом уплотнении ЦСП 66

4.2.1. Отношение мощности речевого сигнала к мощности шумов дискретизации и восстановления 66

4.2.2. Отношение мощности речевого сигнала к мощности шумов квантования по уровню 80

4.3. Качество восстановления речи в ІР-телефонии 86

4.4. Основные выводы и результаты 92

5. Основные результаты и выводы 94

Список литературы 97

Приложение 1 105

Введение к работе

Актуальность темы. В настоящее время в телекоммуникационных сетях возрастает речевой трафик, быстро увеличивается число потребителей речевых услуг, расширяются сферы применения их предоставления, что приводит к необходимости увеличения числа и эффективности использования имеющихся каналов.

В условиях интенсивного развития телекоммуникационных сетей практически отсутствует информация о вероятностных характеристиках сообщения устной казахской речи, аналитические модели этих характеристик.

Известны существенные не только фонетические, но также морфологические и синтаксические отличия казахского языка от русского [57].

Структурно-типологическая характеристика казахского языка, в основном, связана с его принадлежностью к агглютинативным языкам.

Современный казахский алфавит основан на кириллице и включает 42 буквы: 33 русские и 9 казахских, которые отражают специфические звуки казахского языка: Э, 9, , Y, I, F, К,, F, Ц, h. В алфавите 15 букв для передачи гласных: а, о, е, ё, и, о, е, у, , Y ы і» э ю» я5 25 для передачи согласных звуков: б, в, г, г, д, ж, з, й, к, к., л, м, н, ц, п, р, с, т, ф, х, ц, ч, ш, щ, h; 2 знака: ъ (твердый знак), ь (мягкий знак). Буквы в, ф, ц, ч, щ, ь, ъ, ё, э используют только при написании слов иноязычного (в основном русского) происхождения [57,62,63].

В казахском языке ударение большей частью падает на последний слог слова. Согласные звуки в слогах с твёрдыми гласными в казахском языке произносятся твердо, с мягкими гласными произносятся мягко.

При обозначении принадлежности предмета в казахском языке употребляются не только притяжательные местоимения, но и особые притяжательные окончания.

В казахском языке нет предлогов. Значение русских предлогов большей частью передаётся посредством послелогов, а также в форме косвенных падежей.

Числительные и прилагательные в казахском языке в функции определения перед существительными не изменяются ни в числе, ни в падеже.

Категория рода в казахском языке отсутствует. Поэтому одно и то же прилагательное, местоимение или порядковое числительное, в зависимости от смысла предложения, может переводиться на русский язык в мужском, женском или среднем роде.

Именные части речи в казахском языке, в отличие от русского языка, изменяются по лицам.

В казахском языке в отличие от русского вопрос кто? ставится только к существительным, обозначающим человека, а ко всем остальным существительным, в том числе и к одушевленным, ставится вопрос что?.

Причастие в казахском языке, стоя перед определяемым существительным, не изменяется ни в падеже, ни в числе. В русском языке причастие согласуется с определяемым словом в роде, числе и падеже.

В казахском языке имена числительные (количественные, порядковые), употребляясь в предложении перед существительным в функции определения, не изменяются в числе и падеже [57,63].

Фонетические, морфологические и синтаксические отличия казахского языка от русского не могут не привести к не исследованным до настоящего времени отличиям в вероятностных характеристиках сообщения устной казахской речи, их аналитическим моделям, используемым при определении параметров современных телекоммуникационных систем и сетей.

Определение характеристик сообщения устной казахской речи и их моделей, их использование для оценивания качества восстановления речи в телекоммуникационных системах (в том числе и при стохастической цифровой передаче речевого сообщения), применение результатов в производственной деятельности субъектов с учетом требований Международного союза электросвязи (МСЭ) представляются актуальными

задачами для телекоммуникационных сетей Республики Казахстан.

В настоящее время для увеличения эффективности процесса передачи разработаны и широко используются цифровые системы передачи (ЦСП) с преднамеренным введением стохастичности в процесс дискретизации.

Под стохастическими ЦСП (СЦСП) понимаем ЦСП, на вход восстанавливающих устройств которых поступает стохастический поток отсчетов дискретизированной речи [66,77].

Цель работы состоит в определении вероятностных характеристиках сообщения устной казахской речи, их аналитических моделей и разработке методов оценки качества стохастической цифровой передачи сообщения устной казахской речи.

Реализуется следующая последовательность решения задач диссертационной работы:

1. Обзор существующих аналитических моделей речевого сообщения, его вероятностных характеристик.

2. Экспериментальное определение характеристик сообщения казахской речи, его аналитическое моделирование, сопоставление аналитических моделей сообщения казахской речи с моделями сообщений на других языках.

3. Учет специфики сообщения казахской речи при оценке качества примеров реализации стохастической цифровой передачи речи, с использованием критериев отношения мощности речевого сигнала к мощности шумов дискретизации и восстановления, отношения мощности речевого сигнала к мощности шумов квантования по уровню.

Исходная основа диссертации. В основе диссертации лежат:

- фундаментальные работы теории информации Н.Винера, В.А.Котельникова, К.Шеннона и др.

- теоретические и прикладные исследования по цифровой обработке и передаче непрерывных, в том числе речевых сообщений Л.А.Баранова, Дж.Беллами, А.И.Величкина, Г.В.Вемяна, М.Д.Венедиктова, В.Н.Гордиенко,

Г.В.Горелова, А.Г.Зюко, И.П.Кнышева, И.А.Лозового, А.П.Мановцева, М.В.Назарова, Н.И.Пилипчук, Л.Рабинера, О.Н.Ромашковой (Луковой), П.Н.Толмачева, А.Ф.Фомина и др.

- теоретические и прикладные исследования средств и систем передачи информации В.П.Багуц, А.Н.Голубева, Д.В.Дьякова, И.А.Лозового, В.А.Новикова, В.Л.Тюрина, В.П.Яковлева и др.

Методы исследования. В работе использованы методы теории вероятностей, математического анализа, теории массового обслуживания.

Научная новизна. Степень научной новизны диссертации определяется тем, что в ней впервые решаются вопросы моделирования характеристик речевого сообщения устной речи на казахском языке.

Диссертационная работа развивает теорию восстановления речевых сообщений в направлении разработки методики аналитической оценки качества передачи и восстановления сообщений устной казахской речи в стохастических цифровых системах передачи информации, применения разработанных моделей при анализе и проектировании телекоммуникационных систем реализующих передачу и восстановление дискретизированных речевых сообщений.

Практическая ценность результатов диссертации заключена в предоставленной возможности получения аналитическими методами объективных результатов оценки качества устной казахской речи, которые использованы при анализе и проектировании конкретных стохастических цифровых систем, реализующих передачу и восстановление речевых сообщений. 

Спектральная плотность мощности и корреляционная функция речевого сообщения

Различные абстрактные модели речевого сообщения, соответствующие реальной действительности, используются при анализе и синтезе современных телекоммуникационных сетей. Наиболее адекватен нестационарный случайный процесс с медленно меняющимися дисперсией и спектральной плотностью мощности. При использовании такой модели можно синтезировать информационную систему с наилучшими характеристиками. Однако система получается весьма сложной и самонастраивающейся, синтез ее затруднен отсутствием многих статистических характеристик модели [30,66].

Менее точной моделью речевого процесса является нестационарный случайный процесс с медленно меняющейся дисперсией и постоянной средней спектральной плотностью, определяемой экспериментально с использованием усреднения по времени.

Однако, на достаточно продолжительных отрезках времени речевой сигнал может удовлетворять условиям стационарности, что позволяет рассматривать его как квазистационарный. В литературах приводятся примеры применения таких характеристик, как усредненный энергетический спектр (спектральная плотность мощность) и усредненная плотность распределения вероятностей мгновенных значений, предполагающих использование стационарной модели [10,13,30,66].

Использование таких характеристик позволяет получать результаты анализа систем передачи речевой информации с достаточной для инженерной практики точностью. В то время как более тонкое моделирование речевого сигнала существенно усложняет и часто делает невозможным применение аппарата аналитического исследования [30,66].

Одной из форм моделирования речевого сообщения является создание моделей «искусственного рта», «искусственного голоса» [1]. При правильно выбранном расстоянии от источника звука до микрофона акустические параметры должны быть близки к соответствующим параметрам человеческого голоса (рта). При проведении измерений с несколькими источниками звука, прежде всего, необходимо определить, какие параметры будут использованы для сравнения, а какие будут являться базовыми. По данным ITU считается, что расстояние 25 мм от плоскости рта (губ) является наиболее приемлемым [1].

Предполагается, что источник звука должен развивать звуковое давление не менее 90 дБ (2x10 Па) в частотном диапазоне 200-4000 Гц (в диапазоне 100-8000 Гц желательно звуковое давление 100 дБ.) [1].

Искусственный голос - это модель, которая может быть определена математически (задан в аналитическом виде) и которая воспроизводит временные и спектральные характеристики речевого сигнала, что важно при моделировании и проектировании информационной системы. Искусственный голос предназначен для воспроизведения характеристик звучания реального голоса в полосе 100 Гц - 8 кГц. Он может применяться для исследования различных устройств, таких как микрофоны, телефонные громкоговорящие устройства, нелинейные кодеры, слоговые компандеры и др. Конечно, в каждом конкретном случае при исследовании следует внести корректирующие поправки. «Искусственный голос» может являться как электрическим, так и акустическим сигналом (рис. 1.1) [1,30,74]. Искусственный голос, рассматриваемый как электрический сигнал, применяется для исследования и тестирования каналов передачи речи, а также других электрических устройств. Акустический искусственный голос обладает характеристиками 1.2. Характеристики аналитических моделей речевого сообщения Речь предназначена для общения. Возможности речи с этой точки зрения можно характеризовать по-разному. Один из количественных подходов основан на теории информации, в связи, с чем речь можно описать ее информационным содержанием или информацией. Другой способ описания заключается в представлении ее в виде сигнала, т.е. акустического колебания. Речь как акустический процесс характеризуется физическими параметрами. Основными параметрами, используемыми при описании речевого сигнала, являются: - статистическое распределение звуков, слогов и слов при произношении речи; - временные характеристики звуков; - основной тон речи; - усредненный за длительное время спектр; - распределение формантных частот; - мгновенное амплитудное распространение речи. При построении различных систем обработки речи эти параметры играют важную роль [12]. При нормальных условиях передачи суммарный уровень громкости речевых сигналов у рта говорящего принимается равным 97 дБ, что соответствует звуковому давлению примерно 2 Па. Уровни громкости речевых сигналов диспетчеров и других оперативных работников железнодорожного транспорта изменяются в течение их рабочего времени, что объясняется реакцией нервной системы на нагрузку. На рис. 1.2 показано характерное изменение уровня громкости речевых сигналов поездного диспетчера и дежурных по станциям в течение 12-часового дежурства (кривая 1). Наибольшие отклонения АВР от среднего значения ВР=100 дБ приходятся на часы максимальной нагрузки оперативных работников [19,20]. Оснащение рабочих мест диспетчеров, дежурных по станциям и других оперативных работников дополнительными устройствами, обеспечивающими информацию об оперативной обстановке на перегонах, станциях и других объектах не только повышает эффективность деятельности работников, но и улучшает условия их труда. Это сказывается и на изменениях уровня речевого сигнала. В качестве примера, подтверждающего сказанное, на рис. 1.2 приведена кривая 2 изменения уровня громкости речевого сигнала диспетчера при оборудовании его участка диспетчерским контролем. Сравнивая кривые 1 и 2, видно, что во втором случае наблюдаемые колебания уровня громкости речевого сигнала значительно меньше.

Оценки спектральной плотности мощности и корреляционной функции

Таким образом, важнейшей характеристикой речевого сигнала является СПМ S (co) стационарного случайного процесса, которая связана с корреляционной функцией этого процесса преобразованиями Фурье (теорема Винера-Хинчина).

Для уточнения представления об энергетическом спектре речевого сообщения проведем собственные экспериментальные исследования с использованием программы Adobe Aduition, принадлежащей к числу наиболее мощных звуковых редакторов. Предшественниками Adobe Audition являются программы Cool Edit и Cool Edit Pro.

Adobe Audition - это записывающее, редактирующее и микширующее приложение для Windows 2000 или ХР. В программе есть более 50 эффектов цифровой обработки сигналов, фильтров и инструментов реставрации. Кроме того, здесь появились новые возможности обработки звука: улучшенная поддержка видео, новые ручные и автоматические эффекты по корректировке высоты тона, автоматическое устранение щелчков и шлепков для улучшенной оцифровки записей, возможность приглушать либо полностью убирать вокальное или инструментальное содержание, частотно-пространственное редактирование и т.д.[73].

Программа Adobe Audition 1.5 позволяет определять следующие виды спектров [56]. 1. Классический спектр, который основывается на преобразовании Фурье, причем интегрирование по времени выполняется в бесконечных пределах и спектр зависит только от частоты. Однако бесконечная длительность какого-либо процесса - это абстракция, не имеющая ничего общего с реальностью. 2. Текущий спектр, который определяется как результат преобразования Фурье, но с переменным верхним пределом интегрирования, в качестве которого фигурирует текущее время. Поэтому текущий спектр является функцией не только частоты, но и времени. Текущий спектр - нежелателен в тех случаях, когда анализируемый процесс не стационарен. Для того чтобы сблизить частотное и временное представления сигнала, было введено понятие мгновенного спектра. 3. Мгновенный спектр - это спектр короткого отрезка процесса, непосредственно предшествующего данному моменту времени. В этом определении мы имеем дело со скользящим интегрированием: интервал интегрирования имеет постоянную длину, но перемещается по оси времени. 4. Взвешенный спектр Весовая функция описывает зависимость вклада предшествующих отсчетов исследуемого сигнала в вычисляемый спектр. Наглядное представление о весовой функции дает форма так называемого спектрального окна. 5. Быстрое преобразование Фурье (БПФ) - FFT фильтр. Классический спектральный анализ из-за наличия большого количества операций перемножения занимает очень много процессорного времени и при значительном числе отсчетов сигнала неосуществим в реальном темпе обработки. Для сокращения времени спектрального анализа дискретных сигналов разработаны специальные алгоритмы, учитывающие наличие связей между различными отсчетами сигнала и устраняющие повторяющиеся операции. Одним из таких алгоритмов является быстрое преобразование Фурье (БПФ). Если бы не БПФ, то для фильтрации, спектрального анализа и синтеза сигналов не хватило бы быстродействия самого современного компьютера [56]. Несмотря на то, что для получения статистически достоверных данных достаточен объем измерений речи длительностью 22 мин [67], оценку усредненного по времени энергетического спектра произведем для реализации сообщения продолжительностью 35 минут. Выберем частоту дискретизации 44100 Гц. Квантование по уровню равномерное на 216=65536 уровней. Выше было отмечено, что в [30] приведены параметры аналитических моделей энергетического спектра речевых сообщений на русском, английском, испанском и вьетнамском языках. Получаем усредненные СПМ речевого сообщения для полосы телефонного канала 300 - 3400 Гц (рис. 1.5 [47]), для полосы 88,88 - 3400 Гц (рис. 1.6), для полосы 88,88 - 8888,88 Гц (рис. 1.7), для полосы 0 - 16000 Гц (рис. 1.8), для полосы 280 - 3500 Гц (рис. 1.9). Для оценки нормированного усредненного по времени энергетического спектра речевого сообщения на русском языке и для сравнения со спектром, полученным в работе [74], используем спад с крутизной 6 дБ на октаву [76], что не влияет на нормирование спектральной плотности мощности. В аппаратуре спектрального анализа этот наклон обычно компенсируется с помощью дифференцирования речевой волны. Оценки нормированной спектральной плотности мощности речевого сообщения на русском языке представлены на рис. 1.10 [47] (полоса 300 -3400 Гц), 1.11 (полоса 88,88 - 3400 Гц), 1.12 (полоса 88,88 -8888,88 Гц), 1.13 (полоса 0 - 16000 Гц), 1.14 (полоса 280 - 3500 Гц).

Аналитические модели плотности распределения вероятностей речевого сообщения устной речи на казахском языке

В настоящее время широкое развитие получили цифровые сети, в которых все виды информации, в том числе речь, передаются в цифровом виде. При реализации цифровых преобразований речевых сигналов возникают специфические искажения, которые влияют на качество речи.

В соответствии с Рекомендацией Р.48 МККТТ эффективная полоса пропускания звукового тракта речевого (тонального) сигнала лежит в области 300 - 3400 Гц. Одним из критериев качества речи является разборчивость, т.е. смысловая понятность переданной информации слушателю [54].

Разборчивость - объективная количественная величина, характеризующая способность тракта телефонной связи передавать содержащуюся в речи смысловую информацию в данных конкретных условиях акустической среды. Эта величина является объективной, так как зависит от физических параметров тракта телефонной связи, а также от среды, в которой ведется телефонный разговор, и не зависит от субъективных свойств конкретных, измеряющих разборчивость операторов.

Под мерой разборчивости следует понимать отношение числа правильно принятых элементов речи (звуков, слогов, слов, предложений) к достаточно большому общему числу переданных, выраженное в процентах или долях единицы. В соответствии с этим различают разборчивость звуков, слогов, слов и фраз [12,66].

Для проведения испытаний по оценке разборчивости используются тональный и артикуляционные методы, в которых экспертные оценки выносятся экспертами. Основным является статистическая достоверность их результатов, т.е. число участвующих в испытаниях экспертов и количество прослушиваний должно быть достаточными. Тональный метод основан на способности человеческого уха достаточно точно улавливать минимальный порог уровня громкости.

Речевой сигнал воспроизводится в виде отдельных тональных полосок. При прослушивании их уровень уменьшается до минимально воспринимаемой громкости. Полученные значения затухания с помощью справочных таблиц, используемых при расчетах разборчивости речи, пересчитываются и дают численное значение этого параметра [54].

Измерение разборчивости методом артикуляции производится бригадой операторов путем передачи и приема по телефонному тракту серии артикуляционных таблиц, составленных из элементов речи (звуков, слогов, слов, фраз). В зависимости от используемых артикуляционных таблиц (звуковые, слоговые, словарные, фразовые) измеряют следующие виды разборчивости: звуковую, слоговую, словесную и фразовую. В результате таких измерений полученные величины разборчивости являются оценкой качества телефонного тракта [12,15,66].

Из всех типов артикуляционных таблиц на практике нашли применение слоговые и словесные. При этом слоговые артикуляционные таблицы можно рассматривать как основные, так как на практике в основном измеряется именно слоговая разборчивость. Оценочные характеристики для слоговых артикуляционных испытаний представлены в табл.4.1.

С появлением цифровых систем записи и сжатия речи выявляются специфические шумы и искажения, которые ухудшают качество речи. Для их оценки введены разные виды артикуляционных испытаний. Наиболее точными для оценки заметности искажений, вносимых кодеком, являются парные сравнения испытательных фраз. В соответствии с Рекомендацией Р.48 МККТ качество речи испытуемого тракта оценивают с эталонным трактом путем сравнения, в качестве которого используют стандартный телефонный тракт. Качество речи оценивают по контрольным фразам, приведенным в ГОСТ Р50840-95. Каждую контрольную фразу передают один раз через оцениваемый тракт, другой - через эталонный тракт [54].

Качество речи по методу парных сравнений оценивают по 5-бальной системе с оценочным шагом в 0,1 балла. В табл.4.2 приводится соответствие между качеством речи речевого тракта и оценкой в баллах для метода парных сравнений.

Классификация критериев оценки качества речевого сигнала приведена в [21]. Согласно этой классификации, выделяются показатели точности восстановления отдельной реализации и множества реализаций сообщения. Чаще используется вторая группа критериев [71,79], причем предпочтение отдается показателям среднеквадратического приближения [72].

В качестве критерия точности воспроизведения речевого сигнала используем нормированный показатель мощности - средний квадрат (усреднение по множеству реализаций) ошибки, шума воспроизведения (текущей разности между исходным и восстановленным сообщением), усредненный по времени и приведенный к дисперсии сообщения [23,30,80]

Шумы квантования по уровню (отношение мощности сигнала к мощности шумов - ОСШК) относятся к шумам, коррелированным с речевым сообщением, а шумы дискретизации и восстановления (отношение мощности сигнала к мощности шумов - ОСШД) речевого сообщением по его отсчетам - не коррелированным [3,24].

Отношение мощности речевого сигнала к мощности шумов дискретизации и восстановления

Преимущество составляет менее одного децибела, хотя вероятность отбраковки отсчета при чередующемся приоритете практически в два раза меньше. Однако для чередующегося приоритета при чередовании приоритета через отсчет значение ОСШД составляет 42,52 дБ, что на 12,18 дБ больше чем при чередовании приоритета через цикл передачи Е1 и на 12,89 дБ больше чем при фиксированном приоритете.

Следовательно, алгоритм с чередующимся приоритетом с чередованием приоритета через отсчет сообщения устной русской речи является лучшим из трех рассматриваемых в работе реализаций СЦСП. Такое значительное преимущество можно объяснить значительным влиянием на ОСШД потерь более 1 отсчета подряд.

Определим ОСШД сообщения устной казахской речи при /0=300 Гц и а =421 Гц. В случае использования алгоритма с фиксированным приоритетом с использованием исходных данных Fcp=Fcp=3400 Гц, і"д=8000 Гц [30,66] при использовании распределения р(Х), представленного в табл.4.4 получаем по формуле (4.8) оценку ОСШД=34,79 дБ [41]. А при использовании распределения р(Х), представленного в табл.4.5 - ОСШД=48,84 дБ соответственно. Следовательно, при известной оценке вероятности 0 потери пакета использование геометрического распределения (4.6) приводит к завышенной оценке качества восстановления речевого сообщения дополнительного комплекта. В случае использования алгоритма с чередующимся приоритетом для сообщения устной казахской речи с использованием данных табл.4.6. и табл.4.7 получено значение ОСШД=37,53 дБ при чередовании приоритета через цикл передачи Е1 и ОСШД=43,86 дБ при чередовании приоритета через отсчет. Таким образом, также получено подтверждение преимуществу алгоритма с чередующимся приоритетом сообщения устной казахской речи (ОСШД при использовании этого алгоритма равно 37,53 дБ, а при фиксированном приоритете его значение составляет 34,79 дБ). Однако, для чередующегося приоритета при чередовании приоритета через отсчет значение ОСШД составляет 43,86 дБ, что на 6,33 дБ больше чем при чередовании приоритета через цикл передачи Е1 и на 9,07 дБ больше чем при фиксированном приоритете. Следовательно, алгоритм с чередующимся приоритетом с чередованием приоритета через отсчет сообщения устной казахской речи является лучшим из трех рассматриваемых в работе реализаций СЦСП. Такое значительное преимущество можно объяснить значительным влиянием на ОСШД потерь более одного отсчета подряд. Таким образом, для стохастической цифровой системы передачи (СЦСП) со статистическим уплотнением при уточнении аппроксимации СПМ сообщения устной русской речи получены значения ОСШД, отличающиеся от представленного в работе [77] на 3,43 дБ для фиксированного приоритета, на 3,32 дБ при чередовании приоритета через цикл передачи Е1 и на 3,13 дБ при чередовании приоритета через отсчет. При использовании аппроксимации СПМ сообщения устной казахской речи получены значения ОСШД, отличающиеся от значений ОСШД сообщения устной русской речи на 5,16 дБ для фиксированного приоритета, на 7,19 дБ при чередовании приоритета через цикл передачи Е1 и на 1,34 дБ при чередовании приоритета через отсчет. Также получены значения ОСШД, отличающиеся от представленного в работе [77] на 8,59 дБ для фиксированного приоритета, на 10,51 дБ при чередовании приоритета через цикл передачи Е1 и на 4,47 дБ при чередовании приоритета через отсчет. Отношение мощности речевого сигнала к мощности шумов квантования по уровню В системе связи с ИКМ на передающей стороне непрерывный процесс, представляющий собой смесь речевого сообщения с шумом, не только дискретизируется по времени, но и квантуется по уровню. Характерная особенность классической ИКМ заключается в том, что при квантовании по уровню пороги квантования устанавливаются постоянными. На приёмной стороне системы каждый сигнал декодируется и преобразуется в импульс с амплитудой, равной соответствующему уровню. Последовательность таких импульсов образует ступенчатую функцию, называемую квантованным процессом [61]. Квантование - это процесс преобразования непрерывного аналогового сигнала в дискретный сигнал по амплитуде, сопровождаемый шумами квантования и перегрузки [70]. Шум квантования возникает из-за того, что шаг квантования имеет конечное значение, шум перегрузки (ограничения) - из-за ограничения уровня сигнала [11]. В большинстве практических задач уровень перегрузки для случая передачи речевого сигнала принимается равным +3 дБ. Шумы квантования и ограничения не возникают одновременно, общая мощность шумов определяется суммой этих составляющих [30,66].

Для передачи телефонных сигналов использование равномерного (линейного) квантования не является оптимальным, так как распределение амплитуд телефонного сигнала не является равномерным: малые амплитуды сигнала более вероятны, чем большие. В этом случае можно ожидать увеличения отношения сигнал-шум квантования, если ошибку квантования сделать меньшей для более вероятных амплитуд, и телефонные каналы имеют весьма широкий динамический диапазон (порядка 40 дБ), в пределах которого должно обеспечиваться примерно постоянное отношение сигнал-шум квантования.

Похожие диссертации на Вероятностные характеристики сообщения устной казахской речи