Введение к работе
-3-
Актуальность темы Одним из главных направлений развития систем связи является внедрение цифровых систем с интеграцией различных сообщений: речи, видео, данных, факс, телеметрии, телеуправления, мультимедиа и др.
В интересах наиболее эффективного использования пропускной способности различных каналов связи (спутниковых, сотовых, волоконно-оптических, кабельных и других) в современных цифровых системах широко используются различные методы сжатия сообщений (эффективные методы дискретно-цифровых преобразований и энтропийное кодирование) и повышения достоверности передачи (помехоустойчивое кодирование). Поскольку в различных системах связи значительный объем занимают речевые сообщения, то в настоящее время практически во всех указанных современных цифровых системах связи используются низкоскоростные кодеки речи на различные скорости передачи: от 2.4 до 32 Кбит/с, выполняемые по различным рекомендациям МККТТ и UTI (последней из которых является рекомендация G.729, разработки 1996г.) и по рекомендациям отдельных фирм разработчиков.
Проведенный аналитический обзор различных методов сжатия речевых сигналов, рекомендаций МККТТ и конкретных разработок различных фирм показал, что одним из основных элементов большинства используемых низкоскоростных кодеков речи является адаптивный линейный предсказатель, обычно состоящий из комбинации кратковременного (формантного) и долговременного (основного тона) предсказателей. Вместе с тем следует отметить, что в различных стандартах ("INMARSAT", GSM, "MARATHON" фирмы Micom и др.) используются предсказатели различного сравнительно невысокого порядка, определенной конфигурации при различных длительностях кадра. Необходимость использования адаптивных линейных предсказателей связана с существенно нестационарным характером речевых сигналов. Поэтому актуальной задачей является исследование (синтез и анализ) различных адаптивных линейных предсказателей высокого порядка и различной конфигурации.
-4-Известно, что оптимизация параметров низкоскоростных кодеков речі
требует достаточно детальных знаний статистических характеристик речевой
сигнала. Эти характеристики хорошо изучены применительно к европейским і
американским языкам, что нельзя сказать о вьетнамском языке.
Поэтому весьма актуальной и важной в научном и практическом смысл!
является также исследование статистических характеристик вьетнамского і
русского языка и их влияние на повышение эффективности сжатия речи.
Целью диссертационной работы является разработка высокоэффективны:
адаптивных комбинированных линейных предсказателей высокого порядка дл:
низкоскоростных кодеков русской и вьетнамской речи. В соответствии с данноі
целью были поставлены и решались следующие задачи:
-
Аналитический обзор различных алгоритмов сжатия речевых сигналов, реко мендаций МККТТ и конкретных разработок различных фирм с целью опреде ления перспективного направления исследования, направленных на совершен ствование нйзкоскоростных кодеков речи.
-
Синтез и анализ различных методов построения адаптивных линейных пред сказателей речевых сигналов и выбор методики выбора оптимальных парамет ров предсказателя по минимуму дисперсии погрешности предсказания.
-
Аналитический обзор основных характеристик русской и вьетнамской речи і экспериментальные исследования по конкретным фонограмма статистически; характеристик вьетнамской и русской речи.
4. Экспериментальные исследования эффективности адаптивных линейны:
предсказателей различной конфигурации высокого порядка для вьетнамской і русской речи.
Методы исследований В диссертационной работе используются современные теоретические и экспериментальные методы моделирования и оптимизации н; ЭВМ. Теоретические исследования выполнены с использование методов теориї случайных процессов, математической статистики и оптимальной линейноі фильтрации. Экспериментальные исследования выполнены методами статисті ческого и математического моделирования на ЭВМ.
-5-Научная новизна диссертации заключается в следующем:
-
Развита методика оптимизации адаптивных линейных предсказателей высокого порядка комбинированного типа для речевых сигналов.
-
Впервые исследованы статистические характеристики (плотности распределения вероятностей, корреляционные функции, спектральные характеристики, коэффициенты асимметрии и эксцесса) вьетнамской речи и проведено сравнение с соответствующими характеристиками русской речи.
-
Впервые путем статистического моделирования по конкретным фонограммам русской и вьетнамской речи исследования эффективность адаптивных линейных предсказателей высокого порядка (до 22) и различной конфигурации. Практическая ценность работы заключается в следующем:
-
Полученные статистические характеристики вьетнамской и русской речи позволяет более эффективно использовать их для решения различных прикладных задач и прежде всего построения высокоэффективных алгоритмов построения низкоскоростных кодеков прежде всего вьетнамской речи.
-
Полученные результаты экспериментальных исследования адаптивных линейных предсказателей высокого порядка и различной конфигурации указывают пути повышения эффективности подобных предсказателей показано в зависимости от условий их использования.
Личный вклад Все основные научные результаты и результаты статистического моделирования на ЭВМ получены лично автором.
Реализа ция результатов Результаты работы использовались при выполнении научно-исследовательской работы в ОКБ МЭИ (шифр работы "Билингва") и в Радиотехническом институте им. А. Л. Минца при разработке технического проекта спутниковой системы связи, в лабораторных работах по курсу "Теоретические основы транспортной связи".
Апробация работы на кафедре РЭС МИИТа. Основные положении диссертационной работы докладывались и обсуждались: На научно-технических конференциях и семинарах молодых ученых МИИТа / Москва, 1994-1997г.