Электронная библиотека диссертаций и авторефератов России
dslib.net
Библиотека диссертаций
Навигация
Каталог диссертаций России
Англоязычные диссертации
Диссертации бесплатно
Предстоящие защиты
Рецензии на автореферат
Отчисления авторам
Мой кабинет
Заказы: забрать, оплатить
Мой личный счет
Мой профиль
Мой авторский профиль
Подписки на рассылки



расширенный поиск

Разработка способов преобразования речевой информации при передаче по телефонной линии связи Рябинин Евгений Леонидович

Разработка способов преобразования речевой информации при передаче по телефонной линии связи
<
Разработка способов преобразования речевой информации при передаче по телефонной линии связи Разработка способов преобразования речевой информации при передаче по телефонной линии связи Разработка способов преобразования речевой информации при передаче по телефонной линии связи Разработка способов преобразования речевой информации при передаче по телефонной линии связи Разработка способов преобразования речевой информации при передаче по телефонной линии связи Разработка способов преобразования речевой информации при передаче по телефонной линии связи Разработка способов преобразования речевой информации при передаче по телефонной линии связи Разработка способов преобразования речевой информации при передаче по телефонной линии связи Разработка способов преобразования речевой информации при передаче по телефонной линии связи
>

Диссертация - 480 руб., доставка 10 минут, круглосуточно, без выходных и праздников

Автореферат - бесплатно, доставка 10 минут, круглосуточно, без выходных и праздников

Рябинин Евгений Леонидович. Разработка способов преобразования речевой информации при передаче по телефонной линии связи : Дис. ... канд. техн. наук : 05.11.16 Тула, 2005 169 с. РГБ ОД, 61:06-5/108

Содержание к диссертации

Введение

1. Анализ модели передачи информации в информационных системах 12

1.1. Модель системы передачи речевой информации 12

1.2. Анализ способов несанкционированного доступа к открытому каналу связи и способов защиты от них 12

1.3. Модель системы передачи информации по открытому каналу связи с использованием криптографических способов защиты информации 19

1.4. Характеристика источника информации 21

1.5. Известные методов кодирования речевых сигналов 22

1.5.1. Временное сигнальное кодирование 22

1.5.2. Спектральное кодирование сигнала 24

1.5.3. Модельное кодирование источника 25

1.5.4. Гибридные методы кодирования речи 28

1.5.5. Сравнение методов кодирования речи 29

1.5.6. Выбор метода кодирования речевого сигнала 32

1.6. Определение требований к применяемым алгоритмам шифрования 33

1.7. Оценка стойкости защиты информации, передаваемой в информационно-измерительных системах 35

1.7.1. Условия криптоанализа зашифрованных сообщений 35

1.7.2. Совершенная секретность 37

1.7.3. Практическая стойкость 37

1.7.4. Оценка стойкости криптосистемы, основанная на вероятностной модели нарушителя 38

1.7.5.0ценкакриптостойкости с помощью энтропии 40

1.7.6.Выбор способа оценки криптостойкости 43

1.8. Выводы по главе 43

1.9. Постановка задачи 46

2. Формирование модели кодировании речевого сигнала 48

2.1. Модель вычисления спектра сигнала с помошью преобразования Фурье 48

2.2. Модель вычисления спектра сигнала с помошью преобразования Уолша 50

2.3. Модель вычисления спектра сигнала с помошью преобразования Хаара 51

2.4. Модель вычисления спектра сигнала в с помощью дискретного косинусного преобразования 54

2.5. Определение критерия оценки моделей вычисления спектра речевого сигнала. 55

2.6. Исследование моделей вычисления спектра речевого сигнала 55

2.6.1. Сравнение ортогональных преобразований по объёму вычислений 56

2.6.2. Сравнение ортогональных преобразований по возможности сжатия

получаемого результата 58

2.6.3 Выбор ортогонального преобразования 61

3. Исследование модели спектра речевого сигнала, полученной с помощью преобразования хаара 63

3.1. Особенности статистической обработки речевых сигналов 64

3.2. Выбор модели анализа структуры спектра речевого сигнала 67

3.3. Анализ информативности коэффициентов спектра Хаара 68

3.4. Анализ статистических связей между смежными коэффициентами Хаара в соседних уровнях 70

3.5. Анализ статистических связей между коэффициентами Хаара в пределах временного окна 72

3.6. Анализ зашифрованного спектра речевого сигнала 77

3.7. Анализ шифрования первых 64-х коэффициентов спектра речевого сигнала.91 3.8.Анализ первых 64-х коэффициентов зашифрованного спектра речевого сигнала при использовании ключей большой разрядности 102

4. Техническое описание программного комплекса, осуществляющего передачу речевого сообщения по телефонной линии связи 109

4.1. Описание пользовательского интерфейса 109

4.1.1. Настройка параметров шифрования речевого сигнала 110

4.1.2. Настройка параметров сжатия речевого сигнала 111

4.1.3. Настройка способа передачи речевого сигнала 112

4.2. Анализ результатов, обеспечиваемых разработанным программным обеспечением 113

4.3. Описание работы основных блоков программного комплекса 114

4.2.1. Реализация алгоритма вычисления спектра речевого сигнала. Преобразование Хаара 116

4.2.2. Реализация алгоритма сжатия речевого сигнала 119

4.2.3. Реализация алгоритма шифрования речевого сигнала 120

4.2.4. Синхронизация временных интервалов работы передатчика и приёмника речевого сигнала 121

Выводы по работе 132

Литература (библиографический список)

Введение к работе

Актуальность темы. Применение современных средств вычислительной техники и связи, а также современных методов обработки и передачи информации во всех сферах человеческой деятельности на сегодняшний день приняло всеобщий характер, а создаваемые на их основе информационно-измерительные системы (ИИС) и сети становятся более сложными и широко используемыми.

Одним из наиболее распространённых каналов передачи информации в ИИС является телефонных канал, по которому может передаваться информация, представленная как в аналоговом, так и в цифровом виде.

Следует отметить, что использование телефонного канала, являющегося открытым каналом с малой пропускной способностью, в качестве средства передачи информации в ИИС имеет ряд недостатков, к которым относятся: проблема передачи широкополосных сигналов, а также обеспечение установленного статуса надёжности передаваемой информации.

Обращаясь к проблеме обеспечения надёжности информации, передаваемой в ИСС, следует отметить, что анализ возможных угроз нарушения целостности хранимой и передаваемой информации показывает, что несанкционированный доступ (НСД) к передаваемой конфиденциальной информации является источником большого ущерба для частных организаций. В Стенфордском институте были проведены углубленные исследования причин нарушения целостности хранимой и обрабатываемой информации. На основании этих исследований специалисты института пришли к выводу, что, несмотря на принимаемые меры, злоумышленные действия в ИС приняли почти массовый характер. При этом по оценкам специалистов 85% случаев несанкционированного проникновения в информационные системы вообще остаются нераскрытыми.

В настоящее время разработано множество средств, осуществляющих кодирование речевой информации для защищенной передачи по телефонным линиям связи. Однако следует отметить, что большинство из них имеет техническую реализацию, недостатками которой являются: габариты, высокая стоимость, необходимость использования отдельного питания, а также отсутствие возможности гибкого изменения алгоритма защиты.

На основании вышесказанного можно сделать вывод, что задача разработки ИИС, осуществляющей кодирование речевой информации с целью обеспечения её защищенной передачи по открытому каналу связи с малой пропускной способностью с использованием стандартных средств является актуальной.

Объектом исследования диссертационной работы является информационная система, состоящая из датчика, средств преобразования речевого сигнала, средств передачи информации (линии связи), средств, осуществляющих восстановление речевого сигнала на приёмном конце, а также средств воспроизведения.

Для обеспечения целостности информации, передаваемой в указанной ИИС, необходимо проводить её преобразование, которое удобнее всего осуществлять в цифровой форме. Передача речевой информации в цифровой форме требует обеспечения полосы пропускания канала связи, равной 7 КГц. В рассматриваемой ИИС передача информации осуществляется с использованием телефонного канала связи, имеющего малую пропускную способность, недостаточную для передачи оцифрованного речевого сигнала. На основании вышесказанного предметом исследования настоящей работы являются способы преобразования передаваемого речевого сигнала в режиме реального времени с целью обеспечения передачи его по узкополосному каналу связи, а также обеспечения защиты последнего от несанкционированного доступа.

Целью диссертационной работы является разработка методов создания ИИС, используемой для кодирования и передачи речевой информации по открытым каналам связи с малой пропускной способностью с использованием стандартных средств.

В соответствии с поставленной целью автором решены следующие задачи:

Проведён анализ существующих способов кодирования речевых сигналов в ИИС.

Обобщены требования, предъявляемые к эффективности использования различных способов кодирования речевых сигналов.

Выбран способ предобработки речевого сигнала с датчика для применения методов его последующего сжатия и защиты, обеспечивающий выполнение следующих требований: a. осуществление преобразования речевого сигнала без потерь; b. малый объём вычислений, достаточный для работы информационной системы в режиме реального времени; c. обеспечение минимального объема передаваемых данных для последующего согласования с пропускной способностью узкополосного канала связи. N

Проведено исследование различных моделей вычисления спектра сигналов.

Выбрана модель вычисления спектра речевого сигнала, имеющая минимальный объём вычисления, а также обеспечивающая наибольшие возможности для последующего сжатия.

Проведено исследование выбранной модели спектра речевого сигнала, на основании которого: a. предложен способ сокращения избыточности речевого сигнала, обеспечивающий высокую степень сжатия, а также имеющий малый объём вычислении. b. предложен способ оценки качества защиты речевого сообщения, основанный на вычислении энтропии для выборок смежных частот его спектра, а также оценки степени приближенности полученного результата к энтропии белого шума, а также разработан подход к шифрованию, обеспечивающий высокую степень защиты речевого сигнала от несанкционированного доступа (НСД) при использовании ключей малой длины.

Научная новизна диссертации заключается в следующем:

Обосновано применение вейвлета Хаара для эффективного кодирования речевого сигнала путём исследования изменения среднеквадратичной ошибки восстановления его во временной форме в зависимости от удаления наименее информативных частот из его спектра.

На основании анализа модели спектра речевого сигнала разработан способ его кодирования, позволяющий осуществлять эффективное сжатие речевых сигналов, а также защиту от несанкционированного доступа с использованием ключей малой длины.

Предложен способ оценки качества шифрования речевого сообщения, основанный на вычислении энтропии для выборок смежных частот спектра Хаара, полученного для речевого сигнала, а также оценки степени приближенности полученной энтропии к энтропии белого шума.

Практическая ценность работы заключается в следующем:

Разработана методика преобразования речевого сигнала в ИСС, позволяющая осуществлять эффективное сжатие последнего, а также проводить шифрование с использованием ключей малой длины.

Создан аппаратно-программный комплекс, осуществляющий передачу речевого сигнала по открытым каналам связи с малой пропускной способностью.

Положения, выносимые на защиту:

Методика преобразования речевого сигнала в ИИС для передачи по узкополосным каналам связи, основанная на удалении неинформативных частот из его спектра.

Способ оценки эффективности преобразования речевого сигнала для осуществления защищенной передачи по открытым каналам связи.

Реализация результатов работы. Предложенные в работе методы кодирования речевого сигнала внедрены в ООО «Интерсвязь», а также в учебный процесс на кафедре "Робототехника и автоматизация производства" Государственного образовательного учреждения высшего профессионального образования "Тульский государственный университет" при преподавании следующих дисциплин: «Информатика», «Системы автоматизации и управления».

Апробация работы. Основные положения диссертации докладывались на 19-ой юбилейной сессии, посвященной «Дню радио», научно-технических конференциях и семинарах профессорско-преподавательского состава Тульского государственного университета 2003, 2004 и 2005 гг.

Структура и объем работы. Диссертационная работа состоит из введения, четырёх разделов и заключения, изложенных на 158 страницах машинописного текста и включающих 77 рисунков и 21 таблицы, 6 приложений на 28 страницах и списка использованной литературы из 77 наименований.

Публикации.

По теме диссертации опубликовано 10 печатных работ, включенных в список литературы, в том числе: 2 тезиса докладов на всероссийских конференциях, 8 статей.

Во введении обоснована актуальность выбора темы диссертационной работы, охарактеризованы объект и предмет исследования, поставлена задача разработки способов преобразования речевого сигнала в информационно-измерительной системе для обеспечения его защищенной передачи по открытым каналам связи с малой пропускной способностью, дана краткая характеристика работы.

В первом разделе проведён анализ типовой модели информационно-измерительной системы, в которой наибольший интерес представляет алгоритм предобработки речевого сигнала с целью сокращения присутствующей в нем избыточной информации, а также алгоритм шифрования, позволяющий осуществлять защищенную передачу речевых сигналов по открытым каналам связи.

На основании анализа известных способов кодирования речевых сигналов было выбрано спектральное кодирование, обеспечивающее выполнение следующих требований: осуществление преобразования речевого сигнала без потерь; малый объём вычислений, достаточный для работы ИИС в режиме реального времени;

В основу выбора спектрального кодирования было положено и то обстоятельство, что представление речевых сигналов в спектральной области открывает широкие возможности для их последующего сжатия и шифрования.

С целью выбора способа защиты речевых сигналов при передаче по линии связи был проведён анализ известных способов оценки качества его работы, в результате которого было установлено, что наиболее объективную оценку даёт энтропийный способ, отражающий степень присутствия статистической информации в зашифрованном сообщении.

В заключении первого раздела, на основании проведённого анализа сформированы основные задачи исследований, основными из которых являются: определение модели вычисления спектра речевых сигналов, исследование выбранной модели, а также разработка методологии кодирования речевых сигналов, обеспечивающей эффективное сжатие и шифрование последних.

Во втором разделе проведено исследование известных моделей вычисления спектра речевых сигналов, наиболее распространёнными из которых являются: преобразование Фурье (ПФ), быстрое преобразование Фурье (БПФ), дискретное косинусное преобразование (ДКП), преобразование Уолша (ПУ) и преобразование Хаара (ПХ).

Сформирован комплексный критерий оценки рассматриваемых моделей вычисления спектра речевого сигнала, в состав которого входят следующие показатели: возможность последующего сжатия с целью эффективной передачи речевого сигнала по каналам с малой пропускной способностью, наиболее полное отражение нестационарности речевого сигнала, а также обеспечение возможности последующего шифрования с целью обеспечения закрытой передачи речевого сигнала по открытому каналу связи. На основании исследования предложенных моделей в соответствии с сформированным критерием выбрана модель основанная на быстром преобразовании Хаара. В качестве алгоритма вычисления спектра Хаара выбран алгоритм Эндрюса, имеющий простую реализацию, а также малый объём вычислений, позволяющий г4# получать спектр Хаара речевого сигнала в режиме реального времени.

В третьем разделе проведено исследование спектра речевого сигнала, полученного с использованием быстрого преобразования Хаара. Построена модель представления данных, полученных в результате выполнения преобразования Хаара, предлагается способ её анализа.

На основании проведённого анализа структуры спектра речевого сигнала предложен способ кодирования речевого сигнала, позволяющий осуществлять его эффективное сжатие, а также шифрование с использованием ключей малой длины. Также предложен способ оценки качества шифрования речевого сигнала, основанный на вычислении энтропии для выборок смежных частот спектра Хаара, а также оценки степени приближенности полученного результата к энтропии белого шума.

В четвёртом разделе рассмотрены результаты использования разработанных в диссертационной работе способов преобразования речевой информации при разработке программного обеспечения, осуществляющего кодирование и передачу речи по телефонной линии связи.

Сделано подробное описание пользовательского интерфейса, а также алгоритмической реализации механизмов кодирования, сжатия и шифрования речевого сигнала. С целью обеспечения безотказной работы разработанного программного комплекса, в разделе осуществляется расчёт объёма буфера накопления данных (организуемого при приёме-передаче информации) и обеспечивающего согласованную работу передающего и принимающего модулей. $ Проведён анализ эффективности работы разработанного прогрммного обеспечения, реализующего предложенный способ сжатия речевой информации.

Анализ способов несанкционированного доступа к открытому каналу связи и способов защиты от них

В общем виде модель ИС, осуществляющей передачу информации, можно представить следующим образом. Нарушитель Источник информации \/ Канал связи Приёмник информации Рис 1.1. Модель системы передачи информации

Источник речевой информации формирует сигнал, представляющий колебания сложной формы, зависящей от произносимых слов, тембра голоса, интонации, пола и возраста говорящего. Спектр речи расположен в пределах от 50 до 10000 Гц.

Канал связи — это физическая среда, которая используется для передачи сигнала от приёмника к источнику.

Нарушитель - это лицо, предпринимающее попытку выполнения запрещенных операций (действий) по ошибке, незнанию или осознанно со злым умыслом (из корыстных интересов) или без такового (ради игры или удовольствия, с целью самоутверждения и т.п.) и использующее для этого различные возможности, методы и средства.

Анализ способов несанкционированного доступа к открытому каналу связи и способов защиты от них

Нарушителем может быть выбран один из 2-х способов прослушивании телефонной линии: гальванический или индукционный [13].

Гальванический способ (электрическое соединение входов ПУ с телефонной линией) подразумевает параллельное или последовательное подключение. Такой способ подключения изменяет основные параметры линии, такие как: напряжение, ток и сопротивление линии. Эти факторы являются демаскирующими для гальванического подключения.

Второй способ подключения ПУ к линии - бесконтактный, реализуется, как правило, индукционным способом. При индукционном подключении проводник телефонной линии выступает в качестве первичной обмотки, а обмотка индукционного датчика выступает в качестве вторичной обмотки трансформатора связи. С помощью такого образовавшегося трансформатора связи происходит съём аудиоинформации с линии связи.

Индукционный способ подключения практически не имеет демаскирующих факторов, т.к. не меняет параметров линии связи, однако аппаратура, реализующая данный способ имеет большие габариты.

Применяемый способ защиты передаваемой информации должен обеспечивать защиту на всём протяжении линии связи (от источника информации до приёмника) при использовании как гальванических, так и индукционных способов перехвата информации.

Известные способы защиты открытых каналов связи от прослушивания можно разделить на две группы: способы, основанные на ограничении физического доступа к каналу и аппаратуре связи и способы, основанные на преобразовании сигналов в линии к форме, исключающей (затрудняющей) для злоумышленника несанкционированный доступ либо в виде восприятия информации, либо в виде искажения содержания передачи [27].

Способы первой группы имеют ограниченное применение, так как на основном протяжении линия связи находится вне ведения субъекта, организующего защиту.

Способы второй группы направлены на обратимое изменение формы представления передаваемой информации. Преобразование должно придавать , информации вид, исключающий ее восприятие при использовании аппаратуры, стандартной для данного канала связи. При использовании же специальной аппаратуры восстановление исходного вида информации должно требовать затрат времени и средств, которые по оценке владельца защищаемой информации делают бессмысленным для злоумышленника вмешательство в процесс передачи. Основные используемые в настоящее время способы преобразования речевого сигнала, препятствующие перехвату последнего при передаче по каналу связи, и их взаимосвязь представлены на рис. 1.5.

Применение вариантов преобразований А, Б, В требует наличия соответствующей аппаратуры у каждого из взаимодействующих абонентов сети.

При применении защитного шума (вариант А) следует учитывать ряд обстоятельств:

1. Стойкий защитный эффект оказывает лишь наложение шума, действительно являющегося случайным процессом и по диапазону частот полностью перекрывающего речевой сигнал. В то же время, многие известные и широко применяемые способы получения "шумового" сигнала на самом деле формируют сигнал, по ряду своих частотных и временных параметров весьма близкий к действительно шумовому, но на самом деле имеющий существенные внутренние корреляционные связи.

Такой сигнал во многих случаях может полностью заменять шумовой (при измерениях частотных характеристик, оценке помехозащищенности и пр.). Сигнал, имеющий существенные внутренние корреляционные связи, может быть успешно использован и в качестве защитного шума, если перехват ведется на слух, без использования корреляционной обработки принимаемой или предварительно записанной смеси речевой сигнал/шум. Однако при применении относительно несложных методов корреляционной обработки такой "шум" может быть почти полностью подавлен.

2. Речевой обмен в естественных условиях подвержен влиянию множества помех. Вследствие этого в процессе эволюции речевой и слуховой аппарат человека сформировали исключительно помехоустойчивую систему. Поэтому, если для технических систем отношение шум/сигнал, необходимое для подавления восприятия сигнала, составляет обычно десятки процентов, то для речи подавление смыслового восприятия происходит при отношении шум/сигнал в несколько сотен процентов, а подавление признаков речи (невозможность фиксации факта разговора) достигается при отношении шум/сигнал близком к 10.

Модель вычисления спектра сигнала с помошью преобразования Уолша

Функции Уолша представляют собой систему ортонормированных функций, обозначаемых wal(&, t) и имеющих имеет вид последовательности прямоугольных импульсов. Множество функций Уолша определяется следующим выражением: wa\w{k, t) = ca\.(sk, t), к - чётное; walw(, t) = sd\(sk, і), к - нечётное; (2.8) где s/c — частость функции wa\w(k, і), определяемая как 0, к=0 sk= к/2, к-чётное (2.9.) (к+ 1)/2, к-нечётное Первые шесть фугкций Уолша приведены на Рис. 2.2. Действие преобразования Хаара можно представить следующим образом [4, 70,77]: Выбирается 2" значений исходного сигнала. Определяется /7+1 частот.

Причём базовая частота равна половине частоты сигнала ( , где VKB частота квантования), а каждая последующая частота берется равной V V .ifl. Поскольку заранее предполагается, что сигнал является нестационарным, то каждый из и+1 коэффициентов необходимо квантовать по времени. Следовательно, в результате вычисления преобразования Хаара для каждой и-ой частоты будет получен не 1 коэффициент (как в преобразовании Фурье), а 2 ("_1) для каждой 1/[2" ] периода сигнала [].

Для исходной последовательности сообщения X = {Х(0), X(l),..., X(N-1)} результат вычисления быстрого преобразования Хаара (спектр Хаара) Yx = {Y(0),Y(1),...,Y(N-1)} определяется следующей группой выражений.

С целью определения критерия выбора подходящей модели вычисления спектра речевого сигнала вернёмся к требованиям, предъявляемым к способам кодирования речевых сигналов, передаваемым по открытым каналам связи с малой пропускной способностью.

Основным требованием работы выбираемого алгоритма является обеспечение его работы в режиме реального времени. Удовлетворение данного требования непосредственным способом связано с выбором алгоритма, имеющего малый объём вычислений.

Следующим требованием является обеспечение выбранным алгоритмом кодирования возможности выполнения последующего эффективного сжатия передаваемой информации.

Поскольку предполагается, что передача речевого сигнала в ИС будет происходить по открытым каналам связи, немаловажным требованием будет являться обеспечение выбранным алгоритмом кодирования возможности последующего эффективного шифрования.

Как было отмечено в предыдущем разделе, в качестве критерия выбора наиболее подходящего алгоритма вычисления спектра речевого сигнала следует использовать комплексный критерии, характеризующий: скорость его работы, а также возможность последующего эффективного сжатия и шифрования закодированной информации. Проведём сравнительный анализ рассмотренных выше ортогональных преобразований в соответствии с показателями, входящими в состав комплексного критерия

Сравним количество арифметических операций, необходимое для выполнения известных ортогональных преобразований.

Как можно заметить из данных, представленных в таблице, количество операций, необходимое для выполнения различных ортогональных преобразований зависит от длины вектора обрабатываемых значений. В нашем случае под длиной вектора понимается длина временного окна, в котором осуществляется ортогональное преобразование (рассчёт спектра сигнала). .

На Рис. 2.7. приведён график зависимости количества операций, необходимых для выполнения различных ортогональных преобразований в зависимости от длины обрабатываемого вектора данных.

Выбор модели анализа структуры спектра речевого сигнала

Как было отмечено ранее, перевод речевого сигнала из временной в спектральную область осуществляется с помощью преобразования Хаара, выполняемого во временном окне, имеющим малую длину и перемещающимся вдоль временной оси. Было также отмечено, что статистическая обработка речевого сигнала, основанная на подсчёте вероятности появления уровней в зависимости от tf появления предшествующих уровней, невозможна ввиду недостатка ресурсов персонального компьютера для хранения и обработки больших объём данных.

На основании вышесказанного предлагается рассматривать структуру спектра речевого сигнала в виде двумерного массива, строками которого являются выборки коэффициентов Хаара во временных окнах, а столбцами -выборки смежных коэффициентов в соседних временных окнах. Т.к. длина временного окна заранее выбирается равной малому временному интервалу (0,1 с), в течение которого предполагается, что речевой сигнал остаётся стационарным, вектор значений коэффициентов Хаара во временном окне можно рассматривать как один независимый символ.

Предлагаемая модель анализа спектра речевого сигнала представлена на С целью разработки метода эффективного сжатия спектра речевого сигнала, проведём анализ информативности смежных коэффициентов спектра Хаара.

Результат подсчёта количества информативных коэффициентов спектра Хаара, проведённого для различных речевых сигналы, соответствующих мужскому, женскому и детскому голосам представлен на рис. 3.5.

Из полученных результатов видно, что для спектра Хаара, соответствующего речевому сигналу, характерна ярко выраженная картина ф распределения информативных коэффициентов для 4-х интервалов: с 1-го по 32-й коэффициент, с 32-го по 64-й коэффициент, с 64-го по 128-й коэффициент и с 128-го по 256-й коэффициент. Для каждого из указанных интервалов характерно резкое уменьшение количества информативных коэффициентов по сравнению с предыдущим интервалом. Анализ предстваленных результатов также показывает, что основная часть информации содержится в первых 32-х коэффициентах спектра речевого сигнала. Большая часть коэффициентов, соответствующих большим частотам не является информативной.

Из представленных результатов также видно, что для женского и детского голосов по сравнению с мужским голосом характерно наличие большего числа информативных коэффициентов спектра Хаара, соответствующих высоким частотам. Данное обстоятельство предполагает обеспечение меньшего коэффициента сжатия речевых сигналов, соответствующих женскому и детскому голосам.

Анализ информативности коэффициентов, проведённый в пределах различных временных окон, показал, что большое количество временных окон (в дальнейшем неинформативные окна) не содержит ни одной информативной частоты. Равенство 0 всех коэффициентов Хаара в пределах информативного окна соответствует появлению паузы в речи. Очевидно, что данная информация (окна, состоящие только из неинформативных частот) также не будет передаваться по линии связи.

Таким образом, на основании проведённых исследований, можно предположить, что передача по линии связи только информативной части спектра речевого сигнала должна обеспечивать эффективное сжатие последнего. Из приведённых графиков видно, что значения первых 80-ти коэффициентов имеют большой диапазон изменения, в то время как смежные коэффициенты, соответствующих высоким частотам, практически не изменяются. Для анализа статистической зависимости между коэффициентами в спектре речевого сигнала проведём рассчёт их энтропии. Из полученных результатов видно, что значение энтропии изменяется скачкообразно, сохраняя постоянное значение в диапазонах 0-28, 29-64, 65-127, 128-255.

Данные результаты обусловлены большим диапазоном изменения коэффициентов спектра Хаара на малых частотах и малым диапазоном изменения коэффициентов на больших частотах. Также из полученных результат видно, что для спектра речевых сигналов характерна ярко выраженная картина статистических связей между символами. L На основании модели, предложенной в разделе 3.2., проведём анализ коэффициентов спектра речевого сигнала в пределах временного окна. Результаты проведённого анализа на Рис. 3.8-3.10. Коэффициенты го і О Коэффициенты го I о " Л у у/\\Л- А -- .Й—j /5 - Коэффициенты - \Д/\г го x О Jv/vyV"VA —Wrvf Рис. 3.8 Статистика коэффициентов спектра Хаара в отдельно взятом временном окне.

Также, как из Рис.3.6., на основании Рис. 3.8. можно судить о том, что коэффициенты, соответствующие малым частотам спектра Хаара имеют большой диапазон изменения значений, в то время как коэффициенты, соответствующие высоким частотам, практически не изменяются.

Настройка способа передачи речевого сигнала

Разработанный программный комплекс состоит из следующих основных блоков: Основной модуль (MainUn), обеспечивающий взаимодействие функциональных модулей программы, а также служащий для отображения процесса передачи (записи) речевого сигнала. Модуль GraphVisualizerUn, предназначенный для отображения массивов данных на указанном носителе. Модуль StaticMethodsUn, представляющий собой библиотеку стандартных функций, используемых остальными модулями программы. Ф - Модуль SpectrumUm, предназначенный для вычисления спектра речевого сигнала, а также для обратного перевода речевого сигнала из спектральной во л временную форму.

Модуль CompressUn, осуществляющий сжатие спектра речевого сигнала. Модуль CodingUn, осуществляющий шифрования передаваемой информации. Модуль SendingUn, осуществляющий запись передаваемой информации в порт (файл), а также осуществляющий чтение данной информации из порта (файла). - Модуль CodeSettingsUn, предназначенный для настройки параметров шифрования передаваемой информации. Модуль CompressSettingsUn, предназначенный для настройки параметров сжатия речевого сигнала. - Модуль TransfersettingsUn, предназначенный для настройки параметров передачи речевого сигнала.

Взаимодействие указанных блоков программного комплекса показано на рис. 4.6. На рисунке 4.6. цифрами 1-8 обозначены следующие основные функции взаимодействия основного модуля программы с функциональными модулями: 1 - преобразование сигнала из временной в спектральную форму; 2 - преобразование сигнала из спектральной формы во временную; 3 — сжатие спектра речевого сигнала; 4 - восстановление спектра речевого сигнала (декомпрессия); 5 - кодирование сжатого спектра речевого сигнала; 6 — декодирование сжатого спектра речевого сигнала; 7 - передача данных по модему (или сохранение в двоичный файл); 8 - считывание получаемых данных из порта (считывание из двоичного файла).

Первые 6 функций представляют собой программную реализацию результатов исследований, описанных в предыдущей главе. Рассмотрим алгоритмы данных функций.

В основу работы алгоритма вычисления спектра речевого сигнала положено действие временного окна, перемещающегося вдоль временной оси. На основании данных, полученных со звуковой карты с помощью формулы 2.6 в каждом отдельно взятом окне выполняется преобразование Хаара.

В основу алгоритма сжатия спектра речевого сигнала положено сделанное в предыдущей главе утверждение о том, что основная часть спектра не является информативной. Было предложено осуществлять сжатие следующим образом:

1) Массив значений, полученных после преобразования речевого сигнала в спектр Хаара, разбить на 4 интервала, соответствующих указанным выше интервалам.

2) Для каждого из интервалов выполнять следующее: подсчитать количество неинформативных частот. если процент неинформативных коэффициентов превышает заданную величину (например 90%), отметить интервал как неинформативный и не передавать по линии связи. Формат передачи сжатого спектра речевого при выбранном методе сжатия выглядит следующим образом: I » бит 0-32 байт 0-32 байт 0-64 байт 0-128 байт St Tag Wl W2 W3 W4 Рис.4.10. Формат передачи сжатого спектра речевого сигнала J На Рис. 4.10. обозначено: Tag: байт, содержащий информацию о номерах информативных интервалов, данные которых присутствуют в группе передаваемых значений.

W1-W4: данные, соответствующие информативным интервалам спектра речевого сигнала. Поля могут отсутствовать, если передаваемый интервал не является информативным.

При приёме (и последующей дешифрации) сжатого спектра речевого сигнала с целью восстановления исходной информации осуществляется обратная последовательность действий: 1. В массиве полученных (принятых) значений выделить стартовый байт, определяющий объём сжатых данных. 2. Прочитать поле тэга. Определить номера информативных интервалов (номер информативного интервала соответствует номеру бита в поле тэга, выставленному в 1). 3. В соответствии в информацией, полученной в п.2 восстановить: - информативные интеравлы с использованием информации, полученной из полей W1-W4 соответственно; - неинформативные интервалы как последовательность 32-х, 32-х, 64-х, 128-и нулевых значений соответственно для 1, 2, 3 и 4-го интервалов.

Шифрование сжатого спектра речевого сигнала основано на гаммирование по ключу. Поскольку информация о зашифрованном спектре речевого сигнала передаётся в виде последовательности байт, максимально величина каждого элемента ключа должна была выбрана равной 1 байту.

Алгоритмы шифрования и дешифрования спектра речевого сигнала с использованием гаммирования по ключу представлены на Рис. 3.11 — 3.12. соответственно.

Похожие диссертации на Разработка способов преобразования речевой информации при передаче по телефонной линии связи