Введение к работе
Актуальность темы. В настоящее время в связи с необходимостью решения многих научно-технических проблем возрастают требования к производительности численных методов обработки информации. В частности, это касается речевых технологий. Увеличение быстродействия ЭВМ, расширение памяти, снижение стоимости арифметической операции и единицы памяти решает эту проблему, как показывает практика, лишь отчасти. Отсюда возникает потребность в создании новых эффективных численных методов, требующих возможно меньших вычислительных затрат.
Одним из путей повышения эффективности обработки информации является применение методов многомасштабной обработки. Эти методы обеспечивают сокращение объемов данных за счет удаления избыточной и несущественной информации, снижая тем самым вычислительные затраты на последующую обработку. Алгоритмы обработки многомасштабных представлений, основанные на вейвлет-преобразовании (ВП), достаточно надежны и эффективны в реализации. При этом ВП выделяет из сигнала компоненты разных масштабов, и каждый компонент исследуется с той степенью детальности, которая соответствует его масштабу. Однако дискретное ВП не дает полного представления о локальных особенностях нестационарного сигнала, поскольку использование в качестве масштабирующих коэффициентов только целых чисел приводит к значительным потерям информации при переходе с одного уровня разложения на другой. В связи с этим перспективным подходом является использование быстрых алгоритмов непрерывного ВП, позволяющих проводить анализ, выявлять зависимости или отслеживать изменение характеристик сигналов, произвольно выбирая масштабирующие коэффициенты.
Вычисление непрерывного ВП прямым численным интегрированием для больших временных последовательностей занимает длительное время. Для практических приложений очень важным моментом является существование быстрых алгоритмов преобразования и реконструкции сигналов. Поэтому численное вычисление непрерывного ВП производится в частотной области (Сапрыкин В.А., Малый В.В., Лопухин Р.В., Штарк Г.Г.). Но при этом не учитывается свойство симметричности непрерывных вейвлетов, а также возможность вычислять Фурье-спектры вейвлетов с большим масштабным коэффициентом, используя выборку с малым числом отсчетов. Исследования показывают, что учет этих обстоятельств позволяет существенно сократить время вычисления ВП в частотной области.
Кроме возможности многомасштабного представления сигналов, непрерывное ВП сочетает в себе достоинства пространственных и частотных методов фильтрации.
Речевой сигнал является примером нестационарного процесса, в котором информативным является сам факт изменения его частотно-временных
характеристик. Исследования показывают, что адекватными при построении алгоритмов анализа речевых сигналов являются модели на основе частотного представления сегментов вейвлет-спектра речевого сигнала.
Таким образом, разработка численных алгоритмов быстрого непрерывного вейвлет-преобразования сигналов является актуальной задачей, решение которой будет способствовать повышению эффективности обработки информации в широком спектре приложений, в частности в речевых технологиях.
Цель и задачи исследования. Целью настоящего исследования является повышение эффективности (по быстродействию) при выполнении операций численного вычисления непрерывного вейвлет-преобразования. В качестве примера приводится применение разработанных алгоритмов к обработке речевых сигналов.
Для достижения поставленной цели решаются следующие задачи.
1. Разработка алгоритма численного вычисления прямого быстрого
непрерывного ВП на основе БПФ.
2. Разработка алгоритма численного вычисления обратного быстрого ВП
с применением вейвлетов на основе производных функции Гаусса.
Исследование и разработка алгоритма кратномасштабного анализа сигнала.
Разработка математической модели фонем в виде их вейвлет-коэффициентов и формирование базы эталонов фонем на основе этой модели.
Исследование и разработка алгоритмов идентификации фонем с использованием быстрого непрерывного ВП.
Моделирование процесса распознавания речевых команд на основе быстрого непрерывного ВП.
7. Разработка комплекса программ для ЭВМ, реализующего
предложенные алгоритмы в реальном масштабе времени.
Методы исследования. Для решения данных задач в диссертации применяются методы математического анализа, математической статистики, математической логики, цифровой обработки сигналов, вейвлет-анализа, Фурье-анализа, теория алгоритмов, математическое моделирование с применением вычислительной техники.
Научная новизна положений, выносимых на защиту
1. Разработан новый метод численного вычисления прямого быстрого
непрерывного ВП с произвольным выбором масштабирующих
коэффициентов.
2. Разработан новый численный метод обратного быстрого ВП с
применением вейвлетов на основе производных функции Гаусса.
3. Разработан новый алгоритм кратномасштабного анализа сигналов без
каскадного вычисления вейвлет-коэффициентов.
4. Разработана новая математическая модель фонем на основе Фурье-
спектра сегментов вейвлет-спектра и новый алгоритм формирования базы
эталонов фонем на основе этой модели.
5. Предложен новый метод выделения границ между гласными и
согласными звуками речи на основе быстрого непрерывного ВП.
Достоверность. Достоверность положений диссертации обеспечивается корректным использованием математических методов и подтверждается результатами экспериментов на реальных сигналах.
Практическая ценность работы. Предложенные алгоритмы и реализующие их программы дают возможность повысить скорость обработки сигналов.
Реализация и внедрение результатов. Теоретические и практические результаты диссертационной работы использованы в исследовании по гранту РФФИ № 11-07-00276-а «Анализ речи» и в ОАО «ГЭСстрой» -ПЖБИ г. Новочебоксарска. Кроме того, они используются в учебном процессе при проведении лекций и лабораторных работ по курсу «Цифровая обработка сигналов», а также в дипломном проектировании на кафедре компьютерных технологий Чувашского государственного университета.
Апробация работы. Основные положения работы докладывались и обсуждались на семинарах кафедры компьютерных технологий Чувашского государственного университета им. И.Н. Ульянова, XI Всесоюзной конференции по физике электронных и атомных столкновений (Чебоксары, 1991), Третьем семинаре по атомной спектроскопии (Черноголовка, Московская обл.,1992), XXI съезде по спектроскопии (Звенигород, Московская обл., 1995), IV Международной конференции «Импульсные лазеры на переходе атомов и молекул» (Томск, 1999), Международной конференции «TEL' 2007, 2008, 2009» (Казань, 2007-2009), городском семинаре КГТУ имени А.Н. Туполева (Казань, 2009), Средневолжском математическом семинаре Мордовского государственного университета имени Огарева (Саранск, 2009), VIII Всероссийской научно-технической конференции «Динамика нелинейных дискретных электротехнических и электронных систем» (Чебоксары, 2009), межрегиональном форуме-выставке «Чувашия-БИО» (Чебоксары, 2009).
Публикации. По теме диссертации опубликованы 1 монография, 21 статья (2 статьи - в издании из перечня ВАК), 1 патент и 7 свидетельств о государственной регистрации программ для ЭВМ.
Структура и объем работы. Диссертация состоит из введения, четырех глав, заключения, списка литературы и приложения. Общий объем 177 страниц, основной текст - 159 страниц. В работе содержится 91 рисунок.