Введение к работе
Актуальность темы. Проблема обработки несинхронизирован-ных импульсных последовательностей характерна для многих приложений. В системах радиолокации, например, совокупность импульсов может использоваться для принятия решения " свой-чужой", а в системах медицинской и технической диагностики - для установления заболевания и прогнозирования неисправностей. В системах передачи речи по каналам связи зачастую требуется подавление импульсных помех и т.п. Повышение эффективности подобных систем является важной практической задачей. С этой задачей связаны задачи повышения точности, быстродействия и помехоустойчивости алгоритмов обработки несинхронизированных импульсных последовательностей.
Способ задания априорных данных о неизвестных моментах времени начала импульсов определяет специфику алгоритмов решения задач распознавания импульсных последовательностей, их точность, временную и емкостную сложность. Одним из возможных априорных представлений может служить предположение о том, что моменты времени начала импульсов в распознаваемой совокупности - неизвестные детерминированные величины, причем промежутки времени между началами соседних импульсов лежат в некотором заданном интервале. Исходя из физических соображений, подобную совокупность импульсов можно интерпретировать как квазипериодическую последовательность, а дискретные отсчеты такой импульсной последовательности - как числовую квазипериодическую последовательность.
До последнего времени среди существующих алгоритмов отсутствовали алгоритмы распознавания несинхронизнрованных импульсных последовательностей, ориентированные на обработку числовых квазипериодических последовательностей. Очевидно, что алгоритмы распознавания, учитывающие квазипериодичность несинхронизнрованных данных, будут эффективнее своих аналогов в ситуациях, когда квазипериодичность импульсной последовательности действительно имеет место. Поэтому тема диссертационной работы, направленной на построение и исследование алгоритмов распознавания числовых квазипериодических последовательностей, представляется актуальной.
Цель работы и задачи исследований. Целью работы является разработка и исследование апостериорных вычислительных алгоритмов распознавания числовых квазипериодических последовательностей.
Для достижения цели решаются следующие задачи:
1 Работа выполнена в рамках проектов №Э4-01-00169а, №97-07-90302 к №97-01-00806, поддержанных РФФИ.
анализ подходов к решению проблемы распознавания квазипериодических последовательностей;
разработка и исследование алгоритмов (обучения и классификации), обеспечивающих распознавание квазипериодических после-доЕ^ателыюстей;
получение границ вероятности ошибки распознавания;
анализ временной и емкостной сложности разработанных алгоритмов;
численное моделирование і! применение разработанных алгоритмов для решения прикладных задач.
Методы исследований опираются на аппарат теории вероятностей, математической статистики, теоретической кибернетики, а также математическое моделирование.
Работа является частью общего направления исследований по разработке методов и вычислительных алгоритмов обработки квазипериодических последовательностей, развиваемого Кельмаповым Л.В.
Научная новизна работы состоит в следующем.
1. В работе получены приоритетные результаты по решению про
блемы распознавания числовых квазипериодических последователь
ностей, включающих одинаковые подпоследовательности, ориентиро
ванные на обработку данных в условиях, когда моменты времени на
чала подпоследовательностей - неизвестные детерминированные ве
личины. Этими результатами являются решения двух новых, ранее
не исследованных задач:
1) решение задачи классификации квазипериодических последова
тельностей, включающее:
точный вычислительный алгоритм, обеспечивающий принятие решения по критериям Байеса и максимального правдоподобия за полиномиальное время с линейными затратами по памяти,
выражения для верхней и нижней границ вероятности ошибки распознавания, а также оценки временной и емкостной сложности алгоритма, увязанные с параметрами задачи;
2) решение задачи восстановления подпоследовательности, поро
ждающей квазипериодическую последовательность, включающее:
- приближенный вычислительный алгоритм, обеспечивающий
сближение оценок членов подпоследовательности с оценками мак
симального правдоподобия за полиномиальное время с линейными
затратами по памяти,
- оценки временной и емкостной сложности алгоритма, связанные
с параметрами задачи.
2. Созданы новые средства речевых информационных технологий,
включающие алгоритмическое и программное обеспечение для:
1) очистки речевых сигналов от квазипериодических импульсных
помех, что дает возможность эффективно восстанавливать речевые сигналы, утратившие разборчивость;
2) сегментации речевых сигналов на квазипериодические участки, что позволило создать синтезатор русской речи но тексту, генерирующий сигнал, близкий к естественному по натуральности речи. Практическая ценность результатов работы состоит в том, что найденные решения задач, а также предложенное алгоритмическое и программное обеспечение может быть использовано для создания более совершенных продуктов в области обработки сигналов различной природы, в частности, для автоматической обработки речевых сигналов. Научные результаты, полученные в диссертации, внедрены в в/ч 45807-Э.
Связь с государственными программами и НИР. Работа выполнена в рамках проектов №94-01-001G9-a (1994-199бгт), №97-07-90302 (1997-19Э8гг) и №97-01-00866 (1997-1999п), поддержанных РФФИ. Результаты диссертационной работы в виде алгоритмического и программного обеспечения для очистки речевых сигналов от помех были использованы при выполнении ПИР по теме "ЧИНАРА-СО" (1994-1996гг), которая проводилась по постановлению правительства РФ в соответствии с планом МО РФ.
Апробация работы. Основные положения работы докладывались на Второй и Третьей Всероссийских конференциях "Распознавание образов и анализ изображений: новые информационные технологии" (РОАИ-2-95, г.Ульяновск, 1995 г., РОАИ-3-97, г.Нижний Новгород, 1997 г.); Седьмой и Восьмой Всероссийских конференциях "Математические методы распознавания образов" (ММРО-7, ММРО-8, г.Москва, 1995, 1997 гг.);-Втором Сибирском конгрессе по Прикладной и Индустриальной Математике (ШШРИМ-96), г.Новосибирск, 1996 г. Результаты ра.боты обсуждались на научных семинарах Института математики Сибирского отделения РАН, Института вычислительной математики и математической геофизики Сибирского отделения РАН, Новосибирского Государственного университета.
Личный вклад. Выносимые на защиту результаты получены сооискателсм лично. В опубликованных совместных работах участие автора заключалось в разработке и исследовании алгоритмов, их программной реализации и численном моделировании.
Создание и внедрение прикладных разработок осуществлено сотрудниками Института математики СО РАН при непосредственном участии соискателя.
Публикации. Но теме диссертации опубликовано 17 работ, включая 3 отчета по научно-исследовательским работам. На защиту выносятся: 1. Совокупность результатов по решению проблемы распознава-
ішя числовых квазнпериодических последовательностей, содержащая:
точный апостериорный вычислительный алгоритм решения задачи статистической классификации, включая оценки его временной и емкостной сложности, а также оценки сверху и снизу для вероятности ошибочной классификации;
приближенный вычислительный алгоритм апостериорного типа для решения задачи восстановления подпоследовательности по искаженным данным (задачи обучения) вместе с оценками его временной и емкостной сложности.
2. Комплекс научно-технических средств в составе действующих систем обработки (
- алгоритмическое и программное обеспечение подсистемы
очистки речевых сигналов от квазипериодических импульсных по
мех, позволяющее восстанавливать сигналы, утратившие разбор
чивость;
- новое конструктивное решение подсистемы сегментации и мар
кировки речевых сигналов, позволившее улучшить естественность
синтезированной устной речи.
Объем и структура работы. Диссертационная работа изложена на 126 страницах и состоит из введения, четырех глав, заключения и двух приложений. Основной текст занимает 107 страниц, приложения - 6 страниц. Иллюстративный материал включает 29 рисунков. Список литературы состоит из 165 наименований.