Введение к работе
Актуальность темы. Проблема распознавания речи приобретает се большее значение в различных областях науки и техники. Это бусловлено тем, что устройства распознавания речи способствуют сущест-влекию-вз-гл-агодейст-вия человека с ЭШ в наиболее естеетвен-бй для него речевой фотаге. Кроме того, применение этих устройств-озволяет создать аппаратуру телефонной связи, обладащую более Ысокимн технико^зкокомическимк показателями, чем выпускаемая в асгояшее время.
Вместе с тем, существует ряд нерешенных вопросов, связанных разработке формализованного подхода к выбору конкретных моделей емейетв алгоритмов распознавания- и классификации, а также с еыяс» ением роли априорной информации в распознавании речи и порядком е использования* Не в полной мере изучены задачи обучения и самобучения систем распознавания речи. Все это определяет актуаль-ость темы диссертационной, работы.
Цвльу диссертационной работы является теоретическое и экепе-иментальноё обоснование и разработка методов автоматической фоне-ической сегментации и маркировки речевого сигнала.
Msto-д исследования опирается на использование основных- подоєний теории информации, алгебраического подхода к решении задач опознавания или классификации образов, метода интерпретации-(аксиоматического метода), теории чисел, акустической теории ренеоб-азованияі психофизики и некоторых полонений теории .разборчивости.
Научная новизна работы заключается в следующем;
Епервые для описания процессов сегментации и маркировки -рече*
ах сигналов применен математический аппарат алгоритмической тео-
«и информации; . "
на основе алгебраического подхода к решению задач распознава-:ия или классификации образов с использованием-основных понятий еории информации, осуществлен выбор конкретных моделей семейств лгоригмов распознавания и классификации единиц речи;
выявлена обобщенная зависимость восприятия человеком гром-:оСти и высоты акустических сигналов от их уровня и частоты;
разработан ыетод автоматической фонетической сегментации к аркйровки речевого сигнала, основанный на сочетании детерминиро-іанного и вероятностного, подходов к анализу процесса речевой ком-(уникации и учете заявленной обобщенной зависимости.
Практическая ценность работы -заключается б создании- научной
основы .идя решения уацачл повышения точности автоматической <оне-тическоГ; сегментация и маркировки речевого сигнала, программной р^ллзояки алгоритмов и разработки на этой оснобє модели фононного 'сегментного* вокодера. Оценена технико-экономическая уффектлв 5!осгь формантного, полосного и фонемного (сегментного) вокодеров,
Рчал'/лааяя результатов работы. Диссертационная работа выполнялась по планам научно-исследовательских работ сектора автоматического распознавания и цифровой обработки речевого сигнала ВЦ АН СССР, а такая в/ч 25871.
Результаты работы Енедрены в НИР "Логика МО", "Логика М0-І", "РучеЙ'16" й используются в в/ч ІІ520 и Пензенском каучно-ксследо гагельеком электротехническом институте при разработке фонемного вокодера.
Публикации. Основное содержание диссертационной работы осеє-"лено в восьми научно-технических статьях и в описании изобретения
Аггозбапня работы. Результаты работы докладывались ка Все союз ньос школах-семинарах по автоматическому распознаванию слуховых об разов (в ШГЛ, г. Каунас, 1986 г., в ЙК АН ?ССР, г. Таллинн,1989 г на Всесоюзной конференции "Диалог-87" (в ИВЫ. АН ГрССР, г.Тбилиси, 1987 г.), на Всесоюзном совещании по проблеме "Автоматическое рас познавание и синтез речи (б Ж АН УССР, г. Киев, 1988 г.), на постоянно действующих семинарах "Опыт создания локальных сетей ЗВ;'' и "Системные средства САПР" (в ВДНТЯ им. S.3. Дзержинского, г. Ik сква, 1988, 1989 г.г.), на семинарах,сектора автоматического распознавания и цифровой обработки резвого сигнала ВЦ АН СССР, на сеякнарэ ШЯ им, Мориса Тереза и МГЛУ (г. Москва, 1989, 1991 г.г