Введение к работе
Актуальность работы. Одной 'из наибо'лее эффективных и естественных для человека форм общения является речевое взаимодействие. Основное.отличие вычислительных систем пятого поколения' от ЭВМ предыдущих* поколений состоит в использовании "интеллектуальной" периферии, ориентированной на непрофессионального пользователя и обеспечивающей обмен информацией с ЭВМ на естественном для человека языке.
Использование речевого канала вместо обычных терминальных устройств значительно облегчает условия работы, повышает производительность его труда, увеличивая скорость вэода данных.
' Создание систем распознавания и синтеза речи открывает новую .область практических применений, способных расширить возможности человека; Актуальность и перспективность работ по построению средств речевого общения "человек - ЭВМ" косвенно подтверждается большими затратами на исследования в этой области. . _ '
Качественно новые сферы возможного практического применения распознавателей речи раскрываются прн отмене ограничений на размер словаря, необходимость чсполнительного обучения при смене диктора и максимальном приближении языка системы распознавания к естественному. Однако создание подобных' систем свя-, з ало с преодолением целого ряда слолных проблем.
К ним,' з частности, относятся: учет изменчивости акустических характеристик -речевых .-сигналов в зависимости от фонетического контекста,- задача маркировки непрерывного речевого сигнала на акустически .инвариантные, единицы, а такдэ ква-эифонемная классификация'этих единиц.'Надежность обнаружения и классификации кваэифонетических единиц в процессе акустико - фонетического анализа so. многом определяет характеристики (точность распознавания) системы," поэтому большое внимание разработчиков речевых систем уделяется совершенствовании вето-дов. акустико - фонетического анализа. ., , -
Делью диссертационной работы является создание новых ' методов и. алгоритмов'акустико -' фонетического анализа на основе нейронных' сетей, их программная реализация, апробация числен-
-2-ными экспериментами и применение для распознавания речи. Основные задачи исследования:
сравнительный анализ методов первичной обработки и представления речевых сигналов с помощью традиционных подходов и основанных на нейронных сетях;
разработка методов первичного описания и представления, речевых сигналов на основе нейронных сетей;
экспериментальное исследование моделей нейронных сетей;
анализ и разработка алгоритмов обучения для таких моделей. , .
Научная новизна работы:
исследовали разработан метод фонетической маркировки и сегментации слитного речевого сигнала, учитывавший априорную информацию о закономерностях изменения параметров речевого сигнала ( в том числе эффект коартикуляции и длительность звуков);
исследован и разработан метод для выбора наилучшего решения на основе индивидуальных решений о фонетической принадлежности сегментов речевого сигнала, генерируемых в параллельных каналах анализа; .
экспериментально реализован и исследован метод акустико - фонетического анализа"и фонетической маркировки на основе многослойной нейронной сети Кохонена.
Практическая ценность работы заключается в построении эф-, фективных алгоритмов и программного обеспечения анализа сигнала, обучения и распознавания речевых образов.
Реализация результатов работы. Диссертационная работа вы-'
поднялась в рамках плановый теш "Распознавание и синтез слу
ховых образов" ВЦ АН СССР в соответствии с утвержденным поста
новлением Президиума АН СССР N131 от 7.06.91 г. ИГР
0188.0026039. '
Апробация работы. Оснодные результаты работы докладывались на Всесоюзной шкоде - семинаре "Автоматическое распознавание речевых образов'' АРСО - 16 (Москва. 1991), на семинаре сектора автоматического распознавания речи ВД ЛИ СССР, а также на 3-ей Всесоюзной .конференции "Исследование звуковых систем языков аборигенов Сибири сопредельных регионов" (Новосибирск, 1988),
-з-.
Публикации. По теме, диссертации опубликовано пять печатных работ. "
Структура и объем работы. Диссертационная работа состоит из введения, трех глав, выводов и заключения и содержит 91 страницы текста, в том числе 2 таблиц , 6 'рисунков' и 2 приложений. В списке литературы 81 наименований.