Электронная библиотека диссертаций и авторефератов России
dslib.net
Библиотека диссертаций
Навигация
Каталог диссертаций России
Англоязычные диссертации
Диссертации бесплатно
Предстоящие защиты
Рецензии на автореферат
Отчисления авторам
Мой кабинет
Заказы: забрать, оплатить
Мой личный счет
Мой профиль
Мой авторский профиль
Подписки на рассылки



расширенный поиск

Система автоматического фонемного распознавания русской речи Шмелев, Анатолий Александрович

Данная диссертационная работа должна поступить в библиотеки в ближайшее время
Уведомить о поступлении

Диссертация, - 480 руб., доставка 1-3 часа, с 10-19 (Московское время), кроме воскресенья

Автореферат - бесплатно, доставка 10 минут, круглосуточно, без выходных и праздников

Шмелев, Анатолий Александрович. Система автоматического фонемного распознавания русской речи : автореферат дис. ... кандидата физико-математических наук : 01.01.09.- Москва, 1992.- 18 с.: ил.

Введение к работе

Актуальность темы. Повышение в настоящее время мощности и производительности вычислительной техники заставило разработчиков программного обеспечения поставить ряд принципиально новых задач, которые могут быть решены с помощью ЭВМ. Одной из таких задач является разработка и внедрение в действующие в промышленности процессы систем искусственного интеллекта. При разработке основных направлений для создания систем искусственного интеллекта, появился ряд подзадач, решение которых необходимо получить, одной их них является задача обработки сообщений на естественном языке. Первый этап на пути решения данной задачи заключается в создании систем распознавания речи, ксторые разрабатываются совместно с сйсГёмзйи обработки сообцзниа на естественном языке.

При разрабйгке сисгем распознавания речи исследователи столкнулись с непредвиденными трудностяяи, многие из которых нерешены и в настоящее время, что говорит об актуальности таких разработок в настоящее время. Решение задачи распознавания речевых образов актуально не Только для создания систем искусственного интеллекта. Существует множество сфер применения систем распознавания речи, например, организация двусторонней связи иевду человеком и машиной, мевду людьми, управление различными устройствами, создание автоинформаторов ' различного назначения, диагностика, обучение иностранным языкам, медицина (в частности логопедия), криминалистика и т.д.

Преимущества речевого управления обуславливаются следующими основными факторами:

снижение нагрузки на оператора, на зрительный канал:

повышение оперативности управления за счет использования речевого канала взаимодействия, в экстремальных условиях;

возможность дистанционного управления;

возможность модификации и расширения состава управляющих конанд без аппаратных изменений;

отсутствие ограничений на условия освещения;

возможность систематического контроля вводимых команд;

К настоящему времени разработаны и Енедрены в промышленную эксплуатацию мгожество систем автоматического распознавания и синтеза речи. Их эксплуатация дает существенный эконо-

мическш к сошшьвда эффект.

В настоящее время во всем мире продолжаются исследования в двух основных направлениях: создании производительных дешевых компонентов (микропроцессоров и специализированных микросхем для обработки акустических сигналов) и разработке более эффективных алгоритмов распознавания речевых образов.

Для создания полной модели речевого ввода информации в ЭВМ потребуется длительные усилия различных специалистов как в области непосредственной обработки сигналов, так и в области искусственного интеллекта.

Цель работы. Цель работы заключалась в создании системы фонемного распознавания русской речи на базе персональных ЭВМ типа IBM Рс/хт/аТ и PS/2.

При создании системы распознавания решались следующие задачи:

анализ современного состояния методов и систем распознавания речи, их характеристика;

исследование свойств и характеристик полного и клиппи-рованного речевого сигнала;

совершенствование методов фонемного сегментирования речевого сигнала;

совершенствование методов маркировки и распознавания различных групп фонем;

разработка метода идентификации распознанной цепочки фонем со словом из транскриЗированного словаря;

разработка на основе практических исследований алгоритмов;

разработка многословарной системы распознавания;

создание на компьютере реально действуадзй многословарной системы фонемного распознавания русской речи;

Методы исследований, методы . исследования заключались в экспериментальном исследовании свойств полного и клиппирован-ного сигналов и их характеристик. Исследовались отличительные характеристики как различных групп фонем, так и разных фонем в группах. Использовались методы математической статистики, визуальные методы исследований, методы числового анализа.

Научная новизна. Разработаны методы сегментирования и маркировки полного речевого сигнала, методы распознавания гласных и сонорных фонем, а така» фонем 'п' и 'р'. Разработан метод поиска слов в транскрибированном словаре по цэпочкв фо-

еєм. с покощью вероятностных таблиц. Создана многословарнзя система фонемного распознавания русской речи с обоим объемом словарзя в 10 тысяч слов, единым словарем болзе 1000 слов, с полуавтоматической настройкой на диктора.

Практическая ценность. Созданная система распознавания может использоваться в различных системах управления и автоматизации на компьотерах различного типа, т.к. основные алгоритмы реализованы на языке высокого уровня с. Алгоритмы анализа различных характеристик полного звукового сигнала могут быть использованы в разнообразных системах анализа и распознавания аналоговых сигналов.

Реализация результатов. Настоящая диссертационная работа является часть» работ, производимых совместно в ИЛИ АН Россію н в МШТ ііїзяи В.И. Ленина по разработке диалоговых систем "чзлпвек-ЗБМ" с использованием рэч^його Ввода-вывода информация.

Црогргкмное обеспечение реализовано на языках с и Assembler для персональных ЭВМ типа івм рс/хт/ат и PS/2.

Апробашія работы. Основные результаты диссертации докль давались на,научных семинарах, проводимых в ИШ АН России v МПГУ имени В.И. Ленина. Разработанная система распознавши* демонстрировалась на различных научных встречах с российских? и иностранными специалистами в области распознавания образов.

Структура работы, диссертация состоит из введения, трет глав, заключения, списка литературы, содержащего 106 источников и приложения. Всего 11А страниц, 40 рисунков, таблиц ТТ.