Электронная библиотека диссертаций и авторефератов России
dslib.net
Библиотека диссертаций
Навигация
Каталог диссертаций России
Англоязычные диссертации
Диссертации бесплатно
Предстоящие защиты
Рецензии на автореферат
Отчисления авторам
Мой кабинет
Заказы: забрать, оплатить
Мой личный счет
Мой профиль
Мой авторский профиль
Подписки на рассылки



расширенный поиск

Идентификация некоторых групп согласных в системе автоматического фонемного распознавания русской речи Аветисян, Эдуард Армансович

Данная диссертационная работа должна поступить в библиотеки в ближайшее время
Уведомить о поступлении

Диссертация, - 480 руб., доставка 1-3 часа, с 10-19 (Московское время), кроме воскресенья

Автореферат - бесплатно, доставка 10 минут, круглосуточно, без выходных и праздников

Аветисян, Эдуард Армансович. Идентификация некоторых групп согласных в системе автоматического фонемного распознавания русской речи : автореферат дис. ... кандидата физико-математических наук : 01.01.09.- Москва, 1992.- 18 с.: ил.

Введение к работе

Актуальность темы, Развитие современного обп^ства предполагает качественно более высокий уровень информатизации всэх структур данного обэзства, что прямо зовисзгг от степени прзквЕвния ^числительной техники при решении самых различных зддач народного хозяйства. Все больше число лодэ.З, не-являяцжся специалистами в области вычислительной техники и инфоряаткки, активно используют компьютеры и другую технику в рвозз работе. Компьотеры все чдщз заменяют а^ВДЗЗ в производство и в быту, выполняя их работу с гораздо большей точностью и скоростью. Эти и другие фаюда поставили на повестку ЗЯ вопрос -совэрЕэнствозания срэдотз бйдзяия .человека с гаетютероа, что наряду с актуальны;*;? ЯїГ^гяи в рамках обои проблз'лы создания тлскусствзяйргр йнтеллэктз, делает проблему челоцеко машинного общения одной из самых актуальных задач информэтики. Наиболее перспективными средствами еєдєния ' диалога с машиной являются системы речевого щаода-Вывода, поскольку они позволяют сделать этот диалог сййезйоаиым, быстрым, точным и привлекательным длг, дяронаго фуга пользователей.

Проблййа речевого диалога с компьютером решается кя основе исследований и разработок устройств распознавания и синтеза речи. Процессы произнесения и восприятия речи, которые в обыденной жизни кажутся простыми и естественными, на самом деле при их технической реализации оказываются чрезвычайно сложными. Что объясняется большим разнообразием голосов, стилей произносения, неустойчивостью и случаяностьк параметров речевого сигнала, многообразием способов построения высказываний, многозначностью их смыслового содержаний.

Основной задачей распознавания речи является разработка методов и систем, в которых речь представляет собой входную информацию для различной аппаратуры, компьютеров, информационно-поисковых систем, систем идентификации личности и т.д.

Особенно полезным представляется введение речевого управления в промышленности, где

руки рабочего заняты;

требуется обеспечить возможность передвижения рабочего во время процесса ввода данных;

рабочий должен неотрывно следить за экраном дисплея, оптическим прибором или какш-лиЗо другим объектов!

условия не позволяют работать с клавиатурой.

Однако,существующие на данный момент системы автоматического распознавания речи далеки от совершенства и в основном используют в качестве эталонов слова, поэтому трудно, а подчас и просто невозможно пзрэати к распознаванию слитной речи при помощи применяемых в таких системах методов распознавания. На наш взгляд наиболее подходящэн стратегией в распознавании речи является фонемное распознавание.

Создание систем надежного автоматического распознавания является актуальной задачей, решение которой приведет к резкому увеличению применения компьютерной техники в обществе и промышленности, а также явится крупным шагом исследований в области искусственного интеллекта.

Нель работы. Цэль работы заключалась в создании алгоритмов и программ идентификации некоторых групп согласных в системе фонемного распознавания русской речи на базе персональных ЭВМ типа IBM PC/XT/AT и PS/2.

Для достижения поставленной цели в диссертации решались следующие задачи:

а. анализ современного состояния методов и систем рас
познавания речи, их характеристика с точки зрения перспек
тивности применения в различных приложениях;

б. обоснавание целесообразности работы по фонемному
распознаванию речи;

в. исследование свойств и характеристик полного и клип-
пированного речевого сигнала;

г. совершенствование методов фонемного сегментирования
речевого сигнала;

д. совершенствование методов распознавания различных
групп фонен;

е. созданиэ удобного программного обеспечения для изу-

чзния свойств кгишированното речевого сигнала;

ж. практическая реализация программных средств распоз
навания различных групп фонем на основе проведанных исследо
ваний;

з. реализация программного обесгочощія по созданию фо
немных эталонов дня любого диктора;

и. разработка некоторых словарей для мвогссловзрной сястекы распознавания;

Методы исследования. Методы исследования заключались в экспериментальном исследовании стезеп» ївшого и клиппиро-взнеого сигналов и их характеристик..

Исслэдовзлись отличительны хдраіггористигсі как различных групп фонем, так и разных фоюзн в группах.

Использовались цэтола математической статистики, визуальные метода досгадззэзнйЗ, методы числового анализа.

Научная новизна. Разработаны методы сегментирования и распознавания щелевых и фрикативных фонем, аффрикат, о также взрывных фонем 'к' и 'т'.

Разработаны некоторые словари в многословэрной системе фонемного распознавания русской речи с общин объемом словарей в 10 тысяч слов и полуавтоматической настройкой з^злонов и словареа на диктора.

Практическая ценность. Результаты работы могут быть использованы з различных системах автоматического распознавания для дальнейшей эксплуатации в определенных системах управления и автоматизации на компькгг8рах различного типа, так как основные алгоритмы реализованы на языке высокого уровня С.

Алгоритмы распознавания фонем могут быть использованы в разнообразных системах анализа и распознавания речевых сигналов. Система подготовки эталонов речевых единиц позволяет создазать эталоны на голос любого диктора как на произвольный, так и на ограниченный словарный запас.

Реализация результатов. Настоядая диссертационная рзбо-

та являете* Чвстью работ, производимых еевнестко в ИЛИ А8 РбСсШ й д МЯТУ имени в<Й< Лзииаз по разработке диалагофа систвй *чЗлcввк-кoмIшaтe'p,* б использованием речевого ввода-вывода йнфрйции.

фб^амянов обесшчэнш реализовано на языке с для язр-сонаяМыХ компьютеров типа Ї8Й PG/Хт/АТ и PS/2.

АпВобация работу * О0ВОВйые результаты диссертации догладывались на научных сейШарах, щШОдййых в ИЛИ АН РосОШ и ШШ имени В.И. Ленина. Разработанная сиотеш равдаёнайа-нйя демонстрировалась на различных научных встречах" с рое-аШвШШя и иностранными специалистами в области распознавания образов.

Структура работы^ aaccepTaiSri состоит из вщцавяя, трех глйі, заключения, списка литературы , содзрйафэго 109 истеч-никЗв и приложения. Всего 109 страниц , 35 рисунков,

таблиц 5 .