Введение к работе
з ^г^, .
Актуальность темы. Речевая технология - это обширный класс исследований в различных направлениях: фонетика и лингвистика, медико-биологические и логопедические исследования, криминалистические экспертизы и автоматическое распознавание речи, синтез речи, верификация и идентификация дикторов, восстановление архивных записей и многие другие.
Многие годы анализ речевых сигналов проводился с помощью самых различных приборов, в том числе осциллографов, анализаторов спектра и т.д. В последнее время при проведении таких исследованиий все большее внимание уделяется использованию компьютеров, что связано с целым рядом причин.
Во-первых, исследования речевых сигналов требуют и сложных вычислений и обращения с большим объемом исходного материала. Во-вторых, число специалистов - прикладников в самых разных областях, заинтересованных в использовании знаний о природе и особенностях речевых сигналов, достаточно велико, но дороговизна и сложность в организации специальных акустических лабораторий сдерживали широкое развитие таких исследований. Переход от аналоговых методов к компьютерным дал сильный толчок проведению самых разнообразных исследований в области речевой технологии. В-третьих, компьютерные методы позволяют моделировать процессы, которые с большим трудом удается (или вообще невозможно) смоделировать на аналоговых устройствах.
Все эти причины и предопределили устойчивый многолетний интерес к переходу на компьютерные методы исследований речевых сигналов и к разработке программного обеспечения для проведения таких исследований.
Акт\алыюсть темы исследования вызвана необходимостью Ш'іишня такого программного обеспечения, которое могло бы'-
служить основой при проведении исследований речевых сигналов и для создания других специализированных программных комплексов в области речевой технологии. Целью настоящей работы является:
разработка принципов организации сложных систем для исследования речевых сигналов;
разработка алгоритмов обработки и визуализации речевых сигналов;
разработка программного обеспечения для использования фонетических баз данных;
создание программного комплекса, ориентированного на проведение фонетических и лингвистических исследований
- специалистами -прикладниками; комплекс должен
обеспечивать качественно новый уровень исследований с применением методов статистического анализа на основе фонетических баз данных; комплекс должен быть рассчитан на разные уровни подготовки исследователей в области программирования, включая минимальный.
Научная новизна. Разработаны требования к составу программного обеспечения систем для исследований в области речевой технологии. Разработаны принципы построения больших программных комплексов для проведения исследований речевых сигналов. Предложены и проверены алгоритмы визуализации акустических сигналов и их параметров. Разработано программное обеспечение для построения баз данных, ориентированных на фонетические и лингвистические исследования. На основе предложенных принципов построения программных комплексов для исследований в области речевой технологии создана система SLIRE - интерактивная система для исследований речевых сигналов на IBM PC совместимых компьютерах.
Практическая ценность. Полученные результаты по организации систем для исследования речевых сигналов
использованы при разработке системы SLIRE. Разработанная система применяется для отладки новых методов исследований. Система применяется и при обучении экспертов-криминалистов.
Апробация работы и публикации. Результаты работы докладывались на всесоюзном совещании "Акустика речи и слуха" (Минск, 1990), на 16 Всесоюзном семинаре по автоматическому распознаванию слуховых образов (АРСО-16, Суздаль, 1991), на совещании "Методика перцептивных речевых исследований" (Ленинград, 1991).
По теме диссертации опубликованы работы [1 -б].
Структура диссертации. Диссертация состоит из введения, четырех глав с разделами и заключения; содержит 106 страниц машинописного текста. Библиография включает 48 наименований.