Введение к работе
Реферируемая работа посвящена задаче формирования речевого сигнала в системах автоматического синтеза речи по произвольному тексту, созданию алгоритмов, осуществляющих эту функцию, и тестированию созданных алгоритмов.
Актуальность работы обусловлена тем, что в настоящее время, благодаря техническому прогрессу в области компьютерных технологий, разработки, направленные на создание автоматических систем синтеза речи, находятся в центре внимания современных речевых исследований. Хотя разработки в области синтеза ведутся, начиная с 60-х годов, эта проблема не решена до конца ни для одного языка мира.
Главная цель данного диссертационного исследования связана с теоретической разработкой и практической реализацией модуля озвучивания в системе русского синтеза, развиваемой речевой группой филологического факультета МГУ.
В рамках принятой нами технологии конкатенативного синтеза в нашей работе решаются два комплекса задач. Первый комплекс задач связан с разработкой алгоритмов, осуществляющих коррекцию акустическо-фонетической базы синтеза и контроль над ее единицами. Второй комплекс включает задачу создания алгоритмов просодической модификации речевых образцов и алгоритмов формирования выходного речевого сигнала, производящих генерацию непрерывной речи.
Более конкретно в данном диссертационном исследовании ставились следующие основные задачи:
-
Произвести анализ современных технологий и результатов конкретных разработок в области автоматического синтеза речи.
-
Создать алгоритмы, необходимые для формирования непрерывного речевого сигнала, и на их основе разработать специальный модуль озвучивания для системы автоматического синтеза русской речи, разрабатываемой на филологическом факультете МГУ.
-
Провести комплексное тестирование всех параметров и алгоритмов, предлагаемых для формирования речевого сигнала в данной диссертации, разработать для этого специальный компьютерный инструментарий.
-
Создать работающие программы, которые реализуют разработанные алгоритмы генерации речевого сигнала в целостной системе синтеза русской речи.
Что касается новизны исследования, то здесь можно отметить следующее. Знакомство с современными технологиями в области
Кроме того, разработанный нами модуль озвучивания в составе полной системы автоматического синтеза речи может быть применен в учебных курсах для обучения студентов основам современных компьютерных речевых технологий, в курсах по фонетике русского языка, в различных лингвистических исследованиях.
Апробация работы. Так как данное исследование является частью разработки, которая осуществляется речевой группой кафедры теоретической и прикладной лингвистики филологического факультета МГУ, все принципиальные вопросы и достигнутые результаты, связанные с данным исследованием, регулярно обсуждались на рабочих совещаниях этой группы. Кроме того, результаты данного исследования были обсуждены на конференции "Диалог 98" и международной электронной конференции "Синтез и анализ речи" в октябре 1997 г. (модератор Казанский Государственный Университет), они отражены также в трех публикациях.
Структура диссертации. Работа состоит из введения, четырех глав, заключения и списка литературы.