Введение к работе
Актуальность настоящего исследования определяется тем, что для качественного решения прикладных фонетических задач распознавания и высококачественного синтеза речи необходимо понимание отличий процесса речеобразования в разных видах речи, в том числе в особенно сложной и многообразной, спонтанной речи Важным, но недостаточно исследованным аспектом этой проблемы может считаться изучение свойств и особенностей работы артикуляторного аппарата, проявляющихся в вариативности формантной картины
Последовательность реализаций фонем представляет собой информационно насыщенный элемент речевого сигнала Гласные выполняют конститутивные и дифференцирующие функции, участвуют в реализации супрасегментных явлений В речевом сообщении гласные становятся функционально более значимыми, поскольку в них содержится информация о характеристиках окружающих согласных, наиболее полно отражены отличия видов речи (особенности коартикуляции, редукции и тд) Кроме того, гласные участвуют в просодическом оформлении высказывания, от которого может зависеть правильное восприятие звуковых оболочек слов Весомость гласных в речевой посылке обусловила их превращение в объект исследования при сравнительном анализе видов речи
Целью настоящего исследования является определение характерных особенностей формантной картины гласных в спонтанной речи, отличающих ее от чтения текста
Для достижения поставленной цели было необходимо решить следующие задачи
1 Анализ научных публикаций отечественных и зарубежных авторов,
посвященных проблеме изучения разных видов речи и вопросам разработки
необходимых для этого методов
2 Выбор подхода к описанию речевого тракта как сложной динамической
системы, формирование структуры модели такой системы
Создание метода исследования речевого тракта и его составных частей -голосового источника и артикуляторного аппарата путем определения их передаточных функций и частотных характеристик
Разработка расчетного алгоритма и компьютерной программы построения формантных картин сегментов гласных путем автоматизированной обработки первичного аудиоматериала
Проведение сравнительного анализа на формантном уровне особенностей реализации гласных в спонтанной речи и при чтении текста Выявление на уровне изменений формантной картины тонких фонетических эффектов, присущих разным видам речи
Предмет данного исследования - реализации аллофонов гласных русского языка в спонтанной речи и при чтении текста
Научная новизна исследования состоит в создании динамической модели речевого тракта, выделяющей голосовой источник и артикуляторный аппарат, разработке метода описания динамики артикуляторного аппарата и построения на его основе формантных картин гласных, а затем, в проведении с помощью этого метода сравнительного анализа особенностей реализации гласных в разных видах речи
Теоретическая ценность проведенного исследования состоит в изучении особенностей функционирования артикуляторного аппарата в разных видах речи, в обосновании того, что разным видам речи присущи отличия на уровне формантных картин гласных, а также в разработке метода исследования динамики речевого тракта
Практическая ценность работы заключается в том, что динамическая модель речевого тракта и метод ее расчета могут найти применение при решении ряда прикладных задач Их использование дает возможность выделения и раздельного исследования динамики голосового источника и артикуляторного аппарата Каждая из этих составных частей речевого тракта реализует в речевом процессе свои функции В приложении к кругу задач распознавания содержания речевой посылки и синтеза речевого сообщения, в том числе задач, связанных со спонтанной речью, наибольший интерес представляет возможность выделить «очищенную» от влияния частоты
основного тона формантную картину гласных, формируемую артикуляторным аппаратом В свою очередь, для задач, связанных с распознаванием физического и эмоционального состояния диктора, может быть получен выходной сигнал голосового источника (составляющие частоты основного тона (ЧОТ) и ее гармоник), не искаженный действием артикуляторного аппарата Разработанная процедура дает возможность независимо исследовать динамику каждого из отделов речевого тракта и получить необходимые характеристики
В ходе работы нашли применение следующие методы слуховой и аудиторский виды анализа, частотные методы исследования динамических систем, методы компьютерной обработки аудиоматериалов, в частности, пакет программ MATLAB, методы математической статистики
Изложение процедуры и результатов исследования сопровождается таблицами и рисунками
Апробация работы. Результаты исследования были представлены в докладах на заседаниях кафедры фонетики и методики преподавания иностранных языков Санкт-Петербургского государственного университета, на межвузовских конференциях преподавателей и аспирантов СПбГУ (2005, 2006, 2007), на международной конференции Specom'06
Структура работы Данное диссертационное исследование содержит 193 страницы машинописного текста и состоит из введения, четырех глав, заключения, списка использованной литературы (110 наименований) и приложения