Содержание к диссертации
Введение
ГЛАВА 1. Фонетический строй татарского языка. Исторический аспект и современное состояние 11
1.1. Фонетико-фонологическая система татарского языка 11
1.2. Интонационный строй татарского языка 27
1.3. Акцентология в тюркских языках 41
ГЛАВА 2. Проблема реконструкции звучания орфографического текста на татарском языке 53
2.1. Прагматически ориентированная фонологическая система татарского языка 53
2.2. Фонетическая система татарского языка в рамках прикладной фонетики 63
2.3. Явление редукции кратких гласных в татарском языке 67
ГЛАВА 3. Ритмо-темпоральные характеристики татарской речи 83
3.1. Ритмический строй татарского языка 83
3.2. Паузирование письменной речи в татарском языке 95
ГЛАВА 4. Прикладной аспект ритмо-темпоральных характеристик применительно к автоматическому синтезу татарской речи 103
Заключение 119
Библиография 128
Приложение 145
Список сокращений 145
Список дикторов 145
Экспериментальные материалы фонетико-акустических исследований 146
- Фонетико-фонологическая система татарского языка
- Прагматически ориентированная фонологическая система татарского языка
- Ритмический строй татарского языка
- Паузирование письменной речи в татарском языке
Введение к работе
Развитие вычислительной техники, появление быстродействующих, обладающих практически неограниченной памятью компьютеров сделало возможной постановку и решение проблемы общения человека с машиной на естественном языке. За последние 50-60 лет созданы системы распознавания и синтеза речи, а также множество различных устройств с речевым управлением. Исследования по созданию интерфейсных систем «человек-машина» не ограничиваются разработкой технологий и технических устройств. Лингвистическое обеспечение подобных систем имеет непосредственное отношение к речевой деятельности человека вообще и процессам восприятия и порождения речи в частности.
Разрабатываемый синтезатор татарской речи относится к типу «текст -речь» и предназначен для преобразования произвольного орфографического текста в устную форму языка. Основным блоком данного типа синтезаторов является автоматический транскрибиратор, назначение которого -представление буквенной записи в виде речевых единиц.
Опыты по синтезу татарской речи показали, что возможность построения автоматического транскриптора для татарского языка сопряжена со значительными трудностями. Современная орфография татарского языка представляет механическое объединение трех языковых систем - татарского, русского и арабского. Транскрипция орфографического текста усложняется следующими двумя обстоятельствами: 1) наличием в татарском языке огромного количества разночитаемых словоформ и 2) отсутствием в языке акустико-артикуляционной базы, способной обеспечить требования орфоэпий татарского и русского языков.
Первая задача осложняется существующим в орфографии правилом, согласно которому грамматические формы заимствованных основ формируются путем присоединения к концу слова аффиксов татарского языка. Нередко для того, чтобы выяснить, какая часть словоформы является русским заимствованием, а какая - представляет сочетание аффиксов татарского языка, требуется произвести морфологический анализ словоформы. Но для выполнения морфологического анализа необходимо установить наличие в словоформе русской основы (аркада, таксагыз, тарасын). Получается порочный круг.
Что касается второй задачи - наличия необходимой акустико-артикуляционной базы, то такового нет и быть не может. Включение в фонетическую систему татарского языка трех гласных и пяти согласных русского языка явно недостаточно для произнесения более 40% заимствованной лексики по-русски. Для татарского языка не характерны ни йотированные согласные, ни мягкие [ль], [нь], ни широкое произношение гласных, ни словесное ударение, необходимое для озвучивания консонантных групп типа бокс, штраф, допинг и т.д. Другими словами, принятые орфоэпические нормы - произношение заимствований так, как они
произносятся в языке-доноре - не обеспечены фонетическими ресурсами татарского языка.
В диссертационной работе исследована супрасегментная система, а именно: выявлена и описана ритмо-темпоральная структура татарского языка, которая понимается нами как сочетание ритмической единицы и паузы, следующей непосредственно за ритмической группой.
Ритм - естественное свойство речи - зависит от структуры языка, темпа речи, а также от эмоционального состояния говорящего. В акцентных языках, таких как русский, английский, важную роль в организации ритмики играет ударение. В языках, в которых ударение отсутствует, в построении ритмики речи основную роль играет ритмическая группа - фрагмент речи, состоящий из одного слова или сочетания слов, обладающих интонационной и смысловой целостностью. Слоги в составе ритмической группы организованы по тональности, интенсивности и длительности.
Построение системы просодического оформления синтезированных предложений, содержащих в своем составе как исконно татарские, так и заимствованные слова, не представляется возможным. В диссертационной работе в силу указанных обстоятельств, а именно - невозможности при существующей орфографии и орфоэпии автоматической фонетической транскрипции произвольного текста и просодического оформления синтезированных предложений - решается проблема создания целостной проблемно ориентированной фонетико-фонологической системы татарского языка.
Актуальность темы диссертации определяется следующими обстоятельствами:
Ритм - одна из основных просодических характеристик речи. Как и
словесное ударение он выполняет смыслоразличительную,
словоразделительную и словообъединительную функции. В татарском языкознании ритмо-темпоральные характеристики текста вообще не исследованы; работы, посвященные анализу ритмики, паузации текста, отсутствуют.
Исследование ритмо-темпоральных характеристик татарской речи направлено на решение практической задачи, а именно - создание автоматического синтезатора татарской речи. Основное назначение синтезатора - помочь людям, потерявшим зрение, вхождению в мир, в общество.
Языковая политика в стране неоднократно менялась, что не могло не отразиться на фонологической системе языка. В этом плане синтезаторы как преобразователи произвольного орфографического текста в речь представляют собой необходимый инструмент для проверки целостности графической и фонетической систем, возможности использования языка в новых информационных технологиях.
Цель настоящей работы состояла в выявлении ритмо-темпоральных особенностей татарской речи, разработке системы правил, которые при
наложении на синтезированную речь придали бы ей просодическую стройность.
Достижение поставленной цели предполагает решение следующих конкретных задач:
- установление лежащей в основе ритмической структуры татарского
языка речевой единицы, ее характера, природы и функции;
- нахождение тонального и динамического контуров ритмической
единицы;
выявление свойств редукции кратких гласных в составе ритмической единицы (ритмической группы);
определение средней длительности пауз, соответствующей различным знакам препинания;
создание системы правил просодической параметризации ритмических групп в синтезированной речи;
- построение проблемно-ориентированной фонетико-фонологической
системы татарского языка.
Научная новизна. Впервые осуществлено исследование ритмо-темпоральной организации текста в указанном аспекте. Особенность проведенного изучения состоит в том, что оно проводится комплексно - с учетом современного состояния фонологической системы татарского языка, особенностей просодии слова и фонетической структуры татарского языка. Установление ритмической единицы языка, создание правил паузирования и просодического оформления речи проводится в целях улучшения качества синтезированной речи, внедрения татарского языка в новые информационные технологии.
Объектом исследования являются тексты, прочитанные вслух дикторами - носителями литературного татарского языка. Экспериментальный материал составили эмоционально-нейтральные отрывки (авторская речь) из художественных произведений татарских писателей-прозаиков.
Предмет исследования - ритмо-темпоральная организация предложения, а также фонетическая структура ритмической группы - характер распределения слогов по длительности, интенсивности и частоте основного тона; зависимость акустических параметров ритмических групп, играющих важную роль в акцентуации речи, от позиции ритмической группы в предложении.
Теоретическая значимость. В лингвистической литературе ритм трактуется как чередование соизмеримых речевых единиц. В акцентных языках такими единицами являются ударные и безударные слоги. Неакцентным языкам подобного рода чередования не характерны. Ритм в таких языках представляет повторяемость ритмических групп. Но, как известно, нет единого определения понятия «ритмическая группа». К ритмической группе нередко приравнивается как фонетическое слово, так и синтагма, и фраза. Теоретическая значимость настоящего исследования
заключается в определении базовой ритмической единицы татарского языка, ее фонетической (просодической) структуры и вариативности, установлении связи между величиной ритмической группы и темпом речи, а также между распределением различных длин пауз и длительностью предшествующих им и следующих за ними ритмических групп.
Практическая значимость полученных результатов. Результаты работы важны в собственно лингвистическом аспекте, поскольку алгоритмическое описание языка позволяет выявить существующие вариативности в его использовании и выбрать ту форму, которая способствует сохранению языка.
Разрабатываемый синтезатор предназначен для озвучивания произвольного орфографического текста. Если учесть, что в настоящее время принята компьютерная верстка как художественных произведений, так и периодики, то с помощью синтезатора люди, лишенные зрения, получают возможность знакомиться с содержанием печатных изданий.
Достоверность результатов исследования обеспечивается применением современных компьютерных программ акустического анализа речи. Метод «анализ через синтез» сделал возможным осуществление проверки ряда теоретических положений, в частности, о необходимости и достаточности выделенного нами состава фонем для озвучивания орфографических текстов на татарском языке.
Теоретико-методологическую основу исследования составили классические труды по общему языкознанию Фердинанда де Соссюра, И.А. Бодуэна де Куртенэ, Л.В. Щербы, работы в области фонетики Л.Р. Зиндера, Л.В. Бондарко, Л.В. Златоустовой, а также исследования татарского языка экспериментально-фонетическими методами таких лингвистов, как В.А. Богородицкий, Г. Шараф, У.Ш. Байчура, Х.Х. Салимов, Т.И. Ибрагимов, Г.М. Сунгатов и др.
Методы исследования. В диссертационной работе применен комплекс методов, включающий: 1) экспериментально-фонетические методы -экспериментально-акустический анализ речи с применением компьютерных программ Speech Analyzer, Sound Forge, Win Pitch Pro, Cool Edit; 2) метод моделирования - создание алгоритмов мелодической, динамической и темпоральной параметризации ритмических групп; 3) методы математической статистики - усреднение измерений длительностей, частоты основного тона, интенсивностей слогов ритмических групп по данным, полученным на основе анализа текстов в произношении различных дикторов; 4) метод «анализ через синтез» - наличие элементной базы и программных ресурсов, необходимых для осуществления опытных преобразований текста в речь, позволяют широко использовать данный метод, который дает исследователю возможность проверить каждое правило просодической параметризации на примере звучания множества фраз; 5) метод лингвистического анализа в работе отражается в описании языка с позиции первичности устной формы по отношению к письменной, а также в оценках
изменения языка, в том числе предписываемых нормой, с позиции непротиворечивости системе языка. Положения, выносимые на защиту:
- Соизмеримые и регулярно повторяющиеся речевые единицы, лежащие в
основе ритмической структуры татарского языка.
Природа и функции ритмической единицы, определение контура распределения длительностей слогов, а также контуров изменения частот основного тона и интенсивностей ритмической единицы.
Паузирование текста, характер распределения длительностей пауз в соответствии с расстановкой знаков препинания и величины выделяемых ими синтаксических структур.
Фонетические изменения звуков в речевом потоке, природа и характер редукции кратких гласных.
- Алгоритм просодической параметризации ритмических групп в
синтезированной речи.
- Современные системы общения человека с машиной и действующие
орфография и орфоэпия татарского языка.
Апробация работы. Основные положения диссертации изложены во время выступлений с докладами на региональных, всероссийских и международных конференциях: «Теории и практики языкового плюрализма и билингвизма: междисциплинарный подход» - Поволжская научно-практическая конференция студентов, аспирантов, молодых ученых и специалистов. Казань, КГУ, 7 декабря 2006 г.; «TEL-2006» - Казанская школа по компьютерной и когнитивной лингвистике. Казань, КГУ, АН РТ, 9-11 декабря 2006 г.; «Проблемы сохранения языка и культуры в условиях глобализации» - VII Международный симпозиум «Языковые контакты Поволжья». Казань, КГУ, 2-5 июля 2008 г.; Итоговые научные конференции КГУ (2006, 2007, 2009).
Публикации. По материалам диссертации опубликовано семь статей (одна из них в журнале, входящем в Перечень ВАК РФ).
Структура работы. Работа изложена на 152 страницах, содержит 7 таблиц, 11 рисунков и 195 библиографических ссылок. Диссертация состоит из введения, четырех глав, заключения, списка литературы и приложения.
Фонетико-фонологическая система татарского языка
Исследование звукового строя татарского языка имеет длительную историю. Первые упоминания о звуках татарского языка относятся к началу XIX века и связаны с деятельностью С. Хальфина [1778], И. Гиганова [1801], И. Хальфина [1809], А. Троянского [1814], М. Иванова [1842], Г. Махмудова [1857], В.В. Радлова [Radloff, 1883 ; Радлов, 1893] и др. В целях обучения студентов татарскому языку И. Хальфин выпускает краткий татарско-русский словарь [Хальфин, 1809], в котором приводит некоторые сведения о соответствиях букв и звуков, проводит сопоставление произношения отдельных звуков татарского языка с произношением их в русском языке.
В дальнейшем в рамках общей тюркологии проводится изучение звуковой системы татарского языка известным тюркологом В.В. Радловым. В его книге «Фонетика северных тюркских языков» рассматривается широкий круг вопросов татарской фонетики: дается характеристика звукового состава в сравнении с другими тюркскими языками, выявляются закономерности употребления некоторых звуков, исследуются вопросы сингармонизма, ударения [Radloff, 1883]. В татарском языке ученый насчитывает 11 гласных, 23 согласных звука.
Талантливый писатель, крупный ученый-просветитель, долгие годы преподававший татарский язык в русском духовном училище и в семинарии Каюм Насыри внес значительный вклад и в изучение родного татарского языка.
В I860 году он издает учебник «Нэху китабы» (Синтаксис) [Насыйри, 1860]. Позже выходит в свет книга «Энмузэж.» (Образец), где немалое место отводится выделению и анализу звуков татарского языка [Насыйри, 1895]. В этих работах К. Насыри рассматривает чередование, взаимовлияние звуков, закономерности словесного ударения, некоторые принципы классификации звуков. По мнению К. Насыри, гласных в татарском языке не три, как это указывали многие его предшественники, а 10 (а, э, у, у, о, в, ы, е, и, ый) и отмечает, что на письме все 10 изображаются тремя буквами.
Можно с уверенностью сказать, что труды К. Насыри заложили основу татарского языкознания.
Взгляды К. Насыри получили развитие в трудах Г. Нугайбека. Он в книге «Терлек» (под термином «терлек» имеется в виду грамматика) выделяет в фонетике татарского языка 10 гласных и 32 согласных фонем, проводит классификацию согласных по месту образования [Нугайбэк, 1911]. Ученый в работе рассматривает и такие явления, как слог, ударение.
В революционные годы татарское языкознание продолжает развиваться. Основатель татарской диалектологии Джамал Валиди в 1923 году издает книгу «О диалектах казанского татарского языка», а в 1927 году - «Наречия каринских и глазовских татар», где подробно рассматривает и фонетические системы диалектов и наречий татарского языка1.
Надо полагать, что активности татарских ученых в изучении структуры родного языка благоприятствовало образование в стенах университета Казанской лингвистической школы. Татарское языкознание на начальном этапе, на этапе зарождения было ориентировано на исследование собственно языка, а не его графической формы. Безусловно, в этом есть заслуга основателей школы И.А. Бодуэна де Куртенэ и В.А. Богородицкого. Эти ученые знали татарский язык, интересовались им как лингвисты.
Качественная характеристика фонетической системы татарского языка нашла отражение в работе основателя Казанской лингвистической школы, основоположника теории фонемы И.А. Бодуэна де Куртенэ. В своей работе «О смешанном характере всех языков» ученый пишет: «... в «борьбе за существование» победа остается за языком, легче усваиваемым и требующим меньше затраты энергии как физиологической, так и психической. {...} вследствие относительной легкости татарского языка в сравнении с языком русским, представляющим гораздо более трудностей, языком междуплеменного общения между крестьянами русского и татарского происхождения в пределах России является обыкновенно язык татарский» [Бодуэн де Куртенэ, 1963, т. 1, с. 367].
Огромный вклад в описание звуковой системы татарского языка внес В.А. Богородицкий. В.А. Богородицкий организует в Казани первую в
1 См. об этом [Татарская энциклопедия 2002: 529] России лабораторию экспериментальной фонетики, где со своими учениками Г. Шарафом и Дж. Валиди снимает палатограммы, изучает акустические характеристики гласных звуков татарского языка. С помощью кимографа и гортанной капсулы В.А. Богородицкий и его ученики определяют частоту основного тона и длительность гласного, а также характер изменения данных параметров в зависимости от их позиции в слове. В описании звуковой системы татарского языка значительное место В.А. Богородицкий уделяет явлениям сингармонизма и редукции гласных. Верный своему учителю И.А. Бодуэну де Куртенэ в своих трудах В.А. Богородицкий четко отделяет речевой звук от фонемы, строго придерживается принципа системности языка. В описании фонетического строя татарского языка В.А. Богородицкий применяет метод полевой лингвистики - теоретические обобщения делаются на базе анализа множества наблюдений за произношением отдельных слов и словосочетаний носителями татарского языка.
В.А. Богородицкий выделяет в татарском языке 34 фонемы: 10 гласных (а, э, о, в, у, у, ы (краткое), е, и, ый) и 24 согласных {б, п, м, w, ф, д, т, н, з, с, эк, ш, р, л, щ, й, ц, к, г, къ, х, к, гъ, ч). Касательно долгого гласного ы (ый) ученый говорит следующее: «Относительно других долгих гласных, т.е. /, у, у, ы замечу, что, на мой слух, они являются простыми гласными, а не дифтонгами; только ы иногда представляет дифтонгообразный оттенок, суживаясь к концу» [Богородицкий, 1953, с. 39], «ы не краткое встречается главным образом в сфере флексийной (губному сингармонизму не подчиняется), где гласный имеет большую длительность, вероятно, в связи с этимологией, напр., qapu - «смотрит» (при закрытости слога длительность и узкость гласного несколько меньше), yqbi - «читает», алды - «обманывает», сызлы - «болит», «ноет», йодлы - «спит». Некоторые усматривают здесь дифтонг, но я слышу простой долгий гласный, иногда с «дифтонгообразным» сужением» [Богородицкий, 1953, с. 89]. В сфере консонантизма В.А. Богородицкий отрицает наличие в татарском языке мягких и твердых пар согласных: «... мягкость согласных в татарском всегда связана с наличностью палатального гласного, тогда как в русском языке перед одним и тем же непалатальным гласным встречаются как твердые, так и мягкие согласные, равно как и после тех же гласных, как напр., воз\\вёз (произн. в ос), рад\\ряд (произн. р аггі), лад\\ладь и т.д.; напротив, в татарском языке, напр., сочетание am не может иметь на конце вместо твердого смягченное т, а сочетание ит - вместо смягченного твердое и т.п. История русского языка разъясняет тот путь, каким развились в нем сочетания разнохарактерных по твердости-мягкости гласных и согласных; конечно, и для татарского языка не исключена возможность развития со временем подобных сочетаний, даже указывается на случай таких сочетаний в татарском на границе слов (при отсутствии синтаксической паузы), напр., кур аны — «взгляни на него» и др., а в мишарском, по моим материалам, оказываются примеры и внутри слова, напр., ун ъич - «играю» — уйяым, qbw biM - «бью» — аыйным и др.» [Богородицкий, 1953, с. 89].
Рассматривая особенности гармонии гласных в тюркских языках, ученый уточняет, что поскольку смена гласных в суффиксах и окончаниях при сингармонизме отражается в то же время соответствующими модификациями и на артикуляциях согласных тех же придаточных морфем, то можно говорить также и о сингармонизме согласных или даже целых слогов; только не следует забывать при этом, что сингармонизм в гласных является моментом, обусловливающим, а в согласных - зависимым от него.
Прагматически ориентированная фонологическая система татарского языка
Внедрение языка в новые информационные технологии сделало возможным и необходимым создание автоматизированных систем перевода языка из одной формы в другую, в частности, создание автоматического преобразователя орфографического текста в речь. Степень сложности преобразования «буква - фонема» для различных языков различна. Что касается татарского языка, то она (сложность) связана, прежде всего, с ненаучным характером его орфографии и орфоэпии - направленностью орфографических и орфоэпических норм и правил не на сохранение системы языка, а на ее разрушение.
Одно из основных положений орфографии татарского языка состоит в том, что «слова, заимствованные из русского языка через письменную речь, пишутся в такой форме, какую имеют в русской орфографии» [Татарская грамматика, 1995, т. 1, с. 109]. Это правило нашло некоторое отражение и в написании арабских заимствований. В результате современная графика татарского языка представляет механическое объединение трех языковых систем - собственно татарской, русской и арабской. Данное обстоятельство существенно затрудняет создание компьютерных корректоров, систем автоматического распознавания и синтеза речи, в том числе, и устройств перевода языка из одной формы в другую.
Как уже отмечалось, разрабатываемый синтезатор речи представляет преобразователь произвольного орфографического текста в речь. Следовательно, синтезатор должен обладать способностью озвучивать и такие слова, как компьютер, гилми, гишъщ, кэдими, аскарбин, кандилябр, январь, ателье, Дуня и т.д. Согласно орфоэпическим нормам татарского языка [Сэлимов, 2004], носителям татарского языка предлагается произносить русские заимствования с русским акцентом, а арабские слова -с арабским акцентом. Такое требование можно предъявить синтезатору,
если только ввести в состав фонем не только русские гласные /о/, /ё (э)/, /ы/, а также согласные /к/, /г/, ІцІ, ІщІ, /в/ (как это принято в настоящее время), но и гласные /a/, lid и согласные 1л /, /р У, 1н /. Однако и в этом случае трудно гарантировать выполнение синтезатором требований современной орфоэпии. Так, для произнесения слов типа арка «криволинейное прикрытие», боты «высокая калоша» по-русски, а слов арка «спина» и боты «его бедро» по-татарски, необходимо знать о чем идет речь. Для правильного озвучения слов балда «в мёде» и балда «балда», капкан «проглотил» и капкан «орудие ловли» синтезатор должен уметь проводить морфологический анализ. При этом возникает проблема как его осуществить - по морфологии русского языка или по морфологии татарского языка? Возникает своего рода порочный круг: чтобы знать, по морфологии какого языка следует проводить анализ, необходима информация о том, к какому языку слово относится. Для ответа на этот вопрос, в свою очередь, необходимы данные морфологического анализа.
Если бы заимствования в лексике татарского языка были единичными, то вопрос «как писать заимствования» потерял бы свою актуальность. Однако, они не единичны. В лексике современного татарского языка русские заимствования составляют более 40% (в составляющемся электронном словаре из 26 000 основ слов 12 000 оказались неадаптированными русскими заимствованиями), арабские заимствования (неадаптированные или частично адаптированные) - 10%. Тексты деловых бумаг, научного и публицистического стилей приблизительно на 25% покрываются заимствованиями из русского языка. Произносить эти слова по-русски при помощи включенных в фонологическую систему татарского языка семи-восьми русских фонем не представляется возможным. В звуковой картине слова [карабъл ] по-русски звучат не только /к/, но и ударная, и безударная /а/, а также согласные 161 и /л/. По-видимому, «пересаживать» часть фонем одной системы в другую систему звуков невозможно. Как пишет В.А. Богородицкий: «... звуковая система каждого языка представляет не простое собрание звуков, но гармонически связанное целое, {...} полагаю, что только что указанная особенность физиологическая и акустическая гласного /а/ может находиться в связи с более глубоким произношением татарского /к (q)l и 1г (g)/» [Богородицкий, 1953].
Значительное затруднение в произнесении заимствований так, как они звучат в языках-донорах, вносит и то, что образование грамматических форм и сложных слов от основ-заимствований происходит путем присоединения аффиксов, основ татарского языка (колхозчыларга, газулчэгеч, аэрочапа). Согласование основ и аффиксов на сегментном и супрасегментном уровнях, как правило, не удается.
Таким образом, для того чтобы синтезатор мог озвучить произвольный орфографический текст на татарском языке, необходимо придать современной разнородной фонетической системе татарского языка (состоящей из фонетических систем татарского и русского языков) определенную целостность. Работа в данном направлении проводилась нами на базе результатов исследований «народного говора», выполненного В.А. Богородицким на рубеже XIX-XX столетий [Богородицкий, 1953]. С учетом современного состояния языка нами были внесены некоторые изменения в систему В.А. Богородицкого.
Работы по созданию целостной фонологической системы татарского языка продолжаются. Что касается современного состояния разрабатываемой фонетико-фонологической системы, то, по отзывам аудиторов, синтезированная на базе предложенной нами системы речь понятна и в достаточной степени близка естественному звучанию татарской речи.
Основной единицей фонологии является фонема. В татарском языкознании фонема определяется как «неделимые далее звуковые единицы языка, которые служат для построения словоформ и для различения их звуковых видов» [Татарская грамматика, 1995, т. 1, с. 88]. Выделение фонем в татарском языке осуществлялось и продолжает осуществляться на основе правила: «Если два фонетически различных звука, находящиеся в одинаковом фонетическом контексте и одинаковой фонетической позиции различают два разных слова, то они являются различными фонемами». Так, Р.Ф. Шакирова, сопоставляя слова [кош] «птица», [каш] «бровь», [кыш] «зима», выделяет в татарском языке фонемы /о/, /а/ и /ы/. С помощью данного правила в звуковой системе татарского языка выделено 12 гласных и 28 согласных фонем. В перспективе фонологическая система татарского языка может обогатиться и широкими /а/ (сан «число» -сан «социальный статус»,), /и/ (кит «уходи» - кит «рыба»/ а также согласными, например, 1л 7 (тол «вдовый» - толь «строительный материал») и т.д.
Метод квазиомонимов простой и конструктивный. Однако его механическое применение может привести к искаженному представлению звуковой системы языка. Для языков, в орфографиях которых, подобно татарской, значится правило «писать заимствования так, как они пишутся на языке оригинала» метод квазиомонимов, по-видимому, не пригоден. В этих языках среди заимствований всегда найдутся слова, контрастирующие со словами заимствующего языка. Так, из оппозиции орфограмм таких слов, как «тол (вдовый)» - «тол (взрывчатое вещество)», «сыр (резьба)» — «сыр (пищевой продукт)» и др. лингвисты сделали заключение о наличии в татарском языке двух фонем /о/, двух фонем /ы/ и двух 1э1. При этом предполагаются два отнюдь неочевидных допущения, а именно: 1) смысл слова в речевой коммуникации устанавливается в результате опознавания составляющих его фонем и 2) фонетическое равенство контекста звуков, по которым различаются сопоставляемые слова. Было бы не совсем корректно утверждать, что в таких парах как «тол (вдовый)» - «тол (взрывчатое вещество)», «сыр (резьба)» - «сыр (пищевой продукт)» и «сер (секрет)» «сэр (титул)» слова различаются только по гласным звукам.
Ритмический строй татарского языка
В связи с внедрением естественных языков в новые информационные технологии число работ по изучению просодии письменной и устной речи в последние годы существенно возросло. Этому в значительной степени способствовали исследования по созданию систем синтеза речи. Разработчикам таких систем стало ясно, что без просодической параметризации невозможно получить синтезированную речь приемлемого качества [Кривнова, 2000].
Автоматическое определение границ РТ требует, по меньшей мере, проведения неполного синтаксического анализа подлежащего к преобразованию в речь текста. Поскольку синтаксический анализ предложения опирается на данные морфологического анализа, построение алгоритма выделения границ РТ превращается в сложную задачу, которая может быть решена совместными усилиями коллектива сотрудников. На данном этапе основное усилие было направлено на создание системы правил просодической параметризации РТ. Разметку границ РТ проводили по знакам препинания. Длительности паузы, соответствующие знакам препинания, величины их определялись согласно правилам, описанным в работе «Вариативность чтения текстов на татарском языке: паузирование» [Ибрагимов, Салимов, Сайхунов, 2007].
Что касается решения второй задачи, то оно требует раскрытия природы РТ. Что собой представляет РТ - чисто фонетическое явление, обусловленное, например, физиологией речевого дыхания, или фонетико-фонологическое, связанное также и со смыслом высказывания?
Так, если в предложении «Хэлшдэ эби куршесе Кэишфэнец кергэнен яратмады» сделать паузу после слова эби (т.е. в качестве субъекта принять словосочетание Хэмидэ эби), то предложение будет переводиться как «Бабушка Хамида не полюбила приход соседки Кашифы» (буквальный перевод). Но если паузу сделать после словосочетания Хэмидэ эби куршесе, то субъектом становится соседка бабушки Хамиды, и предложение приобретает смысл «Соседка бабушки Хамиды не полюбила приход Кашифы».
Таким образом, речевой такт представляет фонетическое и смысловое целое. Другими словами, как в структурном, так и в функциональном отношении речевой такт совпадает с ритмической группой, лежащей в основе просодической организации татарского языка.
В работе «К проблеме просодического оформления речевых единиц при синтезе предложений татарского языка» [Ибрагимов, 20046] приводятся некоторые сведения о просодической системе, в том числе о ритмической структуре татарского языка, дается определение ритмической группы -базовой единицы ритмического строения татарского языка.
По определению РГ - слово или сочетание слов, представляющее фонетическое и смысловое целое [Щерба, 1957, с. 83-84]. Регулярной повторяемостью обладает не сегментная, а супрасегментная структура РГ -кривые изменения частоты основного тона (мелодический контур), интенсивности (динамический контур) и длительности слогов (контур распределения длительностей слогообразующих гласных). Паузы, с которыми чередуются акцентно-тональные структуры, могут быть заполненными и незаполненными, т.е. проявляться в формах некоторого приращения звучания конечного в речевом сегменте звука и полного прекращения фонации.
Минимальные РГ в зависимости от темпа речи, от длины предложения могут объединяться в синтагмы и фразы. Следует отметить, что с укрупнением РГ увеличивается длительность паузы. Наиболее длительные паузы наблюдаются на границе предложений. Замечено, что длительность паузы коррелирует с длиной как предшествующей, так и следующей за паузой РГ. В частности, нами было выявлено, что чем длиннее следующее предложение, тем длиннее пауза, предшествующая произнесению этого предложения.
Важным свойством РГ является то, что граница РГ совпадает с границей актантной составляющей предложения. Данное обстоятельство позволяет использовать теорию семантических падежей при определении границ РГ.
В работах «Ритмо-темпоральные характеристики татарской разговорной речи» [Сайхунов, 2006] и «К проблеме просодического оформления речевых единиц при синтезе предложений татарского языка» [Ибрагимов, 20046] авторы рассматривают задачу интонационногои оформления синтезированного простого предложения. Основная идея работы заключается в создании базы интонационных контуров (ИК), соответствующих различным коммуникативным типам и подтипам предложений. Предполагается, что при наличии такой базы просодическую параметризацию той или иной синтезированной фразы можно осуществить путем наложения на нее соответствующего ИК (проецирования значений базовых кривых распределения длительности и основного тона слогообразующих гласных во фразе). Однако, как выяснилось, создание базы ИК даже для простых предложений - задача не простая. Число ИК не ограничивается семью типами и их многочисленными подтипами. Ритмо-мелодическая структура предложений зависит от многих факторов, в том числе, от наличия слов с логическим ударением и позиции их в предложении, а также от фонетических свойств слогообразующих гласных и т.д.
Указанные обстоятельства потребовали разработку методики общего подхода к решению проблемы просодической параметризации синтезированных предложений. Способ, который был применен при разработке методики, состоял в определении статистических закономерностей изменения акустических параметров в пределах РГ и представления их в удобном для использования виде. Поскольку начало предложения (оно, как правило, состоит из описания субъекта) произносится несколько иначе, чем середина или конец, а конечная РГ (презентация предиката) несет в себе также информацию о типе предложения по коммуникативной направленности, были выделены три типа РГ - начальная, серединная и конечная.
Паузирование письменной речи в татарском языке
Как и большинство систем автоматического синтеза речи, разрабатываемый синтезатор, как было отмечено, представляет преобразователь произвольного орфографического текста в речь. Качество синтезированной по тексту речи зависит от того, насколько в интонационном отношении она близка естественному чтению, в том числе -насколько в ней правильно выделены и обеспечены паузами соответствующей длительности границы ритмических групп.
В работе мы ограничились рассмотрением темпоральных (физических) пауз ([Кривнова, Чардин, 1999]). Исходя из специфики проводимого исследования (улучшение качества синтезированной речи), основное внимание в работе было уделено следующим моментам: - степень соответствия между паузированием текста и системой пунктуации языка, - вариативность пауз по длительности и причины вариативности, - различия в чтениях текста одним и тем же и разными дикторами, - система распределения несанкционированных (необеспеченных знаком препинания) пауз.
Решение поставленных вопросов сопряжено с проведением большого количества экспериментальных исследований. Результаты настоящего этапа исследований являются предварительными и требуют дополнительного привлечения больших по объему текстов. Приведенные в работе числовые данные и выводы получены на основе анализа текста (отрывок из художественного произведения)14, включающего 173 словоупотребления. Текст состоит из двух абзацев, содержит 35 знаков препинания, в том числе: пятнадцать точек, семнадцать запятых, два тире, одно двоеточие. Таким образом, средняя длина предложения оказалась равной 11,5 словам; средняя длина интонационной фразы (текст между двумя знаками препинания без учета дефиса) - 4,9 словам. Текст в произнесении трех дикторов мужчин был оцифрован. При этом первый диктор читал текст три раза, второй диктор - два, третий диктор - один раз. Были подсчитаны средние длительности пауз, соответствующих местам употребления каждого из указанных знаков препинания, а также границам, не обусловленным пунктуацией ритмических групп, для каждого диктора. Общие данные по распределению длительностей различных типов пауз представлены в таблице 7. Различия в чтениях одного и того же диктора, как и отличия в чтениях разными дикторами, оказались значительными. С учетом выявленного обстоятельства средние длительности паузы, соответствующей определенному знаку препинания, а также паузы на границах, не обозначенных пунктуацией ритмических групп, были вычислены путем
Текст приведен в приложении (Текст 3). деления суммы всех пауз, обусловленных данным знаком препинания, на количество произведенных измерений.
Расчеты показали, что средняя длительность паузы на границах предложений у первого диктора составила 520 мс, у второго диктора - 470 мс, у третьего диктора - 530 мс. Размах вариаций в значениях длительностей данного вида пауз для первого диктора оказался равным 1390 мс, для второго - 280 мс и для третьего - 330 мс.
Представленные в таблице 7 данные позволяют сделать некоторые обобщения. Так, во-первых, 100%-ное паузирование характерно для границ предложений, во-вторых, запятые не всегда выделяются паузой. Далее оказалось, что двоеточия и тире выделяются одинаковой паузой, а слова, написанные через дефис, не выделяются паузой. И, наконец, слова, написанные через тире, могут выделяться паузой, а могут и не выделяться.
Числа, приведенные в последней строке таблицы 7, являются средними значениями длительностей пауз, соответствующих указанным знакам препинания. Обращает на себя внимание то обстоятельство, что разброс между значениями пауз, отвечающих тому или иному знаку препинания, значителен. Так, размах вариаций в распределениях длительностей пауз, соответствующих местам расположения точек, составляет 1369 мс, а аналогичный размах в случае запятых - 531 мс.
Как показали исследования, основным фактором, влияющим на длительность паузы, является длина как предшествующей знаку препинания, так и следующей за знаком препинания фразы. Например, средняя длительность паузы после предложений длиной 14 t15 24 оказалась 550 мс, за предложениями длиной 8 t 10 составила 520 мс, а в случае предложений, имеющих длину 3 t 5, оказалась равной 370 мс. Такая же зависимость наблюдается в длительностях пауз после запятой. В местах, где запятые следовали за фразами, включающими от шести до десяти слов, средняя длительность паузы оказалась 303 мс. В местах, в которых запятые следовали за фразами длиной от одного до четырех слов включительно, средняя длительность паузы составила 180 мс.
Если в распределении длительностей пауз на границах предложений существенную роль играет длина предложения, то «в случае запятых» существенна как длина предшествующей интонационной фразы, так и близость следующей интонационной фразы к границе предложения. В приведенных ниже примерах указаны позиции запятых, в которых они, по крайней мере, два раза не были выделены паузой. 1) шаяру, мэзэк суз эйткэлэшулэр... - 5/6, 2) э бер-берсе белэн аралашу, шаяру... - 3/6, 3) Ык буе узенец йомшаклыгы, эк;ылылыгы белэн... - 3/6, 4) кичлэрен су май кебек ощылы, йомшак. - 3/6, 5) кояш баегач, Ык буена су керергэ китэлэр иде. - 2/6, 6) мэзэк суз эйткэлэшулэр щаныца пакълек всти, рухыца дэрт бирэ. -2/6.
В примерах 1) и 5) предшествующие позиции запятой интонационные фразы состоят из одного либо из двух слов, соответственно. В случаях 2) и 3) место следующей паузы довольно близко располагается к позициям запятой, а в случаях 4) и 6) к позициям запятых близко располагается точка - конец предложения. Данные по распределению длительностей пауз на границах предложений, а также случаи отсутствия пауз в местах расположения запятых говорят о том, что основную роль в паузировании знаков препинания играет речевое дыхание.
Следует отметить, что отсутствие физической паузы или прекращение фонации не говорит об отсутствии паузирования вовсе. Как физическая пауза она, по-видимому, исчезает из-за увеличения темпа речи по причине близости следующей паузы. Однако все другие признаки, характерные для паузы, а именно контрастирование пограничных слогов по основному тону и длительности, сохраняются. При озвучивании текста с помощью разрабатываемого синтезатора татарской речи запятые, в указанных выше позициях, были отмечены нами особым символом, означающим, что данные границы ритмических групп не локализуются физической паузой при сохранении фонетических изменений пограничных слогов.