Содержание к диссертации
Введение
ГЛАВА I. ТИПЫ КОНТЕКСТНЫХ ИЗМЕНЕНИЙ В ФОНЕТИЧЕСКОЙ СИСТЕМЕ 8
ГЛАВА П. ФОНЕТИЧЕСКАЯ СТРУКТУРА ДИФФЕРЕНЦИАЛЬНОГО ПРИЗНАКА ГЛУХОСТЬ /ЗВОНКОСТЬ 18
ГЛАВА III. ГУБНО-ЗУБНЫЕ СОГЛАСНЫЕ В ФОНЕТИЧЕСКОЙ СИСТЕМЕ СОВРЕМЕННОГО РУССКОГО ЯЗЫКА 46
ГЛАВА IV. РЕЗУЛЬТАТЫ ЭКСПЕРИМЕНТАЛЬНОГО ИССЛЕДО ВАНИЯ КОНТЕКСТНЫХ ИЗМЕНЕНИЙ ПО ГЛУХОСТИ / ЗВОНКОСТИ В СОЧЕТАНИЯХ ГУБНО-ЗУБНЫХ СОГЛАСНЫХ НА СТЫКАХ СЛОВ В СОВРЕМЕННОМ РУССКОМ ЛИТЕРАТУРНОМ ЯЗЫКЕ 60
Структура экспериментального исследования 60
Эксперимент 1. Анализ существующего материала 62
Эксперимент 2. Частотное распределение вариантов Ю8
Эксперимент 3. Зависимость произношения губно-зубных согласных на стыках слов от сегментных и жанрово-стилистических факторов 129
Эксперимент 4. Зависимость произношения губно-зубных согласных на стыках слов от просодических и экстралингвисти ческих факторов 156
ЗАКЛЮЧЕНИЕ 170
ЛИТЕРАТУРА 176
- ФОНЕТИЧЕСКАЯ СТРУКТУРА ДИФФЕРЕНЦИАЛЬНОГО ПРИЗНАКА ГЛУХОСТЬ /ЗВОНКОСТЬ
- РЕЗУЛЬТАТЫ ЭКСПЕРИМЕНТАЛЬНОГО ИССЛЕДО ВАНИЯ КОНТЕКСТНЫХ ИЗМЕНЕНИЙ ПО ГЛУХОСТИ / ЗВОНКОСТИ В СОЧЕТАНИЯХ ГУБНО-ЗУБНЫХ СОГЛАСНЫХ НА СТЫКАХ СЛОВ В СОВРЕМЕННОМ РУССКОМ ЛИТЕРАТУРНОМ ЯЗЫКЕ
- Эксперимент 3. Зависимость произношения губно-зубных согласных на стыках слов от сегментных и жанрово-стилистических факторов
Введение к работе
В современном русском литературном языке (далее — СРЛЯ) шумные согласные в положении перед шумным согласным подвергаются ассимиляции по голосу (как внутри слова, так и на стыках фонетических слов). Этого явления обычно не наблюдается в положении перед сонорными согласными, а также перед [в] и [в1], которые в СРЛЯ занимают промежуточное между шумными и сонорными согласными положение — они, как и все сонорные, не вызывают ассимиляции предшествующего шумного, но, как и все шумные, сами подвергаются ассимиляции.
В соответствии с общими закономерностями СРЛЯ сочетания "звонкий губно-зубной щелевой + звонкий губно-зубной щелевой" (" в или в + в или в ") на стыках фонетических слов должны реализовываться сочетаниями [фв] ([ф в ], [фв ], [ф в]). Однако аудитивный анализ звучащей речи показывает, что в этих случаях часто имеет место уподобление по глухости / звонкости согласных, во всем, кроме глухости / звонкости (и, возможно, твердости / мягкости), идентичных. Причем это уподобление может проявяться как в озвончении первого элемента сочетания, так и в оглушении (полном или частичном) второго.
ФОНЕТИЧЕСКАЯ СТРУКТУРА ДИФФЕРЕНЦИАЛЬНОГО ПРИЗНАКА ГЛУХОСТЬ ЗВОНКОСТЬ
В главе I было показано, что в результате контекстных уподоблений как внутри слова, так и на стыках фонетических слов, изменяться может либо значение дифференциального признака (далее — ДП) в целом (например, в случае ассимиляции), либо значение только одного или нескольких — но не всех — параметров, реализующих данный ДП на фонетическом уровне (например, в случае коартикуляции). Настоящая работа посвящена контекстным изменениям на стыках слов, связанным с ДП глухость / звонкость и, соответственно, с реализущими его фонетическими параметрами. В данной главе рассматриваются вопросы фонетической структуры ДП глухость / звонкость.
Проблема выделения в языковой системе дифференциальных фонологических признаков и описания их физической реализации в речи со времен Н.С.Трубецкого остается одной из основных фонетических проблем.
Современные представления об устройстве дифференциальных признаков были сформулированы С.В.Кодзасовым [Кодзасов 1982]. Согласно этой теории, выделяются собственно признаки, т.е. чисто символические, абстрактные сущности, использующиеся на высшем уровне фонетического поведения, и параметры — конкретные субстанциональные сущности, использующиеся на более низких уровнях: моторные (задают состояние мышц во времени), артикуляторные (определяют пространственное положение, форму и механические свойства речевых органов), акустические, перцептивные и др. Каждый признак, таким образом, состоит на каждом из уровней из определенных параметрических комплексов [Кодзасов 1982: 94-95]. При этом субстанциональные комплексы, соответствующие одноименным признакам, могут отличаться друг от друга в трех отношениях — составом параметров, значениями параметров и их временным распределением [Кодзасов 1982: 99-100]. С.В.Кодзасов подвергает критике все еще широко распространенное представление о том, что признак тождествен инвариантному параметру и что при восприятии отождествление этого параметра равнозначно отождествлению признака. По его мнению, этот факт обусловлен неосознанным переносом на отношения признаков и параметров представлений, связанных с отношениями фонем и фонов (звуков речи): если фонема понимается как совокупность различительных признаков, то операция перехода от звука речи к фонеме состоит в опущении нерелевантных признаков; если подобным же образом понимать отношения признаков и параметров, то операция перехода от параметрического комплекса к признаку состоит в опущении нерелевантных параметров. "Такой перенос неверен: операция перехода от параметрической матрицы к признаку носит принципиально иной характер — она состоит в символизации этой матрицы как целого, результат свертывания всех элементов комплекса в один символ" [Кодзасов 1982: 103-104]. С.В.Кодзасов отмечает также, что существующие универсальные инвентари фонетических признаков являются фактически наборами ярлыков для семейств признаков, выделяемых тем или иным способом на универсальном множестве индивидуальных признаков. При этом степень дробности разбиения на семейства может быть различной: чем более тонкие системные взаимосвязи и типологические особенности мы хотим установить, тем большее количество семейств признаков нам придется выделять, "так, из семейства "глухость / звонкость" можно выделить подсемейства "напряженность / ненапряженность" и "придыхательность / непридыхательность... Сейчас степень грубости — тонкости определяется в основном критерием достаточности для называния смыслоразличительных оппозиций. Для описательных и практических целей такая номенклатура является слишком грубой. Переход к более детальному признаковому инвентарю фактически означает переход к описанию в терминах параметров" [Кодзасов 1982, 105-106].
Дальнейшее описание характера акустической реализации ДП глухость / звонкость в настоящей главе строится с опорой на изложенное выше понимание структуры различительного признака и основывается на материале, представленном в [Князев 1991]. В работе принимается положение о том, что между субстанциональными акустическими комплексами, соответствующими дифференциальным признакам глухость / звонкость и напряженность / ненапряженность, имеются лишь различия в значениях параметров (с чем связан и тот факт, что звонкий согласный в общем случае является ненапряженным, непридыхательным и т. п., в то время как глухой — соответственно напряженным, придыхательным и т. п.). Вместе с тем, различия в значениях параметров, очевидно, имеют своим следствием и различия в иерархической организации этих параметров в признак (т.е., в составе разных ДП одни и те же параметры могут иметь разные "веса").
Согласно концепции К.И.Колера [Колер 1984] все акустические параметры, реализующие противопоставление по ДП глухость / звонкость и напряженность / ненапряженность, подразделяются на две большие группы, соотносимые с силой надглоточных артикуляций и потока воздуха и с напряжением в области ларинкса: "В несколько упрощенном виде данный признак может быть связан 1) с параметрами времени артикуляций и 2) с ларингальными компонентами силы / напряжения. Первые соотносятся со скоростью образования и размыкания смычки (щели) и являются универсальными; реализации последних специфичны по языкам. Относительная значимость данных компонентов зависит от позиции в слоге и/или в слове и способа образования согласного. В начале слова у взрывных ларингальный компонент обычно имеет большее значение; в середине слова оба компонента примерно равны по значимости; в позиции конца слова трудно сохранять противопоставление при помощи ларингального компонента, поэтому наиболее важным здесь является временной компонент — в том случае, если противопоставление сохраняется, несмотря на качественное совпадение сегментов. Невозможно обнаружить один постоянный поверхностный параметр, при помощи которого можно было бы описать реализацию ларингальных различий у напряженных / ненапряженных согласных, так же как не существует абсолютных значений при противопоставлениях по артикуляционной длительности" [Колер 1984, 168-169]. Следует, однако, заметить, что для некоторых целей (см., например, [Князев 1989]) было бы гораздо удобнее описывать все акустические параметры единообразно, без разделения их на подгруппы. Такое описание, по-видимому, возможно с опорой на длительность сегментов. Так, фонетический параметр [наличие / отсутствие придыхания] может быть задан через длительность послевзрывной фазы согласного; параметр [наличие / отсутствие голоса] — через длительности участков согласного с наличием и отсутствием колебаний голосовых связок. При этом абсолютные длительности конкретных сегментов могут обусловливаться не только типом ДП, но и индивидуальными особенностями говорящего, ситуацией, положением согласного по отношению к ударению и границам слова (синтагмы), контекстными условиями, количеством сегментов в слове, словесной просодией и т.п. Поэтому представляется более целесообразным задавать не абсолютные, а относительные значения типа "длительность глухого согласного в позиции -VCV- составляет 130% длительности звонкого в той же позиции". Наконец, "фонетический коррелят ДП акустически может быть перемещен в соседнюю сегментную единицу речевой цепи, но и в этом случае не отрывается от своей фонемы" [Барановская 1975: 39], поэтому большинство акустических параметров, реализующих контраст по ДП напряженность / ненапряженность и глухость / звонкость, функционирует в пределах слога или более крупной просодической единицы, распространяясь на соседние (предшествующий и последующий) звуки: "Артикуляторно-временные параметры, связанные с противопоставлением напряженных / ненапряженных согласных, не привязаны к отдельным сегментам, а присущи большим единствам, так что наиболее адекватным является описание слоговых моделей в целом" [Колер 1984: 170], см. также [Фудзимура и Миллер 1979].
1. Начать описание акустических коррелятов ДП напряженность / ненапряженность и глухость / звонкость логично с тех "акустических ключей", которые связаны непосредственно с согласным.
1.1. [наличие / отсутствие голоса], т.е. наличие или отсутствие гармонических колебаний при произнесении согласного. В позиции начала слова перед гласным показателем фонетической звонкости является наличие озвонченного участка длительностью не менее 25 мс (т.е., длительность этого отрезка должна быть всего лишь не меньше минимально воспринимаемой человеком: [Клатт 1976: 1219]. За озвонченным участком смычки может следовать глухой участок значительной длительности (более 25 мс), что не нарушает восприятия согласного как звонкого; таким образом в разных языках произносится до 30% всех начальных звонких взрывных [Моор 1971]. Однако обычно длительность озвонченного участка значительно превышает минимально допустимое значение и составляет 80-100 мс. При этом, правда, существует и еще одно ограничение: длительность звонкого участка смычки должна — для надежной идентификации согласного как звонкого — превышать длительность послевзрывной фазы не менее, чем на 30%.
В интервокальной позиции фонетически маркированными (т.е., менее удобными для произнесения) являются глухие согласные. Соответственно, показателем фонетической глухости является здесь оглушенный отрезок длительностью не менее 30 мс. В позиции конца слова практически ни в одном из языков противопоставление согласных не осуществляется с опорой на этот параметр [Китинг и др. 1983: 74-78]. Наиболее удобной позицией для противопоставления глухих / звонких согласных является положение между гласными; число языков с тем же контрастом в начальной позиции несколько меньше [Китинг и др. 1983: 74-78].
1.2. Под длительностью согласного здесь и далее понимается длительность шума у фрикативных и длительность смычки у взрывных согласных (таким образом, в позиции начала слова взрывные согласные по этому параметру не противопоставлены). Во всех языках и во всех позициях, где сохраняется рассматриваемое противопоставление, напряженные согласные являются более долгими, чем ненапряженные [Якобсон, Фант, Халле 1962, 204; Денеш 1955; Лискер 1957; Шарф 1964а; Делаттр 1968, 227-229; Фишер-Иоргенсен 1968, 78-97, 105-106; Моор 1971; Коул и Купер 1975; Колер 1979; Фуракис и Иверсон 1984]: "Описанные вариации обнаружены в значительном числе языков, а также на не зависящих от языка материалах, так что они являются подлинно внутренними, т.е. не зависящими от какого-либо лингвистического кода, могут быть объяснены в терминах механизма речеобразования, и, следовательно, являются универсальными" [Моор 1971: 83]. Согласно данным ДХКлатта, длительность глухого согласного должна превышать длительность звонкого не менее, чем на 25%. Именно такое (1 : 1.25) соотношение и наблюдается в языках и позициях, где данный параметр не является основным (в языках с ДП глухость / звонкость и в позиции начала слова). Наоборот, в интервокальной позиции, а также в тех случаях, когда большинство других параме тров оказываются нейтрализованными, данный контраст проявляется наиболее ярко; это характерно, например, для положения конца слова в английском языке, где длительность конечного напряженного может составлять до 160% от длительности конечного ненапряженного согласного [Денеш 1955; Коул и Купер 1975]. При нейтрализации противопоставления по ДП нейтрализуются и различия по длительности согласного. Так, именно довольно значительные различия в длительности согласных, реализующих напряженные / ненапряженные фонемы в финальной позиции в НЛЯ, дают основание предполагать отсутствие в этом положении нейтрализации этих фонем [Фуракис иИверсон 1984].
1.3. Интенсивность согласного понимается как интенсивность фрикативного шума или взрыва. Интенсивность напряженных согласных значительно выше, чем ненапряженных [Якобсон, Фант, Халле 1962: 204; Делаттр 1968: 227-229; Фишер-Иоргенсен 1968: 80; Браун 1984: 25-33]. Интересно отметить, что в ряде случаев различия по интенсивности могут восприниматься аудиторами как различия по длительности [Князев 19896].
1.4. Длительность послевзрывной фазы [наличие / отсутствие придыхания]. Существует точка зрения, согласно которой длительность послевзрывной фазы согласного зависит — прямо или обратно пропорционально — от интенсивности взрыва [Зиндер 1979: 124]. Однако полученные на материале РЛЯ результаты свидетельствуют о том, что разная длительность послевзрывной фазы (в зависимости от положения перед тем или иным гласным) может наблюдаться при идентичной интенсивности взрыва. Под длительностью послевзрывной фазы здесь и далее понимается длительность отрезка от начала взрыва до начала следующего звука. В данной работе не используется способ описания противопоставления глухих / звонких согласных при помощи параметра VOT (Voice Onset Time), предложенного в [Абрамсон и Лискер 1964], так как он в первую очередь направлен на выявление общего, а не отличного в характере реализации рассматриваемых ДП. Кроме того, данный способ неудобен при описании контраста глухих / звонких согласных в позиции -VCV- при наличии оглушенного участка в конце смычки звонкого согласного [Фишер-Иоргенсен 1968: 92-93, 106, 109]. Длительность послевзрывной фазы напряженных согласных значительно больше, чем ненапряженных [Делаттр 1968: 227-229; Фишер-Иоргенсен 1968: 79-87, 92-93, 106; Моор 1971; Хоард 1971; Колер 1979; Колер 1984; Браун 1984: 25-33]. Наиболее ярко этот контраст проявляется у губных (вследствие небольшой абсолютной длительности), наименее ярко — у заднеязьиных. Значимость данного параметра (как и любого другого) значительно увеличивается при нейтрализации некоторых других; например, в английском языке в позиции начала слова — при нейтрализации параметров [наличие / отсутствие голоса], длительность смычки и всех параметров, связанных с предшествующим гласным. Еще одно ограничение состоит в том, что функционирование данного параметра возможно почти только в позиции перед ударным гласным.
1.5. Для фрикативных согласных в интервокальном положении существует еще один акустический коррелят звонкости (ненапряженности): более четкая, чем у глухих (напряженных), в некоторых случаях почти "формантная" структура фрикативного шума [Делаттр 1968: 229].
1.6. При произношении конечных смычных как имплозивных акустический параметр длительности согласного может быть заме нен параметром глоттализации напряженного [Колер 1984: 169; Браун 1984: 27].
2. Следующая группа акустических коррелятов ДП глухость / звонкость и напряженность / ненапряженность — это такие параметры, которые реализуются на соседнем элементе речевой цепи (предшествующем или последующем гласном).
2.1. Длительность предшествующего гласного больше в по зиции перед глухим (напряженным), чем перед звонким (ненапря женным) [Денеш 1955; Петерсон и Лехисте 1960; Шарф 1964а, 19646; Делаттр 1968; Фишер-Йоргенсен 1968; Чен 1970; Моор 1971; Рафаэл 1972; Коул и Купер 1975; Джавкин 1976; Мэк 1982; Водрип-Фруэн 1982; Фуракис и Иверсон 1984; Браун 1984; Колер 1979,1984 и др.]. Длительность гласного, предшествующего напряженному согласному, составляет 60-90% длительности того же гласного в положении перед ненапряженным; данные эти для разных языков очень различны [Чен 1970: 136]. Наиболее ярко данный контраст проявляется на ударных гласных английского языка, находящихся перед конечным согласным слова — здесь противопоставление напряженных / ненапряженных согласных (особенно фрикативных) опирается практически только на различие в длительности предшествующего гласного, т.к. почти все другие параметры нейтрализуются. Вопрос о возможных причинах столь значительных различий в функционировании данного параметра в разных языках (точнее, очевидного про тивопоставления английского языка всем другим) будет рассмотрен ниже). 2.2. Характер формантного перехода от гласного к согласному. Перед ненапряженным (звонким) согласным переходный участок F] заканчивается на более низкой частоте, чем перед напряженным (глухим); разница между значениями первой форманты в начале и конце перехода, скорость изменения частоты F0 и длительность переходного участка больше у гласного, предшествующего ненапряженному согласному [Делаттр 1968: 227-239; Фишер-Иоргенсен 1968: 78-79; Колер 1979: 342].
2.3. Характер изменения частоты основного тона предшествующего гласного. "Ровный тон на всем ударном гласном в позиции перед взрывным... приводит к восприятию согласного как напряженного — в отличие от падающего тона — как в английском, так и в немецком языках, но только в том случав, если ровный тон этот может быть легко выделен из макропросодической структуры всего высказывания. В немецком [ровный + падающий] тон отделяется от падающего как еще более яркий показатель напряженности последующего согласного" [Колер 1987: 83]; см. также [Моор 1971]; [Колер 1985]. Понижение F0 в конце гласного перед шумным — универсальное явление [Моор 1971], но перед напряженным разность между максимумом и минимумом F0 и скорость изменения частоты основного тона (далее — 40TJ меньше; отрезок гласного, на котором происходит падение, короче (вероятно, это связано с меньшей общей длительностью этого гласного): часто он не превышает 25 мс и не воспринимается слушающим. 2.4. Длительность отрезка гласного, на котором происходит падение интенсивности, значительно меньше перед напряженным (глухим) согласным, само же падение в этом случае происходит более резко (так называемое "сильное примыкание") [Браун 1984,
29-30]. 3. Следующая группа акустических коррелятов ДП напряженность / ненапряженность и глухость / звонкость связана с последующим гласным.
3.1. Длительность гласного в позиции после ненапряженного (звонкого) согласного больше, чем в положении после напряженного (глухого) на 10-50 мс и составляет до 160% от длительности гласного в позиции после глухого. Различия по длительности последующего гласного обычно значительно больше различий по длительности послевзрывной фазы согласного и, следовательно, прямо не обусловлены ими [Петерсон и Лехисте 1960; Фишер-Иоргенсен 1968: 74].
3.2. Нарастание интенсивности гласного происходит медленнее после ненапряженных (звонких) согласных [Фишер Иоргенсен 1968: 73], соответственно интервал между началом гласного и максимумом его интенсивности больше у гласных в положении после глухого (напряженного) согласного.
3.3. Движение основного тона. В этом случае, как и в П..2.3, имеются в виду так называемые "тональные микроструктуры" [Колер 1985], связанные с качеством отдельных сегментов; они могут взаимодействовать со словесными и фразовыми "макроструктурами". Движение основного тона на последующем гласном начинается с более высокого уровня, если этот гласный следует за напряженным (глухим) согласным: разница может достигать 30 Гц; при этом микропросодический тональный контур нисходящий, а после ненапряженного (звонкого) — восходящий [Лехисте и Петерсон 1961; Фишер-Иоргенсен 1968: 72; Моор 1971; Колер 1985,1987].
3.4. Характер формантного перехода от согласного к гласному. После напряженных (глухих) согласных переходный участок первой форманты начинается с большего значения; разница между начальным и конечным значениями F1 (в герцах), скорость изменения значения F1 и длительность переходного участка, а также длительность интервала между взрывом и концом формантного перехода меньше, чем после ненапряженных (звонких) согласных [Фишер-Йоргенсен 1968: 78-79]. Наиболее отчетливо выделяемой характеристикой является в данном случае длительность переходного участка [Делаттр 1968: 227-228; Стивене и Клатт 1974]. Возможно, длительность этого отрезка связана с длительностью послевзрывной фазы согласного: для надежного опознавания согласного как напряженного (глухого) формантный переход должен быть завершен до момента начала голоса, т.е. на протяжении послевзрывной фазы [Стивене и Клатт 1974]. Этим же могут объясняться и различия по длительности послевзрывной фазы заднеязычных / переднеязычных / губных согласных: "Общеизвестно, что длительность движения артикулятора, который формирует смычку, является наибольшей, если артикулятор — тело языка, она меньше для кончика языка и еще меньше для губ. Измерения скорости формантных переходов и эксперименты с синтезированными стимулами с разной скоростью формантных переходов также свидетельствуют о наименьшей скорости у велярных. Чем меньше переход, тем больше должно быть значение ЧОТ, если изменение спектра должно быть в целом закончено до начала голоса" [Стивене и Клатт 1974: 658].
РЕЗУЛЬТАТЫ ЭКСПЕРИМЕНТАЛЬНОГО ИССЛЕДО ВАНИЯ КОНТЕКСТНЫХ ИЗМЕНЕНИЙ ПО ГЛУХОСТИ / ЗВОНКОСТИ В СОЧЕТАНИЯХ ГУБНО-ЗУБНЫХ СОГЛАСНЫХ НА СТЫКАХ СЛОВ В СОВРЕМЕННОМ РУССКОМ ЛИТЕРАТУРНОМ ЯЗЫКЕ
Первый эксперимент был посвящен анализу произношения губно-зубных согласных на стыках фонетических слов на материале уже существующих записей, представленных в специализированной фонетической базе данных.
Структурированный речевой материал - речевые базы данных - в настоящее время становятся важнейшей составляющей инструментария любого лингвиста, а особенно фонетиста. Самый представительный на сегодняшний день речевой корпус русского языка, который может быть использован как для разработки систем распознавания русской речи, так и для исследовательских целей, создан в Институте системного анализа Российской Академии наук (ИСА РАН) [Кривнова, Захаров, Строкин 2001; Богданов и др. 2003; Кривнова, Богданов, Подрабинович 2004; Кривнова и др. 2004]. Он занимает более 15 гигабайт и содержит более 50 часов фонетически аннотированной непрерывной речи. Речевой корпус RuSpeech создавался по заказу корпорации Intel. Результатом проекта помимо самой речевой базы данных явились отлаженная технология создания речевых корпусов и комплекс программных средств для обеспечения этой технологии [Арлазаров и др. 1998].
Общие характеристики этой базы данных таковы:
30 CD, более 15 Gb;
50 часов записи;
тип произнесения — непрерывная речь;
237 дикторов, в среднем каждый произнес по 250 предложений;
всего более 50000 произнесенных предложений; каждое произнесенное предложение сопровождается
фонетической разметкой: канонической транскрипцией в соответствии с правилами русской речи (ожидаемая фонетическая последовательность) и фактической транскрипцией (последовательность произнесенных фонем), выверенная экспертом. Корпус разделен на 4 непересекающиеся части: TRAIN — набор для исследований, статистических обсчетов и обучения алгоритмов классификации и распознавания;
TEST — набор для тестирования разработанных алгоритмов, программ и систем;
DEVELOPMENT — набор для отладки алгоритмов и программ;
BAD — набор, содержащий произнесения, которые непрофессионалом воспринимаются как нормативные, однако эксперты оценили их как отклоняющиеся от правил русской речи.
Текстовый материал был подготовлен следующим образом:
70 предложений, обеспечивающий полное фонетическое покрытие (встречаемость каждого монофона не менее 3-х раз);
тексты для набора TRAIN — 3060 предложений, обеспечивающих полное аллофонное покрытие (встречаемость каждого из аллофонов), при этом специального подбора слов не осуществлялось и набор практически отражает естественную частотность монофонов и аллофонов в языке; 1000 предложений для тестового набора;
1000 предложений для набора контроля разработки. Для обеспечения требования полного фонетического покрытия для каждого диктора был выделен набор из 70 предложений, который был произнесен всеми диктороми. Далее диктор произносил тексты из переменной части, которые циклически выбирались из общего пула из 5060 предложений.
Тексты отбирались из печатных и сетевых средств массовой информации (газеты "Известия", "Аргументы и факты", "Московский комсомолец" и некоторые другие, новостные сайты в сети Интернет). Тематика текстов: политика, экономика, культура, искусство, медицина, спорт.
Для произнесения предложений, входящих в состав текстового материала, было привлечено 237 дикторов в возрасте от 18 до 65 лет, в том числе 127 мужчин и 110 женщин. Все они не являлись профессиональными дикторами и не имели опыта в искусстве речевого чтения. Распределение дикторов по возрасту выглядит так:
Распределение дикторов по возрасту
Все дикторы проживают в Москве и, в основном, обладают московским произношением. Элементом речевого корпуса является совокупность оцифрованной звуковой волны (wav-файл), представляющей собой предложение, произнесенное диктором, и дополнительной информации об этой волне (wfi-файл). Звуковая волна записана в формате Microsoft Windows RIFF (Resource Interchange File Format) WAV с частотой дискретизации 22050 Гц. Запись производилась с помощью микрофона модели Plantronics и звуковой карты модели SB Live!.
Информационный файл (wfi-файл) содержит ключевые поля со следующей информацией:
SetID — часть речевого корпуса, в которую входит данный речевой элемент;
Text — текст предложения, которому соответствует речевой элемент;
PronunciationExpect — ожидаемое произношение, то есть каноническая транскрипция текста предложения;
RecordDate — дата записи предложения;
RecordPlace — место записи, то есть город, в котором проводилась запись;
MicrophoneModel — модель микрофона;
SoundCard — тип звуковой карты;
SpeakerName — фамилия диктора;
SpeakerlD — идентификатор диктора, представляющий собой конкатенацию двух полей информационной карты диктора, заполняемой при его регистрации, а именно, поля идентификатора и поля регистрационного номера (см. п.6.1);
SpeakerSex — пол диктора; SpeakerAge — возраст диктора;
SpeakerEducation — уровень образования диктора;
SpeakerBirthplace — место рождения диктора;
SpeakerResidence — место проживания диктора;
SpeakerAccent — тип произношения диктора.
Вся эта информация автоматически заносится в информационный файл во время записи предложения, произнесенного диктором. При верификации этой записи, проводимой экспертом-фонетистом, информационный файл дополняется еще следующими информационными полями:
PronunciationActual - актуальное произношение, то есть транскрипция реального произношения текста, построенная экспертом при его верификации;
Comment - комментарий эксперта по поводу произнесения диктором текста предложения, если он необходим;
ExpertID - фамилия эксперта;
VerifyDate - дата верификации.
Всего в исследованном разделе базы данных встретилось 67 фраз с сочетанием "в"+"в" на стыках слов в произношении 45 информантов (при формировании данной базы данных от разных информантов было записано различное количество фраз). Никаких диалектных отклонений в речи данных информантов отмечено не было.
В ходе эксперимента отобранные из базы данных звуковые файлы в формате .wav были исследованы сначала при помощи аудитивного анализа, а затем с использованием экспериментально фонетических методов: при помощи программы Speech Analizer были получены осциллограммы, интонограммы и динамические спектрограммы соответствующих фраз. В большинстве случаев результаты, полученные разными способами, полностью совпадали; при несовпадении слухового впечатления и данных экспериментального анализа решение о глухости / звонкости исследовавшихся сочетаний губно-зубных согласных на стыках фонетических слов принималось на основании экспериментальных данных.
В соответствии с изложенным в Главе II пониманием фонетической организации дифференциального признака глухость / звонкость основным параметром, реализующим данный ДП считается наличие / отсутствие голоса (колебаний голосовых связок, F0); таким образом согласный считался звонким ([в], [в ]) в том случае, если длительность звонкого участка на отрезке его артикуляции превышала 30 мс и глухим ([ф], [ф1]), если длительность такого участка была менее 30 мс. Следует отметить, впрочем, что оглушенный согласный на месте в ( в ) в большей части случаев не является настоящим [ф] ([ф ]) — интенсивность шума при его произнесении обычно значительно меньше, чем при произнесении [ф] ([ф1]); по данным опроса аудиторов предъявленный изолированно этот согласный производит впечатление "среднего", "промежуточного" между [в] и [в ] ([ф] и [ф ]), но "ближе к [в] ([в ])". Результаты эксперимента приводятся ниже.
1. В 38 из 67 файлов зафиксировано произношение [фф]:
Инициатором объединительных процессов выступает межрегиональное общественное движение Шифр в базе данных ИСА РАН - 235В2860 Диктор Ю.М.
Последний раунд переговоров выявил ряд проблем 219В3059 Диктор В.Я.
С помощью фильтров вы получите море чистейшей воды 051В0385 Диктор У.И.
Число междугородних таксофонов в начале двухтысячного года превысит две тысячи 020В0438 Диктор O.K.
Доходы завода за девять месяцев возросли до двух с половиной миллиардов рублей 020В0466 Диктор O.K.
Число междугородних таксофонов в начале двухтысячного года превысит две тысячи 051В0438 Диктор У.И.
Доходы завода за девять месяцев возросли до двух с половиной миллиардов рублей 051В0466 Диктор У.И.
Оборот торгов в валюте составил триста сорок тысяч долларов 053В0814 Диктор Н.А.
На переговорах был затронут вопрос о привлечении туристов в Южную Африку 053В0859 Диктор Н.А.
Соглашение должно облегчить передвижение туристов вовремя отпусков 053В0860 Диктор Н.А.
На переговорах был затронут вопрос о привлечении туристов в Южную Африку 070В0859 Диктор Е.Щ.
Девять из десяти новых спутников вращаются вокруг Юпитера в обратную сторону 039В1261 Диктор Н.М. В эпоху военного коммунизма вместо паспортов выдавались трудовые книжки 039В1274 Диктор Н.М.
У курсантов военно-морских училищ принято освящать кортик в церкви 039В1417 Диктор Н.М.
Готовятся дополнения к закону о защите прав иностранных инвесторов в России 054В0921 Диктор Ж.Д.
В бедах банкиров виноват Международный валютный фонд 054В1011 Диктор Ж.Д.
В бедах банкиров виноват Международный валютный фонд 071В1011 Диктор Ю.М.
Корабль совершил четырнадцать витков вокруг Земли 072В1252 Диктор Г.Ф.
Зависимость произношения губно-зубных согласных на стыках слов от сегментных и жанрово-стилистических факторов
Результаты, полученные в ходе второго эксперимента на материале значительного объема и описанные в предыдущем разделе, позволяют со всей определенностью утверждать, что
в сочетаниях губно-зубных щелевых согласных на стыках
фонетических слов внутри синтагмы возможно произношение [фв], [фф] или [вв], его выбор зависит от индивидуальной стратегии говорящего;
при этом наиболее частотным в данном случае является произношение [фф], менее частотным, но весьма распространенным, произношение [вв] и, наконец, самым редким — произношение [фв], которое хоть и считается для данной позиции нормативным, но встречается преимущественно на стыках синтагм, в то время как внутри синтагмы оно составило всего 3% от общего числа исследованных случаев. Однако весьма значительный объем материала (578 реплик) в ходе проведения второго эксперимента был достигнут исключительно за счет большого числа дикторов (197 человек) и троекратного повторения каждым диктором одного и того же сочетания фонетических слов (таков вопрос). Существует определенная вероятность того, что произношение некоторых особенно частотных сочетаний фонетических слов (таких, как таков вопрос, часов вечера и т. п.) может быть в значительной степени "фразеологизировано" (эти единицы могут храниться непосредственно в словаре знаковых единиц, а не порождаться по правилам), а произношение других, менее частотных сочетаний тех же согласных в тех же позициях может отличаться от произношения этих "фразеологизированных" единиц. В соответствии с этим предположением целями следующего — третьего - из проведенных в ходе настоящего диссертационного исследования эксперимента были
анализ реализации сочетаний губно-зубных щелевых согласных (" в или в + в или в ") на стыках фонетических слов на материале значительного объема (при увеличении этого материала за счет увеличения количества и разнообразия типов этих сочетаний и некотором уменьшении количества дикторов, принимающих участие в эксперименте);
выявление факторов, регулирующих это произношение.
В этом эксперименте приняли участие 30 дикторов, выбранных случайным образом из числа 197, участвовавших в эксперименте № 2. Таким образом, в их числе были студенты, преподаватели и сотрудники филологического факультета МГУ им. Ломоносова и историко-филологического факультета Российского государственного гуманитарного университета в возрасте от 16 до 36 лет; девять из них имели высшее филологическое образование. Дикторами были только коренные москвичи; в их идиолектах никаких диалектных особенностей отмечено не было.
Основными требованиеми к материалу данного эксперимента были:
1. значительный объем материала;
2. разнообразие собственно сочетаний фонетических слов;. разнообразие условий, в которых встречаются сочетания губно-зубных согласных на стыках фонетических слов. Среди факторов третьей группы, обусловливающих разнообразие условий, в которых встречаются сочетания губно-зубных согласных на стыках фонетических слов, могут быть выделены четыре основные группы — сегментные, жанрово-стилистические, просодические и экстралингвистические.
К числу сегментных факторов могут быть отнесены следующие:
тип правого контекста (сегмент, перед которым находится сочетание губно-зубных согласных на стыках фонетических слов — гласный, в, сонорный согласный);
фонемная принадлежность первого согласного сочетания - в ( в ) или ф ( ф ).
К числу жанрово-стилистических факторов может быть отнесена стилистическая принадлежность текста — бытовой vs. поэтический его характер.
К числу просодических факторов могут быть отнесены такие факторы, как
наличие / отсутствие реальной (дыхательной) паузы между фонетическими словами;
наличие / отсутствие между ними синтагматической границы при отсутствии выраженной паузы;
наличие / отсутствие фразового акцента на одном из слов сочетания.
Среди экстралингвистических может быть выделен такой фактор, как возраст информантов.
В настоящем эксперименте было исследовано влияние на характер реализации сочетаний губно-зубных щелевых согласных на стыках фонетических слов только факторов первых двух групп - сегментных и жанрово-стилистических, анализу связи особенностей произношения губно-зубных щелевых согласных на стыках фонетических слов в связи с характером их просодического оформления и возрастом информантов был посвящен отдельный эксперимент (см. ниже раздел "Эксперимент 4").
Кроме прочего, участники эксперимента не должны были знать о его задачах, а в качестве материала использовались только реальные фразы, то есть, фразы, засвидетельствованные в речи носителей СРЛЯ.
В соответствии с перечисленными выше условиями в качестве материала для данного эксперимента были отобраны следующие тексты:
1. Бытовые тексты
1.1. сочетания в +в
Увидев во дворе больницы бойцов воронежского спецназа, террористы всполошились.
Когда Петров-Водкин выставлялся во Франции, его картины имели необычайный успех.
Опыт первых месяцев войны показал огромное превосходство фашистов в современной военной технике.
Сумма перепадов высот в этой гонке составляет 200 метров в абсолютном исчислении.
Александр Попов стал олимийским чемпионом на дистанции сто метров вольным стилем еще в Сиднее.
Лишь в конце второго тайма Ибрагимович скинул мяч под удар Трезеге; больше голов в основное время не было.
Устав воинской службы требует неукоснительного выполнения всех приказов вышестоящих начальников.
Когда плов варится целых 7 часов, его уже просто невозможно есть.
"Ну и каков ваш последний вердикт?" — с надеждой прошамкал дон Фернандо.
После того, как улов вырос примерно в два раза, объем рыбного промысла пришлось ограничить законодательно.
Узнав Ваську по смешным веснушкам, он радостно хлопнул его по плечу и громко засмеялся.
И всё же я рискну предположить, что "Астон Вилла" останется без еврокубков в этом сезоне.
На выходе из музея "Титаника" в Орландо висят два списка — список пассажиров выживших и пассажиров погибших во время крушения.
Приехав в Азию впервые, он был совершенно очарован необычной природой и доброжелательностью местных жителей.
Врачи сделали все возможные анализы, но признаков высокой концентрации газа в крови так и не обнаружили.
Впервые побывав в Антарктиде, я решил вернуться сюда надолго.
А я так и не узнал никогда — каков вообще на вкус этот авокадо...
Только увидев выход собственными глазами, Виктор, наконец, согласился.
Когда Жак Вильнёв выиграл свой первый гран-при, он посвятил эту победу своему отцу — великому Жилю Вильнёву.
Горбатые киты достигают 20 метров в длину, поэтому у них совсем нет врагов в океане.
Став военным, Виктор Петрович сразу начал вырабатывать у себя командный голос.
Заседание правительства началось с обсуждения итогов выборов в областную думу.
В результате выборов в Орловской области стало очевидно, что большая часть населения окончательно разочаровалась в старой власти.
Безумно устав возиться с первоклашками, Маша решила все-таки попробовать поступить в пединститут.
По словам министра обороны, призывать студентов высших учебных заведений пока никто не собирается.
Тысячи ветеранов войны и труда вышли на улицы протестовать против монетизации льгот.
Правительство Москвы приняло постановление, согласно которомку за полугодовую неуплату коммунальных платежей неплательщиков выселят в специальные общежития.
Автопредприятие приглашает на работу водителей автобуса первой категории, учеников водителей автобуса, автослесарей, газоэлектросварщиков и автомехаников.
На кампанию по вживлению бродячим собакам чипов виртуального наблюдения город готов выделить около 6 миллионов внебюджетных долларов.
Каков вопрос, таков ответ!