Взаимодействие контекстной предсказуемости и частотности в процессе восприятия спонтанной речи : на материале русского языка Риехакайнен, Елена Игоревна

Диссертация - 480 руб., доставка 10 минут, круглосуточно, без выходных и праздников

Автореферат - бесплатно, доставка 10 минут, круглосуточно, без выходных и праздников

Риехакайнен, Елена Игоревна. Взаимодействие контекстной предсказуемости и частотности в процессе восприятия спонтанной речи : на материале русского языка : диссертация ... кандидата филологических наук : 10.02.19 / Риехакайнен Елена Игоревна; [Место защиты: С.-Петерб. гос. ун-т].- Санкт-Петербург, 2010.- 261 с.: ил. РГБ ОД, 61 11-10/291

Содержание к диссертации

Введение

Глава I. Частотность, восприятие речи, контекст: основные понятия 11

1.1. Частотность: определение в вопросах 11

1.2. Восприятие речи: определение области исследования 29

1.3. Ментальный лексикон слушающего

1.3.1. Определение 36

1.3.2. Ментальный лексикон говорящего и слушающего 39

1.3.3. Структура и единицы 41

1.4. Модели доступа к словарю слушающего 51

1.4.1. Последовательный перебор или параллельная активация 51

1.4.2. Источники активации 53

1.4.3. Роль контекста: автономные vs. интерактивные модели 59

1.5. Частотность в словаре слушающего 62

Выводы 69

Глава II. Спонтанная речь: обоснование выбора материала исследования 71

2.1. Определение 71

2.2. Фонетические особенности спонтанной речи 78

2.3. Редуцированные словоформы в спонтанной речи: общий обзор 80

2.4. Статистический анализ редуцированных словоформ в спонтанных текстах 2.4.1. Материал исследования 85

2.4.2. Принципы анализа материала 86

2.4.3. Результаты: общая характеристика словоформ, подвергшихся изменению 89

2.4.4. Результаты: степень редукции словоформ 91

2.4.5. Сопоставление полученных результатов с орфоэпической нормой современного русского языка 94

2.4.6. Количество редуцированных реализаций в речи разных коммуникантов 96

2.4.7. Значение полученных результатов для описания процесса восприятия речи 98

Выводы... : 105

Глава III. Базовая стратегия распознавания редуцированных словоформ 108

3.1. Общий обзор — 108

3:2. Предварительный эксперимент 110

3.2.1. Материал и-методика предварительного эксперимента 110

3.2:2. Результаты 111

3.3; Изолированное и контекстное восприятие редуцированных словоформі 12

3:3.1. Цель эксперимента 112

3.3.2. Материал:. : 112

3.3.3. Методика проведения эксперимента... 114

3.3.4. Основные принципыобработки данных .115

3.3.5. Результаты эксперимента: восприятие изолированных словоформ.. 117

3.3.6. Результаты эксперимента: восприятие словоформ в контексте в сопоставлениис данными по восприятию изолированных словоформ. 120

3.3.7. Результаты эксперимента: перцептивно значимые элементы редуцированных словоформ 124

.3.3.8. Результаты эксперимента: роль частотности:в процессе восприятия

редуцированных словоформ .132

3.4. Роль контекста в распознавании редуцированных словоформ 138

3.4.11 Цели и задачи;... 139

3.4.2. Материал экспериментального исследования; 140

3.4.3. Методика проведения эксперимента. 144

3.4.4. Основные принципы обработки данных .146

3.4.5. Результаты эксперимента: общий обзор; 147

3.4.6. Результатыэксперимента: сокращение контекста 147

3.4.7. Результаты эксперимента: увеличение:контекста... 150

3;4.8; Результаты эксперимента: изменение контекста 152

Выводы .156

Глава IV. Распознавание словоформ в условиях отсутствия контекста, снимающего неоднозначность 158

4.1. Цель исследования 158

4.2. Материал эксперимента 159

4.3. Методика проведения эксперимента и испытуемые 167

4.4. Принципы обработки результатов 169

4.5. Результаты эксперимента

4.5.1. Общий обзор 170

4.5.2. Распознавание омофонов Типа 1 171

4.5.3. Распознавание омофонов Типа 2 175

4.5.4. Распознавание омофонов Типа 3 179

4.5.5. Распознавание омофонов Типа 4 180

4.5.6. Стратегия с опорой на фонетический принцип орфографии 185

4.6. Обсуждение полученных результатов 187

Выводы 190

Глава V. К вопросу о существовании стратегий, отличных от базовой, при распознавании редуцированных словоформ 192

5.1. Цель исследования 192

5.2. Апробация методики получения материала исследования

5.2.1. Обоснование метода получения материала 194

5.2.2. Материал эксперимента 195

5.2.3. Методика и ход эксперимента 199

5.2.4. Принципы обработки результатов 201

5.2.5. Сопоставление результатов первого и второго этапов эксперимента 201

5.2.6. Восприятие естественных и искусственно созданных редуцированных словоформ 204

5.2.7. Выводы 210

5.3. Основной эксперимент 211

5.3.1. Распознавание редуцированных словоформ различной частотности211

5.3.2. Влияние синтаксической функции редуцированной словоформы на надежность ее распознавания 214

5.3.3. Доработка предыдущего эксперимента 216

5.3.4. Методика проведения эксперимента 217

5.3.5. Результаты восприятия стимулов мне очень нравятся ситуации и сказала в последний раз 218

5.3.6. Результаты распознавания редуцированных словоформ различной частотности 219

5.3.7. Влияние синтаксической позиции редуцированной словоформы на надежность ее распознавания 224

5.3.8. Выводы 225

5.4. Анализ фонетического облика некоторых высокочастотных словоформ 226

Выводы 231

Глава VI. Различные подходы к описанию восприятия речи: мнимые противоречия 233

Заключение 238

Список использованной литературы

Ментальный лексикон говорящего и слушающего
Статистический анализ редуцированных словоформ в спонтанных текстах 2.4.1. Материал исследования
Изолированное и контекстное восприятие редуцированных словоформі
Принципы обработки результатов

Введение к работе

Активное изучение процесса восприятия речи началось в 50-ые гг. XX века. За шестьдесят лет было опубликовано значительное число работ по данной проблематике, предпринимались неоднократные попытки создания действующей модели речевосприятия (в том числе компьютерной). Однако до сих пор не существует концепции, которая бы могла претендовать на полное и непротиворечивое описание того, каким образом слушающий распознает речевой сигнал. С одной стороны, это связано с тем, что долгое время исследования процесса восприятия речи проводились преимущественно на материале прочитанных изолированных слов или предложений и многие выводы, сделанные по результатам подобных исследований, оказались неприменимыми к распознаванию речи в естественных условиях.

С другой же стороны, отсутствие действующей модели восприятия речи объясняется желанием большинства исследователей разработать лишь одну глобальную стратегию распознавания речевого сигнала, в то время как экспериментально доказано, что «в разных условиях приема слушающие оперируют разным количеством оперативных единиц, их наборами и порядком по значимости», т.е. применяют разные стратегии. Логично предположить, что в ситуации естественного общения значимость различных признаков, доступных слушающему, может изменяться под влиянием не только условий приема, но и множества других факторов (характеристик ситуации общения и коммуникантов, типа воспринимаемого сообщения и т.п.).

Объектом исследования, описываемого в данной работе, является процесс восприятия естественной русской речи носителями русского языка. Все полу-

См. об этом, например: Венцов А.В., Касевич В.Б. Проблемы восприятия речи. М. : Едито-риал УРСС, 2003 (1994); Luce Р.А., McLennan СТ. Spoken Word Recognition: The Challenge of Variation II The Handbook of Speech Perception I eds. : D.B. Pisoni, R.E. Remez. Berlin, Oxford : Blackwell Publishing Ltd, 2005. P. 592-609; Залевская A.A. Введение в психолингвистику. M. : Российск. гос. гуманит. ун-т, 2007. С. 384-446 и др.

Штерн А.С Перцептивный аспект речевой деятельности: (Экспериментальное исследование). СПб. : Изд. С.-Петерб. ун-та, 1992. С. 187.

ченные результаты интерпретируются с точки зрения их возможного применения к описанию распознавания подобного речевого сигнала.

В потоке естественной речи некоторые звуки могут качественно или количественно изменяться или вообще исчезать, что приводит к искажению фонетического облика словоформ и к появлению многочисленных отрезков речи, для однозначной интерпретации которых информации, представленной в акустическом сигнале, оказывается недостаточно. Тем не менее обычно это не является причиной коммуникативных неудач: даже неподготовленная речь хорошо воспринимается слушающим(и) и не вызывает переспросов. В качестве основных факторов, способствующих надежному распознаванию подобных фрагментов речи, обычно называются контекстная предсказуемость и частота употребления единиц в речи. При этом, как правило, в соответствии с описанной выше тенденцией, эти факторы рассматриваются независимо друг от друга.

Предметом настоящего исследования является взаимодействие стратегий, опирающихся на контекст и частотность, в процессе распознавания естественной русской речи, т.е. речи, элементы (словоформы) которой характеризуются

«неполным типом произнесения».

Обращение к естественному речевому сигналу в сочетании с пониманием восприятия речи как процесса, предполагающего взаимодействие различных стратегий, отличает данное исследование от многих предшествующих и определяет его актуальность.

Цель работы — подтвердить гипотезу, согласно которой в процессе восприятия речи слушающий пользуется стратегиями, опирающимися на контекст и частотность, и описать взаимодействие этих стратегий на материале русской спонтанной речи.

Сформулированная цель предполагает решение следующих задач:

1) дать качественную и количественную характеристику естественной звучащей речи с целью определения того, насколько часто для ее успешного рас-

³ Русская разговорная речь / под ред. Е.А. Земской. М. : Наука, 1973. С. 40.

Стили произношения и типы произнесения / Л.В. Бондарко [и др.] // Вопросы языкознания. 1974. №2. С. 65.

познавания необходимо привлечение дополнительной информации, помимо той, которая содержится в акустическом сигнале;

описать возможный механизм использования контекстной предсказуемости в процессе распознавания речи;
выявить признаки, на которые опирается слушающий в тех случаях, когда контекст не позволяет снять неоднозначность;

4) сравнить стратегии восприятия словоформ различной частотности.
Кроме того, для успешного осуществления исследования требуется решить

две методические задачи, а именно:

определить возможные источники получения материала для исследования восприятия естественной речи;
оценить существующие способы получения сведений о частоте встречаемости языковых единиц и выбрать из них те, которые наилучшим образом отражают частотность, представленную в словаре слушающего и используемую при распознавании речи.

Для решения указанных задач используется совокупность методов. Первая задача решается путем слухового и инструментального анализа фрагментов звучащей русской речи. Основным методом решения трех последующих задач является эксперимент по распознаванию слов на слух (dictation task), предполагающий прослушивание испытуемыми стимулов различной длительности и их письменную фиксацию в бланках ответов буквами русского алфавита. При подготовке стимулов для экспериментов используются различные методы инструментальной обработки звуковых сигналов, предоставляемые звуковыми редакторами. Для сравнения полученных в экспериментах результатов применяются статистические методы: вычисление доверительных интервалов на 5%-ом уровне значимости и корреляционный анализ на основе коэффициента корреляции рангов Спирмена. Оценка источников получения материала исследования и способов вычисления частотности языковых единиц, а также анализ научной литературы по обсуждаемым в работе темам осуществляются при помощи индуктивно-дедуктивного метода и метода критического анализа.

Исходный материал исследования — записи бытовых диалогов и телевизионных ток-шоу (участники — носители русского языка). В экспериментах в качестве стимулов используются фрагменты данных записей, а также прочитанные дикторами фразы (в исходном звучании или после предварительной инструментальной обработки).

Достоверность описания речевого сигнала обеспечивается сочетанием методов инструментального и слухового анализа. Проведение серии экспериментов, в которых приняли участие в общей сложности 425 человек, объем полученного материала (13176 реакций), а также применение статистических методов при анализе данных обеспечивают достоверность результатов экспериментальной части работы.

Научная новизна работы заключается в том, что в ней впервые предпринимается попытка детального описания механизма распознавания редуцированных словоформ, представленных в русской спонтанной речи, с учетом целого ряда факторов, ведущими из которых являются частотность и контекст.

Получение новых сведений о роли различных стратегий в процессе восприятия фрагментов речи, характеризующихся неполным типом произнесения, позволяет приблизиться к пониманию механизма распознавания естественной речи человеком и выдвинуть предположения об устройстве ментального лексикона слушающего, что определяет теоретическую значимость работы.

Результаты исследования могут применяться при создании моделей восприятия речи, а также при разработке методик обучения восприятию естественной речи взрослых и детей с нарушениями слуха, что свидетельствует о практической ценности работы.

Положения, выносимые на защиту:

1. При распознавании спонтанной речи, фонетический облик которой характеризуется значительной неполнотой (редуцированностью), слушающий может пользоваться различными стратегиями, опирающимися как на параметры акустического сигнала, так и на другие факторы, ведущими из которых являются контекстная предсказуемость и частотность.

Базовая стратегия распознавания редуцированных словоформ может быть описана следующим образом. В процессе восприятия редуцированной словоформы слушающий опирается на ряд сохранившихся в ее звуковой форме полезных признаков (прежде всего на консонантный «скелет») и выбирает из множества единиц перцептивного словаря, активированных на основе этих признаков, ту, которая более всего соответствует контексту.
При наличии нескольких единиц, в равной степени допускаемых контекстом и соответствующих входному сигналу, более сильную активацию могут получать более частотные словоформы, а также словоформы, входящие в частотные контексты. В случае грамматической неоднозначности на степень активации единиц могут также влиять кумулятивная частотность грамматической формы, под которой подразумевается суммарная частотность всех словоформ, образующих данный грамматический класс, а также количество потенциальных контекстов, в которых встречается словоформа.

В ряде случаев слушающий сразу соотносит услышанное с редуцированной реализацией, которая хранится в словаре в качестве самостоятельной единицы. На подобный статус могут претендовать лишь типичные реализации высокочастотных словоформ, количество которых, согласно полученным на данный момент сведениям, сравнительно невелико.
Результаты экспериментов позволяют предположить, что ментальный лексикон носителя русского языка представляет собой динамическую многомерную структуру, единицами которой являются словоформы, соединенные между собой связями, формирующимися на основе как парадигматических, так и синтагматических отношений. Сила связей определяется частотностью соответствующих единиц и их комбинаций.
Проведенное исследование дает все основания для выдвижения гипотезы о наличии единого глобального механизма распознавания речи, включающего в себя стратегии, описываемые в рамках различных моделей восприятия речи. Следовательно, оно не опровергает полностью ни один из существующих

подходов к описанию процесса соотнесения входного речевого сигнала с соответствующей ему единицей словаря слушающего.

Апробация работы. Основные положения и отдельные аспекты исследования обсуждались на заседаниях секции «Общее языкознание» Межвузовской научной конференции студентов-филологов (Санкт-Петербург, 2005, 2006, 2007), на заседании секции «Восприятие речи» конференции «Научные чтения Петербургского лингвистического общества» (Санкт-Петербург, 2006), на междисциплинарном семинаре «Анализ разговорной русской речи» (Санкт-Петербург, 2007, 2010), на заседаниях выездной школы-семинара «Порождение и восприятие речи» (Череповец, 2007, 2008, 2009), на Третьей и Четвертой Международной конференции по когнитивной науке (Москва, 2008; Томск, 2010), на заседаниях секции «Психолингвистика» Международной филологической конференции (Санкт-Петербург, 2009, 2010), на заседании секции «Филология» (подсекция «Теоретическая и экспериментальная фонетика») XVI Международной научной конференции студентов, аспирантов и молодых ученых «Ломоносов» (Москва, 2009), на 13-ой Международной конференции "Speech and Computer" SPECOM'2009 (Санкт-Петербург, 2009), на заседании семинара «Акустика детской речи» в рамках секции физиологии речи Санкт-Петербургского общества физиологов, биохимиков, фармакологов им. И.М. Сеченова (Санкт-Петербург, 2009), а также на заседаниях кафедры общего языкознания Филологического факультета Санкт-Петербургского государственного университета (2008, 2009). Исследование поддержано следующими грантами: РФФИ №06-06-80152а, РФФИ №09-06-00244а, Министерства образования РФ №1590, Президента РФ №НШ-3688.2010.6. По теме диссертации опубликовано 15 работ.

Цели и задачи исследования определили структуру работы. Диссертация состоит из введения, шести глав, заключения, списка использованной литературы и 33 приложений. Звуковые файлы с тестовыми последовательностями всех экспериментов, результаты которых описываются в работе, представлены на CD-носителе.

Ментальный лексикон говорящего и слушающего

Для подсчета слов в тексте необходимо также наличие четких критериев деления текста на слова. При работе с письменными текстами технически наиболее простым решением оказывается сегментация на отрезки, разделенные пробелами. Подобный метод, однако, часто приводит к тому, что элементы устойчивых сочетаний, составных предлогов и других неоднословных лексических единиц фигурируют в словаре только в качестве самостоятельных единиц (см., например, [Частотный словарь... 1977; Шаров 2001; Ляшевская, Шаров 2008]). Выделение же так называемых «составных слов», которое было предпринято при составлении «Частотного словаря словоформ...», требует решения отдельной лингвистической задачи по определению того, что следует считать «составным словом». Кроме того, при использовании в качестве материала звучащей речи могут возникать дополнительные сложности с делением на слова, поскольку в звучащих текстах высока вероятность образования т.н. фонетических слов за счет присоединения проклитик и энклитик к знаменательным словам (см. об этом 1.3.3.). Где?

Ответ на данный вопрос подразумевает определение той совокупности языкового материала, в рамках которой будет производиться подсчет частотности. Однозначное определение границ изучаемого материала возможно лишь в том случае, когда исследователя интересуют частотные характеристики одного или нескольких конкретных текстов или произведений одного или нескольких конкретных авторов.

Для многих современных лингвистических исследований, направленных на изучение и моделирование процессов порождения и восприятия речи, на решение проблем, связанных с методикой преподавания иностранных языков, и т.п., более актуальной оказывается задача выявления частотности единиц в языке в целом. Здесь необходимо сделать одно важное уточнение: то, что в большинстве работ (см., например, [Частотный словарь... 1977; Ляшевская, Шаров 2008 и др.]) называется частотностью единиц в языке, на самом деле следовало бы называть частотностью единиц в речи, поскольку значение данного параметра выводится только при анализе продуктов речевой деятельности носителей того или иного языка, т.е. совокупности созданных на этом языке текстов (ср. термин «статистика речи», используемый В.А. Ицковичем в предисловии к «Частотному словарю современного русского литературного языка» Э.А. Штейнфельдт [Ицкович 1963: 6]).

П.М. Алексеев указывает на некорректность термина «частотность единиц в языке» и вводит понятия «частота» и «вероятность». Первому соответствует «то, что мы получаем в наблюдении над текстом», под вторым же подразумевается идеальная величина, «которая была бы получена, если бы удалось просчитать все тексты, порожденные на сегодняшний день, и все другие, которые могут быть созданы на данном языке» [Алексеев 2001: 22].

На наш взгляд, употребление выражения «частотность единиц в языке» может быть оправдано лишь тем, что под ним понимается характеристика единиц языковой системы, указывающая на то, насколько часто эти единицы встречаются в текстах, созданных на данном языке. Именно в таком понимании (и во многом в силу уже сложившейся традиции) это выражение будет использоваться в диссертации.

Задача определения частотности единиц в языке не может быть выполнена полностью хотя бы из-за объема материала, т.е. тех текстов, из которых может быть получена информация о частотности языковых единиц. Так, для языков с богатой письменной традицией (русского, английского, немецкого и т.д.) даже обработка одних лишь письменно зафиксированных текстов оказывается невыполнимой задачей. На самом же деле, термин «текст» в данном случае следует трактовать максимально широко и учитывать не только письменные, но и устные фрагменты языкового опыта человека. Ведь именно на основе последних, по-видимому, формируются представления большинства индивидов о частотности единиц языка, поскольку доля устной коммуникации в языковом опыте человека значительно превосходит долю информации, получаемой из письменных/печатных источников посредством чтения. Возможным решением данной проблемы является составление представительных выборок текстов различных функциональных стилей и жанров (как письменных, так и устных) и допущение того, что сведения о частотности, полученные на этом материале, будут отражать соотношение частоты встречаемости языковых единиц в совокупности всех текстов данного языка.

Другая сложность при определении материала, на основе которого будет производиться вычисление частотности, связана с тем, что даже носители одного языка на протяжении жизни имеют доступ к разным текстам, и, следовательно, представления о частотности тех или иных языковых единиц у них могут быть различными. Эта сложность представляется непреодолимой, поэтому всегда приходится признавать, что даже данные о частотности, полученные в результате анализа большого объема материала, не обязательно соответствуют представлениям о частотности каждого отдельно взятого носителя языка. Откуда?

Вопрос о выборе источников, по которым будет определяться частотность, является основополагающим в любом исследовании, так или иначе касающемся частотности единиц в языке в целом, поскольку в зависимости от языкового материала (например, от жанра текста) соотношение единиц (прежде всего слов) может существенно различаться.

В распоряжении исследователей, работающих с русскоязычным материалом, находится несколько значительных по объему частотных словарей, часть из них доступна в виде печатных изданий, часть — только в качестве Интернет-ресурсов.3 При выборе словаря, который будет использоваться для получения сведений о частотности, необходимо учитывать следующие факторы: - время создания словаря и его источников; - представленность в словаре текстов различных жанров; - размер выборки; - тип единиц словаря. Полные сведения о наиболее представительных частотных словарях русского языка отражены в Приложении №1. В рамках же данного параграфа будут проанализированы лишь некоторые параметры.

Статистический анализ редуцированных словоформ в спонтанных текстах 2.4.1. Материал исследования

Считается, что частотность является не просто одной из характеристик единиц словаря, а тем параметром, который во многом определяет структуру последнего. Так, исследователи, придерживающиеся двусистемного подхода к описанию процесса восприятия речи (см. 1.3.3.), допускают, что в ментальном лексиконе могут быть представлены только те формы слов, образующиеся по регулярным моделям, которые являются высокочастотными (см. ссылки на подобные исследования в [Alegre, Gordon 1999: 42-43]).

Данное предположение подтверждается результатами экспериментов на принятие лексического решения, в которых влияние частотности для регулярных морфологически сложных форм наблюдалось только в том случае, если их частотность была выше 6 употреблений на миллион (ipm 6), в то время как для морфологически простых форм увеличение скорости распознавания наблюдалось и в тех случаях, когда они были менее частотными [Alegre, Gordon 1999]. Дж. Байби, признавая наличие в ментальном лексиконе репрезентаций всех морфологически сложных словоформ, объясняет возможные различия в оперировании словоформами различной частотности тем, что для низкочастотных словоформ более значимой оказывается не частотность самой словоформы, а частотность грамматического класса (или классов), в который она входит {type frequency; см. [Bybee 2004 (1995): 64-65] и раздел 1.1.). Это предположение указывает на то, что слушающий может пользоваться не только частотностью словоформ, но и частотностью их классов при распознавании речи.

Более того, как отмечается в [Венцов, Касевич 1998: 37], «среди всех возможных типов структурирования ментального лексикона должны иметь место 1) группировки слов по фонологическим характеристикам; ... 2) группировка слов по классам частотности». В моделях последовательного поиска частотность определяет порядок проверки единиц словаря на идентичность с входным сигналом: чем частотнее словоформа, тем раньше она будет проверена [Bradley, Forster 1987]. В [Glanzer, Ehrenreich 1979] выдвигается предположение о существовании двух внутренних лексиконов {internal lists), в одном из которых представлены все лексические единицы (complete list), а в другом — только наиболее частотные (ready-access list). Таким образом, высокочастотные единицы оказываются представленными в ментальном лексиконе дважды: в специальном отделе для частотных словоформ и в том месте, где они должны быть по своим фонетическим характеристикам. Слушающий, идентифицируя словоформу, сначала осуществляет поиск среди частотных словоформ, и если не находит в нем нужную словоформу, то переходит к поиску по основному лексикону. Гипотеза о подобном устройстве словаря слушающего была предложена авторами статьи для объяснения того, что в экспериментах на принятие лексического решения частотные словоформы распознаются быстрее, когда в эксперименте представлены только частотные словоформы, чем в тех случаях, когда в эксперименте, наряду с частотными словоформами, представлены также словоформы средней и низкой частотности. Т.е. в первом случае осуществляется поиск только внутри ограниченного подмножества частотных словоформ, во втором же необходимо работать со всем перцептивным словарем.

В коннекционистских моделях, опирающихся на понятие активации, обычно не указывается, каким образом частотность влияет на расположение единиц словаря слушающего, но подчеркивается роль фактора частотности в процессе конкуренции. Например, в описанной в 1.4.2. Модели активации по близости внутри «соседств» быстрее и надежнее распознаются те словоформы, которые являются более частотными по сравнению с «соседними», т.е. относительная частотность которых выше, чем у «соседей». Подобное проявление эффекта частотности было замечено и экспериментально доказано еще в [Savin 1963]: при распознавании нечастотных слов в шуме в том случае, когда доступные для восприятия признаки допускали существование более частотного кандидата на распознавание, этот частотный кандидат предлагался в качестве ответа большинством испытуемых. В том же случае, когда доступные для восприятия при знаки допускали только один вариант распознавания, правильный вариант доминировал и для частотных, и для нечастотных стимулов.

Вместе с тем в ряде работ отмечается, что объяснение эффекта частотности является слабым местом коннекционистских моделей, поскольку одним из результатов активации более частотных словоформ по сравнению с менее частотными является то, что малоупотребительные словоформы, сходные по звучанию с высокочастотными, не смогут быть распознаны в силу того, что всегда будут активироваться слабее, чем их конкуренты [Forster 1996 (1989): 86; Yelland. 1994: 5013 идр.].

Возможным решением данной проблемы является принятое выше допущение о множественности источников информации, т.е. о влиянии контекста. В таком случае словоформы, имеющие низкую частотность, но: больше подходящие по контексту, чем их высокочастотные конкуренты,, получат дополнительную активацию и смогут претендовать на распознавание. В соответствии же с принятой выше гипотезой о том, что слушающий может пользоваться различными стратегиями в процессе восприятия:речи, логично предположить, что выбор того; какой фактор — частотность или контекстная предсказуемость — окажется наиболее значимым, зависит от конкретной ситуации восприятия.

Изолированное и контекстное восприятие редуцированных словоформі

В эксперименте, направленном на проверку этой гипотезы, было решено использовать следующие типы омофонов: лексические: (1)существительные в форме Им.п. ед.ч., заканчивающиеся на глухой согласный: например, /rok/ (рог-рок), /так/ (маг-мак) и т.д. К этому же типу была отнесена и пара лексико-семантических омофонов без-бес, в которой одно из слов является не существительным, а предлогом; грамматические: (2) формы глаголов прош.вр. ед.ч. с безударным окончанием/a/: /sto+ila/ (стоило-стоило), /slama+las / (сломалось-сломалась) и т.д.; (3) словоформы, которые могут быть интерпретированы как наречия и краткие прилагательные ср.р. или краткие прилагательные ж.р.: /uza+sna/ (ужасно-ужасна), /zabo+tl iva/ (заботливо-заботлива) и т.д.

Включение грамматических омофонов в состав стимульного материала обусловлено не только их большим количеством в русском языке, но и тем, что в литературе описываются различные стратегии поведения слушающих при необходимости распознавания омофоничного стимула, одной из интерпретаций которого является морфологически сложная форма. Как уже отмечалось выше (см. 1.3.3.), результаты одних исследований указывают на то, что грамматические формы слов, состоящие из нескольких морфем, не хранятся в словаре слушающего, поскольку в тех случаях, когда более частотным омофоном в паре оказывается словоформа, состоящая из нескольких морфем, выбор часто делается не в ее пользу, а пользу одноморфемного конкурента [Taft 1984]. В других же было, напротив, показано, что большинство испытуемых предпочитают наиболее частотную интерпретацию омофона даже в тех случаях, когда ей является регулярная или нерегулярная форма глагола прош.вр., что свидетельствует о наличии данных форм в словаре слушающего в качестве самостоятельно ньгх единиц [Hare et al. 2001]. Таким образом, включение грамматических омофонов в тестовую последовательность позволит в очередной раз проверить гипотезу о словоформе как об основной единице словаря слушающего применительно к русскому языку.

Три выбранных типа омофонов встречаются как в спонтанной речи, так и в КЛЯ. Однако, как было отмечено в 2.3.3., разнообразие омофоничных отрезков в спонтанной речи значительно больше, чем в КЛЯ. Поскольку именно спонтанная речь является объектом изучения в рамках диссертации, представлялось интересным включение в эксперимент омофонов, характерных прежде всего для естественной речи. Большинство омофонов, специфичных для спонтанной речи, возникает в результате полной количественной редукции элементов словоформ. Результаты экспериментов, описанных в Главе III, не подтвердили предположение о том, что редуцированные реализации словоформы представлены. в перцептивном словаре. Следовательно, в таких парах омофонов входной акустический сигнал полностью совпадает с фонетическим обликом только одной из единиц перцептивного словаря, а до фонетического облика другой должен быть восстановлен слушающим (например, ну еще что [int er esnb] интересно/интересного; Qes l i] — если и есть ли, см. эти и другие примеры в [Фонетика спонтанной речи 1988: 135-137]). Кроме того, определенную сложность в данном случае представляет и вычисление частотности, поскольку должна учитываться частотность реализаций, а не просто частотность словоформ, что является проблематичным при отсутствии достаточного по объему корпуса русских спонтанных текстов. Таким образом, подобные омофоны не могут быть использованы для проверки сформулированной выше гипотезы.

Поэтому в качестве материала эксперимента решено было использовать омофоны, возникающие в результате качественной редукции безударного гласного, а именно: (4) формы глаголов 3 л. наст.вр. с безударным окончанием: /vo+z it/ (возит— возят), /so+r ica/ (ссорится—ссорятся) и т.д.

Безударный гласный окончания в приведенных формах может подвергаться значительной редукции, поскольку он находится в первом заударном слоге [РРР 1973: 46]. Близость звучания безударных гласных в окончаниях форм 3 л. ед. ч. и 3 л. мн.ч. глаголов наст.вр. отмечал еще Р.И. Аванесов, однако он призывал к различению редуцированных гласных в этих формах в КЛЯ и к произнесению более открытого и отодвинутого назад звука («типа [ъ], а не [э]») в формах 3 л. мн.ч. [Аванесов 1972: 159-160]. Л.А. Вербицкая же считает произнесение /і/ или /ы/ (после мягкого и твердого согласных соответственно) в безударном окончании 3 л. мн.ч. нормативным [Вербицкая 1993: 74].

При этом, если для КЛЯ все же можно представить ситуацию, в которой в указанной позиции будет произнесен аллофон /а/ (например, при желании показать, что данная форма является именно формой мн.ч. (ср. [Щерба 1957: 142]), то в спонтанной речи это, по-видимому, невозможно. Как показало исследование фонетического облика редуцированных словоформ, в спонтанной речи гласные в безударной позиции редуцируются настолько сильно, что в ряде случаев определение их качества представляется затруднительным. Следовательно, можно предположить, что в перцептивном словаре слушающего формы глаголов 3 л. наст.вр. ед.ч. и мн.ч. представлены если и не идентичными, то очень близкими реализациями, и процесс соотнесения акустического сигнала с фонетическим обликом каждого из этих омофонов существенно не различается по сложности.

Принципы обработки результатов

В качестве материала эксперимента были использованы словоформы с одинаковым типом редукции — глагольные формы 3 л. ед.ч., имеющие структуру C(C)V+d VC, 61 с выпадением звонкого переднеязычного согласного /dV в интервокальной позиции. Полной количественной редукции данного согласного способствует то, что он часто встречается в однородном лексико-грамматическом материале, а именно выступает как конечный согласный основы глаголов типа ходит, видит. Как раз на эти формы приходится наибольшее число случаев выпадения /d7. Наиболее частотные из них редуцируются по фонетическим причинам, в остальных же «фонетический процесс уже в большей степени поддерживается и "подталкивается" аналогией» [РРР 1973: 81]. Таким образом, данное изменение фонетического облика словоформ в спонтанной речи является продуктивным, что делает оправданным его использование при изучении процесса восприятия редуцированных словоформ.

При подготовке эксперимента были отобраны следующие глагольные формы: будет, ходит, видит, водит, будит, гладит, судит. Частотность данных словоформ определялась по нескольким источникам: по всему НКРЯ, по подкорпусу текстов, созданных после 1950-ого года, по подкорпусу устной непубличной речи НКРЯ и по КРЛЯ (эти сведения представлены в Приложении №29). Хотя соотношение частотностей некоторых словоформ меняется в зависимости от корпуса (например, ходит является более частотным, чем видит в устном подкорпусе НКРЯ и в КРЛЯ, во всем же НКРЯ и в текстах, созданных начиная с 1950-ого года, чаще встречается видит), по любому из корпусов можно выделить следующие группы: - высокочастотная словоформа: будет; - частотные словоформы: ходит, видит; - низкочастотные словоформы: водит, гладит, будит, судит. Выделение словоформы будет в отдельную группу обусловлено тем, что ее частотность во всех корпусах значительно превышает частотность словоформ ходит и видит (в 14-17 раз в зависимости от корпуса).

Были подготовлены 15 стимулов. Прежде всего, все анализируемые словоформы были прочитаны в семантически ненагруженном контексте он ... (ходит, водит и т.д.). Кроме того, все словоформы были представлены и в более широком контексте. Для того чтобы можно было сравнить надежность воспри ятия словоформ, имеющих разную частотность, в тех случаях, когда это было возможно, для различных словоформ подбирался одинаковый контекст. Так, словоформы видит, водит и судит были поставлены в контекст он ... нас (на месте многоточия находилась редуцированная словоформа). Помещение в подобный контекст словоформы гладит было бы странным с семантико-прагматической тоски зрения, поэтому для данного случая был составлен более естественный контекст он гладит кошку, позволяющий однозначно определить глагол.

Для словоформ будет и будит были созданы контексты он будет меня ждать, он будит меня по утрам, в которых ближайший к редуцированным словоформам контекст (он ... меня) не различался, однако добавление к нему элементов ждать или по утрам должно было обеспечить надежное распознавание редуцированных словоформ.

Наибольшее количество контекстов было предложено для словоформы водит. Кроме уже упоминавшегося контекста он водит нас, в эксперимент был включен контекст он водит нас к психологу. Это было сделано для сравнения с результатами восприятия стимула она ходит к психологу, который неоднократно предъявлялся испытуемым в предыдущих экспериментах. Появление контекста он водит нас к психологу было при этом обусловлено тем, что для переходного глагола более естественным является контекст с прямым дополнением, следующим непосредственно за глаголом. Кроме того, в эксперимент был включен стимул он водит громко для проверки того, будет ли редуцированная словоформа водит восприниматься как воет в контексте, который допускает подобную интерпретацию.

Все описанные стимулы были прочитаны тем же диктором, который читал предложения при апробации методики проведения эксперимента, после чего из каждой исследуемой словоформы был удален согласный /d / в интервокальной позиции. Для придания стимулам естественного звучания в контекстах он будет меня ждать и он будит меня по утрам словоформа меня была редуцирована до /mn a/. Темп звучания стимулов изменению не подвергался.

Результаты эксперимента по восприятию естественных редуцированных словоформ показали, что словоформы, выступавшие в роли вводных слов (или входившие в состав вводных конструкций), воспринимались достаточно плохо (см. результаты для словоформ и словосочетаний понимаешь, слушай, представляешь (себе это)). Как следствие, было выдвинуто предположение об определяющей роли контекста в процессе распознавания редуцированных словоформ.

Однако для некоторых словоформ употребление в функции вводного слова является более типичным, чем употребление в качестве элемента основной структуры высказывания. В работах по фонетике спонтанной речи отмечается, что наиболее сильной редукции таких словоформ будет способствовать именно позиция вводного слова в силу более высокой частотности и меньшей информативности (см. об этом 2.3.1.).

В связи с этим возникает вопрос, в какой позиции одна и та же реализация будет распознаваться лучше: в позиции вводного слова, в которой она встречается чаще, или в позиции знаменательного слова, в которой контекст существенно способствует распознаванию. Надежное распознавание подобных словоформ в позиции вводного слова будет свидетельствовать о том, что при их распознавании используется стратегия, в которой ведущую роль играет не лекси-ко-грамматическая предсказуемость контекста, а частотность употребления словоформ в функции вводных слов. Возможно, это также можно трактовать как обусловленность контекстом, если под контекстом подразумевать не лекси-ко-грамматические факторы (как это делается при описании базовой стратегии), а особенности интонационного оформления фразы, прагматическую информацию, извлекаемую из ситуации общения и т.п.