Электронная библиотека диссертаций и авторефератов России
dslib.net
Библиотека диссертаций
Навигация
Каталог диссертаций России
Англоязычные диссертации
Диссертации бесплатно
Предстоящие защиты
Рецензии на автореферат
Отчисления авторам
Мой кабинет
Заказы: забрать, оплатить
Мой личный счет
Мой профиль
Мой авторский профиль
Подписки на рассылки



расширенный поиск

Лингвистический анализ и формальное представление содержания нарративного текста Ефимова Татьяна Владимировна

Лингвистический анализ и формальное представление содержания нарративного текста
<
Лингвистический анализ и формальное представление содержания нарративного текста Лингвистический анализ и формальное представление содержания нарративного текста Лингвистический анализ и формальное представление содержания нарративного текста Лингвистический анализ и формальное представление содержания нарративного текста Лингвистический анализ и формальное представление содержания нарративного текста Лингвистический анализ и формальное представление содержания нарративного текста Лингвистический анализ и формальное представление содержания нарративного текста Лингвистический анализ и формальное представление содержания нарративного текста Лингвистический анализ и формальное представление содержания нарративного текста
>

Диссертация - 480 руб., доставка 10 минут, круглосуточно, без выходных и праздников

Автореферат - бесплатно, доставка 10 минут, круглосуточно, без выходных и праздников

Ефимова Татьяна Владимировна. Лингвистический анализ и формальное представление содержания нарративного текста : Дис. ... канд. филол. наук : 10.02.19 : Воронеж, 2004 250 c. РГБ ОД, 61:04-10/1430

Содержание к диссертации

Введение

Глава 1. Лингвистический анализ нарративного текста 11

1.1. Текст как объект лингвистического анализа 11

1.2. Определение жанрово-стилевой принадлежности текста 17

1.3. Анализ структурной организации текста 17

1.3.1. Объемно-прагматическое членение текста 18

1.3.2. Контекстно-вариативное членение текста 20

1.4. Анализ семантического пространства текста 23

1.4.1. Выявление ключевых слов и их лемматизация 25

1.4.2. Кореферентное обобщение ключевых слов 26

1.4.3. Анализ семантико-синтаксической связи между ключевыми словами и их контрагентами 29

1.4.3.1. Выделение семантических типов предикатов и их структур 30

1.4.3.2. Анализ семантико-синтаксической связи между ключевыми словами 42

1.4.3.3. Анализ семантико-синтаксической связи между ключевыми словами и их контрагентами 84

Выводы по 1-ой главе 93

Глава 2. Формальное представление содержания нарративного текста 95,

2.1. Текст как объект формализации 95

2.2. Построение обобщенной статической модели содержания текста 97

2.2.1. Выявление кореферентной доминанты в целом по тексту ..97

2.2.2. Построение графической модели связей между персонажами и оценка силы этих связей 97

2.2.3. Выявление предикативной доминанты в целом по тексту 101

2.2.4. Визуализация полученной информации в виде диаграммы 103

2.3. Семантическая сеть как инструмент структурно-смыслового сегментирования содержания текста 103

2.3.1. Выявление семантических связей между элементами текста 104

2.3.2. Понятие сложного синтаксического целого 107

2.3.3. Критерии выделения сложного синтаксического целого 108

2.3.4. Описание внутреннего композиционного устройства сложного синтаксического целого 109

2.3.5. Построение семантической сети 124

2.3.6. Установление типа семантической сети 125

2.3.7. Определение с использованием семантической сети количественных параметров, характеризующих систему семантических связей в тексте 125

2.3.7.1. Семантическая связность 125

2.3.7.2. Цепочечный коэффициент 126

2.3.7.3. Функциональный вес сложного синтаксического целого 126

2.4. Построение динамической модели содержания текста 130

2.4.1. Исследование динамики референтов по частям семантической сети и визуализация полученной информации в виде схемы связей 130

2.4.2. Исследование динамики типов предикативной связи по частям семантической сети и визуализация полученной информации в виде диаграмм и графиков 148

2.4.3. Внутритиповая динамика предикативной связи 163

2.5. Интерпретация результатов исследования 170

Выводы по 2-ой главе 184

Заключение 186

Библиографический список использованной литературы :..190

Список условных обозначений 203

Список таблиц 205

Список рисунков (схем, диаграмм, графиков) 206

Список приложений 207

Приложения 209

Введение к работе

В данной работе «Лингвистический анализ и формальное представление содержания нарративного текста» предлагается метод извлечения, формализации и наглядного представления существенной информации текста.

В середине XX века Эмиль Бенвенист прогнозировал "формальное" будущее лингвистики, подчеркивая ее стремление к точности, которое заключалось, прежде всего, в изменении отношения к своему объекту: «Если наука о языке должна выбирать себе образец для подражания, то им будут науки математические или дедуктивные, которые представляют свой объект в полностью рациональной форме, сводя его к совокупности объективных свойств, получающих постоянные определения. Из этого следует, что лингвистика будет становиться все более и более "формальной", по крайней мере, в том смысле, что язык предстанет как некоторая совокупность всех своих наблюдаемых форм» [Benveniste 1966; русск. пер. в кн.: Бенвенист 1974:37].

На современном этапе развития лингвистики, в эпоху всеобщей компьютеризации и глобальной информатизации наш интерес к опыту точных наук и использование этого опыта в разработке авторской технологии исследования текста можно считать отвечающим запросам времени.

Выявление семантически значимой информации происходит во многом благодаря использованию средств компьютерной графики. Высокая эффективность графического представления информации подтверждена многочисленными исследованиями наглядно-образного и визуального мышления на основе когнитивного подхода. Фундаментальная идея этого подхода заключается в том, что мышление есть не что иное, как манипулирование внутренними (мысленными) репрезентациями структурированных определенным образом знаний - фреймов, сетей, планов, сценариев. Исходя из этого, разработаны модели представления знаний на основе семантических сетей, продукций, логики предикатов и нечетких знаний [Поспелов 1989].

Следует отметить, что разработанное на основе когнитивного подхода новое направление в области искусственного интеллекта - когнитивная компьютерная графика (ККГ) - с 1988 г. является «стратегическим приоритетом национальной политики США в области развития перспективных информационных технологий, прежде всего для науки и образования. Суть концепции ККГ очень проста: если на экране дисплея удается визуализировать существенные свойства и отношения между объектами некоторой предметной области (даже любой степени абстракции), то такой ККГ-образ, как правило, содержит в себе информацию (на уровне графических деталей компьютерного изображения) о возможных и не всегда заранее известных следствиях этих свойств и этих отношений» [Агеев 2002:37].

Изложенные выше соображения определяют актуальность данного исследования.

Цель нашего исследования - разработка и применение метода анализа нарративного текста как системы таких алгоритмизируемых процедур, которые способны выявлять лингвистически значимую информацию, моделировать процесс перехода от лексико-грамматического уровня текста к структуре его содержания, визуализировать статику и динамику последнего.

Объектом анализа является содержание нарративного текста как ментальное образование - семантика текста в её статике и становлении.

Материалом для исследования послужил рассказ А.П. Чехова «Дама с собачкой», хорошо структурированный небольшой по объему текст (его длина составляет 317 предложений (5238 ЛЕ)) как обозримое целое для анализа, но с достаточным материалом для классификации. Исследуемые единицы отбирались при помощи компьютерной программы "Словари", разработанной под руководством сотрудников Научно-методического центра по компьютерной лингвистике факультета РГФ ВГУ. Обработка материала проводилась на компьютере Pentimn IV в редакторе Word for Windows; для количественной обработки использовались электронные таблицы и графические представления Excel for Windows.

Предлагаемый нами метод исследования семантики текста предполагает пошаговое решение следующих задач:

- выявление ключевых слов посредством анализа частотного словаря;

- выявление кореферентных наименований ключевых слов;

- анализ семантико-синтаксической связи между ключевыми словами и составление структурных схем, формируемых определенным предикативным типом и репрезентирующих статус ключевых слов;

- грамматическое и кореферентное обобщение контрагентов ключевых слов;

- представление системы семантических связей в тексте в виде графических моделей;

- определение с использованием графических моделей количественных параметров, характеризующих систему семантических связей в тексте: семантической связности, характеризующей план содержания текста, его семантическую монолитность; цепочечного коэффициента, определяющего среднюю длину цепочки сложного синтаксического целого (ССЦ), в которой каждое предшествующее ССЦ непосредственно связано с последующим за ним ССЦ; функционального веса, параметра, определяемого числом семантических связей, в которые вступает в данном тексте рассматриваемая единица;

- исследование и визуализация динамики референтов и предикативной связи;

- интерпретация фактов, выявленных с помощью предлагаемой технологии обработки информации; а также решение целого спектра более частных задач.

О методе исследования изучаемого объекта заявлено в названии темы диссертации, а его создание определено как цель. Предлагаемый метод разработан на основе частных лингвистических методов исследования % письменных текстов, основанных на количественном анализе, методах контент анализа и валентного анализа, методов и средств когнитивной компьютерной графики.

Научная новизна исследования заключается 1) в разработке оригинального метода анализа и формализации содержания нарративного текста;

2) в выборе в качестве материала исследования самого сложного случая -художественного текста1;

3) в разработке и представлении динамической модели содержания #; нарративного текста.

Теоретическая значимость работы состоит в попытке выйти за рамки анализа художественного текста, который является на данном этапе исследований пока традиционным и собственно лингвистическим, и разработать алгоритмический метод использования лингвистической информации для выявления и наглядного представления содержания текста.

Практическая ценность предложенного алгоритма заключается в возможности как его самостоятельного использования, так и в составе других алгоритмических процедур для решения ряда практических задач, связанных с компьютерной обработкой текста в рамках литературо- и переводоведения, а также для построения интегрированных технологий для систем искусственного интеллекта. Поэтому наблюдения и обобщения, сделанные в процессе исследования, могут быть использованы специалистами по теоретической и прикладной лингвистике и прогностике текста, квантитативной лингвистике, литературоведению и переводу в лекционных курсах и на практических занятиях.

1 Существует мнение, что художественная проза и поэтические тексты, «не могут быть объектом формализации» [А. Новиков 1983:6], поскольку их формализация «не диктуется какой-либо практической необходимостью» [Там же]); одновременно отмечается, что «проза А.П. Чехова -наиболее трудно поддающиеся формализации и моделированию тексты» [Лотман 1972:355].

Положения, выносимые на защиту, формулируются следующим образом:

1. Первым этапом анализа является выделение ключевых слов, опирающееся на анализ употребительности слов в тексте.

2. Вторым, к сожалению, пока не формализованным этапом анализа является установление кореферентного тождества слов и словосочетаний с целью получения полной информации о номинировании персонажей (действующих лиц, участников ситуации).

3. Формализация семантического пространства может осуществляться через анализ синтаксических связей членов предложения.

4. Количество минимально необходимых для существенного представления содержания нарративного текста в его статике и динамике предикативных типов равно 11: акциональный, перцептивный, экзистенциальный, сущностный, квалификативно-дескриптивный, социативный, посессивный, коммуникативно-контактный, предикаты речи, движения и состояния.

5. Динамика отношений между персонажами (количество и качество их отношений) может измеряться через количество и качество их синтаксических связей, опосредованных глаголами указанных семантических типов.

6. Семантическая сеть текста, построенная по методу Э.Ф. Скороходько, может использоваться для выделения значимых частей текста как условие моделирования динамики его содержания.

Основные положения диссертации изложены и апробированы в период с 2000 по 2003 гг. на научных конференциях и семинарах различных уровней: международной конференции «Актуальные проблемы языкознания и методики обучения иностранным языкам», организованной факультетом иностранных языков Воронежского государственного педагогического университета (март 2000); международной конференции «Перевод: язык и культура», проводимой факультетом РГФ Воронежского государственного университета (октябрь 2000, сентябрь 2001); второй и третьей конференциях «Проблемы лингвистической прогностики», организованных и проведенных факультетом РГФ, Научно-методическим центром по компьютерной лингвистике и кафедрой теоретической и прикладной лингвистики Воронежского государственного университета (ноябрь 2001, май 2003); международной научной конференции «Проблемы компьютерной лингвистики», организованной Научно-методическим центром по компьютерной лингвистике, факультетом РГФ и факультетом ПММ Воронежского государственного университета (май 2002 и 2004); на третьем международном семинаре по когнитивной лингвистике (Тамбовский госуниверситет, сентябрь 2002), а также отражены в 9 публикациях.

Структура работы обусловлена поставленными задачами. Диссертация состоит из введения, двух глав и заключения, 29-ти таблиц, 11-ти схем, 10-ти диаграмм, 4-х графиков, списка использованной литературы, 10-ти приложений.

Таблицы содержат количественную характеристику изучаемых объектов, а также иллюстрируют качественную динамику референтов и предикатов.

Графики и диаграммы визуализируют эту динамику по частям семантической сети и по тексту в целом.

Граф моделирует семантическую структуру текста, а схемы - связи между персонажами.

Во Введении обосновывается выбор темы, описываются объект и материал исследования, формулируется цель исследования, намечаются его задачи, раскрывается теоретическая и практическая значимость работы.

В Главе I дается определение текста как объекта лингвистического анализа; перечисляются его основные текстообразующие категории и свойства; характеризуется такой параметр как жанрово-стилевая принадлежность исследуемого текста; анализируется его структурная организация - объемно-прагматическая (или абзацная) и контекстно-вариативная; проводится анализ (кореферентный и предикативный) семантического пространства текста.

. Глава II посвящена формализации содержания текста (построению обобщённой статической и динамической моделей содержания). Сначала дается определение текста как объекта формализации. Затем осуществляется моделирование содержания текста в статике на базе данных лингвистического анализа, полученных в Главе I. Далее проводится структурно-смысловое сегментирование текста: определяются критерии выделения основных структурно-смысловых единиц - сложных синтаксических целых, дается описание их внутреннего композиционного устройства. Затем строится модель семантической структуры текста - семантическая сеть, с помощью которой определяются количественные параметры, важные для системы семантических %-, связей в тексте (семантическая связность, цепочечный коэффициент, функциональный вес); прослеживается динамика референтов и типов предикативной связи, а также внутритиповая динамика, которая визуализируется с помощью компьютерной графики - различных графических образов (схем, графиков, диаграмм); интерпретируются результаты исследования, полученные предложенным методом. В Заключении подводятся итоги исследования.

Выделение семантических типов предикатов и их структур

Как известно, каждую семантико-синтаксическую структуру формирует определенный тип предиката с относящимися к нему актантами. Оперируя термином "предикат", мы понимаем его вслед за Ю.С.Степановым как «особую семантическую сущность, чья категоризация представляет собой обобщение объективных явлений бытия» [Степанов 1981:312]. Другими словами, под предикатом понимаются слова (глаголы) и выражения (связка+прилагательное; связка+ограниченный круг слов типа печален, жаль, надо и т.д.) в предикатной функции, то есть выполняющие в предложении роль сказуемого.

Что касается семантических типов предикатов, то в этом вопросе в семасиологических исследованиях отсутствует единое мнение относительно их количественного и качественного состава. В исследованиях семантики глагола противопоставляются элементы разных систем, описываются различные признаки их субстанций, предпринимаются попытки различных классификаций, однако отсутствие однозначно описанной семантики глагола оставляет почву для дальнейших исследований.

Любая классификация основывается на определенных свойствах, общих для данного класса. Так, В.Г. Гак первоначально выделил пять семантических предикатов (состояния, активного действия, отношения, идентификации, обстоятельственного отношения) [Гак 1977:214], которые впоследствии свел лишь трем основным: процессному, квалификативному и процессно-квалификативному. Первые два предиката подразделяются на типы. Основные типы процессного предиката: экзистенциальный, выражающий существование; статальный, выражающий состояние; локальный, выражающий пространственное отношение; реляционный, выражающий отношение субъекта к объекту; акциональный, выражающий действие субъекта в отношении объекта. Квалификативный предикат подразделяется на следующие типы: идентифицирующий, классифицирующий и характеризующий. Н.С. Авилова в своей книге "Вид, залог и семантика глагольного слова" предлагает следующую классификацию предикатов - предикаты действия, процесса, состояния, качества, нахождения в пространстве, потенциальности, класса и "связи", результата и факта [Авилова 1976:151]. Эти группы связаны между собой определенной системой признаков. Предикаты действия и процесса различаются между собой по признаку агентивности/неагентивности субъекта. Их отличительной чертой является то, что они существуют пофазно, то есть "в каждый отдельный момент времени существует только отдельная фаза развития действия или процесса, а не действие, процесс в целом" [Селиверстова 1982:94]..

При классификации предикатов большое внимание часто уделяется признаку "активности /неактивности". Иногда этот признак рассматривается как один из признаков, по которому дифференцируются стативные и нестативные предикаты, а иногда предлагается выделять особую категорию активности/неактивности [Алисова 1971:37-38].

Связывая классификацию предикатов с двумя формами суждения (атрибутивным и реляционным), О.И. Москальская выделяет два основных семантических предиката - детерминирующий и реляционный. Эти предикаты могут характеризоваться статальностью, процессуальностью или ащиональностью [Москальская 1981]. Существует также "естественная" классификация предикатов, где нет одного общего признака, разделяющего все предикаты на группы. Здесь некоторые группы выделяются по признакам, присущим только им. Наиболее общим является признак "фазовости/нефазовости" существования, который отделяет предикаты со значением действия, процесса, состояния от предикатов качества (свойства) или набора свойств, объединенных в предмете, то есть помогает провести границу между глаголами и "не глаголами".

Вслед за Л.В. Щербой, Т.В. Булыгина выделяет три типа предикатов со значениями действия, состояния и свойства (качества). Их основной семантической характеристикой считается потенциальная темпоральная локализация: для предиката действия характерна динамичность, для предиката состояния - статичность, для предиката свойства-качества - панхроничность. Первое значение, по мнению авторов, передается полнозначными глаголами, второе - связкой плюс некоторый ограниченный круг слов (печален, жаль, в состоянии, надо и др.), третье - связкой плюс полное прилагательное [Щерба 1974:90; Булыгина 1982:7-85].

Известно, что каждый семантический тип предиката эксплицируется соответствующей предикатной лексикой - предикаторами1, обладающими общностью грамматических и семантических признаков, предикаторами одного и того же валентного типа; и составляет основу семантико-синтаксической структуры с относящимися к нему актантами и отражает один и тот же тип отношений в реальной действительности.

В основе нашей семантической классификации предикатов лежат знания актантной структуры предикатов, общность синтаксем эксплицирующих их предикаторов [см. Г.А. Золотова 1991]. Выделение семантических типов предикатов и их структур мы осуществляем в два этапа: на первом этапе дифференцируем конкретные высказывания, а на втором - идентифицируем и обобщаем однотипные конкретные высказывания как по форме, так и по смыслу.

Ашщональный предикат коррелирует с семантикой следующих предикаторов: встречать, женить, изменять, учиться, обедать, поманить, погрозить, заворчать, дать, кусаться, служить, предлагать, нюхать, обнять, поцеловать, найти, играть (роль), спрятать, делать, завтракать, привлекать (к себе), переродить, обмануть, выходить (замуж), удержать, найти, провожать (проводить), сесть (в вагон), получать (письмо), писать, извещать, играть (в карты), играть (на рояле), устроить (свидание), собраться в дорогу, хлопотать (за), окликнуть, послать (записку), курить, посылать (к Гурову человека в красной шапке), застать, испугать, отстранять (от себя), заставлять (страдать, жить), пить, взять (за плечи), приласкать, пошутить, поймать, простить, избавить (себя) от, освободиться от.

Анализ семантико-синтаксической связи между ключевыми словами и их контрагентами

Текст как объект формализации обладает специфическими свойствами, которые дифференцируют его среди прочих ее объектов: он представляет собой содержание, выраженное знаковыми средствами естественного языка. Эти языковые средства являются формой содержания. Следовательно, текст можно рассматривать как в определенной мере формализованную систему.

Известно, что термин "формальный" в лингвистике имеет несколько значений: а) соотнесенный с платоническими формами; б) соотнесенный с формами языка; в) относящийся к строгости в процедурном аспекте описания; г) "неэмпирический" и даже "нормирующий"; д) абстрактный [Демьянков 1984:197].

В большом энциклопедическом словаре термин "формальный" употребляется как эквивалент "формализованного", "эксплицитного" в противоположность "неформальному" или "интуитивному" [Языкознание. БЭС 2000:558].

В основном, представление о формализации в отечественной и зарубежной лингвистике связано с целью описания: задачей формализации признается «обеспечение возможности выявить дефекты анализа с той же ясностью, что и его достоинства» [Dowty 1979:322], а также «выявление и уточнение изучаемого явления через рассмотрение и фиксацию его формы и оперирование с нею» [Бирюков и др. 1973:19].

Решение этой задачи напрямую зависит от применения определенных формальных правил. Совокупность этих правил обычно называют алгоритмом, который, как известно, является методом формализации. Предлагаемый нами алгоритм позволил на этапе лингвистического анализа [см. Главу 1] получить необходимые данные (отчасти формализованные в виде таблиц и структурных схем) для решения ряда семантических задач, в частности, предполагающих в той или иной форме моделирование семантического пространства текста в статике и динамике. Речь идет, прежде всего, о визуализации полученной информации в виде графических образов (далее ГО), которые трактуются как модели отображаемого объекта - текста, как средство представления данных исследований сложных структур, явлений, процессов [Валькман 2002] \

К построению графов существуют определенные требования: графы должны обладать связностью, целостностью, законченностью, полнотой и непротиворечивостью трактовки: «Как и устная фраза, "графическая фраза", создаваемая с помощью диаграммы, схемы и т.д., значит не больше того, что заложено в передаваемых ею идеях. Таким образом, форма ясной визуальности фразы должна обладать функциональностью. Формы (графемы, графемные конструкции) взаимодействуют в ГО подобно тому, как взаимодействуют слова в предложении. Контекст влияет на интерпретацию как отдельных компонент, так и ГО в целом. С помощью ГО визуальные фразы связываются в графическое высказывание» [Указ. соч.].

При построении ГО внимание акцентируется на значимых аспектах отображаемого объекта исследования. Как известно, любой ГО, как и модель, строится с определенной целью. В нашем случае построение семантической сети (СемСети) и дальнейшая ее сегментация на части (в другой терминологии цепочки) проводится с целью выявления КС в каждой из частей и связей между этими частями. Затем при помощи статистического метода определяется их динамика (интенсивность и качество), а также доминанта лексическая и предикативная. Именно доминанта, по мнению многих ученых-лингвистов, литературоведов, психолингвистов, специфицирует художественное произведение, обусловливает его уникальность. Само понятие доминанты связывают, прежде всего, с именем психофизиолога Л.А. Ухтомского, убедительно доказавшего, что принцип доминанты является физиологической основой внимания и предметного мышления. В дальнейшем это понятие было использовано и обосновано известными представителями школы русского формализма (Р. Якобсоном, Б.М. Эйхбаумом и др.), которые связывали понятие доминанты, прежде всего, с формой. В настоящее время доминантой художественного произведения признаются как формальные, так и содержательные средства. Однако данное понятие, на наш взгляд, эффективно в первую очередь в анализе формальных средств выражения содержания. 2.2. Построение обобщенной статической модели содержания текста. В результате лингвистического анализа линейной структуры текста выявлены кореферентные наименования персонажей [см. Главу 1, табл. 1-5]. 2.2.1. Выявление кореферентной доминанты (Сг-доминанты) по тексту в целом. Итак, в тексте представлены 16 персонажей (Сгобщ=607), имеющие эксплицитную предикативную связь, из которых ключевыми являются Гуров (Сг=265), Анна Сергеевна (Сг=208); муж Анны Сергеевны (Сг=33), женщины (Сг=24), жена (Сг=11). Среди кореферентных наименований Гурова доминируют местоимение он в форме 3 л. им. п. и имя собственное Гуров; Анны Сергеевны - местоимение 3 л им. п. и имя собственное Анна Сергеевна в форме им. п.; мужа Анны Сергеевны - местоимение 3 л им. п. и имя существительное муж в форме им. п.; женщин - местоимения 3 л. род. и тв. п.; жены - существительное жена в им.п.. 2.2.2. Построение графической модели связей в целом по тексту. Чтобы получить модель связей между персонажами в целом по тексту в виде графа, представим все в относительных величинах путем составления пропорции с учетом общего количества кореферентных наименований. Граф состоит из вершин и ребер. Вершины в виде круга - это персонажи произведения с указанием их имен-гиперонимов и количества кореферентных наименований; ребра же в виде стрелок отражают связи между действующими лицами и силу этих связей.

Построение графической модели связей между персонажами и оценка силы этих связей

Со своей стороны в качестве критерия семантической связности мы приняли кореферентные наименования основных персонажей, объединив первое, второе, третье условия основного и оба условия расширенного критерия, а также четвертое условие основного критерия.

Однако максимальной силы семантическая связь между предложениями достигается в том случае, когда связанными оказываются слова, релевантные относительно заданного текста или его отрывка (имеется в виду не контекстуальная, синтагматическая, а постоянная - парадигматическая связь между значениями: мол - пароход - пристань - встречающие). Количество релевантных слов, с которым семантически связано данное слово, называется его относительной степенью релевантности. Множество релевантных слов текста образует фрагмент СемСети [Скороходько 1983:107].

Учет степени релевантности слов дает возможность усовершенствовать лексический критерий установления семантической связи между предложениями. Сила семантической связи может также определяться числом совпадающих слов, их частотой (признак текстуальной значимости), тема-рематическими характеристиками и т.д. [Рылова 1971]. Предложение как элемент системы семантических связей репрезентирует план содержания текстов небольшой длины (20-30 предложений) типа сказок, притч, публицистических заметок etc., а также отрезков более длинных текстов: абзацев, параграфов etc.

Однако для описания семантического пространства рассказа А.П.Чехова «Дама с собачкой», чья длина составляет 317 предложений, подобное членение оказывается недостаточным: предложение становится слишком мелкой единицей, а пофразная СемСеть - слишком громоздкой. Это затрудняет анализ семантической структуры текста и определение ее типа. Поэтому в нашей работе за единицу системы семантических связей мы взяли так называемое сложное синтаксическое целое (ССЦ).

Появление этого термина связывают с именем Н.С. Поспелова [Поспелов 1948:53], который еще в конце 40-х годов XX в. признавал, что помимо простых и сложных предложений в языке имеют место и синтаксически организованные группы предложений, рисующих одну картину, причем в этой картине осмысляются отдельные ее части. Группа предложений может выражать сложную мысль, которая распадается на ряд отдельных мыслей. Построенная таким образом группа образует сцепление предложений, связанных единством высказывания, при этом сохраняется синтаксическая самостоятельность отдельных предложений в ее составе. Такую группу предложений автор условно назвал сложным синтаксическим целым [Поспелов 1948; Поспелов 1950]. Следует заметить, что для именования группы предложений в лингвистике используют множество терминов: "большой контекст" [Т.И.Сильман 1967]; "прозаическая строфа" [Г.Я.Солганик 1965]; "сверхфразовое единство" [Л.А. Булаховский 1952; О.С. Ахманова 1966; Б.А. Маслов 1974; А.И. Новиков 1983; П.А. Лекант 1988; и др.]; "межфразовое единство" [Н.С. Валгина 2003]; "компонент текста", "складень" [И.А.Фигуровский 1961]; "сгусток" [Э.Ф. Скороходько 1983]; "абзац" [А.М.Пешковский 1956]; "языковое образование" [С. Winkler 1962]; "цепь предложений" [J.A. Fodor 1965]; "группа предложений" [J. Ries 1931]; "дискурс" [М. Pecheux 1969] и др. Но все же наиболее устойчивым и общепринятым является термин сложное синтаксическое целое (И.Р.Гальперин, ГА. Золотова, В.А. Кухаренко, О.И. Москальская, З.И.Тураева, Ю.В. Попов, Т.П. Трегубович и мн. др.). Все эти термины, в сущности, предполагают одни и те же требования: наличие смысловой и синтаксической (формальной) связи между предложениями в пределах данной единицы текста.

Наиболее полное, на наш взгляд, определение сложного синтаксического целого дают Л.Г. Бабенко и Ю.В. Казарин в своей монографии «Лингвистический анализ художественного текста»: «Основная единица текста, имеющая собственное содержательное, структурное и коммуникативное устройство, - это сложное синтаксическое целое. Главная его особенность -относительно тематическая самостоятельность и законченность некоторой совокупности высказываний, которую они сохраняют при извлечении из текста, а также особый характер межфразовых связей, существующих внутри ССЦ» [Бабенко, Казарин 2003].

Критерии выделения ССЦ. Поскольку во всех исследованиях ССЦ выделяются на основе семантического единства, сегментирование текста на ССЦ и определение силы семантической связи между ними производилось нами на основании тех же критериев, что были установлены для предложений, в два этапа: сначала устанавливалась семантическая связь между предложениями, входящими в эти ССЦ, затем - семантическая связь и её сила между ССЦ. Другими словами, критерий семантической связи между ССЦ - наличие семантической связи между составляющими их предложениями. Сила семантической связи, как между предложениями, так и между ССЦ, эквивалентна числу индикаторов связности. Следует упомянуть еще об одном критерии сегментирования текста. Речь идет о «типичной особенности чеховской прозы начинать или заканчивать какой-либо смысловой кусок фразами, суммирующими впечатление» [Чудаков 1992:124], например: Что-то в ней есть жалкое все-таки»,- подумал он и стал засыпать; Дети ему надоели, банк надоел, не хотелось никуда идти, ни о чем говорить.

Описание внутреннего композиционного устройства сложного синтаксического целого

Схема связей IV части [см. Рис.7, 138] демонстрирует смещение акцентов: если в I части Анна Сергеевна является для Гурова лишь одной из множества женщин (включая жену), то в IV-ой она - явная доминанта этого "множества" (ср. относительный вес DAC=17,14 против ВжеШвдны=4,38). Более того, данный персонаж выходит на первый план по отношению к Гурову (ср. относительный вес DAC=17,14 против 1 08=12,2). Из текста известно, что указанный фрагмент включает покаянную речь Анны Сергеевны у себя в номере (Сг-доминанта: мест. 1 л ед. ч.). Граф также демонстрирует довольно прочную связь Анны Сергеевны с мужем (второе место по силе). Однако толщина стрелок, отражающая силу связи Гуров - Анна Сергеевна, увеличение относительного веса референта "они", с которым связано появление новых персонажей, свидетельствуют о развитии ялтинского романа.

На графе V части мы видим, что ключевым также является треугольник: Гуров - Анна Сергеевна - муж, где центральной фигурой по-прежнему остается Анна Сергеевна [см. Рис.8, 140]. Но в то же время наблюдается снижение относительного веса всех участников ситуации - ср. DAC=10512; DrypoB==9504; Омуж=4,5; D0ffir=2,26. Это говорит об окончании курортного романа: «И он думал о том, что вот в его жизни было еще одно похождение или приключение, и оно тоже уже кончилось, и осталось теперь воспоминание... 145" [см. Приложение 1, 213].

На графе VI части [см. Рис.9, 142] отчетливо видно, что ключевым персонажем здесь является Гуров, при этом среди участников моделируемой ситуации Анна Сергеевна по-прежнему доминирует [ср. относительный вес и силу связи - см. Главу 2,140]. Если во II-V частях главным объектом внимания автора была Анна Сергеевна, "эта дама с собачкой", то здесь предметом авторских интенций становится Гуров. Смещение акцента указывает на начало новой фазы повествования.

Эта тенденция имеет свое продолжение и в VII части [см. Рис.10, 144]: диспозиция восьми участников моделируемой ситуации на графе демонстрирует очевидное лидерство уже другой пары персонажей - Гурова и чиновника-партнера, относительный вес которых составляет: DrjpaB=9,6 - D4HffijBIfflK=4,54; а сила связи равна 5,12 [см. Главу 2, 142]. Обратимся к содержанию. Указанный фрагмент включает известный диалог: Гуров, которого "томило сильное желание поделиться с кем-нибудь своими воспоминаниями" об "очаровательной женщиной", наталкивается на чудовищное непонимание своего собеседника, не замечающего несовместимости любви и осетрины, да еще с душком. Затем, как известно, следует возмущенный внутренний монолог Дмитрия Дмитрича, который сам "давеча" говорил об осетрине. Эта эмоциональная вспышка, вызвана, в общем то, незначительным событием. У Чехова подобные незначительные события, «ничтожные и случайные поводы», по словам Н.Л. Шапира, очень часто являются «неосознаваемыми причинами сложных настроений, а, в свою очередь, настроения, случайные и мгновенные, становятся причиной принципиально важных выводов» [Шапир 1905:501]1. Вывод Гурова известен -он решил поехать в С, чтобы повидаться с Анной Сергеевной, но «зачем? Он и сам не знал хорошо» [см. Приложение 1,215]. Схема VIII части [см. Рис.11,146], отражающая сложное взаимодействие девяти персонажей, акцентирует значимые аспекты моделируемой ситуации: на общем фоне резким контрастом выделяется пара Гуров - Анна Сергеевна, при щ этом относительный вес Гурова достигает максимальной величины 20,2, Анны Сергеевны - 16,3 [см. Главу 2, 145]. Насыщенная событиями данная часть СемСети содержит вербальное описание приезда Гурова в С, его чувств, его прозрения, когда он увидел Анну Сергеевну в толпе зрителей провинциального театра: «Сердце у него сжалось, и он понял ясно, что для него теперь на всем свете нет ближе, дороже и важнее человека»; а также описание портрета мужа Анны Сергеевны, которого мы видим глазами Гурова [см. Приложение 1, 215]. Цитируется по В.Б. Катаеву [Указ.соч, 134]. Здесь мы узнаем о приездах Анны Сергеевны в Москву: «Она останавливалась в "Славянском базаре" и тотчас же посылала к Гурову человека в красной шапке» [см. Приложение 1, 217] (на схеме - человек в красной шапке или посыльный). Восьмая часть заканчивается осознанием Гурова всей лживости его прежней жизни, «его оболочки, в которую он прятался, чтобы скрыть правду, как, например, его служба в банке, споры в клубе, его "низшая раса", хождение с женой на юбилеи ... » [см. Приложение 1,217] (на схеме - жена, женщины).

Граф IX части как и 1-ой визуализирует оппозицию Анна Сергеевна-женщины [см. Рис.12, 148], но здесь Анна Сергеевна уже не воспринимается в рамках этого множества (ср. относительные величины: DAc=8,46 против ОженщиныгЗ ; сила связей: 8,85 (Гуров -» Анна Сергеевна) против 2,09 (Гуров - женщины) [см. Главу 2, 147]. Для Гурова она - настоящая и единственная любовь. Обобщенный референт "они", относительный вес которого достигает здесь максимальной величины, позволяет рассматривать ключевых персонажей как единое целое (ср. очень близкие, родные люди; как муж и снсена; как неоюные друзья; им казалось, что сама судьба предназначила их друг для друга; как две перелетные птицы) [см. Приложение 1,218].

Похожие диссертации на Лингвистический анализ и формальное представление содержания нарративного текста