Содержание к диссертации
Введение
Глава 1. Категория дискретности в языке и тексте 11
1.1. Понятие дискретности в лингвистике 11
1.2. Понятие дискретности в лингвистике текста 21
1.2.1. Категория дискретности в концепции текстовых пространств 28
Выводы по первой главе 37
Глава 2. Дискретность семантического пространства текста 39
2.1. Определение единиц семантического пространства текста 39
2.2. Дистантные и контактные связи как способ реализации категорий дискретности и континуальности структуры текста 55
2.2.1. Распределение контактных связей как результат дискретизации семантического пространства текста 63
2.3. Дискретизация семантического пространства текста на уровне ключевых слов 67
2.4. Аналитическая и синтетическая стратегии членения семантического пространства текста 82
Выводы по второй главе 102
Глава 3. Дискретность физического пространства текста 105
3.1. Проявления категорий дискретности и континуальности на уровне ритмической организации текста 107
3.1.2. Дискретизация физического пространства текста в процессе развертывания текста на уровне предложений 119
3.2. Типы размеров предложений как показатели ритмизации структуры текста 123
3.2.1. Проявления категорий дискретности и континуальности на уровне количественного соотношения размеров предложений 129
3.2.2. Проявления категорий дискретности и континуальности на уровне количественного соотношения размеров абзацев 133
3.3. Взаимодействие параметров членения физического и семантического пространств текста 136
3.4. Распределение единиц семантического пространства текста относительно единиц физического пространства 140
3.4.1. Количественное распределение единиц семантического пространства текста относительно единиц физического пространства 151
Выводы по третьей главе 160
Заключение 163
Библиографический список 166
- Понятие дискретности в лингвистике текста
- Дискретизация семантического пространства текста на уровне ключевых слов
- Дискретизация физического пространства текста в процессе развертывания текста на уровне предложений
- Распределение единиц семантического пространства текста относительно единиц физического пространства
Введение к работе
Реферируемое диссертационное исследование посвящено изучению одной из важнейших фундаментальных текстовых категорий – категории дискретности, ее роли в процессе осмысления текста, выявлению закономерностей дискретизации семантического и физического пространств текста.
Актуальность. Интенсивное изучение текста ведется несколько десятилетий, при этом текст становится объектом исследования многих научных концепций и направлений, таких как лингвистика / стилистика текста (И.Р. Гальперин, М.Я. Дымарский, С.Г. Ильенко, О.И. Москальская, Т.М. Николаева, Г.Я. Солганик, З.Я. Тураева); изучение текстовой семантики (А.И. Новиков, Н.В. Халина, А.А. Чувакин, В.Я. Шабес); психолингвистика текста (Т.М. Дридзе, Н.И. Жинкин, Л.Н. Мурзин, Н.М. Нестерова, Н.П. Пешкова, В.А. Пищальникова, Л.В. Сахарный, Ю.А. Сорокин, P. Coirier); лингвосинергетика текста (К.И. Белоусов, А.Ю. Корбут, Г.Г. Москальчук, Н.Л. Мышкина). Выявление и описание категорий текста, определение их формальных и содержательных аспектов является одной из основных задач современной теории текста. Актуальность нашего исследования определяется отсутствием на современном этапе теории текста комплексного описания фундаментальной текстовой категории – категории дискретности.
Во многих работах, посвященных исследованию текста, используется понятие текстового пространства (Л.Г. Бабенко, Р. Барт, М.М. Бахтин, К.И. Белоусов, С.А. Борисова, А.Ю. Корбут, Е.С. Кубрякова, Ю.М. Лотман, Г.Г. Москальчук, Н.Л. Мышкина, Ю.А. Сорокин, В.В. Налимов, В.Н. Топоров), при этом, по мнению ряда исследователей, текст может рассматриваться как материальный объект и как семантическая структура. Подобное понимание феномена текста актуализирует задачу рассмотрения проявлений фундаментальных категорий дискретности и континуальности на уровне семантического и физического пространств текста.
Объектом исследования является текст как функционально завершенное речевое целое, предметом – категория дискретности текста, рассматриваемая на уровнях семантического и физического пространств текста.
Цель настоящей диссертационной работы заключается в выявлении механизмов дискретизации семантического и физического пространств текста.
Достижение поставленной цели предполагает решение следующих задач:
1) рассмотреть понятия, посредством которых может проявляться категория дискретности;
2) разработать исследовательскую программу по выявлению единиц семантического пространства текста;
3) рассмотреть особенности членения семантического пространства текста;
4) рассмотреть проявления дискретности физического пространства текста;
5) сравнить проявления дискретности на уровне семантического и физического текстовых пространств.
Теоретической базой диссертационной работы послужили труды ученых в области теории текста (К.И. Белоусов, И.Р. Гальперин, М.Я. Дымарский, С.Г. Ильенко, О.И. Москальская, Т.М. Николаева, А.И. Новиков, Л.В. Сахарный, З.Я. Тураева).
Материалом исследования послужили 960 реакций, полученных в результате психолингвистического эксперимента, в ходе которого использовались тексты художественной литературы Л. Андреева, И. Бунина, Н. Гнедича, Л. Енгибаряна, М. Зощенко, В. Катаева, Ф. Кривина А. Куприна, М. Пришвина, И. Тургенева объёмом от 14 до 1670 словоформ, а также тексты из цикла А.С. Пушкина «Повести покойного Ивана Петровича Белкина».
Выбор материала обусловлен стремлением использовать разноаспектный языковой материал при рассмотрении проявлений категории дискретности семантического и физического пространств текста. В работе использовались тексты двух типов. При рассмотрении дискретности семантического пространства текста в ходе эксперимента использовались тексты от 14 до 1670 словоформ, что обусловлено возможностями проведения эксперимента. Однако данные тексты в силу своего размера не позволяют получить статистических данных по дискретизации физического пространства текста, поэтому в качестве материала в процессе анализа дискретности физического пространства текста нами были использованы тексты объемом от 1990 до 5416 словоформ («Повести покойного Ивана Петровича Белкина»).
Научная новизна работы состоит в том, что впервые
– описаны категории дискретности и континуальности текстовых пространств;
– выявлены и описаны стратегии членения семантического пространства текста;
– семантическое пространство текста представлено в виде иерархической системы, компоненты которой имеют характерные для каждого уровня иерархии свойства;
– предложена классификация единиц семантического пространства текста, основанная на локализации связей лексем текста;
– разработана комплексная исследовательская программа по изучению и сопоставлению единиц физического пространства текста;
– выявлены сценарии ритмического становления материального бытия текста в контексте рассмотрения категории дискретности;
– предложена комплексная исследовательская программа по выделению единиц семантического пространства текста и их сопоставлению с единицами членения физического пространства текста;
– изучены способы взаимосвязи материальных и идеальных сторон бытия текста.
Достоверность результатов обеспечивается использованием в качестве материала значительного количества единообразно обработанных реакций информантов (960), а также применением разноаспектных методов исследования, в том числе квантитативных методов и метода моделирования.
Теоретическая значимость исследования состоит в развитии одного из аспектов теории текста, связанного с изучением базовых категорий текста, в комплексном рассмотрении проблемы языковых средств представления дискретности. В связи с тем, что предпринятое в диссертации исследование проявлений категории дискретности текста затрагивает проблемы изучения фундаментальных категорий бытия с позиции языковой деятельности, полученные выводы могут представлять интерес для общего языкознания.
Результаты проведенного исследования по разработке сценария восприятия и понимания текста, выделения стратегий членения семантического пространства текста могут применяться в психолингвистике; по разработке механизмов переработки информации – в когнитивной лингвистике.
Практическая значимость диссертации состоит в возможности использования результатов работы в вузовских курсах по общему языкознанию, спецкурсах по теории текста, психолингвистике и когнитивной лингвистике. Новые факты о соотношении дискретности и континуальности в тексте могут учитываться в практике филологического анализа текста.
Выявленные механизмы структурной организации текста могут быть заложены в разработку новых компьютерных программ, предназначенных для обработки и анализа текста и лингвистической идентификации личности.
Основные положения работы, выносимые на защиту:
1. Категория дискретности может рассматриваться в качестве структурообразующей категории семантического и физического пространств текста.
2. Фундаментальная категория дискретности в рецептивном пространстве актуализируется посредством членимости, и если членимость есть производная аналитической деятельности с объектом, то дискретность относится к его онтологическим свойствам (на уровне процессов формообразования объекта).
3. В процессе дискретизации семантического пространства текста используются аналитическая и синтетическая стратегии членения семантического пространства текста, при этом выбор стратегии дискретизации семантического пространства текста связан с аналитической или синтетической деятельностью мышления.
4. Единицы физического пространства текста оказывают влияние на членение семантического пространства текста. Дискретизация семантического пространства текста производится на трех уровнях представления текста: самого текста как семантического образования; вида деятельности (аналитической / синтетической / смешанной стратегий членения семантического пространства текста); соответствия с членением физического пространства текста.
5. Категории дискретности и континуальности могут рассматриваться через категорию связности, при этом все типы семантических связей между словами текста можно условно разделить на два типа: связи, которые образуются в зависимости от расстояния между словами текста, то есть с опорой на физическое пространство текста, и связи, для которых данный фактор является нерелевантным.
6. Абзацное членение является оптимальным для организации как физического, так и семантического пространств текста поскольку количественное распределение абзацев в качестве единиц членения физического пространства текста, а также распределение единиц семантического пространства текста относительно абзацного членения подчинены универсальному закону формообразования (золотому сечению).
7. Количественное распределение наиболее частотных показателей основных единиц физического пространства текста (предложений и абзацев) в разных текстах происходит по одним и тем же сценариям, что свидетельствует о фрактальности модели распределения данных единиц текста.
Апробация работы. Основные результаты исследования излагались на IV Международной научной конференции «Слово, высказывание, текст в когнитивном, прагматическом и культурологическом аспектах» (Челябинск, 25 – 26 апреля 2008 г.); Международной научно-практической конференции «Филологические чтения» (Оренбург, 7 октября 2009 г.); Всероссийской научно-практической конференции «Лингвометодические и культурологические проблемы обучения иностранным языкам в вузе» (Уфа, 17 апреля 2010 г.); Всероссийской научно-практической конференции «Многопрофильный университет как региональный центр образования и науки» (Оренбург, 20 – 22 мая 2009 г.); V Международной научной конференции «Слово, высказывание, текст в когнитивном, прагматическом и культурологическом аспектах» (Челябинск, 26 – 27 апреля 2010 г.); Всероссийской научно-практической конференции «Филологические чтения» (Оренбург, 29-30 октября 2010 г.); VIII Международной научно-практической конференции «Наука и современность – 2011» (Новосибирск, 1 февраля 2011 г.); Всероссийской научно-методической конференции «Лингвометодические и культурологические проблемы обучения языковой коммуникации» (Уфа, 20-21 апреля 2011 г.).
Основные положения и выводы исследования отражены в 15 публикациях. Диссертационное исследование обсуждалось на заседании кафедры английской филологии и методики преподавания английского языка Оренбургского государственного университета. Результаты работы обсуждались на аспирантских семинарах в рамках Лаборатории филологического моделирования и проектирования ГОУ ОГУ (2008 2010 гг.).
Логика изложения результатов исследования, его цели и задачи, а также характер объекта и предмета изучения определили структуру работы. Диссертационная работа состоит из введения, трех глав, заключения, библиографического списка, который включает 205 наименований. В тексте 24 рисунка, 19 таблиц.
Понятие дискретности в лингвистике текста
В последние годы внимание исследователей текста привлекают не столько формальные признаки текста, сколько его сущностные характеристики и свойства. В связи с расхождением в подходах к пониманию текста разными учеными выделяются различные категории текста. Согласно определению Т.В. Матвеевой текстовая категория - это такой признак, который свойствен всем текстам и без которого не может существовать ни один текст, то есть это типологический признак [Матвеева 1990:10]. Текст не моделируется одной текстовой категорией, но всегда их совокупностью [там же: 13]. Таким образом, текст может рассматриваться как совокупность определенным образом соотнесенных текстовых категорий. По мнению З.Я. Тураевой категории текста отражают его наиболее общие и существенные признаки и представляют собой ступеньки в познании его онтологических, гносеологических и структурных признаков [Тураева 1986: 80].
В работе И.Р. Гальперина «Текст как объект лингвистического исследования», с которой берет свое начало идея о категориях текста, описаны такие его категории как информативность, модальность, когезия (внутритекстовые связи), интеграция, завершенность, ретроспекция и проспекция. Некоторые из перечисленных категорий, такие как связность, единство и цельность выделяет А.А. Леонтьев [Леонтьев 1979].
В настоящее время список категорий текста продолжает уточняться и упорядочиваться. Среди исследователей нет единства как в определении сущности текстовых категорий и единиц, так и в подходе к их классификации. Тем не менее, можно отметить некоторое сближение точек зрения в вопросах, касающихся деления этих категорий на содержательные и структурные [Николаева 1978; Гальперин 1981; Каменская 1990 и др.].
Категории цельности и связность называют большинство исследователей [Гальперин 1981; Каменская 1990; Леонтьев 1979; Лосева 1980; Москаль- ская 1981; Солганик 2007; Филиппов 1983 и др.], при этом они признаются основными характеристиками лингвистики текста: «Цельность и связность - это системные свойства речевых произведений, они лежат в самой основе выделения лингвистики текста в самостоятельную научную дисциплину» [Филиппов 1983: 135].
Это объясняется тем, что текст как объект лингвистического исследования представляется, прежде всего, как информационное и структурное единство, как функционально завершенное речевое целое. Так, например, согласно Лингвистическому энциклопедическому словарю текст — это «...объединенная смысловой связью последовательность языковых единиц, основными свойствами которой являются связность и целостность» [ЛЭС 2002: 348]. Цельность и связность отражают содержательную и структурную сущность текста. В то же время нет единого мнения по поводу определения цельности.
Цельность, как психолингвистическая категория, находится в центре внимания исследователей текста [Сахарный 1994; Сорокин 1982; Солодянки- на 2004 и др.]. По мнению Л.В. Сахарного «Понятие цельности как феномена, связанного с речемыслительной деятельностью человека, не может быть строго операционально сформулировано в рамках современной лингвистики, привыкшей работать с дискретными элементами плана содержания и логическими структурами их комбинирования и преобразования. Цельность — это психолингвистический феномен особого рода, который представляет собой возникающее в психике человека симультанное (одновременное) интегральное, полностью не осознаваемое динамическое представление о некотором объекте» [Сахарный 1994: 20].
Автор утверждает, что цельность «может быть представлена в виде древовидной иерархии смысловых компонентов текста (субцельностей). Между такими субцельностями устанавливаются тема-рематические отношения, где цельность более высокого порядка является темой для цельности более низкого порядка» [Сахарный 1998: 7].
Согласно концепции Л.Н. Мурзина «признание цельности текста влечет за собой признание его непрерывности. Если текст целен, то его детали и части сливаются в одно непрерывное целое. Но вместе с тем текст — структурное, то есть расчлененное целое. Цельность текста опирается одновременно на два логически исключающих друг друга основания - непрерывность и дискретность» [Мурзин 1991: 14].
Ю.А. Сорокин пишет: «С психолингвистической точки зрения текст есть нечто целостное (цельное), есть некий концепт, то ментальное образование, которое в лингвистической литературе именуется цельностью текста [Сорокин 82: 62]. Из приведенного высказывания А.Ю. Сорокина следует, что в качестве синонима к цельности можно использовать понятие целостности. Действительно, в некоторых работах посвященных исследованию текста, описывается целостность текста [Артемова 2002; Москальская 1981; Сазонова 2006], при этом ей приписываются те же свойства что и цельности.
Мысль о психолингвистической природе целостности выражена в работах, посвященных исследованию связности текста «Целостность является психолингвистической категорией, и поэтому ее невозможно определить лингвистическим путем» [Сазонова 2006: 29].
Целостность — результат воплощения в тексте авторского замысла (коммуникативного намерения), что в свою очередь есть отражение целеполагающего характера деятельности вообще. Цельность текста — это, прежде всего, единство тематическое, концептуальное, модальное. Очевидно, что категория целостности является наиболее общей, охватывающей другие текстовые категории (системности, персональное, модальности) и зависящей от них. Однако ее реализация зависит также и от категорий, которые можно включать, или не включать в ее состав (например, от категории дискретности и адресованности) [Артемова 2002: 28].
В других работах целостность отождествляется с широко понимаемой связностью, при этом к смысловой и структурной добавляется третий вид целостности - коммуникативная [Москальская 1981].
Связность - наличие средств межфразовой связи, и шире - структурированность текста в линейном плане, членение его на взаимосвязанные по содержанию и форме части. Связность признана лингвистической категорией текста [Леонтьев 1976; Милевская 2003; Тураева 1986; Halliday 1977; Theoret, Mareuil, 2001]. При этом исследователи, в частности, различают локальную и глобальную связность [Тураева 1986]. Локальная связность — это связность линейных последовательностей (высказываний, межфразовых единств). Глобальная связность - то, что обеспечивает единство текста как смыслового целого, его внутреннюю цельность [там же]. В некоторых работах термин «связность текста» выступает только как синоним термина «когезия», а терминологическим соответствием смысловой связности — когерентности является цельность (целостность), которая рассматривается как особая категория [Гальперин 1981; Леонтьев 2003; Милевская 2003].
По мнению Т.В. Милевской связность в её коммуникативнопрагматическом выражении — когезия — может быть квалифицирована как категория дискурса и текста, средства выражения которой, ориентированы на интеграцию элементов речевого потока, на создание континуума, реализующегося в структурно-семантической сопряжённости этих элементов, обеспечивающей последовательную и логическую цельность текста [Милевская 2003].
Из приведенных высказываний следует, что в контексте рассмотрения основных категорий текста часто используется антиномия дискретности и континуальности (континуума).
Понятие дискретности довольно часто используется в современной лингвистике текста [Белоусов 2006; Дымарский 2001; Корбут 2004; Коржне- ва 2003; Моисеева 2007; Москальчук 2003]. В исследованиях последних лет понятия дискретности и континуальности нашли отражение в теории сильных позиций: «...теория сильных позиций опирается в своих построениях на явление текстовой дискретности — в самом понятии позиции заложено выделение (вычленение) языкового элемента из последовательности. В позиционном анализе, ориентирующемся на структурирование целостности текста, действие текстовой дискретности уравновешивается континуальностью благодаря введению ряда более протяженных по сравнению с позицией конструкций: позиционного интервала и позиционной зоны» [Белоусов 2006: 32].
Дискретность текста рассматривается в контексте порождения и восприятия текста: «...на всем протяжении процесса создания текста сохраняет актуальность соотношение целостность / дискретность — как 1) применительно к частным семантическим прообразам смысловых зон (каждому из которых предстоит воплотиться в концептуально значимом смысле), так и 2) применительно к способу синтаксического представления смысла» [Дымар- ский 2001: 202].
Дискретизация семантического пространства текста на уровне ключевых слов
Одним из заданий, выполняемых информантами в рамках эксперимента, было определение ключевых слов. Ключевые слова рассматривались в работах многих лингвистов [Лукин 1999; Мурзин; Штерн 1991; Новиков 1983; Сахарный 1989 и др.], в которых ключевые слова определялись как «смысловые вехи» или «опорные пункты» в понимании текста [Штерн 1991: 73].
Полагаем, что при выделении «смысловых вех текста» информанты членят семантическое пространство текста на отдельные семантические блоки, границей которых являются ключевые слова. При этом Расстояние между ключевыми словами является показателем размеров этих смысловых блоков. Кроме того, сами ключевые слова могут рассматриваться в качестве дискретизированных составляющих семантического пространства текста, так как в ходе эксперимента информанты выделяют, а значит, отделяют данные слова от остальной части текста. Информанты в процессе выделения ключевых слов определяют количество значимых, по их мнению, смыслов текста и тем самым членят его семантическое пространство.
Совокупность всех ключевых слов, выделенных информантами в каждом тексте может рассматриваться как отдельный семантический блок, содержащий его основную информацию (напомним, что задание в эксперименте формулировалось следующим образом: прочитайте текст и подчеркните в нем ключевые слова — слова, наиболее значимые для его понимания).
В процессе выявления ключевых слов информанты отделяли значимую часть семантического пространства от незначимой, дискретизируя тем самым все семантическое пространство текста. В результате выделения ключевых слов семантическое пространство текста представлено двумя частями: совокупностью ключевых слов, содержащих основную информацию текста, и остальными словами текста, которые не определяются в качестве ключевых. Представляется возможным рассмотрение особенностей дискретизации семантического пространства текста в следующих аспектах:
1) членение семантического пространства на две части: значимую для его понимания и незначимую;
2) членение семантического пространства на смысловые блоки, границей которых являются ключевые слова.
В аспекте рассмотрения членения семантического пространства с помощью ключевых слов на значимую и незначимую части представляется актуальным определение размеров данных частей текста. Для того, чтобы рассмотреть особенности дискретизации семантического пространства в данном аспекте, для каждого текста были установлены следующие параметры:
1) среднее количество выделенных ключевых слов;
2) его размер;
3) среднее количество слов, не обозначенных в качестве ключевых слов;
4) доля среднего количества ключевых слов относительно размера текста.
Эти параметры представлены в таблице 5.
В первом столбце таблицы расположены тексты в порядке увеличения их размера; во втором столбце — размер текста (в словах); в третьем - среднее количество ключевых слов для каждого текста (сумма ключевых слов в каждой реакции делилась на количество реакций); в четвертом - среднее количество слов, не входящих в состав ключевых (данный показатель определялся разностью между размером текста и средним количеством ключевых слов); в пятом столбце - доля среднего количества ключевых слов (отношение среднего количества ключевых слов к размеру текста).
Анализ данных таблицы 5 позволяет установить следующую закономерность выявления ключевых слов: количество слов, выделяемых информантами в тексте, всегда меньше слов, не входящих в их состав. Следовательно, при определении ключевых слов семантическое пространство текста делится на две неравные части, при этом основную информацию текста содержит часть, размер которой составляет не более 37% от размера всего текста.
Показательным является то, что доля среднего количества ключевых слов, а, следовательно, количественная составляющая наиболее воспринимаемой части семантического пространства текста, меняется в зависимости от размера текста. Динамика изменения доли среднего количества ключевых слов относительно размера текста представлена на рисунке 9.
Линия тренда на рисунке 9 носит явную нисходящую направленность, что свидетельствует о наличии следующей тенденции: чем больше текст, тем меньше в нем доля ключевых слов. Увеличение размера текста означает возрастание вариативности в выборе ключевых слов, однако, возможность расширения списка ключевых слов информантами не используется, что предполагает наличие некоторых границ в восприятии наиболее значимой информации.
График на рисунке 9 позволяет проследить еще одну особенность в распределении доли ключевых слов относительно размера текста. На рисунке видно, что размер текста «Идущие» (54 словоформы) не является наименьшим. Тем не менее, именно в тексте «Идущие» наблюдается максимальная доля ключевых слов (см. таблицу 5). Полагаем, что данное явление объясняется тем, что среди обозначенных текстов именно в тексте «Идущие» содержится наибольшее количество повторов (в тексте «Идущие» их 18, «Осень, ночь, пустота» — 4, «Лето» — 2, «Одни несчастные сострадательны» — 10). Та же тенденция (см. рисунок 9) наблюдается и при распределении доли ключевых слов в текстах «Аплодисменты» (88 повторов) и «Как хороши, как свежи были розы...» (158 повторов), что может свидетельствовать о том, что в состав ключевых слов входят повторы.
Итак, в процессе выявления ключевых слов размер текста компенсируется количеством повторов. Из вышесказанного следует, что количество повторов является релевантным параметром при дискретизации семантического пространства текста с помощью ключевых слов (чем больше повторов, тем больше среднее количество ключевых слов).
Повторы традиционно признаются проявлениями категории симметрии [Белоусов 20056; Корбут 1994; 2005; Моисеева 2007; Москальчук 1998; Пономаренко 2006; Hrebicek 2002]. Подобным образом выявляются элементы симметрии в членении физического и синтаксического пространств текста [Моисеева 2007], следовательно, на процесс выделения ключевых слов, который в нашем исследовании рассматривается как проявление категории дискретности, оказывает влияние категория симметрии.
В ходе рассмотрения особенностей выявления ключевых слов в контексте дискретизации текста на значимую и незначимую для восприятия части, были выявлены следующие закономерности:
1) наиболее значимая для восприятия информация содержится не более чем в 40% текста;
2) чем больше текст по размеру, тем меньше в нем доля ключевых слов, а, следовательно, и доля наиболее информативной его части;
3) на дискретизацию семантического пространства текста в процессе выявления ключевых слов оказывает влияние категория симметрии. В контексте рассмотрения ключевых слов в качестве границ смысловых блоков представляется актуальным проследить зависимость размеров смысловых блоков, на которое членится семантическое пространство текста при помощи ключевых слов от размера текста. Для этого было установлено среднее расстояние между ключевыми словами для каждого текста (подсчитано среднее расстояние между ключевыми словами в каждой реакции и определено среднее значение для всех реакций). Динамика распределения параметра «среднее расстояние между ключевыми словами» в зависимости от размера текста представлена на рисунке 10.
Линия тренда графика на рисунке 10 имеет восходящую направленность, что свидетельствует об общей тенденции к возрастанию расстояния между ключевыми словами при увеличении размера текста.
Тем не менее, на графике наблюдаются некоторые исключения из общей закономерности. Например, среднее расстояние между ключевыми словами в тексте «Марсельеза» (771 слов) намного меньше, чем в тексте «Третий класс» (661 слов) при довольно значительной разнице в размере текстов.
То же явление наблюдается и при сравнении других пар текстов, например, «Русь» (224 слов) и «Сила таланта» (257 слов), «Ботик» (397 слов) и «Безумие» (453 слова) и др.
Дискретизация физического пространства текста в процессе развертывания текста на уровне предложений
По мнению О.И. Москальской, существуют определенные закономерности расположения предложений в тексте, варьирование же происходит только в рамках этих закономерностей [Москальская 1981: 145]. Автор использует понятие позиции предложения в тексте, при этом О.И. Москальская отмечает, что это понятие реляционное, так как речь идет о месте предложения по отношению к соседним предложениям в тексте и по отношению ко всему составу текста [там же]. Полагаем, что в рамках нашего исследования актуальным является определение позиций в тексте предложений, дифференцированных по количественному признаку (по размеру), так как локализация в тексте предложений определенной длины может свидетельствовать о распределении проявлений категорий дискретности и континуальности в тексте. Локализация предложений в тексте потребовала проведения исследовательской программы, состоящей из нескольких этапов:
1) в каждом тексте подсчитываются размеры всех предложений в словах, значения размеров фиксируются в порядке следования предложений. Например, в тексте «Станционный смотритель» динамика распределения размеров предложений следующая: 10-22-16-17 — 4-19-10-4-...-18.
2) по оси ОХ отмечается локализация предложения в тексте, которая определяется величиной относительной протяженности предложения и его относительных границ в тексте. Для этого необходимо найти абсолютные значения расположения границ предложения в тексте. Например, в тексте «Станционный смотритель» первое предложение состоит из 10 слов, второе — из 22 слов, следовательно, первое предложение заканчивается на десятом слове, а второе начинается на одиннадцатом, при этом заканчивается оно на тридцать втором слове включительно. После того, как получены все абсолютные значения расположения границ предложений в тексте, они переводятся в относительные величины. Для этого каждый компонент цепи значений делится на максимальное значение, совпадающее с размером всего текста (3442 слова). Например, правая граница первого предложения будет равна 10 / 3442 = 0,1613, правая граница второго - 22 / 3442 = 0,3548 и т. д.;
3) по оси OY откладывается относительный размер каждого предложения, то есть рассчитывается доля каждого предложения относительно самого длинного предложения в тексте, величина которого принимается равной 1. Чтобы рассчитать долю каждого предложения относительно самого длинного, количество слов в каждом предложении делится на максимальное значение размера предложения в анализируемом тексте. В тексте «Станционный смотритель» максимальный размер предложения равен 62, следовательно, относительный размер первого предложения равен 10 /.62 = 0,61, второго —22 v / 62 = 0,35 и т.д.;
4) каждому участку по оси OY (от 0 до 1), соответствующему тому или иному предложению, присваивается значение размера данного предложения. Например, каждой координате первого предложения, занимающего расстояние от 0 до 0,1613, ставится в соответствие значение, равное 0,61;
5) определяется среднее значение размера предложений для всего текста. Данный показатель высчитывается следующим образом: сумма всех значений размера предложений (в относительных величинах) делится на количество предложений. Для текста «Станционный смотритель» средний размер предложений равен 55,52 / 312 = 0,178.
Описанный выше алгоритм был заложен в программное средство АРСТ (Анализатор ритмической структуры текста).
На рисунке 19 представлена динамика распределения размеров предложения в рассказе «Станционный смотритель».
График на рисунке 19 позволяет проследить динамику распределения предложений разного размера в тексте.
На рисунке видно, что существует общая тенденция чередования кон- тинуализации (увеличение размеров предложений) и дискретизации (уменьшение размеров предложения), при этом среднее значение размера предложений является маркером границы проявлений дискретности и континуальности в тексте. Так, все значения размера, находящиеся ниже линии среднего значения, считаются проявлением дискретизации физического пространства текста, все значения, находящие выше этой линии — континуализации.
Данный график отражает общую тенденцию превалирования проявлений категории континуальности над категорией дискретности. Происходит это, главным образом, за счет «сохранения» размера в нескольких следующих друг за другом предложениях.
В распределении предложений разной длины в тексте обращает на себя внимание тот факт, что начало текста представлено предложениями, свидетельствующими о континуализации физического пространства текста.
Данная тенденция отмечена во всех 6 текстах цикла. Кроме того, во всех исследуемых текстах начальная часть графика является областью проявления сверхдлинных предложений. Участком текста, где в наибольшей степени отмечена тенденция к континуализации, является середина текста. Во второй половине текста (во всех текстах цикла) отмечено превалирование проявлений дискретности над континуальностью. Еще одним фактом, на наш взгляд, заслуживающим внимания, является то, что заключительная часть всех текстов характеризуется высокой долей дискретности физического пространства текста. Следует отметить, что в трех текстах («От издателя», «Станционный смотритель», «Выстрел») размер последних предложений превышает среднее значение, тем не менее, данные превышения являются незначительными и проявляются на уровне 1—4 предложений.
Итак, локализация предложений разного размера в тексте позволяет сделать следующие выводы о процессе дискретизации физического пространства текста на уровне размера предложений:
1) структура физического пространства на уровне распределения предложений разного размера является неоднородной и представляет собой пор- ционированное чередование проявлений дискретности и континуальности;
2) общее распределение предложений относительно протяженности текста характеризуется превалированием проявлений континуальности физического пространства текста над дискретностью;
3) начало текста характеризуется тенденцией к континуализации физического пространства текста;
4) наибольшая степень проявлений категории дискретности физического пространства текста приходится на его вторую половину (в частности, на конец текста).
Напомним, что динамика ритма дискретности и континуальности семантического пространства текста подчиняется несколько иному сценарию: начало текста также характеризуется высоким показателем проявлений категории континуальности, однако в середине текста отмечена тенденция к дискретизации текста. Тем не менее, в заключительной части текста снова присутствует тенденция к континуализации. Подобная динамика в распределении единиц семантического и физического пространств текста свидетельствует о некотором расхождении в организации ритма дискретности и континуальности семантического и физического пространств текста.
Распределение единиц семантического пространства текста относительно единиц физического пространства
Итак, нами рассмотрены основные закономерности распределения единиц физического пространства текста. Полагаем значимым при исследовании механизмов дискретизации структуры текста соотнести единицы членения физического и семантического текстовых пространств. Рассмотрение взаимодействия компонентов членения семантического и физического пространства возможно с помощью методики выделения и локализации единиц семантического пространства текста ( то есть без обращения к информантам).
Для того, чтобы проследить распределение компонентов семантического пространства текста в зависимости от абзацного членения, было проведено комплексное исследование, включающее в себя несколько программ.
За единицу членения физического пространства текста был принят абзац, что обусловлено тем, что в ряде работ абзацное членение признано одним из основных способов делимитации текста [Валгина 2003; Гальперин 1981; Ильенко 2003; Саланина 2005; Сильман 1967, 1985]. Исследовательская программа по определению единицы семантического пространства текста состояла из нескольких этапов. На первом этапе при помощи метода контентанализа был сгенерирован частотный словарь художественного текста.
Контент-анализ является одним из методов качественноколичественного изучения содержания текстов [Andren 1981; Holsti 1968; Krippendorf 1980; Markoff, Shapiro Weitman 1974]. Он позволяет анализировать смысловое содержание текста с использованием исчерпывающего количества слов. В процессе контент-анализа происходит реконструкция семантической структуры текста на основе частотности словаря анализируемого текста.
Контент-анализ помогает исследователю выявлять содержание в источнике коммуникации (книгах, статьях, кинофильмах), экспериментировать с содержанием и рассматривать его с использованием методов, отличных от обычного прочтения книги или просмотра телевизионной программы, а также обнаружить те аспекты содержания текста, которые не очевидны на поверхности [Ньюман 1998: 120].
Метод контент-анализа используется, главным образом, в социологических исследованиях [Барсамов 2006; Ньюман 1998; Юрлова 2008], однако с недавнего времени он находит применение в исследованиях, проводимых в рамках литературоведения [Баевский 2001; Зелянская 2008], в прикладных филологических работах — в области нейминга (создание марочного имени) и в работах по реконструкции медиа-портретов политиков и политических организаций [Белоусов, Зелянская 2005, 2008].
Процедура исследования текста при помощи метода контент-анализа может осуществляться с использованием компьютерных технологий (в частности, в нашем исследовании применялась широко известная программа контент-анализа А.Н. Чуракова). В автоматизированном режиме метод контентанализа реализуется следующим образом: с помощью компьютерной программы Контент-анализ обрабатывается весь массив текста. В результате образуется список, состоящий из всех лексем текста, где одинаковые словоформы объединены в группы, и определено их количество. То есть первый этап исследования представляет собой механический подсчет всех словоформ текста.
Как отмечает Л. Ньюман, контент-анализ вскрывает содержание текста, но не способен интерпретировать значение этого содержания, и поэтому исследователь должен изучать текст непосредственно [Ньюман 1998: 121]. Данная специфика определяет следующий этап исследования.
На втором этапе производится качественная обработка полученных данных, а именно: происходит формирование семантических полей с учетом реализовавшихся в тексте значений каждого слова. По мнению Н.Л. Зелян- ской, именно «специфика контекстуальной реализации значения дает возможность обнаружить тот интегральный признак, который объединяет различные лексемы текста в смысловые общности, отражающие актуальные для анализируемого произведения семантические тенденции» [Зелянская 2008:86].
Рассмотрим, как реализуется этап обработки полученных данных на примере контекстов повести «Станционный смотритель». В результате контент-анализа мы получили 4 лексемы с семантикой брат, объединенных по формальному признаку. После обращения к тексту мы отнесли их к разным семантическим группам (полям), поскольку в повести они встречаются в разных по смысловым интенциям контекстах. Так, в предложении «Наконец представлено возвращение его к отцу; добрый старик в том же колпаке и шлафорке выбегает к нему навстречу: блудный сын стоит на коленах; в перспективе повар убивает упитанного тельца, и старший брат вопрошает слуг о причине таковой радости» лексема брат реализует семантику, связанную с категориями родства, семьи. В остальных 3 случаях употребления лексемы брат реализуется иное семантическое значение данной лексемы — форма дружеского ли фамильярного обращения к кому-либо [Словарь современного... 1950 Т 1: 608]: «Минский вышел сам к нему в халате, в красной скуфье. «Что, брат, тебе надобно?» — спросил он его». При этом одно и то же слово может одновременно отражать несколько смысловых значений. Например, в предложении «Мне стало жаль моей напрасной поездки и семи рублей, издержанных даром» лексема «поездка», репрезентирующая поле События внешней жизни, может быть также отнесена к полю Передвижения в пространстве. Далее сформированные семантические группы (поля) по общим основаниям были объединены в более крупные семантические образования (макрополя), репрезентирующие обобщенные смысловые тенденции произведения. В результате были созданы следующие макрополя текста: Люди, Человек, Действия, Характеристики, Отношения, События, Состояния, Духовное, Вещи, Время, Пространство, Природа, Количество. Таким образом, образовалась двухуровневая иерархия семантического пространства текста. Например, макрополе Природа сформировано полями Растения, Животные, Стихии, Природные явления, макрополе Люди состоит из следующих полей:
Имена героев, Семья, Представители профессий, Личное пространство героев, Объединённое пространство героев, Представители сословий и т.п. (см. таблицу 19). Всего было выделено 13 макрополей, состоящих в общей сложности из 118 полей. Таким образом, всё семантическое пространство текста было дискретизировано на смысловые блоки (поля), которые были приняты за компоненты семантического пространства текста.
Итак, определена единица семантического пространства текста - поле. В отличие от абзаца, который является оформленной единицей членения текста, имеющей свою структуру, маркеры начала и конца (абзац всегда омар- кирован красными строками), поле представляет собой совокупность слов, объединенных на основании семантической общности. Семантическое поле — это семантическое образование, актуализированное суммой значений лексем текста определенной тематики, не имеющее выраженных границ. Следовательно, представляется более целесообразным называть семантическое поле единицей протяженности семантического пространства текста. Тем не менее, как и любую единицу, поле можно выделить из общего континуума семантического пространства текста и установить количественное распределение полей в составе текста. Следовательно, смысловое поле может быть сопоставлено с единицами членения физического пространства текста.
Анализ распределения семантических полей относительно единиц физического пространства текста осуществлялся при помощи программного средства «Автоматизированный анализ смысловой структуры текста»1. Данное программное средство позволяет при помощи созданной системы полей идентифицировать смысловые поля в любом отрывке текста. При помощи этой программы можно определить качественно-количественное распределение полей в определённом фрагменте текста, то есть качественное и количественное семантическое наполнение каждого абзаца. Программа осуществляет анализ с помощью исходного текста, представленного в виде текстового документа, и базы данных, представленной Excel-таблицами (базы данных состоят из фиксированного количества смысловых полей, в которые отнесены слова исследуемого текста). В процессе анализа осуществляются следующие действия:
1) исходный текст сегментируется на фрагменты определенного размера. Размер фрагментов текста определяется в словах. Количество слов задает сам исследователь, то есть сегментация текста на участки происходит после того, как исследователь определил размер сегментируемого фрагмента. В нашем случае текст сегментируется на абзацы (соблюдается авторское членение);
2) на выделенных участках устанавливается наличие всех смысловых полей текста (программа последовательно перебирает и сверяет с базой данных слова каждого участка текста);
3) промежуточные представления наглядно преобразуются в виде таблицы.