Содержание к диссертации
Введение
ГЛАВА 1. «Сказание о Мамаевом побоище» как вариативный текст и объект исследования
1.1 Вариативный текст как объект исследования 25
1.2 Текстология «Сказания о Мамаевом побоище» 28
1.3 Принципы отбора текстов для исследования 36
1.4 Списки «Сказания о Мамаевом побоище», выбранные для исследования в настоящей работе 38
1.5 Текстологическое и палеографическое описание исследуемых списков «Сказания о Мамаевом побоище» 41
1.6 Методика обработки списков «Сказания о Мамаевом побоище» для лексико статистического анализа 50
1.6.1 Правила компьютерного набора списков «Сказания о Мамаевом побоище» 50
1.6.2 Методика формирования частотных словарей списков «Сказания о Мамаевом побоище» 1.7 Основные количественные характеристики частотных словарей списков «Сказания о Мамаевом побоище» 64
1.8 Заключение 67
1.9 Выводы 68
ГЛАВА 2. Моделирование структуры текста как поликомпонентного объекта
2.1 Моделирование статистической структуры поликомпонентных объектов
2.2 Концепции описания структуры поликомпонентных объектов 88
2.2.1 Принцип максимума диссимметрии М.В.Арапова-Ю.А.Шрейдера 89
2.2.2 Исправление эффекта рангового искажения по В.П.Маслову 96
2.2.3 Ценологический подход Б.И.Кудрина 97
2.2.4 «Ядро» и «периферия» в подходе Г.Я.Мартыненко 109
2.2.5 Рангово-энтропийный подход и информационный язык RHA Т.Г.Петрова 116
2.2.6 Структурно-топологическая динамика В.В.Фуфаева и модель изменения словаря во времени М.В.Арапова-М.М.Херц 124
2.2.7 Точка h Хирша и геометрическая модель в исследованиях И.-И.Попеску, Я.Машутека и
Г.Альтманна 135
2.3 Сопоставление рассматриваемых методик с помощью набора концептуально значимых
признаков 139
2.4 Заключение 155
2.5 Выводы 158
ГЛАВА 3. Лексико-статистическая структура списков «Сказания о Мамаевом побоище» 160
3.1 Анализ частотных словарей «Сказания о Мамаевом побоище» в рамках разных подходов
3.1.1 Анализ ЧС «Сказания о Мамаевом побоище» с применением методики В.П.Маслова 161
3.1.2 Анализ ЧС «Сказания о Мамаевом побоище» с применением методик Б.И.Кудрина 165
3.1.3 Анализ ЧС «Сказания о Мамаевом побоище» с применением скользящего коэффициента вариации по Г.Я.Мартыненко 168
3.1.4 Анализ ЧС «Сказания о Мамаевом побоище» с применением рангово-энтропийного подхода Т.Г.Петрова 173
3.1.5 Анализ ЧС «Сказания о Мамаевом побоище» с применением структурно-топологической динамики В.В.Фуфаева 177
3.1.6 Анализ ЧС «Сказания о Мамаевом побоище» с применением точки h Хирша (по методике
И.-И.Попеску, Я.Машутека и Г.Альтманна) 195
3.2 Заключение 196
3.3 Выводы 196
ГЛАВА 4. Многомодельное представление лексико-статистической структуры «Сказания о Мамаевом побоище» как вариативного текста 200
4.1 Проблемы сопоставимости результатов, полученных с применением разных подходов 201
4.2 Сопоставление значений пойнтер-точки R, границ монотонности скользящего коэффициента вариации и точки h 203
4.3 Сопоставление групп списков с применением индекса Я/С и диаграммы НА 212
4.4 Сопоставление групп списков, полученных с помощью диаграммы НА и долей ноевой и саранчёвой каст 213
4.5 Ранговый состав стабильной зоны S-распределения и устойчивость лексики разных ранговых групп 214
4.6 Количественные особенности характера сокращения текста 228
4.7 Заключение 234
4.8 Выводы 234
Заключение 236
Список сокращений и условных обозначений 242
Список литературы 243
Список иллюстративного материала 259
Список приложений 262
Пояснительная записка к приложениям диссертации 264
- Списки «Сказания о Мамаевом побоище», выбранные для исследования в настоящей работе
- Правила компьютерного набора списков «Сказания о Мамаевом побоище»
- Рангово-энтропийный подход и информационный язык RHA Т.Г.Петрова
- Анализ ЧС «Сказания о Мамаевом побоище» с применением скользящего коэффициента вариации по Г.Я.Мартыненко
Списки «Сказания о Мамаевом побоище», выбранные для исследования в настоящей работе
Многочисленность дошедших до нашего времени списков «Сказания» свидетельствует о большом интересе к этому памятнику у средневекового читателя. На протяжении нескольких веков это произведение жило активной жизнью: новые редакции и обработки появлялись с момента создания в первой четверти XV века и до включения в XVII веке в состав Киевского синопсиса 1674 года1, существуют списки «Сказания», датируемые XIX веком.
«Сказание о Мамаевом побоище» – не единственный памятник, посвященный победе русских князей в Куликовской битве. Совокупность этих памятников принято в настоящее время называть Куликовским циклом. Кроме «Сказания» в него входят «Задонщина», краткая и пространная летописные повести. К Куликовскому циклу примыкают «Житие Сергия Радонежского» и «Слово о житии и о преставлении великого князя Дмитрия Ивановича». Все эти памятники интенсивно переписывались, но характерной особенностью списков «Сказания» является наличие большого числа разночтений и вариантов в пределах одной и той же редакции2.
Попытка текстологического исследования «Сказания о Мамаевом побоище» была предпринята в начале XX в. С.К.Шамбинаго3, а в 1950-х годах Л.А.Дмитриев уточнил систематизацию Шамбинаго (С.К.Шамбинаго пришел к неверному выводу при определении палеографическое описание всех известных ему на тот момент списков «Сказания». При формировании коллекции текстов для исследования, опора осуществлялась на текстологические данные, содержащиеся в трудах Л.А.Дмитриева, наименования редакций также заимствованы у него. Характеристика редакций и обоснование их старшинства везде далее приводится в соответствии с работами Л.А.Дмитриева, лишь в случае необходимости сопровождаясь ссылками на другие источники. После Л.А.Дмитриева к изучению «Сказания» обращалась Н.С.Демкова1 и другие исследователи2, но на справедливость систематизации Л.А.Дмитриева их работы не повлияли. Итак, Л.А.Дмитриев обследовал 103 рукописи со списками «Сказания» и дал их палеографическое описание3.
Л.А.Дмитриев склонен считать, что «Сказание о Мамаевом побоище» было написано в первой четверти XV в., на основании следующих умозаключений: 1. В 1456 г. произошел разрыв союзнических отношений между Московским и Серпуховским княжеством. После того, как московский князь заключил в заточение князя серпуховского, автор «Сказания» не мог бы усиленно подчеркивать любовь и дружбу между московским и серпуховским князьями. 2. В «Сказании» ни разу не назван митрополит Алексей среди святых, помогавших Дмитрию в его борьбе с Мамаем. Это указывает на то, что «Сказание» было написано до канонизации митрополита Алексея, т.е., до 1431 г. 3. Упоминание в «Сказании» имен гостей-сурожан, часть из которых восстанавливается по различным историческим документам как лица, действительно жившие в то время и которых несовременник знать не мог, свидетельствует о том, что памятник был написан вскоре после Куликовской битвы.
Повести о Куликовской битве. С.481509. 4. То, что в «Сказании» Ольгерд и митрополит Киприан представлены как участники событий 1380 г., не ошибка автора, а эвфемизм. Заменить из политических соображений имя действительного союзника Мамая Ягайла именем умершего к тому времени литовского князя Ольгерда автор «Сказания» мог только при жизни Ягайла (Ягайло умер в 1434 г.). В то же время, включение в число участников событий митрополита Киприана едва ли могло иметь место до его смерти (1406 г.), т.к. при жизни Киприана говорить о том, что он находился в Москве, было неудобно. Для Киприана это явилось бы напоминанием об одном из самых неприятных моментов в его деятельности на Руси, поскольку в 1380 г. он находился в Киеве, куда был изгнан из Москвы в 1378 г. великим князем Дмитрием Ивановичем (был возвращен в 1390 г. при княжении сына Дмитрия князя Василия с тонким расчетом: у Киприана были очень дружественные отношения с литовскими князьями).
Л.А.Дмитриев выделяет следующие редакции и варианты внутри редакций, которые пока будут описаны безотносительно к тому, какие из списков рассматриваются в настоящей работе:
Основная редакция. Эта редакция может быть положена в основу всех остальных редакций «Сказания», текст редакции, по мнению Л.А.Дмитриева, наиболее близок к авторскому тексту. Многочисленные списки этой редакции разбиваются на несколько групп, отличающихся друг от друга изменениями неидейного характера1. а) Списки группы О. К этой группе относятся списки, в основу которых может быть положен список РНБ O.IV.22 XVI в., наиболее близкий к протографу (по мнению Л.А.Дмитриева)2. Но и в этом списке есть поздние изменения текста: например, небольшая вставка из пространной летописной повести явно вторичного характера и сокращения первоначального текста. б) Списки группы У. Списки этой группы близки к списку РГБ, собр. Ундольского, № 578. Они отличаются от списков группы О поздним характером
Дмитриев Л.А. Сказания и повести о Куликовской битве. С.334335. 31 окончания (сюжетное повторение в обратной последовательности пути великого князя и войска с поля боя на Москву, текстуально совпадающее с описанием движения войска из Москвы на Дон); поздний характер окончания в У виден из того, что в нем встречаются текстуальные повторения таких отрывков из рассказа о походе на поле битвы, которые никак не подходят к рассказу о возвращении войск с поля брани. Кроме того, в плаче великой княгини говорится, сколько русских было убито на Калке, решение о послании первой «сторожи» было принято на пиру у Микулы Васильевича и т.д.
Правила компьютерного набора списков «Сказания о Мамаевом побоище»
На первый взгляд сходны с идеями Ю.А.Шрейдера соображения, развиваемые математиком В.П.Масловым1, но В.П.Маслов принимает распределение Ципфа как данность, обращаясь для его обоснования, как и Б.И.Кудрин, к простым числам.
Для того, чтобы приблизить эмпирическое распределение к эталонному распределению (распределению Ципфа) В.П.Маслов рассчитывает, как функцию от ранга, параметр С из известной формулы Дж.Ципфа f x г = const, график изменения которого в случае идеального соответствия теоретического и эмпирического распределений должен образовывать прямую, параллельную оси абсцисс2. В.П.Масловым предложена следующая логарифмическая поправка к формуле Ципфа: С,. = гсо1. / log2 /;, где / - ранг, со - частота. Рассмотрение произведения ранга на частоту как функции от ранга содержательно полностью соответствует исследованию симметричности гиперболы относительно биссектрисы первого квадранта по Ю.А.Шрейдеру (см. анализ частотных словарей в 3.1.1).
Цель модели В.П.Маслова - приблизить моделирующее распределение к эмпирическим данным, убрав ранговое искажение.
Как пример устойчивости исследовательских рассуждений, внимания заслуживает характеристика, именуемая В.П.Масловым, как постфактор. Постфактор характеризует активность слова в определенной текстовой среде и вводится В.П.Масловым в качестве параметра в формулу Ципфа:
Маслов В.П. Закон «отсутствия предпочтения» и соответствующие распределения в частотной теории вероятностей // Математические заметки. 2006. Т. 80. Вып.2. С.220230. ; Маслов В.П., Маслова Т.В. О законе Ципфа и ранговых распределениях в лингвистике и семиотике // Математические заметки. 2006. Т. 80. Вып.5. С.718732.
Назначение постфактора – дать более точную аппроксимацию с использованием отраслевых корпусов. Полувеком ранее Н.Д.Андреевым был предложен коэффициент специфичности, основанный на учете представленности слова в микровыборках2. Г.Я.Мартыненко относит подобные показатели к мерам устойчивости, причисляя к ним, кроме коэффициента специфичности Н.Д.Андреева, «коэффициенты лексической устойчивости3, учитывающие и фактор частоты, и фактор распространенности»4.
Этот подход сложился в процессе практической деятельности его автора по проектированию электроснабжения цехов металлургических заводов и их. Как пишет сам Б.И.Кудрин, «основу моих исследований, ведущихся с 1971 г., … составил опыт проектирования и строительства крупных заводов и их хозяйств, цехов; отдельных комплексов, зданий, сооружений, сетей. … Практика индустриализации 50-60-х годов обозначила две проблемы: 1) необходимость представления объекта в целом для определения ресурсов сейчас и на
В сжатом виде его методологические установки изложены в статье «Мои семь отличий от Ципфа»2.
Во-первых, Б.И.Кудриным вводится новая терминология с целью создания единого междицисциплинарного унифицированного метаязыка (брат Б.И.Кудрина А.И.Кудрин – биолог, этим объясняется обилие биологических заимствований в терминологии Б.И.Кудрина. Центральное понятие теории Б.И.Кудрина – ценоз следует считать неологизмом Б.И.Кудрина (ср. в биологии и экологии – биоценозы, биогеоценозы, фитоценозы и т.д.).
Проиллюстрируем это на примере того, как переформулируются известные закономерности Дж.Ципфа в ценологическом описании: «Первый закон Ципфа утверждает, что произведение вероятности (r) обнаружения особи выделение полужирным шрифтом – Л.К. ui в тексте длиной Т (словарь которого объёмом V), и ранга частоты r даёт константу b. Ципф каждую особь относил к какому-либо виду, объединяя особи одного вида в группы (популяции). Наибольшей по численности популяции присваивается первый ранг r1=1, вероятность которой (1), и далее по убывающей (r) выстраивают все популяции, число которых оказывается равным количеству видов S: в первом “ранго-вероятностном” законе Ципфа речь идёт о вероятности: количеством особей) в группу k є K, называемую кастой1, и утверждает, что между значениями і=1, 2, … и частотой (вероятностью появления группы - касты) есть зависимость, отражаемая кривой (гиперболической), параметры которой сохраняются для всех без исключения текстов, созданных человеком. … Второй закон Ципфа, в нашей терминологии, есть видовое гиперболическое Н-распределение»2. Термин //-распределение для распределений гиперболического типа также введен Б.И.Кудриным (на наш взгляд, термин «гиперболическое Н-распределение» тавтологичен, хотя им пользуется сам автор термина)3, непонятна также и путаница терминов «частота» и «вероятность», поскольку Б.И.Кудрин имеет в виду эмпирическую частоту.
Рангово-энтропийный подход и информационный язык RHA Т.Г.Петрова
В этом разделе производится анализ ЧС «Сказания» в той форме, в какой они описаны в п. 1.6.1 по рассмотренным в главе 2 методикам без соотнесения результатов, получаемых в результате применения разных методик. Соотнесение результатов производится в главе 4.
В таблице 7 указано, какие типы словарей анализировались для каждого из методов («+» – ЧС указанного типа обрабатывался по соответствующей методике, «–» – не обрабатывался).
В том случае, когда анализ не производился для ЧС рукописных словоформ, в таблицах и обсуждениях соответствующего раздела под «словоформой» понимаются стандартизованные словоформы.
Так как выяснилось, что данные ЧС рукописных словоформ не информативны при исследовании смысловых особенностей редакций из-за длинного «хвоста» низкочастотных элементов и отсутствием (за редким исключением) полнозначной лексики в «голове» распределения, ЧС рукописных словоформ не обрабатывались по методике В.В.Фуфаева. По той же причине не исследовались ЧС рукописных и стандартизованных словоформ по В.П.Маслову.
В.П.Маслов предлагает две разные функции для аппроксимации головы и хвоста гиперболического распределения. Вводя логарифмическую поправку, он рассчитывает получить график распределения произведения ранга на частоту (С) в виде прямой, параллельной оси абсцисс1.
Для частотных словарей лексем «Сказания» были построены графики изменения параметра С без учета логарифмической поправки и с ее учетом. Для удобства представления графики построены для части частотного словаря с абсолютными частотами n5 (см. рисунок 14 и рисунки на листах Е.1–Е.4 в Приложении Е).
Как видно из рисунков Приложения Е, графики однотипны, но ни в одном из случаев не удается получить желаемого результата: до ранга со значением 50 о «параллельности» графика оси абсцисс не может быть и речи, а после 50-го ранга решение, как провести параллельную прямую, принимается с помощью экспертной оценки и, в силу этого, является предметом личностного знания.
Примечание r – ранг, F(r) – абсолютная частота слова с рангом r Рисунок 14 График изменения параметра С распределения Ципфа до (верхняя линия) и после (нижняя линия) исправления эффекта рангового искажения по В.П.Маслову для частотных словарей лексем сокращенного варианта «Сказания»
Можно условно считать, что исправленный по методике В.П.Маслова график укладывается в значительно более узкую, чем неисправленный, полосу, параллельную оси абсцисс, и, что примечательно, при самом поверхностном рассмотрении напоминает гиперболу.
В ранговом диапазоне 50 r 100 удается добиться постоянного значения С с помощью логарифмической поправки для списков Летописной, Киприановской редакции, редакции Синопсиса и компилятивного списка. Графики параметра С для ЧС Распространенной редакции и ее сокращенного варианта, наоборот, показывают сходное поведение на этом интервале: С убывает с увеличением ранга. График С для Основной редакции и ее беллетризованного варианта также сходны: на рассматриваемом интервале С изменяется скачкообразно.
Эти предварительные наблюдения за изменением или постоянством произведения ранга и частоты, соответствующей этому рангу, в ранговом диапазоне 50 r 100 позволяют предположить, что редактирование текста с целью его сквозного сокращения или сокращения за счет определенных эпизодов (в данном случае, религиозных) не меняет его частотную структуру в указанном ранговом диапазоне. Напротив, добавление фрагментов из иных редакций, превращение «однородного» текста в компилятивный оказывает влияние на частотную структуру. Этот вопрос требует дальнейшего прояснения. В таблице 8 приведены лексемы с рангами 60 r 80 и их абсолютные частоты для Распространенной редакции и сокращенного и компилятивного списков, которые также относятся к Распространенной редакции «Сказания» (см. таблицу 1 на с. 39).
Среди этих лексем обнаруживаются имена непосредственных фигурантов Куликовской битвы: князя Олега Рязанского и литовского князя Ольгерда, брата князя Дмитрия Владимира Андреевича, посла Захария (выделены полужирным в таблице 8), в сокращенном варианте упоминается Сергий Радонежский. В этот же ранговый диапазон попадают названия средневековых социальных институтов: бояре, земля, братия, полк, люди, посол, воевода, отец, сын, православный, а также ключевая для русского сознания лексика: вера, Божий, единый. Уже этот результат сам по себе важен и интересен, но воспроизводим частично: в других списках в интервал 50 r 100 попадают только антагонисты великого князя.
Анализ ЧС «Сказания о Мамаевом побоище» с применением скользящего коэффициента вариации по Г.Я.Мартыненко
В таблицах М.1М.3 Приложения М содержатся данные о динамике коэффициента вариации и его прироста для 24 эмпирических спектровых распределений, построенных по ЧС всех типов.
Все исследователи Н-распределений в настоящее время отмечают либо «бугорок» на гиперболическом распределении, либо «всплески и провалы» на графике спектровых распределений в области средних частот.
Приведенные в приложении М таблицы в этом отношении очень показательны: левая граница монотонности прироста скользящего коэффициента вариации совпадает с эмпирически установленной границей монотонного убывания количества классов с ростом n (их численности), т.е. с началом «выпячивания» кривой. Фрагмент таблицы М.2 Приложения М приведен в таблице 22.
Пойнтер-точка R и точка В равноценны как индикаторы, поскольку пойнтер-точка маркирует границу между высокочастотными значениями и остальными классами статистического ряда. Как было показано в 3.1.3 и всех рисунках приложения Ж, на графике прироста скользящего коэффициента вариации четко выделяются 3 зоны. Соотнесением позиции пойнтер-точки R и позиции точки B (Bсгл) на видовом распределении подтвержается, что эти параметры либо совпадают, либо очень близки.
Только для распределений Летописной редакции и Киприановской редакции расхождение между пойнтер-точкой R и точкой В больше 3% по ЧС рукописных словоформ и ЧС лексем. По данным ЧС стандартизованных словоформ значения точки В и пойнтер-точки R не близки для распределения Распространенной редакции.
Полученные результаты дают основания считать сопоставляемые методы равноценными в практической деятельности. При этом очевидно, что подходы обоих авторов типологически сходны: Г.Я.Мартыненко выделяет ядерную, периферическую и переходную зоны, Б.И.Кудрин – ноеву и саранчёвую касты и особую область между ними, с тем существенным отличием, что у первого зона состоит из нескольких элементов, у второго – ноева и саранчёвая касты единственны (каста уникальных видов и одноэлементная каста, формируемая видом с максимальной численностью), что вообще говоря, является условностью, т.к., скажем, каста видов, особи которых встречены дважды (трижды, четырежды и, может быть, и десять раз на фоне частот в тысячи, десятки и сотни тысяч особей), функционально тяготеет к ноевой, а с саранчёвой функционально сходны и несколько менее частотных каст.
Совмещение значений натуральнозначного аргумента, пойнтер-точки R (полужирный шрифт), левой (курсив и подчеркивание) и правой границ знакомононности прироста скользящего коэффициента вариации (подчеркивание) и точки h (белый шрифт на черном фоне) – по ЧС стандартизованных словоформ
В связи с этим актуализируется вопрос о формальной процедуре определения пойнтер-точки и абсолютизации значения этой точки. По таблицам Приложения М легко заметить, что пойнтер-точке, определяемой как первое значению аргумента с частотой 1, предшествует некоторое значение аргумента с частотой 2, 3, а до него – снова ряд классов уникального объема. В подобных случаях «двойки» и тройки нередко интерпретируют, как ошибки или случайность, и помещают пойнтер-точку ближе к средним частотам, что, собственно, и пытается делать Б.И.Кудрин в рабочем порядке, не пользуясь при этом никакими формальными критериями. Такой «сдвиг» можно объяснить требованиями теории Б.И. Кудрина, заключающимися в том, что до R не должно быть пропусков значений n, что, в общем, не выполняется на практике. Хорошее совпадение правой границы монотонности графика прироста скользящего коэффициента вариации ( = точка B) и пойнтер-точки R, определяемой как значение первого одноэлементного класса, можно считать подтверждением «правильности» именно последнего определения пойнтер-точки.
Здесь нужно отметить, что Б.И.Кудрин и Г.Я.Мартыненко по-разному осмысляют сами эмпирические данные. Для Б.И.Кудрина каждое распределение является уникальным, несмотря на то, что это эмпирическое распределение, оно является совершенным воплощением некоторой идеи, а Г.Я.Мартыненко, как на то указывает его практика расчетов, придерживается принципа, согласно которому существует некоторое совершенное распределение, которое, воплощаясь, получает некоторые искажения, и сглаживание должно их снять.
Теперь следует обратиться к качественному анализу лексических единиц, отграничиваемых пойнтер-точкой R и точкой B. Лексика, выделенная с помощью рассматриваемых параметров по ЧС словоформ (таблицы 23–24) весьма ожидаема: это союзы, местоимения и клише, а также коллокаты (титул великий князь).