Содержание к диссертации
ПРЕДИСЛОВИЕ 5
ВВЕДЕНИЕ '. 13
Общее 13
Представления предложения и правила перехода между ними (0.1). Принцип
минимальности (0.2). Направление правил перехода (0.3). О соотношении с
моделями «Смысл<^>Текст» (0.4). Редуцированный анализ при чтении корейского
текста (0.5).
Основные этапы изучения синтаксиса корейского языка (Обзор литературы) 20
Глава первая
ИЗУЧАЕМЫЕ ПРЕДСТАВЛЕНИЯ ПРЕДЛОЖЕНИЯ. ОБРАЗЦЫ 55
Общее (1.0). Образцы представлений (1.1). Первичное морфологическое представление (1.2). Линейная структура (1.3). Фрагменты (1.4). Замечание о скелетальности линейной структуры (1.5). Разные предложения — одна линейная структура (1.6). Получение линейных структур (1.7). Синтаксическая структура (1.8). Об интерпретации стрелок синтаксической зависимости (1.9). Получение синтаксических структур (1.10). Актантно-предикатная структура (1.11). Разные предложения — одна актаптная структура (1.12).
Глава вторая
ЛИНЕЙНЫЕ СТРУКТУРЫ 66
Первичное морфологическое представление текста 66
Общее (2.1). Буквенные символы (2.2). Разделители (2.3). Вычленение показателей (2.4). Инвентарь служебных формативов (2.5)
Линейные структуры 71
Общее (2.6). Содержание линейных структур (2.7).
Лексемная запись 73
Словарь лексем (2.8). Омонимия лексем (2.9). Словообразовательные связи между лексемами (2.10).
Грамматические классы 75
Классы N (имена) и Р (предикаты) (2.11). Класс предикатов (2.12). Класс имен (2.13). Особые случаи (2.14). О словаре лексем (2.15).
Грамматические метки и ключевые показатели 80
Общее (2.16). Служебные формативы и формативы-ключи (2.17). Неключевые
показатели (2.18). Грамматические метки (2.19). Соотношение «ключи—метки»
(2.20). Разрешение Х-ключей (2.21). N-ключи (2.22). Р-ключи (2.23). Замечание
о метке ConV (2.24). Х-ключи (2.25).
Фрагменты 90
Фрагменты в составе линейной структуры (2.26). Синтагматическая характеристика фрагмента (2.27).
Приведенная линейная структура 92
Общее (2.28). Сцепления (2.29). Правило выделения сцеплений (2.30). Передвижение границ фрагментов и запись сцеплений (2.31). Пассивные формы (2.32). О форме записи линейных структур при цитировании (2.33).
Правила построения линейных структур 96
Схема применения правил перехода вида «Mph(txt)—>LinStr» (2.34). Первый шаг первого блока (2.35). Второй шаг первого блока (2.36). Третий шаг первого блока (2.37). Результат работы первого блока (2.38). Правила второго блока — общее (2.39). Правила разрешения Х-ов: формативы-катализаторы (2.40). Правила разрешения Х-ов: лексемы-катализаторы (2.41). Правила разрешения Х-ов: синтагматические характеристики фрагментов (2.42). Итоговый пример построения линейной структуры (2.43).
Глава третья
СИНТАКСИЧЕСКИЕ СТРУКТУРЫ 111
Синтаксическое представление (Synt-A) 111
Формальная организация синтаксического представления (3.1). Узлы (3.2). Ребра (3.3). Замечание о содержании синтаксических представлений (3.4). О системе нотации (3.5). О скобочной и древесной записи (3.6).
Правила построения синтаксических структур 115
Схема применения правил перехода вида «LinStr—»Synt-A» (3.7). Допустимые конфигурации скобок (3.8). Иллюстрации (3.9). Циклы и переименование скобок (3.10). Формальные правила расстановок скобок (3.11). Пример построения скобочной записи (3.12).
Правила перехода от скобочной записи к дереву Synt-A 123
Общие принципы работы правил (3.13). Примеры (3.14).
Глава четвертая
АКТАНТНО-ПРЕДИКАТНЫЕ СТРУКТУРЫ 126
Актантно-предикатные структуры 126
Общие данные: Формальная организация актантно-предикатной структуры (4.1). О каталоге предложений контрольного корпуса и словаре атомарных предикатов (4.2). Замечание о содержании Р-картинок (4.3).
Язык Р-картинок 130
Предварительные замечания (4.4). Предварительные примеры (4.5).
Алфавит примитивных символов 133
Предикатные буквы (4.6). Термы (4.7).
Атомарные формулы 135
Правила построения атомарных формул из предикатных букв и индивидных констант (4.8). Правила построения атомарных формул из предикатных букв, индивидных констант и вспомогательных символов (4.9).
Атомарные формулы: специальные случаи 138
Расширение словаря предикатных букв: аналоги N-лексем (4.10). Расширение словаря предикатных букв: фиктивные предикаты (4.11). Расширение словаря
атомарных символов Р-картинок: межпредикатные операторы (4.12). Расширение словаря термов: фиктивные термы (4.13).
Правила перехода вида «P-D—»Synt-A» 142
Общее (4.14).
Исчисление Q: правила линейных композиций 142
Система обозначений (4.15). Правила линейных композиций (4.16).
Комментарии к правилам линейных композиций 150
Дополнение к правилу «Адъективизация» (4.17). Дополнение к правилу «Врезка \|/-узла» (4.18). Дополнение к правилу «Сориі-введение» (4.19). Дополнение к правилу «Понижение валентности...» (4.20).
Техника построения выводов 162
Общее (4.21). Нулевой цикл: связывание (4.22). Нулевой цикл: переворот (4.23). Нулевой цикл: лексические функции (4.24). Нулевой цикл: операторы (4.25). Финальная обработка (4.26). Замечание о порядке действий (4.27). Сопоставление конечного выражения вывода с заданной Synt-A (4.28). Первый пример вывода (4.29).
Операторы 172
Общее (4.30). Операторы и актантно-предикатные связи (4.31). Оператор «COMPAR» (TE/TEWUK) (4.32). Оператор «WHEN» (TTAY) (4.33). Оператор «FOR» (WIHA) (4.34). Оператор «ACCORDING» (TAY=LO) (4.35). Оператор «NOT S, BUT T» (ANI=LA) (4.36).
Лексические функции 183
Лексические функции и актантно-предикатные связи (4.37). Лексические функции в построении вывода (4.38). Словарь лексических функций (4.39). Правила преобразований (4.40). Сводные примеры (4.41).
Глава пятая
ОСНОВНЫЕ ВЫВОДЫ 197
Морфологические характеристики (5.1). Автоматический морфологический анализ (5.2). Синтаксический анализ (5.3). Язык актантно-предикатных связей (5.4). Переход от актантно-предикатной структуры предложения к его синтаксической структуре (5.5). Соотношение между отношениями непосредственной синтаксической доминации и актантно-предикатными связями в одном и том же предложении (5.6). Классификация бинарных пол и предикативных конструкций (5.7). Программное обеспечение (5.8).
БИБЛИОГРАФИЯ 221
ПРЕДИСЛОВИЕ
Диссертация посвящена исследованию грамматики корейского языка, а именно его морфологии, синтаксису и семантике. В работе предпринята попытка построить для корейского языка грамматическую конструкцию, обеспечивающую представление грамматики в виде системы переходов, подобных тем, которые строятся в моделях типа «Смысл<=>Текст» (далее МСТ).
Разумеется, во всем объеме такая задача не может быть решена в рамках диссертационной работы, поэтому речь идет о построении грамматической конструкции, которая подобна конструкции типа «Смысл<=>Текст» по своей организации, но охватывает морфологию, синтаксис и семантику корейского языка не в полном объеме, а лишь частично. Такая конструкция названа в работе скелетальной конструкцией МСТ (термин заимствован из категорного анализа)1.
Прежде всего, рассматриваемые в работе представления смысла отражают не все содержание предложения, а только его актантно-предикатную структуру. Оказалось, что при таком сужении задачи и морфологическое строение предложения можно рассматривать не во всем объеме: достаточно учитывать лишь некоторые (названные в работе ключевыми) показатели. В работе разрабатываются определенные представления предложения и правила, обеспечивающие переход от одних представлений к другим; а именно: морфологическое представление, линейная структура, синтаксическая структура и актантно-предикатная структура. Предлагаются независимые системы правил: с одной стороны, правила, обеспечивающие переход от исходного представления текста к его линейной структуре и от линейной структуры к синтаксической; а с другой стороны, правила, обеспечивающие
1 См., например, Голдблат Р. Топосы. М.: Мир, 1983; Гельфанд С. И., Манин Ю. И. Методы гомологической алгебры. Том I. Введение в теорию когомологий и производные категории. М., 1988.
вывод синтаксической структуры из актантно-предикатной структуры данного текста.
Введение к работе
Актуальность исследования
Несмотря на достаточно длительную традицию изучения грамматики корейского языка, многие синтаксические проблемы корейского языка остаются не только недостаточно детально изученными, но в известных случаях даже недостаточно подробно описанными. Известно, что для агглютинативных языков многие традиционные синтаксические понятия, сформированные на базе флективных языков, требуют определенных переосмыслений и уточнений, а подчас оказываются и вовсе неприменимы. В настоящее время крайне актуальна задача поиска новых форматов грамматических описаний, адекватных для языков агглютинативного строя и удовлетворяющих требованию межъязыковой сопоставимости. Настоящая работа могла бы способствовать построению таких грамматик современного корейского языка, ориентированных под разные конечные цели: от типологии до систем автоматической обработки корейского текста.
Цели и задачи диссертации
В теоретическом плане основная цель диссертации — исследовать проблемы, возникающие при построении для корейского языка модели «Смысл<=>Текст» и построить конкретную скелетальную конструкцию типа МСТ. С точки зрения проблем математической и прикладной лингвистики основная цель диссертации — выяснить формально-логические свойства промежуточных представлений предложения (уровней, в терминах МСТ) и правил межуровневых переходов в корейском языке; в частности, показать возможность полной алгоритмизации некоторых блоков конструкции.
Для достижения названных целей в диссертации ставятся и решаются следующие задачи:
Объект исследования в диссертации - это предложения современного корейского письменного текста.
Предмет исследования — грамматическая и логико-семантическая организация предложений современного корейского текста.
Материал исследования, достоверность результатов
Основной материал исследования — тексты на современном корейском языке различного жанра: научная проза, художественная и журнальная литература, сказки; частично привлекался иллюстративный материал из грамматик А. А. Холодовича, Ю. Н. Мазура, С. Мартина, X. Сона и других2.
Новизна исследования
Научная новизна исследования состоит в том, что для корейского языка грамматические описания в идеологии моделей «Смысл<=>Текст» ранее не предлагались. При этом важно отметить, что в построенном в диссертации описании синтаксический анализ предложения осуществляется независимо от анализа семантического, более того, все используемые синтаксические правила работают без обращения к какого бы то ни было сорта словарям, в частности, без обращения к словарю моделей управления предикатов. Прикладная новизна исследования состоит в том, что разработан принципиально новый подход к построению алгоритмов морфологического и синтаксического анализа корейского предложения. Хотя этот подход учитывает в первую очередь особенности корейского языка, тем не менее он является достаточно общим и может применяться и при разработке грамматик других языков.
2 См. Холодовий А. А. Очерк грамматики корейского языка. М., 1954; Мазур Ю. Н. Грамматика корейского языка. (Морфология. Словообразование). (Издание подготовлено Л. Р. Концевичем при участии Мун Хесук). М.: Издательский дом «Муравей-Гайд», 2001; Martin, S. Е. A reference grammar of Korean. Charles E. Turtle Company, Rutland, Vermont and Tokyo, Japan, 1992; Sohn, Ho-Min. The Korean Language. Cambridge University Press: Cambridge (Mass.), 1999.
Теоретическая и прикладная значимость исследования, практическая ценность результатов
Исследование синтаксиса и формальное моделирование синтаксического анализа отдельного языка принадлежат к проблемам, важным для языкознания в целом. В этом отношении проведенное исследование имеет общетеоретическое значение.
Конкретно-лингвистическая значимость данного исследования заключается, прежде всего, в разработке принципиально нового алгоритма синтаксического анализа. Построенный алгоритм может быть применен с некоторыми поправками к другим алтайским языкам. Грамматические конструкции, аналогичные построенной в работе для корейского языка, могут быть построены и для других алтайских языков. Выявленные при этом данные могут представлять ценность для синтаксической типологии алтайских языков, поскольку для того чтобы сделать предметом типологического рассмотрения более обширные системные явления, необходимы описания соответствующих участков языковой системы для отдельных языков или пар языков.
Результаты предлагаемого синтаксического описания представляют значимость и для прикладной лингвистики: сформулированные правила синтаксического разбора корейского предложения могут быть использованы в практике преподавания корейского языка, а разработанные алгоритмы могут быть использованы в различных системах автоматической обработки корейского текста.
Основные результаты исследования, выносимые на защиту
1. Для обнаружения отношений синтаксической доминации и актантно-предикатных связей, имеющих место в обрабатываемом предложении, достаточно располагать следующей информацией: 1) каков грамматический класс (N или Р) каждой словоформы, входящей в предложение, 2) какие синтаксически значимые показатели входят в словоформу, 3) какова обобщенная грамматическая характеристика словоформы. Указанную информацию
манифестируют 48 показателей-ключей, список которых представлен в настоящей работе.
Сперва строится линейная структура предложения, представляющая собой его лексемную запись, в которой при каждой лексеме указана только синтаксически значимая морфологическая информация. Линейная структура строится лингвистически обоснованной и алгоритмически эффективной системой морфологического анализа (алгоритм 1), которая выделяет ключевые показатели в словоформах предложения и в соответствии с ними приписывает каждой словоформе эту информацию.
Построенная система синтаксического анализа (алгоритм 2) позволяет строить скелстальное синтаксическое представление предложения, то есть дерево, в котором отражены отношения непосредственной доминации. Алгоритм (2), обеспечивающий переход от линейной структуры к синтаксическому представлению, расставляет в линейной структуре скобки на основании предложенного списка допустимых конфигураций «слуга-хозяин» (см. табл. 4); расстановка скобок предполагает циклическое использование списка допустимых конфигураций. Скобочная запись автоматически переводится в дерево.
4. Предложенный в работе формально-логический язык для записи
актантно-предикатного представления предложения использует в качестве
атомарных единиц объекты, практически копирующие лексемы корейского
языка.
5. В работе предъявляются 6 правил «линейных композиций», а именно:
«Адъективизация», «Р-внедрение», «Врезка -узла», «Сориі-введение»,
«Сочинительное сокращение», «Понижение глубины формулы и/или
валентности невершинного узла». Последовательность применения этих правил
к актантно-предикатной структуре строит вывод из нее синтаксического
представления предложения.
6. Классификация корейских предложений, содержащих две предикации, оценивает механизм связывания двух клауз: по адъективизации, по Р-внедрению, по сочинительному сокращению, по Сориі-введению.
Апробация и внедрение результатов
По теме диссертации опубликованы четыре статьи. Многие положения диссертации были представлены в докладах на заседаниях Центра компаративистики РГГУ, на семинарах «Некоторые применения математических методов в языкознании» (под руководством В. А. Успенского и М. Р. Пентуса) в МГУ им. Ломоносова, на конференциях в Праге (Korean Studies Graduate Students Convention (KSGSC), Prague, 2006), в СПбГУ (Корейский язык и литература в XXI веке. К 100-летию со дня рождения А. А. Холодовича. 4-6 апреля 2006 г.) и Институте востоковедения РАН (Востоковедные чтения 2008. 8-10 октября 2008 г.). Работа была обсуждена в центре компаративистики Института восточных культур и античности РГГУ По теме диссертации был прочитан спецкурс «Теоретическая грамматика корейского языка» в Институте Восточных культур и античности (специализация — корееведение) РГГУ; правила синтаксического анализа, рассматриваемые в работе, используются на практических занятиях корейским языком со студентами той же специализации в течение четырех лет (с 2005/2006 учебного года).
Структура диссертации
Диссертация состоит из введения, включающего краткий обзор литературы, пяти глав и трех приложений.