Электронная библиотека диссертаций и авторефератов России
dslib.net
Библиотека диссертаций
Навигация
Каталог диссертаций России
Англоязычные диссертации
Диссертации бесплатно
Предстоящие защиты
Рецензии на автореферат
Отчисления авторам
Мой кабинет
Заказы: забрать, оплатить
Мой личный счет
Мой профиль
Мой авторский профиль
Подписки на рассылки



расширенный поиск

Математические модели суффиксального словообразования и их использование для автоматической обработки отглагольных имен существительных в текстах русского языка Шаронова Наталья Валерьевна

Математические модели суффиксального словообразования и их использование для автоматической обработки отглагольных имен существительных в текстах русского языка
<
Математические модели суффиксального словообразования и их использование для автоматической обработки отглагольных имен существительных в текстах русского языка Математические модели суффиксального словообразования и их использование для автоматической обработки отглагольных имен существительных в текстах русского языка Математические модели суффиксального словообразования и их использование для автоматической обработки отглагольных имен существительных в текстах русского языка Математические модели суффиксального словообразования и их использование для автоматической обработки отглагольных имен существительных в текстах русского языка Математические модели суффиксального словообразования и их использование для автоматической обработки отглагольных имен существительных в текстах русского языка Математические модели суффиксального словообразования и их использование для автоматической обработки отглагольных имен существительных в текстах русского языка Математические модели суффиксального словообразования и их использование для автоматической обработки отглагольных имен существительных в текстах русского языка
>

Данный автореферат диссертации должен поступить в библиотеки в ближайшее время
Уведомить о поступлении

Диссертация - 480 руб., доставка 10 минут, круглосуточно, без выходных и праздников

Автореферат - 240 руб., доставка 1-3 часа, с 10-19 (Московское время), кроме воскресенья

Шаронова Наталья Валерьевна. Математические модели суффиксального словообразования и их использование для автоматической обработки отглагольных имен существительных в текстах русского языка : ил РГБ ОД 61:85-5/2656

Содержание к диссертации

Введение

1. Состояние вопроса и постановка задач исследования

1.1. Обзор работ в области автоматической обработки русского словообразования 12

1.2. Обзор исследований в области моделирования смысла деривата 18

1.3. Анализ состояния исследований в области морфемного и словообразовательного анализа 23

1.4. Анализ литературных данных по моделированию механизмов словообразования ; 30

1.5. Постановка задач исследования 34

2. Аналитическое описание структуры суффикса

2.1. Сегментация суффиксальных морфов, классификация сегментов 41

2.2. Представление суффиксов всех частей речи в сегментированной форме 48

2.3. Моделирование линейной сочетаемости сегментов 52

2.4. Распределение сегментированных суффиксов в регистре 57

Выводы 63

3. Разработка системы признаков для моделирования словообразования

3.1. Формирование признаков для моделирования связей суффиксальной морфемы 64

3.2. Описание семантических признаков модели морфемы и отношений на их множестве 69

3.3. Определение семантических ролей морфем с использованием дерева семантических признаков 78

3.4. Формирование признаков для моделирования внутриморфемных связей 84

3.5. Формализация распределения морфов в морфеме 90

Выводы 98

4. Построение математической модели связей суффиксальной морфемы

4.1. Описание категориальных и лексических значений морфем 100

4.2. Моделирование связей суффиксальных морфем, обозначающих конкретные имена существительные мужского рода 103

4.3. Моделирование связей морфем, обозначающих конкретные существительные немужского рода и p&fta&a iantum. 109

4.4.Построение моделей морфем существительных с абстрактным значением 113

Выводы 117

5. Практические приложения результатов исследования

5.1. Разработка и исследование алгоритмов разбиения слова на морфы 118

5.2. Эвристический алгоритм решения уравнений алгебры конечных предикатов 125

5.3. Решение задач словообразовательного анализа и

синтеза на базе решения уравнений АКП 133

5.4. Обнаружение и исправление ошибок в суффиксальной

части слова 139

5.5. Использование модели словообразования имен существитель

ных в общей системе автоматической обработки текстов .145

Выводы 149

Основные выводы v 150

Литература

Введение к работе

Определяя основные направления развития науки и ускорения научно-технического прогресса, ХХУІ съезд КПСС призвал сосредоточить усилия на "совершенствовании вычислительной техники, ее элементной базы и математического обеспечения, средств и систем сбора, передачи и обработки информации" /I, с. 146/. ЦК КПСС и Совет Министров СССР в постановлении "О мерах по ускорению научно-технического прогресса в народном хозяйстве" определили в качестве одного из главных направлений работы по ускорению научно-технического прогресса широкую автоматизацию технологических процессов на основе применения автоматизированных станков, машин и механизмов, унифицированных модулей оборудования, робототехнических комплексов и вычислительной техники.

Для эффективного использования огромных возможностей электронной вычислительной техники необходимо, чтобы ЭВМ могла воспринимать и обрабатывать информацию, представленную на естественном языке. Человек, занятый в науке или производстве, вынужден перерабатывать все возрастающий объем информации],, основная часть которой представлена на естественном языке /142/, поэтому автоматизация научной и производственной деятельности во многом определяется возможностью обработки словесной информации на ЭВМ. В связи с этим существует настоятельная необходимость в изучении и моделировании способности человека владеть языком, в создании действующих моделей языка /31,32,47 и др./, область приложения которых непрерывно растет и расширяется /93,142/. Интеграция науки и производства, быстрое внедрение научных открытий и изобретений в народное хозяйство, современное управление и планирование невозможны без развитых управляющих, информационно-поисковых, справочно- библиографических и других систем, эффективность функционирования которых во многом определяется способностью воспринимать и выдавать сообщения на языке, близком к естественному.

Большой вклад в постановку и решение проблемы математического моделирования естественного языка и его фрагментов внесли А.А.Ляпунов, Д.Ю.Панов, Г.Г.Белоногов, И.А.Большаков, Р.Г.Котов, Р.Г.Пиотровский, А.В.Гладкий, Т.Н.Молошная, О.И.Ревзина, П.А.Соболева, Н.Хомский, С.Маркус, Р.Шенк, В.Ингве, Т.Виноград и многие другие ученые.

Опыт исследования и моделирования естественного языка доказал необходимость детального исследования и формализации разнообразных процессов на уровне отдельного слова, включая словообразовательные процессы, а также вопросы морфемного анализа и синтеза. В этом направлении плодотворно работали В.В.Виноградов, Е.С.Кубрякова, Л.Н.Засорина, И.Г.Милославский, Б.Н.Головин, В.И.Максимов, З.М.Волоцкая, Ю.П.Шабанов-Кушнаренко и многие другие исследователи.

Язык - основа мышления, интеллектуальная деятельность без языка невозможна. Автоматизм и неосознанность процессов синтеза и восприятия речи человеком рождают иллюзии простоты языка. Однако проявления языка крайне сложны и многообразны, их изучают многие научные дисциплины. Уже на морфологическом уровне наблюдается большое разнообразие периферийных явлений языка и сказывается отсутствие удобных средств формального описания этих явлений. Традиционные лингвистические описания адресованы прежде всего человеку и опираются на его языковую интуицию, способность самостоятельно выявлять аналогии и т.п. Математические же описания языка должны быть адресованы вычислительной машине, должны быть "понятны" ей. Необходимо полное, однозначное и эксплицитное описание естественного языка, в том числе и словообразовательных процессов, которое предназначено для ЭВМ и может сделать доступными для них свойственные человеку операции по обработке текстовой информации. Несмотря на достигнутые результаты в области математического моделирования морфемики и словообразования, многие вопросы еще недостаточно изучены.

Важным аспектом проблемы моделирования процессов обработки слов является построение математических моделей суффиксальных морфем - наиболее развитых словообразовательных формантов. В настоящей работе объектом описания являются отглагольные имена существительные русского языка, образованные суффиксальным способом. Выбор объекта формализации объясняется главенствующей ролью, которую, наряду с глаголами,играет в языке имя существительное, а также его наиболее развитой словообразовательной системой.

Дель работы заключается в построении математических моделей суффиксального словообразования имен существительных русского языка в виде систем уравнений алгебры конечных предикатов и реализации этих моделей в системах автоматической обработки русских текстов.

К основным задачам исследования относятся: анализ существующих методов лингвистического описания, систем и способов морфемной и словообразовательной обработки слов с целью выделения возможного круга задач, в которых можно эффективно использовать деривацию; разработка методики формального описания суффиксальной деривации русского языка средствами алгебры конечных предикатов; формирование системы признаков для моделирования суффиксальной морфемы; построение математической модели морфа и комплексной модели морфемы, описывающих как внутриморфемные связи, так и связи морфемы с окружающим ее текстом; реализация на ЭВМ математических моделей суффиксального словообразования отглагольных имен существительных и выработка рекомендаций по их практическому применению.

Научная новизна работы заключается в следующем: предложена методика формального описания морфемного уровня языка системой уравнений алгебры конечных предикатов; такое описание позволяет единым образом ставить и решать большой крут задач морфемной обработки текста в условиях полностью или частично заданной информации; построена комплексная математическая модель суффиксального словообразования отглагольных имен существительных русского языка, включающая семантическую и грамматическую модели и позволяющая свести разнообразные задачи морфемной обработки к решению системы уравнений при различных начальных условиях; разработана система формальных признаков, позволяющая формализовать выбор морфа в суффиксальной морфеме; предложена система семантических признаков для описания семантических ролей морфем; разработана и исследована сегментированная форма записи суффиксальных полей, изучена и формализована линейная сочетаемость суффиксальных сегментов, решена задача устранения многовариантности автоматического разбиения слова на морфы; разработаны алгоритмы, реализующие предложенные модели морфемной обработки слов, а также производящие выделение и сегментацию суффиксальных полей и автоматическую коррекцию ошибок во входных текстах.

Практическая ценность работы состоит в том,что разработанные модели и реализующие их алгоритмы позволяют повысить эффективность общения пользователя и ЭВМ. Входя наряду с моделями корневых морфем, финалей, флексий, префиксов, моделями синтаксиса словосочетаний в общую систему автоматической обработки текстов, модели и алгоритмы данной работы дают возможность решать самые разнообразные задачи, связанные с машинной обработкой русских текстов. Методика формального описания деривативных процессов и математические модели настоящей работы нашли практическое приложение при разработке и внедрении системы каталогизации банка данных АСУ железнодорожным транспортом (ВЦ КВД, г.Харьков), используются при построении системы "Фонема", разрабатываемой на кафедре вычислительной техники Харьковского института радиоэлектроники, цель которой - машинное распознавание звучащей речи.

Апробация работы.Основные результаты диссертационной работы докладывались и обсуждались на: Всесоюзном семинаре "Эргономическое обеспечение сложных человеко-машинных систем" (Харьков, 1981), УІ Украинской республиканской конференции по бионике (Ужгород,1981), Всесоюзной конференции "Переработка текста методами инженерной лингвистики" (Минск, 1982), Школе-семинаре молодых ученых (Киев, 1982), Пятой и Шестой школах-семинарах "Интерактивные системы"(Кутаиси, 1983, Батуми,1984), Всесоюзном семинаре "Семиотические аспекты формализации интеллектуальной деятельности" (Телави, 1983), Симпозиуме по синтетическим и аналитическим грамматикам (Таллин, 1983).

По результатам выполненных исследований опубликовано 12 работ /19-24, 89,90,126-130/.

Диссертационная работа состоит из введения, пяти разделов, выводов, списка используемой литературы и приложений.

В первом разделе проведен анализ литературных источников, использующих деривацию в различных задачах автоматической обработки текстов, выделен круг возможных задач, в которых возможно эффективное использование словообразовательной информации. В этом разделе дана характеристика деривативных процессов как объекта исследования, рассмотрены вопросы сегментации текста, проведен сравнительный анализ морфемного и словообразовательного подходов в свете нужд вычислительной лингвистики, поставлены задачи исследования.

Второй раздел диссертации посвящен описанию математического аппарата моделирования и методике формального описания словообразования». Основными объектами математического моделирования в настоящей работе являются деривативные отношения - связи морфемы с окружающим ее текстом. Здесь же разрабатывается сегментированная форма представления суффиксальных морфов, исследуется линейная сочетаемость сегментов в суффиксальном поле и показано распределение системы сегментированных морфов в лингвистическом регистре. Введение сегментированной формы записи суффиксов позволяет решать задачу устранения многовариантности автоматического разбиения слова на морфы, помогает обнаруживать и исправлять ошибки во входных текстах.

В третьем разделе вводится и обосновывается система формальных признаков для моделирования морфемных связей. Разработанная система признаков позволяет описывать как внутриморфемные связи (распределение морфов в морфеме), так и связи морфемы с окружающим ее текстом. В этом разделе выделяются уровни математического описания деривации и устанавливается зависимость между этими уровнями. В раооте предлагается различать признаки морфа и морфемы. Семантические признаки морфемы задаются деревом семантических признаков, позволяющим выделить некотррое множество семантических ролей морфемы, выоор же морфа внутри морфемы происходит с использованием признаков морфа.

Четвертый раздел диссертации содержит комплексные модели суффиксальных морфем и морфов на материале отглагольных имен существительных русского языка. Комплексная модель морфемы включает в себя описание семантического аспекта и формализацию распределения морфов в морфеме.

Пятый раздел посвящен практическим приложениям результатов исследований. В нем определено место разработанных моделей в общей системе автоматической обработки текстов русского языка, описаны алгоритмы решения уравнений алгебры конечных предикатов в различных режимах, приводятся примеры решения различных задач морфемной обработки русских текстов. В этом разделе описаны также алгоритмы автоматического обнаружения и исправления ошибок во входных текстах информационных систем, рассматриваются вопросы практического применения результатов диссертационной работы по материалам внедрения.

Диссертационная работа выполнена на кафедре Вычислительной техники Харьковского ордена Трудового Красного Знамени института радиоэлектроники имени академика М.К.Янгеля в соответствии с планом научно-исследовательских работ, утвержденным постановлением Президиума Ж УССР от 19.12.79 г. в рамках темы "Разработать и исследовать программные и технические средства обработки словесной информации в человеко-машинных системах" ОБ государственной регистрации 80073100) и планом важнейших научно-исследо- вательских работ на 1982-1985 гг., утвержденным координационным планом АН СССР по проблеме "Кибернетика", в рамках темы 1.12.9.4(6) "Создание систем анализа и синтеза текстов".

Обзор работ в области автоматической обработки русского словообразования

Словообразование является одним из важнейших аспектов естественного языка. Словарный состав языка очень чувствителен к человеческой деятельности и изменяется почти непрерывно. Образование новых слов осуществляется в основном двумя путями - путем заимствования из других языков и путем различных способов словообразования. Заимствование, пусть даже многочисленное по составу слов, из других языков "всегда так или иначе ограничено и затрагивает отдельные, вполне определенные категории лексических единиц. Поэтому оно играет подчиненную роль" /120, с.252/.Словарный состав языка обогащался ранее и пополняется в настоящее время преимущественно путем деривации, т.е. образования новых слов на основе и с использованием материала, который в языке уже существует.

Русское словообразование было объектом постоянного внимания исследователей на всем протяжении развития отечественного языкознания. Особенно возрос интерес к вопросам словообразования за последние два-три десятилетия, о чем свидетельствует все возрастающее число работ, так или иначе связанных с вопросами словообразования. Это непосредственно связано с общей интенсификацией изучения русского языка, с расширением терминотворчества и необходимостью его регулирования, с вопросами машинного перевода и решением других задач машинной обработки текстов. Непрерывно расширялась и углублялась проблематика, связанная с изучением словообразования, совершенствовались методы и принципы анализа.

И.Г.Милославский в работе /82/ отмечает, что за последние десятилетия наука о русском словообразовании решила множество принцип пиальных вопросов. Это - членение слова на морфы и определение отношений между мотивирующим и мотивируемым словами /8,55,64,72, 124 и др./, определение характера словообразовательной семантики /55,63,108/, исследование морфонологических явлений при деривации /54,73 и др./. Активно изучаются механизмы отношений между словами в словообразовательном гнезде /106,104,137/, специально исследованы вопросы глагольного префиксального словообразования /48/, вопросы образования названий лиц /80,93,141/. "В известной степени стали ясны словообразовательные особенности отдельных частей речи - существительных, прилагательных, глаголов и наречий"/82,с.3/. Детально исследованы и теоретически обоснованы многие вопросы словообразовательного синтеза, под которым понимается получение смысла деривата на базе анализа морфов /82/. Однако, несмотря на обилие работ в языкознании, посвященных вопросам словообразования, имеется немало нерешенных проблем. "На сегодняшний день наука находится еще в начале большого и сложного пути к познанию системы русского словообразования не только в ее прошлом, но и в настоящем, как в целом, так и во многих ее отдельных звеньях"/76,с.З/. Например, до сих пор много противоречий в понимании структуры производных слов, отношения ее к составу слова /77/, не определено место словообразования в общей системе языка, нет общего мнения об отношениях между словообразовательным и морфемным анализом, нет единства в толковании понятий морфа и морфемы. Очень много открытых вопросов стоит .. перед исследователями в области формализации ЯВЛЕНИЙ словообразования.

Вообще между явлениями словоизменения и словообразования нет четкой границы. Известная регулярность наблюдается и в первом, и во втором случаях. Выделение словоизменительных категорий в значительной степени традиционно. В работе /10/ отмечается, что "морфология системнее словообразования потому , что морфологическими следует признать материально выраженные и противопоставленные друг другу значения, охватывающие все слова данного класса (части речи), в то время как словообразовательными следует признать материально выраженные значения, охватывающие часть слов данного класса (производные слова с определенным формантом), и не обязательно являющиеся членами противопоставления" /IO S/. Как видно из этого высказывания, системность характеризует как словоизменительные, так и словообразовательные явления, и различие здесь не в сущности, а в степени. Этим объясняется тот факт, что словообразование то выделяется как самостоятельная отрасль языкознания, то растворяется в морфологии, то пересекается с ней. Нам кажется более целесообразным рассмотрение словообразования, входящего в одном ряду со словоизменением в морфологию. В.В.Виноградов указывал, что "задачу морфологии составляет изучение правил, а также типов и норм изменения слов в системе языка", и подчеркивал, что это "изменение" осуществляется не только за счет формообразования, но и за счет словообразования /34/.

Сегментация суффиксальных морфов, классификация сегментов

Предметной областью для математического моделирования в настоящей диссертационной работе является множество суффиксальных морфов, связанных деривативным отношением D со всевозможными наборами признаков, характеризующих смысловые и формальные проявления морфов. В русском языке, по данным Академической грамматики /101/, более шестисот разных суффиксальных морфов, из них две трети составляют производные суффиксы, исторически образованные путем наращивания (иногда - усечения) звуков на исходные морфы /86/. У каждой части речи имеется свой инвентарь суффиксов, при этом самую разнообразную систему суффиксальных морфов имеет имя существительное. Суффиксы обладают разнообразным буквенным составом, разной длиной и могут стоять на разных позициях в слове после корня. Для математического описания деривативного отношения с целью введения переменных необходимо прежде всего определить порядок расположения букв суффиксов в регистре переменных, расклассифицировать суффиксальные морфы по формальным признакам и выявить законы их формального взаимодействия.

Разные исследователи выделяют различное число суффиксов. Разброс данных частично объясняется отсутствием четких критериев выделения суффиксов. Трудности возникают из-за того, что под морфемой понимается смыслонесущая форма. Наличие смысла, не облеченного в форму, или формы, не несущей смысла, еще не дает основания для выделения суффикса. Так, например, слова "шить" и "портной" связаны отношением действие - деятель , но мы не можем трактовать фрагмент слова -ной как суффикс со значением лица. С дру гой стороны, имеется немало участков слов, по форме совпадающих с суффиксальными морфами, но не имеющими их значений, и поэтому не считающихся суффиксами. Имеется также много участков суффиксального поля, которые трактуются лингвистами самым различным образом (это традиционные примеры:-ан- в слове "американский", -ин-в слове "большинство" и т.п.).

Образованию суффиксальных основ русского языка свойственны элементы агглютинации /86/. Простые суффиксы относительно немногочисленны, наиболее разнообразны цепочки суффиксальных образований, из которых исторически возникали производные суффиксы. Значение осложненных, вторичных суффиксов не всегда прямо определяется значениями исходных морфов, но часто анализ отдельных частей помогает при .определении значения производного суффикса. Следует отметить, что, наряду с разнообразием и многочисленностью суффиксов, в их составе часто встречаются одинаковые фрагменты, исторически восходящие к простым суффиксам, а также формально одинаковые наращения исходных морфов. Например, можно заметить, что в перечисленных в /101,с.569/ суффиксальных морфах часто встречаются такие фрагменты, как -ец-, -ин-, -ан- и другие, которые и сами могут выполнять функцию суффикса (старик-ан, отц-ов), и могут входить в состав производных суффиксов (шал-ов-ливый, америк-ан-ский и т.п.). За счет таких повторяющихся фрагментов можно было бы значительно сократить формальную запись морфов.

Если при выделении префиксов никогда не возникает разногласий по поводу места проведения морфемных швов, то иначе обстоит дело с суффиксами. При выделении отдельных суффиксов внутри суффиксального поля часто возникают затруднения, и существует много разных мнений по поводу локализации морфемных швов между суффиксами /55, 64,73/. Если рассматривать суффиксальное поле пофрагментно, таких трудностей можно избежать. Кроме того, при описании процессов чередования в суффиксах, а также при формальном описании распределения морфов в морфеме оказывается удобным изучать и описывать не весь суффикс или суффиксальное поле с их связями, а лишь изменяющуюся часть суффикса. Этой частью чаще всего оказывается крайний правый или крайний левый трехбуквенный фрагмент суффикса.

Формирование признаков для моделирования связей суффиксальной морфемы

Самым важным и сложным этапом при моделировании словообразования является введение и обоснование системы признаков, адекватно отображающей связи и отношения в языке. Признаки - это формализованное представление тех смысловых значений, которые передает та или иная часть текста, они играют роль промежуточных переменных, связывающих текст с его смыслом /120/. В грамматике русского языка большое развитие получило учение о словоизменительных категориях (род, число, падеж, время и др.) Эти категории с успехом используются при моделировании словоизменительных процессов /83,17,50/. Совершенно иная ситуация сложилась в области формирования словообразовательных категорий. Систематического учения о словообразовательных категориях нет, о них имеются лишь разрозненные и методически не объединенные данные /например, 101, с.130-142/. Отсутствуют исследования, где была бы разработана общая система семантических и грамматических признаков для связей словообразовательного уровня. Чтобы успешно осуществлять моделирование словообразовательных процессов, необходимо прежде сформировать словообразовательные категории.

Любая грамматическая категория представляет собой переменную, заданную на некотором множестве смысловых оттенков. Например, категория числа имеет два смысловых оттенка: единственное, множественное. Чтобы сформировать грамматическую категорию, достаточно указать для нее множество смысловых оттенков, на которое она распространяется. Множество это не может быть выбрано произвольным образом, оно должно удовлетворять определенным требованиям. Определив эти требования, мы сможем указать метод формирования грамматических категорий.

Применение такого формального аппарата, как алгебра конечных предикатов, предъявляет определенные требования к формированию и использованию признаков. С одной стороны, для корректного введения любой буквенной переменной X необходимо и достаточно, чтобы она удовлетворяла законам истинности Xа V х"г / V Xа" =J, (З.І.І) и ложности Xа X а / = О; (%/ VVA (3.1.2) где CLi , хг,..., а# - область определения переменного признака X , т.е. множество всех оттенков, отнесенных нами к одному признаку. При этом исчерпываются все логические возможности и соблюдается взаимоисключаемость разных оттенков, отнесенных к одному признаку /120, 28/. С другой стороны, все признаки должны быть равноправны, поскольку они являются аргументами, т.е. независимыми переменными морфологической функции U-F(X) , где X -набор признаков, У - соответствующий этому набору текст, X = ( X, , Х2 ,..., Хгу, )» где X,, Хг ...,Хт- признаки текста

Смысловые оттенки относятся к отдельным морфемам, при этом одни и те же морфемы в различных текстах могут характеризоваться различными наборами смысловых оттенков. Такие различные наборы смысловых оттенков для одной морфемы мы будем называть смысловыми ролями морфем. Таким образом, набор семантических оттенков характеризует не весь суффикс, а лишь его конкретное семантическое проявление, т.е. роль суффикса в тексте. Например, суффикс тель может характеризоваться оттенком одушевленности (производитель, пользователь) или неодушевленности (выключатель, рыхлитель), находясь при этом в разных семантических ролях при совпадении всех остальных оттенков, характеризующих данную морфему.

Текст, окружающий морфему и однозначно характеризующий набор относящихся к ней смысловых оттенков (семантическую роль суффикса), назовем текстовой ситуацией. Набор смысловых оттенков, однозначно определяющий соответствующую ему морфему в данной текстовой ситуации, назовем полным. Две текстовые ситуации, которые характеризуются одинаковыми полными наборами смысловых оттенков, будем считать тождественными.

Пусть 7=1 а1, CLZ,. ..,#д] - множество всех морфем, для которых требуется сформировать грамматические категории. Пусть далее В - \ $1,&г,"ч8р [- множество всех интересующих нас текстовых ситуаций с морфемами из множества Л .

Описание категориальных и лексических значений морфем

Распределение морфем по семантическим ролям соотносится с традиционным разделением значений морфем на категориальные и лексические /105/. Словообразовательное значение производного слова является результатом воздействия категориального значения словообразовательного форманта (в данном случае - суффиксальной морфемы) на категориальное и лексическое, т.е. лексикограмматическое значение мотивирующего слова. При образовании словообразовательных значений ведущая роль принадлежит категориальным значениям. Лексическое же значение слова лишь конкретизирует понятия процесса, предмета и т.п. Так, например, о словах а) преподаватель, издатель, строитель, б) мыслитель, созерцатель, в) выключатель, рыхлитель, истребитель, г) закрепитель, имеющих морфему стель , можно сказать, что их словообразовательное значение в самом общем виде сформулируется как "предмет, имеющий отношение к действию". Б каждой из перечисленных выше групп производных слов словообразовательное значение конкретизируется под влиянием лексического значения слова: а) специалист, б) человек, выполняющий действие независимо от профессии, в) предмет - субъект действия или орудие для его выполнения, г) вещество, служащее для выполнения указанного в основе действия.

Ведущая роль категориальных и подчиненная роль лексических значений при возникновении словообразовательных значений подтверждается также тем, что при одном и том же форманте словообразовательные значения могут получать различную конкретизацию. Так, слово "молочник" обозначает "сосуд для молока" и "человек, занимающийся поставкой молока", слово "телятник" обозначает "помещение для телят" и "человек, ухаживающий за телятами" и т.п. Особенно очевидной главенствующая роль категориальных значений в формировании словообразовательных становится при рассмотрении суффиксов прилагательных. Б приведенных в работе /105,с.19/ примерах "картофельный бал", "летний чемодан", "автомобильные деньги" словообразовательное значение слов "картофельный", "летний", "автомобильный" выступает в наиболее чистом от лексики, в наиболее абстрагированном виде и может быть сформулировано только как "признак, имеющий отношение к предмету". Б каждом конкретном употреблении этот признак уточняется, конкретизируется. Этот процесс конкретизации в настоящей работе нашел воплощение в семантических ролях словообразовательных морфем.

Как было сказано в 3.3, под семантической ролью морфемы понимается конкретное семантическое проявление суффиксальной морфемы в тексте, т.е. тот набор признаков, который характеризует морфему в данной лингвистической ситуации. Полный список ролей суффиксальных морфем на примере отглагольных имен существительных приведен в Приложении 5. Анализ таблицы приложения показывает, что суффиксальная морфема из этого множества может принимать участие в образовании от одной до семи ролей. Например, морфема ок располагает следующим набором ролей: I) ЧеЛОВеК - Субъект ДеЙСТВИЯ (знаТОК) - OKj, 2) предмет - орудие действия (скребок) - ОК2» 3) предмет - субъект действия (поплавок) - окд, 4) предмет - место, где производится действие (каток) - ок , 5) человек - результат действия (подросток) - ок , 6) ЖИВОТНОе - результат ДеЙСТВИЯ (ВЫКОРМОК) - OKg, 7) предмет - результат действия (подарок) - ок?. Здесь, как и ранее, морфема заключается в утловые скобки, семантические роли морфемы индексируются снизу номером роли в списке ролей одной морфемы. Все перечисленные роли oKj-oKr, расположены на разных ветвях дерева признаков, а формальная запись совокупности семантических ролей этой морфемы будет иметь вид: А ( , И) .у Lc (о«, X), (4Л л) где Li - выражение АКПдля : -ой семантической роли морфемы - ок , Н - характеристика морфемы (набор признаков из X ).

Похожие диссертации на Математические модели суффиксального словообразования и их использование для автоматической обработки отглагольных имен существительных в текстах русского языка