Электронная библиотека диссертаций и авторефератов России
dslib.net
Библиотека диссертаций
Навигация
Каталог диссертаций России
Англоязычные диссертации
Диссертации бесплатно
Предстоящие защиты
Рецензии на автореферат
Отчисления авторам
Мой кабинет
Заказы: забрать, оплатить
Мой личный счет
Мой профиль
Мой авторский профиль
Подписки на рассылки



расширенный поиск

Формализованное описание структуры лексико-семантического поля глаголов деятельности для компьютерного идеографического словаря типа WordNet Ушакова Анастасия Александровна

Формализованное описание структуры лексико-семантического поля глаголов деятельности для компьютерного идеографического словаря типа WordNet
<
Формализованное описание структуры лексико-семантического поля глаголов деятельности для компьютерного идеографического словаря типа WordNet Формализованное описание структуры лексико-семантического поля глаголов деятельности для компьютерного идеографического словаря типа WordNet Формализованное описание структуры лексико-семантического поля глаголов деятельности для компьютерного идеографического словаря типа WordNet Формализованное описание структуры лексико-семантического поля глаголов деятельности для компьютерного идеографического словаря типа WordNet Формализованное описание структуры лексико-семантического поля глаголов деятельности для компьютерного идеографического словаря типа WordNet Формализованное описание структуры лексико-семантического поля глаголов деятельности для компьютерного идеографического словаря типа WordNet Формализованное описание структуры лексико-семантического поля глаголов деятельности для компьютерного идеографического словаря типа WordNet Формализованное описание структуры лексико-семантического поля глаголов деятельности для компьютерного идеографического словаря типа WordNet Формализованное описание структуры лексико-семантического поля глаголов деятельности для компьютерного идеографического словаря типа WordNet Формализованное описание структуры лексико-семантического поля глаголов деятельности для компьютерного идеографического словаря типа WordNet Формализованное описание структуры лексико-семантического поля глаголов деятельности для компьютерного идеографического словаря типа WordNet Формализованное описание структуры лексико-семантического поля глаголов деятельности для компьютерного идеографического словаря типа WordNet
>

Работа не может быть доставлена, но Вы можете
отправить сообщение автору



Ушакова Анастасия Александровна. Формализованное описание структуры лексико-семантического поля глаголов деятельности для компьютерного идеографического словаря типа WordNet : 10.02.21 Ушакова, Анастасия Александровна Формализованное описание структуры лексико-семантического поля глаголов деятельности для компьютерного идеографического словаря типа WordNet (на материале русского языка) : диссертация... кандидата филологических наук : 10.02.21 Санкт-Петербург, 2007 176 с. РГБ ОД, 61:07-10/1156

Содержание к диссертации

ВВЕДЕНИЕ 3

ГЛАВА 1 ЛЕКСИКО-СЕМАНТИЧЕСКОЕ ПОЛЕ КАК СПОСОБ ОРГАНИЗАЦИИ ЛЕКСИКО-СЕМАНТИЧЕСКОЙ СИСТЕМЫ ЯЗЫКА 9

1.1 Исторический аспект: поле Й. Трира, Л. Вайсгербера и В. Порцига 10

1.2 Семантические классы слов 14

1.3 Поля в лексике: варианты трактовки понятия 20

1.4 Ономасиологический и семасиологический подходы к выделению лексико-семантического поля 24

1.5 Принципы организации лексики в лексико-семантическом поле 27

1.6 Роль КОМПОНЕНТНОГО анализа при описании структуры лексического значения 34

ГЛАВА 2 ОСОБЕННОСТИ ОРГАНИЗАЦИИ ЛЕКСИКО-СЕМАНТИЧЕСКОГО ПОЛЯ ДЕЯТЕЛЬНОСТИ 40

2.1 Действие и деятельность: проблема разграничения 40

2.2 Характер временной локализованности как семантическая особенность, являющаяся основанием для выделения поля глаголов деятельности 46

2.3 Принципы семантической классификации предикатных выражений 3. Вендлера 48

2.4 т-категория е.в. пддучевой для семантической классификации аспектуальных соотношений глаголов русского языка 54

2.5 Особые виды «состояний» 3. Вендлера 60

2.6 Анализ семантических особенностей обобщенных и частных «состояний» 62

2.7 Предикаты класса и способы глагольного действия 66

ГЛАВА 3 ФОРМАЛИЗОВАННОЕ ОПИСАНИЕ СТРУКТУРЫ ЛЕКСИКО-СЕМАНТИЧЕСКОГО ПОЛЯ ГЛАГОЛОВ ДЕЯТЕЛЬНОСТИ ДЛЯ КОМПЬЮТЕРНОГО ИДЕОГРАФИЧЕСКОГО СЛОВАРЯ ТИПА WORDNET 70

3.1 Определение состава и выявление базовой структуры лексико-семантического поля глаголов деятельности 70

3.2 контекстный анализ как метод выявления структуры лсп глаголов деятельности 80

3.3 Состав лексико-семантического поля деятельности и его основные параметры 85

Архилексема ЛСП деятельности и ее связи 102

Подгруппа глаголов приобретения знаний и обучения 111

Подгруппа глагола РАБОТАТЬ 116

Подгруппа глагола ВОСПИТЫВАТЬ 129

Подгруппа глагола ВОЕВАТЬ 135

Подгруппа глагола ТОРГОВАТЬ 143

Подгруппа глагола ЗАЩИЩАТЬ 146

Подгруппа глагола ЗАБОТИТЬСЯ 154

ЗАКЛЮЧЕНИЕ 165

СПИСОК ЛИТЕРАТУРЫ 169 

Введение к работе

Представление семантической информации, содержащейся в языке, в виде удобной для пользователя и многофункциональной структуры остается по-прежнему нетривиальной задачей, побуждающей исследователей искать новые подходы к решению проблем, связанных с созданием такого описания. Обращение лингвистов к компьютерным ресурсам открыло ряд новых возможностей, что послужило толчком к появлению такого проекта как WordNet, опирающегося на обширную словарную базу, единицы которой существуют не изолированно друг от друга, но связаны между собой разнообразными парадигматическими отношениями. Компьютерная версия идеографического словаря WordNet появилась в 1995 году. Компьютерные технологии являются одним из средств, дающим возможность формализовать содержательную сторону языка, представив ее в виде структуры (сети) значений.

Методология построения лексико-семантической базы данных WordNet была заложена группой ученых Принстонского университета (США), возглавляемой Дж. Миллером (Miller 1990, Fellbaum 1998). Задача, которую они поставили перед собой, предполагала структурное описание лексики английского языка как составляющей языкового знания его носителей. В связи с этим исследователи делали упор на психолингвистические методики и большое внимание уделяли данным ассоциативных экспериментов. Получившийся в результате компьютерный идеографический словарь WordNet представляет собой сеть, базовыми элементами которой являются слова и синонимические ряды (синсеты). Синсеты могут быть связаны друг с другом парадигматическими отношениями. База данных состоит из четырех разделов, соответствующих четырем частям речи - существительному, прилагательному, наречию и глаголу.

Установка на приоритетность принципов организации лексических единиц в сознании носителей языка вывела на первое место отношения, которые связывают вместе разрозненные элементы словаря, формируя некую структуру. Слова, связанные лексико-семантическими отношениями, обычно принадлежат к одной семантической области или семантическому полю. Единица такой области (слово или синеет) представляет собой лексикализованное понятие. Информация о такой единице, содержащаяся в словаре, включает в себя словарное определение значения слова с примерами употребления в данном значении, указание на часть речи, к которой принадлежит данная единица, и ее парадигматические связи (антонимы, гипонимы, гиперонимы, тропонимы и т. д.). Кроме этого, запрос в виде слова предполагает в качестве ответа перечисление всех синонимических рядов, в состав которых данное слово входит (что эквивалентно перечислению всех его значений).

Идеи, которыми руководствовались создатели WordNet, получили широкое развитие — в ходе реализации проекта Euro WordNet к 1999 году были разработаны лексико-семантические базы данных для целого ряда европейских языков (французского, испанского, итальянского, немецкого, голландского, эстонского и чешского). Участники Euro WordNet следовали основным принципам, лежащим в основе WordNet, и поставили перед собой аналогичную задачу — описание всего комплекса языковых единиц, а не какой-либо отдельно взятой тематической или семантической области. При этом необходимо отметить, что тематическая организация лексики не принималась во внимание создателями WordNet, в основе которого лежат прежде всего внутриязыковые системные связи единиц. Тезаурус каждого из языков отражает особенности лексической системы соответствующего языка. Между собой национальные тезаурусы связаны посредством общей понятийной схемы (Top Ontology), которая включает в себя более 1300 понятий. Система межъязыковых указателей (Inter-Lingual-Index) позволяет установить корреляцию между элементами понятийной схемы и переходить от одной языковой структуры WordNet к другой. В отличие от американских ученых создатели

EuroWordNet опирались прежде всего на традиционные лексикографические источники (толковые, синонимические и переводные словари), а также корпусы текстов (Азарова и др. 2002).

В 1999 году на кафедре математической лингвистики СПбГУ была начата работа над созданием аналогичного лексикона для русского языка. Проект получил название RussNet (Азарова и др. 2002, 2003 и 2004). Целью проекта является построение компьютерного тезауруса, который, подобно WordNet, должен охватывать базовую общеупотребительную лексику и не ограничиваться описанием отдельной терминологической области. Наполнение словаря ведется методом отбора и анализа лексико-семантических полей, в состав которых входят высокочастотные лексемы, которые предположительно формируют ядерную часть лексико-семантических полей. При этом используются данные контекстного анализа, различных толковых словарей и ассоциативного словаря. RussNet содержит четыре взаимосвязанных базы данных, отображающих лексику основных частей речи — существительных, прилагательных, глаголов и наречий.

Для русского языка не существует описания подобного типа. Важность его создания подкрепляется широкими возможностями, которые описание типа WordNet предоставляет пользователям: будучи уникальным информационным ресурсом, он способен дать полномасштабное представление о значениях слова, его связях в рамках лексико-семантической системы языка и возможностях его употребления. В частности, уже созданные компьютерные WordNet-лексиконы могут применяться в области информационного поиска для уточнения запросов пользователей с привлечением данных о связях слова в данном конкретном значении и для измерения смысловой близости текстов. Постепенно пополняемый тезаурус RussNet используется в процедурах автоматического анализа текстов, где его ресурсы позволяют уточнить семантическую интерпретацию текста и разрешить семантическую и грамма тическую неоднозначность (Азарова и др. 2006). Актуальность исследования определяется необходимостью развития представлений, связанных с полевым методом, для его использования в качестве основы компьютерного идеографического словаря RussNet, включающего информацию о парадигматических связях. Выбор глаголов деятельности в качестве предмета исследования обусловлен тем, что этот пласт глаголов пока остается в стороне от систематизирующих описаний, что, в свою очередь, объясняется диффузным характером категориального значения деятельности, лишенного четко очерченных границ и прозрачной внутренней структуры. В то же время тот факт, что это значение присутствует у высокочастотных глаголов, указывает на очевидную необходимость включения этой совокупности в состав интегрального описания.

Целью исследования является создание структурного описания ядра лек-сико-семантического поля глаголов деятельности русского языка и выявление основных закономерностей и коррелятивных зависимостей, существенных для дальнейшего описания поля, в их взаимодействии с лексическим окружением.

Указанная цель предполагает решение следующих задач исследования:

1) рассмотрение теории лексико-семантического поля с выделением базовых принципов методологии его построения в контексте обработки подмножества глаголов для представления в тезаурусе RussNet (глава 1);

2) анализ специфических особенностей категориального значения деятельности (глава 2);

3) отбор и контекстный анализ глаголов, реализующих значение деятельности, с выявлением парадигматических связей между глагольными значениями (глава 3).

Научная новизна исследования состоит

• в использовании комплексного подхода к анализу и последующему описанию лексико-семантического поля как базового компонента компьютерного тезауруса RussNet;

• в выполнении анализа категории деятельности применительно к ее использованию в качестве полеобразующего значения;

• в оформлении модели семантического поля глаголов деятельности путем представления системы параметров категориального значения.

Исследование проводилось на материале 74 значений глаголов деятельности, реализующихся в 2959 контекстах исследовательского корпуса текстов «Бокренок» (Азарова, Синопальникова 2004).

Таким образом, в число теоретических задач, поставленных перед автором, входило следующее:

1. анализ теории лексико-семантического поля (виды парадигматических группировок, варианты трактовки понятия поля, основные подходы к наполнению лексико-семантического поля, особенности его внутренней организации);

2. решение проблемы разграничения понятий «действие» и «деятельность» и раскрытие содержательных особенностей последнего;

3. сопоставление и анализ семантических классификаций, опирающихся на особенности временной соотнесенности глаголов;

4. выявление особенностей временной соотнесенности глаголов деятельности и параметров полеобразующего значения;

5. формулировка принципов анализа видовых пар глаголов для их представления в тезаурусе RussNet.

Практическими задачами работы являлись: 1. определение принципов отнесения глаголов к лексико-семантическому полю глаголов деятельности;

2. отбор наиболее употребительных (частотных) глаголов, реализующих деятельностное значение (согласно перечню, приведенному в частотном словаре С.А Шарова);

3. анализ структуры значений выделенных глаголов с учетом результатов контекстного анализа и лексикографической информации;

4. выявление и описание парадигматических связей глаголов деятельности.

Работа состоит из трех глав. В первой главе рассматривается лексико-семантическое поле как способ организации лексико-семантической системы языка. Отдельные разделы посвящены описанию истории вопроса, перечислению видов различных парадигматических группировок слов и их особенностей, изложению вариантов трактовки понятия «поле», анализу существующих подходов к выделению лексико-семантического поля и принципов его внутренней организации. Во второй главе проводится разграничение понятий «действие» и «деятельность» на основе различий во временной локализованное™ глаголов, анализируется ряд классификаций, отражающих содержательные особенности аспектуальных соотношений глаголов, выделяются области этих классификаций, соотносимые с понятием «деятельность». Третья глава посвящена структурному описанию ядерной части лексико-семантического поля глаголов деятельности русского языка для тезауруса RussNet, анализу значений и парадигматических связей ряда глаголов периферии рассматриваемого поля, а также раскрытию параметров, актуальных для расширения его количественного состава и выявления входящих в него подгрупп.

Похожие диссертации на Формализованное описание структуры лексико-семантического поля глаголов деятельности для компьютерного идеографического словаря типа WordNet