Модели алгоритмического типа для распознавания семантических связей в системах машинной обработки естественного языка Поляков, Владимир Николаевич

Данная диссертационная работа должна поступить в библиотеки в ближайшее время
Уведомить о поступлении

Диссертация, - 480 руб., доставка 1-3 часа, с 10-19 (Московское время), кроме воскресенья

Автореферат - бесплатно, доставка 10 минут, круглосуточно, без выходных и праздников

Поляков, Владимир Николаевич. Модели алгоритмического типа для распознавания семантических связей в системах машинной обработки естественного языка : автореферат дис. ... кандидата технических наук : 05.13.16 / Моск. гос. ин-т стали и сплавов.- Москва, 1997.- 20 с.: ил. РГБ ОД, 9 98-1/1981-0

Введение к работе

Актуальность работы обуславливается потребностями, возникшими в области обработки естественно-языкового текста в связи с бурным развитием компьютерных средств коммуникации. Достижения последних лет в области современной логики, искусственного интеллекта и компьютерной лингвистики создали новые предпосылки для исследования природы семантических связей в естественном языке в целях построения формальных моделей для естественноязыковых форм: предложения, высказывания, текста. Прогресс в области информационных технологий обеспечил необходимые предпосылки для компьютерной реализации разработанных моделей.

Цель данной работы - исследование природы семантических связей в предложении и высказывании естествегаюго языка, а также разработка алгоритмических моделей для автоматического построения логических выражений, описывающих их семантику (= смысл) с учетом перспективы дальнейшего использования в целом ряде прикладных компьютерных систем (системы машинного перевода, текстовые базы .данных, системы анализа текстов, естественно- языковой интерфейс к автоматизированным системам).

Достижению поставленной цели подчинено решение следующих более конкретных задач исследования:

изучить полученные ранее и опубликованные в литературе результа.ы в области исследования предложения и высказывания как феноменов естественного языка; изучить существующий опыт построения формальных моделей языка (=грамматик) и смысла естественно-языковых форм;

исследовать механизмы взаимосвязи семантически эквивалентных друг другу языковых и логических структур с целью выявления семантических примитивов модели языка и модели смысла ; определить понятия семантический примитив модели языка и семантический примитив модели смысла; выявить семантические примитивы в составе логического представления смысла; изучить их структуру, типы, свойства, внутренние и внешние семантические связи; выявить их эквиваленты в естественно-языковых формах предложения и высказывания; изучить структуру, типы, свойства, признаки идентификации естественно-языковых эквивалентов семантических примитивов модели смысла, закономерности построения структурного представления предложения с использованием семантических примитивов модели языка, закономерности построения логического представления предложения и высказывания с использованием семантических примитивов модели смысла;

построить грамматики и модели представления смысла для машинной обработки наиболее часто встречающихся в научных и технических .текстах повествовательных предложений и высказываний утвердительного типа;

разработать методы и алгоритмы машинного выявления семантических примитивов в языке и их использования для построения логического представления смысла предложения.

Научная новизна диссертации состоит в том, что автором:

предлагается новый подход к разработке моделей для обработки естественно
языковых форм, который заключается в том, что разрабатываются
одновремешю две согласованные модели: модель языка (грамматика) и модель
смысла;

в основе согласования моделей языка и смысла лежит идея автора о существовании эквивалентных семантических примитивов в моделях языка и смысла;

последовательно разграничиваются модели для различных естественноязыковых форм: предложения и высказывания на основании феноменологических свойств этих форм в области i« семантики; это обеспечивает качественно новый уровень моделирования понимания текста за счет включеїшя коммуникативно- функциональных составляющих в структуру, представления смысла;

на основании обнаруженных закономерностей разработаны алгоритмические
модели для машинной обработки повествовательных предложений и
высказываний утвердительного типа русского языка (Многоаспектная модель
смысла и Грамматика элементов смысла).

Теоретическая значимость исследования заключается в том, что в работе:

выявлены языковые и логические структуры нового типа: эквивалентные друг другу семантические примитивы модели языка и модели смысла;

исследованы их типы, состав, свойства, семантические связи;

выявлены закономерности построения структурных представлений предложеїшй на основе семантических примитивов языка,

показана связь между семантическим примитивом модели языка и поверхностно-синтаксическим отношением в модели Смысл <-> Текст,

выявлены закономерности построения логических представлений предложений и высказываний на основе семантических примитивов модели смысла;

определены логические формулы для повествовательных предложений и высказываний утвердительного типа русского языка;

показан универсальный характер обнаруженных закономерностей на примерах из русского и английского языков ;

показаны ограничения в существующих моделях, которые можно преодолеть при использовании семантических примитивов в моделях языка и смысла.

Практическая ценность диссертации заключается в возможности использования результатов работы при разработке прикладных систем моделирования языковой способности - лгаспшетических процессоров различного назначения, при разработке автоматизированных систем извлечения из текстов данных и знаний. Обнаруженные закономерности могут быть использованы в методике преподавания русского языка как инострашюго и иностранных языков. Результаты исследования могут найти применение в теоретических курсах по компьютерной лингвистике.

Предмет, материал и цель исследования определили используемые в работе меТощ:

При подборе, анализе и интерпретаций фактов естественного языка
использовались ог(исате*но4мал«тическия и диетрибутивне-

контекстологический методы исследования, компойентиый анализ. Построение формальных моделей языка и смысла потребовало привлечения методов структурночжмаїггического и логйко-математяческого моделирования. При разработке программного обеспечения использовались методы алгоритмического моделирования, метод макетирования и элемлпы структурного прстгзаммирования. В работе использовался компьютерный эксперимент.

На защиту выносятся Многоаспектная модель смысла для предложения и высказывания, Грамматика элементов смысла, которые имеют следуюпгче рсиовпые положения:

1. Смысл предложешга и высказывания может быть представлен как логическая
формула, состоящая из типовых струттурных единиц - семантических
примитивов модели смысла.

2. Для того, чтобы учитывать феноменологические особенности построения
естественно-языкового высказывания, семантический примитив в модели
смысла должен включать:

вид отношения (действия, состоянкя) и его участников;

значения коммуникативной и семантической роли участников отношения;

референциалыгое значение.

Поэтому о« может быть описан в исчислении предикатов несимметричным предикатом с явным указанием на индивидное и множествешюе значение термов. При этом порядок термов задает их коммуникативные роли, а множественно-категориальное значение - семантические роли. Форма задают

юідивидного и множествешю- референциального значеїшя терма определяет его референциальный тип. Такой семантический примитив получил название элемент субъект - отношение - атрибут или СОА-элемент. , 3. СОА-злементу в составе предложения можно поставить в соответствие однозначно морфемно- семантическую, лексико-семантическую или структурно-семантическую единицу: семантический примитив языка, получивший название элемент смысла.

А. Элементы смысла, соединяясь, образуют структурное (= графовое) представление - дерево элементов смысла.

Дереву элементов смысла соответствует один из компонентов логической формулы для смысла простого предложения.
Темпоральные отношения образуют второй компонент формулы для смысла простого предложения - сетевой граф.
Смысл сложного предложения в отличие от смысла простого предложеїшя включает два дополнительных компонента, образованных сочинительными или подчинительными связями между его простыми предложениями - сеть сетей и дерево деревьев отношений.

8. Ш уровне высказывания, смысл предложещія дополняется тремя
компонентами: базовым коммуникативным компонентом, компонентом
коммуникативной пресуппозищш, компонентом обстоятельств высказывания,
которые, как правило задаются экстралингвистическими средствами.

9. Возможно построение компьютерной системы, которая при заданном типе
высказывания будет автоматически выявлять элементы смысла на основании их
признаков и составлять логическую формулу для предложения и высказывшшя
соответствешю их смыслу.

Апробация работы. Основные положения работы нашли отражение в докладах

на следующих научных семинарах и конференциях:

"Экспершые и обучающие системы", Саратов, СГУ, 1991;

"Лопгческое управление с использованием ЭВМ", Владикавказ, 1991;

"Искусственный интеллект в XXI веке", Калининград, 1995; .

"Диалог'96: компьютерная лингвистика и ее приложения", Пушино, 1996 ;

V Национальная конференция "Искусственный интеллект-96", Казань, 1996.

Теоретические вопросы диссертации освещаются в 6 научных публикациях.

Результаты работы послужили основой для создшшя исследовательской

автомашзировашюй системы моделирования языковой способности

"Недоросль-".

Публикации. По теме диссертации опубликовало 6 работ.

Структур» и объем диссертационной работы. Работа состоит из введения,

чешрех глав, заключения, двух приложений и списка литературы.

включающего 269 наименований. Основной текст занимает 163 машинописных страницы.