Электронная библиотека диссертаций и авторефератов России
dslib.net
Библиотека диссертаций
Навигация
Каталог диссертаций России
Англоязычные диссертации
Диссертации бесплатно
Предстоящие защиты
Рецензии на автореферат
Отчисления авторам
Мой кабинет
Заказы: забрать, оплатить
Мой личный счет
Мой профиль
Мой авторский профиль
Подписки на рассылки



расширенный поиск

Автоматизированное формирование лингвистических баз знаний : Интеграционный подход Субботин, Алексей Викторович

Диссертация, - 480 руб., доставка 1-3 часа, с 10-19 (Московское время), кроме воскресенья

Автореферат - бесплатно, доставка 10 минут, круглосуточно, без выходных и праздников

Субботин, Алексей Викторович. Автоматизированное формирование лингвистических баз знаний : Интеграционный подход : диссертация ... кандидата физико-математических наук : 05.13.11.- Москва, 1999.- 148 с.: ил. РГБ ОД, 61 00-1/326-3

Введение к работе

Актуальность темы

Сегодня системы, обрабатывающие естественный язык (ЕЯ-системы), применяются практически во всех областях человеческой деятельности. Эти системы решают широкий спектр задач, начиная от поддержки редактирования текстов, до информационного поиска, управления документооборотом, обработки запросов и генерации текстов и речи на естественном языке (ЕЯ).

Общепризнанным фактом является то, что для достижения приемлемого для большинства задач качества ЕЯ-обработки необходимы специальные информационные массивы, содержащие информацию о языке, называемые «лингвистическими базами знаний» (ЛБЗ). В связи с большим объемом, сложностью, разнородностью обрабатываемой при формировании ЛБЗ информации, а также необходимостью привлечения экспертов формирование баз знаний нуждается в автоматизации. Практика показывает, что для эффективного формирования лингвистических баз знаний необходимо совместное использование различных методов обработки лингвистической и текстовой информации.

Однако при интеграции методов формирования ЛБЗ возникают следующие трудности:

Отсутствуют целостные подходы к интеграции различных методов и поддерживающие их лингвистические и математические модели.

Реализация методов формирования ЛБЗ ведется на базе разных информационных технологий, часто без опоры на стандарты, что существенно затрудняет их интеграцию.

Таким образом, актуальной задачей является создание моделей, на основе которых могут быть интегрированы различные методы автоматизированного формирования ЛБЗ, и их компьютерная реализация.

Основные цели работы

Основными целями представленной диссертационной работы являются:

обобщение опыта интеграции различных методов автоматизированного формирования ЛБЗ в целостный подход,

создание моделей для представления ЛБЗ и процесса их формирования,

разработка архитектуры системы автоматизированного формирования ЛБЗ.

Научная новизна

В диссертации на основе анализа существующих подходов к автоматизированному формированию ЛБЗ, современных технологий и методологий построения информационных систем формулируется новый подход к интеграции различных методов обработки лингвистической информации. Стержнем этого подхода является метамодель для интеграции различных методов формирования ЛБЗ (МЕТАМОДЕЛЬ), основанная на метамодели языка объектного моделирования UML и нечеткой математике.

В диссертации предложены оригинальные методы автоматизированного формирования отдельных компонентов ЛБЗ, а также архитектура распределенной системы автоматизированного формирования ЛБЗ (САФЛБЗ), основанная на стандартах OMG (CORBA, CORBAservices, CORBAfacilities).

Методы исследования

В работе использованы методы объектно-ориентированного моделирования, анализа, проектирования и программирования, нечеткой математики, теории сетей Петри.

Практическая значимость работы

Работа выполнена в рамках госбюджетной темы НИР кафедры алгоритмических языков факультета Вычислительной математики и кибернетики МГУ им. М.В. Ломоносова «Лингвистические и алгебраические методы в современных информационных технологиях» (Гос. per. № 01960003308).

Результаты работы использованы при выполнении НИР по теме «Программно-информационное обеспечение обработки текста в интегрированных информационных системах» (подпрограмма «Информатизация России» - шифр проекта 037.01.178.23, Гос. per. № 01.9.80 003341).

Практическая значимость данной работы подтверждается результатами экспериментов с системой распознавания речи, разрабатывавшейся в рамках договора о сотрудничестве между факультетом вычислительной математики и кибернетики МГУ им.М.В.Ломоносова и американской компанией Accent,Inc. в 1995-1996 гг. (за счет применения методов, описанных в третьей главе диссертации, бьшо зафиксировано устойчивое повышение надежности распознавания на 1 -2% при исходном уровне в 93-94%), а также эксплуатацией прототипов системы автоматизированного формирования ЛБЗ при построении специализированного информационно-поискового тезауруса.

Созданная метамодель может применяться для унифицированного іредставления различных методов обработки лингвистической информации.

Апробация

Результаты диссертационной работы докладывались на Международных сонференциях и семинарах: "Интеллект. Язык. Компьютер." (Казань, 1996г.), 'Диалог'97" и "Диалог'98" (Ясная поляна 1997г., Таруса 1998г.), "Когнитивное моделирование" (Пугцино, 1999г.), "Анализ систем на рубеже тысячелетий: Теория и Трактата" (Москва, 1998, 1999 гг.), а также на научной конференции МГУ 'Ломоносовские чтения" (Москва, 1997 г.).

Публикации

По теме диссертации опубликовано 7 работ, достаточно полно отражающих кновные научные результаты диссертации.

Структура и объем работы

Похожие диссертации на Автоматизированное формирование лингвистических баз знаний : Интеграционный подход