Введение к работе
Актуальность темы. В последние годы задачи связанные с формированием всеобъемлющих пространств знаний пытаются решать с использованием онтологических систем. Главное отличие онтологий от других систем представления знаний заключается в их сетевом взаимодействии и совместном использовании одних онтологий для целей расширения и верификации других онтологий. Совместное использование онтологий рассматривается как механизм неограниченного накопления знаний об окружающем мире, онтологии выступают в качестве средства хранения и интеграции знаний. Совместное использование онтологий достигается в процессе их соединения.
Для формирования пространств знаний из большого числа независимых онтологий необходимо решить задачу их автоматического соединения, состоящую из трёх последовательных этапов, каждый из которых использует результаты предыдущего. Первый этап - это установление соответствий между онтологиями через их отображение друг на друга, второй этап - это сохранение установленных соответствий внутри сливаемых онтологий через их выравнивание, третий этап - это непосредственное объединение онтологий. В настоящий момент разработаны методы автоматического отображения онтологий, которые позволяют, с той или иной точность, выявлять подобные элементы в качестве кандидатов на слияние. Задачи автоматического выравнивания и непосредственного объединения проработаны в гораздо меньшей степени. Все существующие методы соединения онтологий являются полуавтоматическими. Это означает, что инструментальные средства слияния, используя алгоритмы автоматического отображения онтологий, генерируют варианты для объединяемых сущностей, а потом человек-эксперт вручную проводит выравнивание онтологий и их непосредственное объединение.
Для того чтобы знания, сохраненные внутри независимых онтологий, могли быть полноценно задействованы для решения разнообразных поисковых задач необходимо иметь инструмент, реализующий автоматический поиск нужных онтологий и их совместное использование. Очевидно, что в ситуации, когда требуется найти и учесть множество онтологий, режим работы человека-эксперта и программы-помощника является малопродуктивным. Это является одним из сдерживающих факторов, мешающих повсеместному внедрению и широкому использованию онтологий. Гораздо более предпочтительной является схема работы программных агентов, которые периодически просматривают ресурсы сети на предмет поиска подходящих онтологий и осуществляют их автоматическое соединение с целью получения наиболее широко проработанной базы знаний.
Настоящая диссертационная работа выполнена в рамках данной проблематики и посвящена разработке и исследованию методов для решения задачи автоматического выравнивания и непосредственного объединения онтологий, которые основываются на грамматическом подходе к представлению онтологических знаний.
Целью диссертационной работы является разработка и исследование методов автоматического выравнивания и непосредственного объединения онтологий, построенных на независимых основаниях, с использованием грамматического подхода.
Для достижения поставленной цели в диссертационном исследовании решаются следующие задачи:
-
Провести анализ существующих методов и инструментальных средств соединения онтологий.
-
Разработать и исследовать методы использования грамматического подхода для формального представления онтологий с целью их автоматического выравнивания и непосредственного объединения.
-
Разработать и исследовать модель формальной системы в виде порождающей грамматики для описания иерархических связей между различными сущностями предметной области, в которой выводимое множество терминальных цепочек образует язык, поставленный в соответствие семейству иерархий.
-
Используя модель представления онтологий предметных областей в виде грамматики, разработать алгоритм их автоматического выравнивания и непосредственного объединения. Построить программную модель для экспериментального исследования и апробации теоретических выводов и результатов.
Методы исследования включают теоретические, с использованием теории формальных систем и теории формальных грамматик, методов объектно- ориентированного анализа и моделирования, а также экспериментальные методы на основе специально разработанных программных моделей.
Достоверность результатов диссертации вытекает из корректного использования теории формальных систем и теории формальных грамматик, а также результатами проведённых экспериментов.
Научная новизна результатов диссертационной работы заключается в следующем:
-
-
Предложен новый метод формального описания иерархических связей между различными сущностями предметной области, отличающийся от известных тем, что используется грамматика, которая порождает всё множество классификационных последовательностей для элементов иерархической системы. Каждая классификация рассматривается как допустимая терминальная цепочка, а совокупность всех правильных цепочек совпадает с семейством иерархий. (С. 38-59, 66-70).
-
Разработана формальная модель онтологии предметной области в качестве средства представления распределенных сетевых знаний, которая отличается от известных тем, что построена на основе механизма порождающих грамматик. (С. 3135).
-
Предложен новый метод соединения онтологий (без разработки собственных процедур автоматической идентификации подобных сущностей) для целостного представления разрозненных знаний, отличающийся от известных тем, что основан на представлении онтологий с использованием грамматического подхода. Применение грамматик для описания онтологических знаний позволяет решать задачи автоматического выравнивания и непосредственного объединения онтологий (задача автоматического отображения онтологий не рассматривается). (С. 107-120).
Основные положения, выносимые на защиту:
-
-
-
Предложена схема грамматики для вывода семейства иерархий всевозможных сущностей предметной области, которая используется для реализации алгоритма их автоматического соединения.
-
Предложена формальная модель онтологии предметной области на основе грамматического подхода, которая позволяет решать задачи автоматического выравнивания и непосредственного объединения независимых онтологий, разработанных вне рамок единой базовой онтологии.
3. Разработан алгоритм решения задачи автоматического выравнивания и непосредственного объединения онтологий, которые имеют своё представление на базе грамматического подхода.
Практическая ценность диссертационного исследования заключается в прикладном характере предложенных алгоритмов выравнивания и непосредственного объединения онтологий, позволяющих проектировать программные агенты для автоматического построения единой базы онтологических знаний, которые сформированы из многих частей, хаотично размещенных в сети, и разработанных независимо друг от друга вне рамок базовой системы понятий. Сформированная внутри программных агентов единая база знаний может быть использована для интеллектуального поиска среди данных не связанных друг с другом в явном виде.
Использование результатов работы. Полученные в работе результаты использованы в рамках решения задач по исследованию и разработке средств представления и накопления знаний и внедрены в научно-исследовательский процесс лаборатории ELDIC.
Апробация результатов работы. Основные результаты работы докладывались и обсуждались на конференциях и семинарах различного уровня:
-
Всероссийской научной школе-семинаре молодых ученых, аспирантов и студентов «Интеллектуализация информационного поиска, скантехнологии и электронные библиотеки» (Таганрог, ТТИ ЮФУ, 25-28 мая 2010г.);
-
II Международной научно-технической конференции «Технологии разработки информационных систем (ТРИС-2011)» (Геленджик, филиал ТТИ ЮФУ, 18-24 сентября 2011г.);
-
IX Всероссийской научной конференции молодых ученых, аспирантов и студентов «Информационные технологии, системы анализ и управление» (Таганрог, ТТИ ЮФУ, 08-09 декабря 201 Ir.);
Всероссийской научной школе-семинаре молодых ученых, аспирантов и студентов «Интеллектуализация информационного поиска, скантехнологии и электронные библиотеки» (Таганрог, ТТИ ЮФУ, 23-25 мая 2012г.);
III Международной научно-технической конференции «Технологии разработки информационных систем (ТРИС-2012)» (Геленджик, филиал ТТИ ЮФУ, сентябрь 2012г.).
Публикации. По материалам диссертации автором опубликовано 7 печатных работ, в том числе две статьи в изданиях из списка рекомендованного ВАК РФ, в которых отражены основные результаты диссертационного исследования.
Структура и объем работы. Диссертация состоит из введения, трёх глав и заключения. Основной текст изложен на 124 страницах, содержит 8 рисунков, 13 таблиц, список литературы из 104 наименований, приложения изложены на 17 страницах, включают коды программ, реализующих программную модель.
Похожие диссертации на Разработка и исследование грамматического подхода для решения задачи автоматического выравнивания и объединения онтологий предметных областей
-
-
-