Электронная библиотека диссертаций и авторефератов России
dslib.net
Библиотека диссертаций
Навигация
Каталог диссертаций России
Англоязычные диссертации
Диссертации бесплатно
Предстоящие защиты
Рецензии на автореферат
Отчисления авторам
Мой кабинет
Заказы: забрать, оплатить
Мой личный счет
Мой профиль
Мой авторский профиль
Подписки на рассылки



расширенный поиск

Метод автоматизированного построения онтологии предметной области Антонов, Игорь Вадимович

Метод автоматизированного построения онтологии предметной области
<
Метод автоматизированного построения онтологии предметной области Метод автоматизированного построения онтологии предметной области Метод автоматизированного построения онтологии предметной области Метод автоматизированного построения онтологии предметной области Метод автоматизированного построения онтологии предметной области
>

Диссертация - 480 руб., доставка 10 минут, круглосуточно, без выходных и праздников

Автореферат - бесплатно, доставка 10 минут, круглосуточно, без выходных и праздников

Антонов, Игорь Вадимович. Метод автоматизированного построения онтологии предметной области : диссертация ... кандидата технических наук : 05.13.01 / Антонов Игорь Вадимович; [Место защиты: Балт. гос. техн. ун-т (ВОЕНМЕХ) им. Ф.Д. Устинова].- Псков, 2011.- 156 с.: ил. РГБ ОД, 61 12-5/76

Содержание к диссертации

Введение

1. Проблемы автоматизации построения онтологии предметной области 12

1.1. Способы формального представления онтологии 12

1.2. Инструментальные средства построения онтологии 15

1.3. Анализ существующих подходов к автоматизации построения онтологии предметной области 17

1.4. Постановка задачи по разработке метода автоматизированного построения онтологии предметной области 22

Выводы по главе.1 25

2. Разработка модели и метода автоматизированного построения онтологии предметной области 27

2.1. Математическая модель онтологии предметной области 27

2.2. Модель машинного представления онтологии 30

2.3. Разработка метода и алгоритмов автоматизированного построения онтологии предметной области 38

Выводы по главе 2 56

3. Проектирование программной реализации метода автоматизированного построения онтологии предметной области 58

3.1 Разработка базы данных онтологии предметной области 59

3.2 Разработка редактора онтологии предметной области 68

3.3 Технология построения онтологии на основе метода автоматизированного построения онтологии предметной области 93

Выводы по главе 3 99

4. Экспериментальное исследование метода автоматизированного построения онтологии предметной области 101

4.1 Выбор предметной области для исследования метода автоматизированного построения онтологии 101

4.2 Экспериментальное построение онтологии предметной области... 103

Выводы по главе 4 115

Заключение 117

Список использованных источников 118

Введение к работе

Актуальность темы. В диссертации ставятся и решаются задачи, связанные с разработкой математического и программного обеспечения автоматизированного построения онтологии предметной области. Процесс развития современного общества характеризуется постоянно возрастающей ролью информационных технологий в науке, производстве и управлении. В последние годы многократно увеличились объемы информационных потоков, что привело к необходимости поиска новых способов хранения, представления, формализации, систематизации и автоматической обработки информации в компьютерных системах. Одним из результатов работ, выполняемых в данном направлении, стало появление онтологических технологий и их использование в информационных системах. Онтологии обеспечивают связное системное представление иерархии и содержания системы понятий, охватывающих предметную область. В этой роли они используются в учебных, научных и производственных приложениях, включая задачи информационной поддержки проектирования сложных технических систем. Формализованное представление понятийной структуры предметной области в онтологии позволяет выполнять автоматическую обработку онтологической информации, что находит применение в поисковых системах нового поколения и системах интеграции данных, получаемых из гетерогенных источников.

Весомые результаты в работах по онтологическому представлению знаний связаны с работами таких ученых, как Т.А. Гаврилова, В.П. Гладун, А.С. Клещев, В.Д. Соловьев, Т.В. Левашова, В.Ф. Хорошевский, М. Minsky, Т. Graber, S. Staab, R. Studer, A. Gomez-Perez, Y. Sure, T. Winograd и др.

В применяемых в настоящее время редакторах онтологии построение онтологии выполняется экспертом предметной области вручную и сводится к последовательному включению моделей новых концептов в онтологию. В последние годы в ряде работ рассматриваются различные методы автоматического и автоматизированного построения онтологии, для чего, как правило, используется лексический и синтаксический анализ документов. Исследования, проводимые в данном направлении, представлены в работах Н.Г. Загоруйко, Л.В. Найхановой, A.M. Налетова, Е.А. Рабчевского, В.Ш. Рубашкина, С.В. Смирнова, A. Maedche, S. Staab, Н. Haav и др.

Однако рассматриваемые в работах вышеупомянутых авторов методы автоматизации не охватывают всех аспектов построения онтологии, характеризуются рядом ограничений и, как правило, не предусматривают автоматизации построения многоуровневой онтологической иерархии. В целом проблема отсутствия инструментов автоматического и автоматизированного построения онтологии остается актуальной.

Целью диссертационной работы явилась разработка средств, обеспечивающих автоматизацию процесса построения онтологии предметной области.

Поставленная цель потребовала решения следующего ряда взаимосвязанных задач:

  1. Исследовать существующие методы и технологии построения онтологии предметной области.

  2. Сформировать модель онтологии предметной области, обеспечивающую возможность автоматизации построения онтологии.

  3. Разработать метод автоматизированного построения онтологии предметной области.

  4. Построить алгоритмы, реализующие метод автоматизированного построения онтологии предметной области.

  5. Разработать программное обеспечение построения онтологии предметной области.

Объектом исследования является технология построения онтологии предметной области.

Предметом исследования являются модели и методы автоматизированного построения онтологии предметной области.

Методы исследования. При проведении исследований использовались принципы и методы системного анализа, теория множеств, теория графов, математическая логика, технологии объектно-ориентированного анализа, проектирования и программирования.

Научные положения, выносимые на защиту:

  1. Модель онтологии предметной области, реализующая принцип классообразующей роли атрибутивной структуры концептов.

  2. Метод построения онтологии предметной области, обеспечивающий автоматическое размещение концепта в онтологии на основе анализа атрибутивного состава концепта.

  3. Проект базы данных и редактора онтологии в качестве программного комплекса, обеспечивающего автоматизированное формирование онтологии предметной области с функциями машинного обучения распознаванию семантически незначимых обобщенных концептов.

Научная новизна:

  1. Построенная математическая модель онтологии предметной области, основанная на классообразующей роли атрибутивной структуры концептов, позволяет автоматизировать операции включения концептов в онтологию, выполняемые до этого экспертом предметной области вручную.

  2. Разработанный метод построения онтологии предметной области обеспечивает автоматический поиск места для размещения новых концептов в онтологической иерархии, что позволяет исключить влияние субъективности эксперта и необходимость принятия экспертом интуитивных решений в процессе определения места включения нового концепта в онтологию.

  3. Построенный программный комплекс реализует совокупность операций автоматизированного построения онтологии предметной области и обеспечивает машинное обучение автоматическому распознаванию семантически незначимых обобщенных концептов, что позволяет исключить многократную обработку таких концептов в процессе построения онтологии.

Практическая ценность работы. В результате выполнения работы создано специальное программное обеспечение, обеспечивающее автоматизацию операций включения концептов в состав онтологии предметной области. Предложенное решение сокращает число операций, выполняемых вручную экспертом предметной области в процессе создания онтологии, исключает влияние субъективности эксперта и необходимость принятия им интуитивных решений при включении новых концептов в состав онтологии. Указанные свойства разработанного в диссертации решения улучшают потребительские качества и расширяют диапазон возможностей программных средств, используемых для построения онтологии предметной области, в случае применения в них разработанного метода.

Разработанные алгоритмы и программные средства могут использоваться для построения онтологии предметной области в системах семантически-ориентированного доступа к информационным ресурсам, включая системы навигации и поиска, электронных обучающих системах, использующих онтологическое структурирование элементов знаний и учебных объектов, информационных системах научно-исследовательского назначения, обеспечивающих построение согласованной между специалистами унифицированной концептуальной модели предметной области.

Реализация результатов работы. Результаты диссертационной работы используются в учебном процессе кафедр вычислительной техники и информационных систем и технологий Псковского государственного политехнического института и кафедры «Прикладная информатика» Санкт-Петербургского Государственного университета технологии и дизайна. Модель онтологии и метод построения онтологии, обеспечивающие автоматизацию размещения новых концептов в онтологической иерархии, используются в качестве теоретических материалов по современным онтологическим технологиям в учебных курсах «Представление знаний в информационных системах» и «Интеллектуальные информационные системы». Редактор онтологии CONCEPT MAKER используется при проведении практических занятий студентов специальности 230201 по курсу «Представление знаний в информационных системах» в качестве инструмента автоматизированного построения онтологии предметной области.

Апробация работы. Результаты работы были представлены для обсуждения на XV Международной научно-методической конференции «Высокие интеллектуальные технологии и инновации в образовании и науке» в 2008 году, на XIII Всероссийской конференции по проблемам науки и высшей школы в 2009 году, на XIV всероссийской конференции «Фундаментальные исследования и инновации в национальных исследовательских университетах» в 2010 году, на XIV Международной научно-практической конференции «Системный анализ в проектировании и управлении» в 2010 году, на XVIII Международной научно-методической конференции «Высокие интеллектуальные технологии и инновации в национальных исследовательских

университетах» в 2011 году, на 12-м Международном форуме «Высокие технологии XXI века» в 2011 году.

Личный вклад автора. Основные научные положения, методы, алгоритмы и их программные реализации, содержащиеся в диссертационной работе, получены автором самостоятельно.

Публикации. Основные теоретические и практические результаты диссертации опубликованы в 20 научных работах, среди которых 8 статей (одна статья опубликована в журнале, входящем в число ведущих рецензируемых изданий, рекомендуемых в перечне ВАК), 11 докладов на международных и общероссийских научно-практических и научно-технических конференциях, а также 1 свидетельство о государственной регистрации программы для ЭВМ.

Структура и объем диссертации. Диссертация состоит из введения, четырех глав, заключения, списка использованных источников, включающего в себя 108 наименований. Работа изложена на 128 страницах, содержит 39 рисунков, 6 таблиц и 4 приложения.

Постановка задачи по разработке метода автоматизированного построения онтологии предметной области

Как следует из анализа рассмотренных выше работ, в настоящее время наблюдается определенная недостаточность технологий и инструментальных средств, которые обеспечивали бы автоматизированное построение и сопровождение онтологии предметной области [87]. Данное обстоятельство является фактором, ограничивающим масштабы использования онтологических технологий в современных информационных системах и сдерживающим темпы их внедрения. Дальнейший прогресс в этой сфере требует разработки новых методов автоматизированного построения онтологии предметной области и программных средств, предоставляющих возможности автоматизации построения и сопровождения онтологии [88].

В разделе 1.3 были рассмотрены современные разработки, связанные с поисками решений по автоматизации построения онтологии. В рассмотренных в разделах 1.3.1 и 1.3.2 работах формализованные методы анализа данных используются для извлечения из текстов предметной области статистической информации об используемых в них терминах и типичных сочетаниях этих терминов. Полученная в результате работы этих методов информация выступает в роли справочных данных, анализируемых в дальнейшем экспертом и учитываемых им в процессе принятия решений о внесении изменений в онтологию. Соответственно, указанные методы автоматизации не затрагивают собственно фазу инжиниринга онтологии, а только предоставляют для нее исходные данные. Метод, рассмотренный в разделе 1.3.3, напротив, на основе формального анализа данных о структуре объектов предметной области обеспечивает полностью автоматическое формирование структуры онтологии. Однако отсутствие в составе метода механизмов выделения из формальных обобщений понятий, имеющих семантическую значимость для пользователей онтологии, делает проблематичным его .использование в прикладных системах. Кроме того, в методе, описанном в [23], не предусмотрен итеративный вариант построения онтологии путем последовательного включения в нее новых понятий, что является наиболее типичным случаем при решении практических задач по созданию онтологии.

Таким образом, рассмотренные подходы и методы не решают в достаточной мере задачу автоматизации построения онтологии предметной области. Соответственно, задача разработки соответствующих методов и инструментов сохраняет свою актуальность. В сложившейся ситуации представляется перспективным направление исследований, связанное с разработкой средств автоматизации операций онтологического инжиниринга на этапе введения в онтологическую модель новых концептов и выполнения операций по корректировке структуры онтологии. Предшествующая указанному этапу деятельность экспертов по содержательному анализу предметной области, выделению в ней объектов и понятий, и определению их структурного содержания является плохо формализуемой. То есть, объектная декомпозиция предметной области и структурная декомпозиция характеризующих ее понятий, это задачи, которые чаще всего плохо поддаются формализации и требуют для своего решения непосредственного участия эксперта предметной области [89]. При этом в рамках процесса формирования онтологии предметной области можно выделить задачи, для которых формализация возможна и может существенно снизить затраты на создание и сопровождение онтологии. К таким задачам можно отнести размещение нового концепта в онтологической иерархии, дополнение онтологии абстрактными категориями, обобщающими существующие концепты, анализ состава и связей концептов онтологии на целостность, непротиворечивость и полноту. Эти операции потенциально могут быть автоматизированы при условии соответствия моделей концептов, используемых в онтологии, возможности машиной обработки содержащейся в них информации. Формализация перечисленных операций, прежде всего, возможна на основе машинного анализа атрибутивного состава концептов [90]. Набор атрибутов, характеризующий концепт, является объективным и пригодным для машинного анализа источником информации для автоматизированного анализа свойств концепта и его отношений с другими концептами онтологии. Но не все, используемые на практике модели онтологии, предполагают возможность атрибутивной декомпозиции моделей концептов. В онтологиях верхнего уровня и онтологиях гуманитарной сферы преимущественно используется неформализованная вербальная интерпретация концептов, входящих в онтологию. Соответственно, в этой области возможности формализованной обработки онтологической информации существенно ограничены. Однако для онтологии, используемых в составе информационных систем, наоборот, достаточно характерным является объективное представление свойств концепта онтологии на основе определенного набора его атрибутов. Рассматриваемые в данной работе подходы могут быть применимы к онтологиям второго рода.

С учетом изложенного выше актуальной является задача разработки метода построения онтологии, позволяющего совместить автоматизацию формирования онтологической иерархии на основе формальных методов с учетом и обработкой семантической значимости формальных концептов, автоматически порождаемых алгоритмами анализа данных. Метод должен соответствовать следующим требованиям:

Автоматически определять место включения нового концепта в онтологическую иерархию и его родовидовые связи на основе анализа атрибутивного состава концепта. Позиция концепта в онтологии должна определяться независимо от уровня, который должен занять концепт в общей иерархии - на верхнем уровне, на нижнем уровне или на любом из промежуточных уровней онтологии;

Разработка метода и алгоритмов автоматизированного построения онтологии предметной области

Предложенная в 2.1-2.2 модель онтологии может являться основой для автоматизации ряда операций, выполняемых с онтологией. Далее в работе рассматривается разработка метода автоматизированного построения онтологии предметной области. Идея метода заключается в использовании формализованного анализа атрибутивного состава вводимых в онтологию концептов в качестве инструмента, применяемого для объективного определения места включения концепта в онтологическую иерархию на основе выявления родовидовых связей концепта. Возможность такого использования анализа атрибутивного состава концептов обусловлена особенностями предложенной в диссертационной работе модели онтологии предметной области. Дальнейший анализ позволяет определить общие подмножества атрибутов, наличествующие у существующих и у вновь вводимых в онтологию концептов. Существование общих подмножеств атрибутов означает наличие объективных оснований для выявления не включенных на текущий момент в онтологию абстрактных понятий, характеризующих предметную область.

На основе свойств предложенной в работе модели онтологии новые абстрактные понятия могут быть определены формальными процедурами. Однако не все новые концепты, полученные с использованием формальных процедур, представляют собой ценность для онтологии. Среди них встречаются случайно повторяющиеся комбинации атрибутов, не имеющие соответствия среди актуальных для предметной области абстрактных понятий. Данное обстоятельство требует участия эксперта предметной области на этапе оценки семантической значимости для онтологии автоматически построенных обобщений. Сохранение и учет при дальнейшей обработке информации о не имеющих семантической значимости концептах позволяет реализовать машинное обучение распознаванию концептов, не имеющих семантической значимости для онтологии. Решения, принятые экспертом, фиксируются системой, и в дальнейшем она автоматически распознает не имеющие семантической значимости обобщения и исключает их из числа новых концептов, предлагаемых для включения в онтологию.

В предлагаемом методе онтология формируется путем последовательного включения в ее состав новых концептов, что является общепринятым подходом к построению онтологии предметной области. Однако метод дополняет традиционную для редакторов онтологии технологию построения онтологии «сверху - вниз» возможностью ввода в онтологию новых концептов «снизу» в произвольном порядке, что осуществляется на основе ввода в систему информации об атрибутивном составе нового концепта. Источником вводимой в онтологию информации о структуре понятий нижних уровней могут являться знания о свойствах объектов предметной области, а также данные, получаемые в результате применения технологий анализа данных [90]. . Основные идеи предлагаемого метода изложены в работах [91-94].

Процедура определения места концепта в онтологии должна обеспечивать автоматическое выявление родовидовых связей вводимого в онтологию концепта, то есть, определение всех его связей с родительскими и дочерними концептами. Предлагаемый метод обеспечивает реализацию итеративного формирования онтологии путем последовательного ввода в модель онтологии новых моделей концептов сх, представляемых наборами их атрибутов Мх.

Рассмотрим процесс автоматического определения связей нового концепта, включаемого в онтологию.

Ввод в онтологию нового концепта сх в общем случае выполняется в

условиях наличия в онтологии сформированной ранее иерархии концептов и множества атрибутов, характеризующих эти концепты. Модель нового концепта вводится путем указания множества характеризующих его атрибутов. Атрибуты нового концепта могут содержаться в исходном множестве атрибутов онтологии М. В случае наличия в модели концепта новых для онтологии атрибутов, они включаются в множество М перед выполнением процедуры определения места концепта в онтологической иерархии.

Утверждение 1. Если множество атрибутов концепта не является надмножеством состава атрибутов какого-либо из концептов онтологии, то концепт занимает положение на уровне, непосредственно следующим за корневым концептом онтологии с0: 3Cj((су є С) л (М сМх)) = г0х := 1. Доказательство. Если множество атрибутов сх не является надмножеством множества атрибутов с}: М х Мх, то в соответствии со свойством 2 сх не является потомком сj. Если указанное условие выполняется для всех концептов онтологии, кроме с0, то ни один из них не является родительским для сх, и, следовательно, концепт сх наследует непосредственно от концепта с0.

Технология построения онтологии на основе метода автоматизированного построения онтологии предметной области

Разработанное в настоящей диссертационной работе программное обеспечение, реализуя новые возможности, связанные с автоматизацией процесса построения онтологии, поддерживает также и традиционную технологию построения онтологии предметной области путем последовательного ввода экспертом предметной области моделей концептов с явным указанием позиции их включения в онтологическую иерархию. Поскольку работа с редактором онтологии в таком режиме достаточно близка к работе в наиболее популярном редакторе Protege [78] далее рассматривается технология построения онтологии в редакторе Concept Maker с использованием его возможностей по автоматизации процесса построения онтологии. При использовании редактора в таком режиме возможен либо ручной, либо автоматический ввод моделей концептов в редактор онтологии.

В режиме ручного ввода моделей концептов эксперт предметной области формирует онтологию предметной области путем последовательного ввода моделей концептов в диалоговом режиме. Модель концепта задается путем указания характеризующих концепт атрибутов, имени и описания концепта. Атрибуты, характеризующие концепт, могут наличествовать в онтологии на этапе ввода модели концепта, либо отсутствовать в ней. Во втором случае эксперт дополняет необходимыми атрибутами список доступных в онтологии атрибутов.

Затем на основе разработанного в настоящей работе метода выполняется автоматическое определение позиции, занимаемой новым концептом в онтологической иерархии, и определяются дополнительные родовидовые связи концепта. Добавленный в онтологию новый концепт отображается на дереве концептов и на графе онтологии.

В случае использования режима ввода с автоматическим формированием обобщенных концептов выполняется поиск новых обобщений и эксперту предоставляется информация о составе и родовидовых связях найденных обобщений. Эксперт может принять решение о включении обобщения в состав онтологии. В этом случае для найденного обобщения задается имя концепта и опционально - его описание. Если эксперт принимает решение об исключении найденного обобщения из состава онтологии, соответствующий концепт включается в число запрещенных и не предлагается для анализа в дальнейшем при его обнаружении.

Далее рассматривается выполнение в редакторе CONCEPT MAKER основных операций, сопровождающих построение онтологии в режиме ручного ввода моделей концептов.

При запуске программы по умолчанию создается проект пустой онтологии, содержащей один корневой концепт, не имеющий атрибутов. База атрибутов концептов при этом является пустой. Исходный вид окна редактора онтологии после запуска представлен на рисунке 20.

Ввод моделей концептов в онтологию возможен при наличии непустой базы атрибутов. Для ввода атрибутов следует перейти на закладку «Конструктор понятия». Вид окна редактора в этом состоянии показан на рисунке 18. Кнопка «Новый» под списком «Атрибуты» вызывает панель ввода атрибута, представленную на рисунке 26. После ввода в поля панели значений свойств атрибута и выбора его типа, панель закрывается по кнопке «ОК» и атрибут включается в список атрибутов онтологии. Кнопка «Правка» позволяет изменить свойства атрибута. Удаление атрибута возможно через команду контекстного меню, появляющегося при щелчке по строке атрибута в списке правой кнопкой мыши.

Для ввода модели нового концепта на закладке «Понятия» следует нажать кнопку «Новое». Произойдет переход на закладку «Конструктор понятия». Модель концепта формируется на основе множества характеризующих концепт атрибутов. Для добавления атрибута в модель концепта строка соответствующего атрибута выделяется в списке «Атрибуты» и нажимается кнопка «- », после чего атрибут добавляется в правый список атрибутов, характеризующих вводимый в онтологию концепт. Нажатие на кнопку «X» позволяет удалить из модели концепта ошибочно включенный туда атрибут. После ввода набора атрибутов, характеризующих концепт, задается имя концепта, указывается, если требуется, атрибут, используемый для обозначения экземпляров концепта в списке экземпляров, и нажимается кнопка «Добавить». После этого программа выполняет автоматический поиск места включения концепта в онтологическую иерархию, размещает концепт в онтологии, обновляет дерево концептов, отображаемое в левой части окна редактора, и выделяет в дереве концептов вновь введенный концепт.

Если в настройке программы активны опции «Искать обобщения» и «Анализ обобщений», выполняется процедура автоматического поиска в онтологии потенциальных обобщенных концептов. Если обобщения находятся, выводится панель, представленная на рисунке 28, и эксперт принимает решение о включении нового обобщения в онтологию или о его исключении.

Для ввода концепта с явным указанием позиции его включения в онтологическую иерархию следует выбрать родительский концепт на дереве концептов и в панели «Понятия» нажать кнопку «Производное». После этого произойдёт переход в панель «Конструктор понятия», в которой в список атрибутов концепта будут автоматически включены наследуемые атрибуты. Для этих атрибутов недоступна операция их удаления. Визуальным признаком невозможности удалить атрибут является желтый цвет фона строки такого атрибута. Дальнейшие действия с моделью концепта выполняются в соответствии с пунктом 3.3.1.3.

Изменить модель концепта онтологии можно, выбрав концепт на дереве концептов и нажав кнопку «Правка». При этом произойдет переход в панель «Конструктор понятия», в которой будет отображен доступный для редактирования текущий состав атрибутов концепта. По окончании редактирования измененная модель концепта сохраняется в онтологии после нажатия на кнопку «Сохранить».

Выбор предметной области для исследования метода автоматизированного построения онтологии

Разработанный в настоящей диссертационной работе метод автоматизированного построения онтологии предметной области и реализующие его программные средства представляют собой основу для построения онтологических информационных систем, применяемых в приложениях семантически ориентированного поиска [99, 100], учебных [101, 102], научных и бизнес приложениях, работающих с онтологическими моделями и использующих онтологические аннотации информационных объектов. Одним из перспективных направлений использования онтологических технологий является их применение в системах семантически ориентированного доступа к файлам, документам и другим информационным объектам. В стандартах, разработанных для создания и использования репозиториев электронных учебных объектов - LOM (Learning Object Model) [103] и SCORM (Shareable Content Object Reference Model) [104], уже реализованы элементы семантически ориентированного доступа к данным. Поиск и отбор объектов в системах, построенных на основе этих стандартов, может выполняться на основе аннотирующих объекты метаданных. Однако в рамках стандартов LOM и SCORM метаданные не структурированы. Построение и использование онтологии предметной области позволяет иерархически структурировать метаданные учебных объектов и информационных объектов в других предметных областях. Отдельным информационным объектам предметной области при таком подходе соответствуют экземпляры концептов нижних уровней онтологии. Концепты верхних уровней при использовании разработанной в настоящей работе технологии построения онтологии могут формироваться по мере ввода в систему новых моделей объектов как обобщения (абстракции) данной предметной области. Аналогичным образом «снизу - вверх» формируются концептуальные модели конкретных предметных областей и в процессе практического их освоения человеком. То есть, используемый в работе подход в какой-то мере повторяет характер систематизирующей работы сознания человека при освоении определенной предметной области. В рамках использования предложенной методики расширение состава учитываемых системой объектов сопровождается формированием вертикальной иерархии, включающей абстрактные понятия, характеризующие предметную область. Сформированная таким образом онтология используется в качестве средства семантического аннотирования информационных ресурсов, которыми могут являться, в частности, -.любые файлы, документы и web-ресурсы. Аннотированные ресурсы включаются в онтологическую систему в качестве объектов (экземпляров) онтологии. На основе рассматриваемой системы навигация по коллекции доступных пользователям ресурсов может осуществляться посредством перемещения по уровням иерархического меню, пункты которого соответствуют концептам предметной области разного уровня обобщения. В качестве частичной аналогии может рассматриваться приложение «Проводник», входящее в состав операционной системы Windows. Однако «Проводник» работает с файловыми путями, а рассматриваемая система - с семантическими.-, категориями, реализуя таким образом инструмент семантически ориентированной навигации по информационным ресурсам. Отбор объектов также может происходить на основе обработки запросов, задающих шаблоны и ограничения для атрибутов интересующих пользователя ресурсов. Таким образом, рассматриваемая онтологическая система в роли инструмента доступа к информационным объектам совмещает в себе функции системы навигации и поисковой системы. В существующей практике для аннотирования файлов некоторых форматов (doc, pdf, трЗ и т.д.) в эти файлы включаются метаданные, представляющие собой одноуровневый набор информационных тегов. Метаданные файлов различных форматов не связаны в единую систему и не совместимы по типу. В информационной системе, построенной на основе онтологии, вместо одноуровневых разнотипных наборов данных, содержащихся в метаданных файлов, для навигации по информационным ресурсам используется единая иерархическая система аннотирования файлов и других информационных объектов. В этом случае мы имеем дело с метаинформацией, организованной иерархически и обеспечивающей общую среду аннотирования, навигации и поиска по информационным ресурсам любых типов.

С учетом вышеизложенного в качестве предметной области для экспериментального исследования метода автоматизированного построения онтологии предметной области целесообразно выбрать предметную область компьютерных файлов и документов, для которых построение онтологии обеспечивает возможность семантического аннотирования и семантически ориентированного доступа к коллекциям документов и файлов различных форматов и назначения.

Для экспериментального построения онтологии предметной области при ручном вводе моделей концептов была выбрана предметная область «форматы компьютерных файлов». Доступ к файловым ресурсам по мере роста объемов дисковых накопителей становится все более сложной задачей. Наличие у файлов онтологических аннотаций позволяет обеспечить доступ к файлам на основе семантических критериев при построении специализированных профессиональных приложений и приложений для широко круга пользователей.

Для экспериментального исследования построения онтологии при автоматическом вводе моделей концептов была использована предметная область учебных текстов по web-технологиям и дополнительный программный модуль, формирующий модель html-документа для онтологии на основе его юз метаданных.

Похожие диссертации на Метод автоматизированного построения онтологии предметной области