Электронная библиотека диссертаций и авторефератов России
dslib.net
Библиотека диссертаций
Навигация
Каталог диссертаций России
Англоязычные диссертации
Диссертации бесплатно
Предстоящие защиты
Рецензии на автореферат
Отчисления авторам
Мой кабинет
Заказы: забрать, оплатить
Мой личный счет
Мой профиль
Мой авторский профиль
Подписки на рассылки



расширенный поиск

Математическое моделирование процесса анализа реляционных баз данных при интеграции информационных систем Кропотин Александр Александрович

Диссертация - 480 руб., доставка 10 минут, круглосуточно, без выходных и праздников

Автореферат - бесплатно, доставка 10 минут, круглосуточно, без выходных и праздников

Кропотин Александр Александрович. Математическое моделирование процесса анализа реляционных баз данных при интеграции информационных систем: диссертация ... кандидата Физико-математических наук: 05.13.18 / Кропотин Александр Александрович;[Место защиты: ФГАОУ ВО Тюменский государственный университет], 2017

Содержание к диссертации

Введение

ГЛАВА I Анализ проблем интеграции данных информационных систем 12

1.1 Интеграция информационных систем 12

1.2 Интеграция данных

1.2.1 Проблемы и конфликты 17

1.2.2 Технологии и инструменты 35

1.3 Онтология и представление знаний 37

1.3.1 Формализмы представления онтологических знаний 38

1.3.2 Языки спецификации онтологий 45

1.3.3 Редакторы онтологий 47

1.3.4 Ризонеры онтологий..

1.4 Методы онтологического представления данных 51

1.5 Инструменты онтологической интеграции данных 56

1.6 Выводы 58

ГЛАВА II Применение формализма дескрипционных логик для идентификации семантических конфликтов метаданных и несоответствия интегрируемых данных 60

2.1 Онтологическая модель концептуальных объектов 61

2.1.1 Представление множества сущностей и множества значений 61

2.1.1.1 Представление сущности и значения 64

2.1.2 Представление множества связей и атрибута

2.1.2.1 Представление транзитивной связи 77

2.1.2.2 Представление зависимости существования

2.1.3 Представление ключа сущности 83

2.1.4 Представление отношения сущностей 84

2.1.5 Онтология концептуальных объектов 90

2.2. Объединение онтологий концептуальных объектов 91

2.2.1 Объединение терминологических аксиом 91

2.2.2 Объединение утверждений 95

2.2.3 Общая онтология концептуальных объектов

2.3. Онтологическое моделирование концептуальных схем сущность-связь 96

2.4. Анализ онтологии концептуальных схем сущность-связь

2.4.1 Решение алгоритмической проблемы согласованности терминологии 104

2.4.2 Решение алгоритмической проблемы классификации терминологии 115

2.4.3 Решение алгоритмической проблемы согласованности онтологии 117

2.5 Выводы 126

ГЛАВА III Описание программного обеспечения проверки согласованности концептуальных схем сущность-связь реляционных баз данных 127

3.1 Средства разработки программного обеспечения C3S 127

3.2 Архитектура программного обеспечения C3S 129

3.3 Описание программного обеспечения C2O 134

3.4 Описание программного обеспечения C2OP 142

3.5 Применение программного обеспечения C3S для проверки согласованности концептуальных схем сущность-связь

3.5.1 Построение концептуальных схем 148

3.5.2 Описание онтологий 152

3.5.3 Интеграция онтологий 155

3.5.4 Анализ онтологии 158

3.6 Выводы 160

ГЛАВА IV Эксперементальная оценка способа выявления семантических конфликтов и несоответствия интегрируемых данных 162

4.1 Этапы экспериментальной оценки 163

4.2 Экспериментальная оценка на наборах опытных данных группы НТ 166

4.2.1 Экспериментальная оценка на наборах опытных данных группы НТ ОТНЕ 166

4.2.2 Экспериментальная оценка на наборах опытных данных группы НТ НТОЕ 170

4.2.3 Экспериментальная оценка на наборах опытных данных группы НТ НТНЕ 1 4.3 Экспериментальная оценка на наборах опытных данных группы НУ 173

4.4 Экспериментальная оценка на наборах опытных данных группы НО 175

4.5 Выводы 179

Библиографический список

Введение к работе

Актуальность темы исследования. Развитие технологий создания интеллектуальных систем и Semantic Web во многом обуславливает возросший интерес к исследованиям, направленным на разработку технологий и инструментов интеграции и обеспечения интероперабельности информационных систем.

Среди многих научных школ во всем мире, которые участвуют в исследованиях, связанных с интеграцией информационных систем, можно выделить Department of Informatics – Database Technology, University of Zurich, Wright State University, Dublin City University School of Computing. Кроме того, ежегодно организуется множество конференций на тему интеграции информационных систем, в числе которых проводятся следующие: Интеграция интеллектуальных систем, Международная конференция по корпоративным информационным системам, Международная конференция по интеграции данных в науках о жизни.

Особое место в процессе интеграции и обеспечения интеропе-рабельности совокупности информационных систем занимают задачи интеграции данных, которые характеризуются необходимостью обеспечения обмена данными между системами, исключая её дублирования, потерю и несогласованности, при возрастающем её объеме.

Традиционные методы решения задач интеграции данных в основном направлены на решение задач интеграции каждого конкретного случая и характеризуются построением связей между элементами систем вручную. Такие методы, как правило, требуют выполнения следующих шагов для каждой из систем, в случаях реализации метода или изменения структуры одной из систем: проведение детального анализа каждой системы для выявления связей и зависимостей, поиск источников информации, семантическая обработка запросов, построение правил и ограничений целостности для запросов, обрабатывающих несколько источников данных одновременно, обеспечение ограничения доступа, произведение работы с метаданными. Кроме того, готовые технологии по интеграции данных сложны и далеки от решения семантических проблем.

Один из наиболее перспективных на данный момент методов интеграции основан на применении онтологических спецификаций для описания информационных ресурсов. Этот метод тесно связан с технологией Semantic Web и одним из ее самых перспективных и развивающихся направлений – технологией связанных данных. Большой вклад в разработку таких методов внесли российские и зарубежные ученые А. Ф. Тузовский, Л. В. Найханова, А. Н. Бездушный, А. С. Клещев, В. А. Серебряков, И. С. Михайлов, Ю. А. Загорулько, К. И. Шахгельдян, N. Guarino, N. Noy, M. Ehrig, G. Nenadic и A. Maedche.

Целью исследования является разработка способа применения формализма дескрипционных логик для автоматизации процесса выявления конфликтов концептуальных схем сущность-связь реляционных баз данных.

Для достижения поставленной цели необходимо решить следующие задачи:

  1. Разработать математическую модель онтологического представления реляционных баз данных на основе формализма деск-рипционных логик, который обеспечивает необходимые синтаксис, семантику и механизмы логического вывода, достаточные для выявления семантических конфликтов метаданных и несоответствия данных, при интеграции этих баз данных.

  2. На основании математической модели онтологического представления концептуальных объектов и численных алгоритмов анализа таких баз знаний для выявления и разрешения структурных и семантических конфликтов интегрируемых данных разработать комплекс программ проверки согласованности концептуальных схем сущность-связь, который реализует функции отображения метаданных и данных в базу знаний, описанную в формате языка OWL.

  3. С целью апробации комплекса программ проверки согласованности концептуальных схем сущность-связь провести серию экспериментов на опытных данных, которые представляют различные случаи возникновения таких конфликтов.

Научная новизна исследования заключается в получении следующих результатов:

  1. Разработана онтологическая модель концептуальных объектов, которая предоставляет правила представления концептуальных схем сущность-связь реляционных баз данных в виде терминологических аксиом и утверждений дескрипционной логики. Расширение онтологической модели концептуальных объектов добавляет правила слияния терминологических аксиом и утверждений онтологий концептуальных схем, которые направлены на обеспечение возможности выявления семантических конфликтов метаданных и несоответствия данных этих схем.

  2. Разработан метод проверки согласованности концептуальных схем сущность-связь реляционных баз данных, который позволяет свести процесс выявления их семантических конфликтов метаданных и несоответствия данных к решению алгоритмических проблем согласованности и классификации терминологии и согласованности онтологии этих схем.

  3. Разработан алгоритм построения терминологических аксиом и утверждений дескрипционной логики, в соответствии с правилами онтологической модели представления концептуальных объектов и ее расширения, исходя из семантического представления реляционных баз данных.

  4. Разработан комплекс программ, который реализует предложенный алгоритм преобразования концептуальных схем реляционных баз данных и метод выявления их семантических конфликтов и несоответствия данных.

Теоретическая значимость работы заключается в разработке новых математических моделей, методов и алгоритмов, и архитектуры комплекса программ, которые позволяют идентифицировать семантические конфликты метаданных и несоответствия интегрируемых реляционных баз данных.

Практическая значимость работы заключается в реализации разработанных математических моделей, методов и алгоритмов в виде кроссплатформенного комплекса программ, который предлагает функции преобразования концептуальных схем реляционных

баз данных и метод выявления их семантических конфликтов и несоответствия данных.

Объектом исследования является процесс интеграции данных информационных систем.

Предметом исследования являются основанные на онтологическом моделировании данных методы и алгоритмы интеграции реляционных баз данных.

Методология и методы исследования, которые применялись при решении поставленных задач, основаны на методах математического моделирования, теориях искусственного интеллекта, графов и множеств, парадигмы представления знаний Semantic Web, формализме дескрипционных логик, а также технологии объектно-ориентированного программирования и стандартах OWL 2.0, UML 2.5 и XMI (КОЛЕС 19509).

На защиту выносятся следующие результаты, соответствующие трем пунктам паспорта специальности 05.13.18 - Математическое моделирование, численные методы и комплексы программ по физико-математическим наукам:

Пункт 1. Разработка новых математических методов моделирования объектов и явлений.

  1. Предложена новая математическая модель представления концептуальных схем сущность-связь реляционных баз данных в виде семантической сети, узлами которой являются концепты и индивиды, обозначающие сущности и значения, а дугами - роли, обозначающие ассоциации между сущностями, атрибуты и ограничения. Такая модель предоставляет правила описания концептуальных схем в виде терминологических аксиом и утверждений деск-рипционной логики SHOJ!F(P), которые основаны на синтаксическом сходстве баз данных и онтологий, обоснованы принятым предположением о замкнутости мира в базах данных против принятого предположения об открытости мира в онтологиях.

  2. Предложена новая математическая модель объединения семантических сетей концептуальных схем сущность-связь реляционных баз данных. Такая модель предоставляет правила объединения сетей в виде терминологических аксиом и утверждений деск-

рипционной логики, которые направлены на обеспечение возможности выявления семантических конфликтов метаданных и несоответствия данных концептуальных схем через проверку согласованности их онтологии.

Пункт 3. Разработка, обоснование и тестирование эффективных вычислительных методов с применением современных компьютерных технологий.

3. Предложен новый метод проверки согласованности концеп
туальных схем сущность-связь реляционных баз данных, направ
ленный на выявление семантических конфликтов метаданных и
несоответствия интегрируемых реляционных баз данных посредст
вом проверки согласованности их семантических сетей. Такой ме
тод основан на применении формализма дескрипционных логик
для выявления несоответствий терминологических аксиом и/или
утверждений семантической сети и, в частности, решения алгорит
мических проблем согласованности и классификации терминоло
гии, и согласованности онтологии.

Пункт 4. Реализация эффективных численных методов и алгоритмов в виде комплексов проблемно-ориентированных программ для проведения вычислительного эксперимента.

  1. Предложен комплекс программ, который реализует алгоритм построения терминологических аксиом и утверждений дескрипци-онной логики, по правилам онтологической модели концептуальных объектов, исходя из семантического описания реляционных баз данных и метод выявления семантических конфликтов метаданных и несоответствия данных этих баз.

  2. Проведена серия вычислительных экспериментов на опытных данных, включающих 902 базы данных. Результаты экспериментов показали адекватность разработанных математических моделей, методов и алгоритма.

Таким образом, в соответствии с формулой специальности 05.13.18 в диссертации представлены оригинальные результаты одновременно из трех областей: математического моделирования, численных методов и комплексов программ.

Достоверность изложенных в работе результатов подтверждается использованием известных математических аппаратов, техно-

логий разработки программных продуктов, их тестирования вычислительными экспериментами, а также положительной оценкой на научных конгрессах, конференциях и семинарах.

Апробация результатов. Основные результаты диссертационной работы докладывались на конференциях, таких как:

  1. 27th DAAM International Symposium on Intelligent Manufacturing and Automation. – 2016. Mostar, BiH. – 26-29 October.

  2. 10th IEEE International Conference on Application of Information and Communication Technologies AICT2016. – 2016. Baku, Azerbaijan. – 12-14 October.

  3. 3rd International Workshop on OWL Reasoner Evaluation (ORE 2014) co-located with the Vienna Summer of Logic (VSL 2014). – 2014. Vienna, Austria. 13 July.

  4. Международная научно-практическая конференция «Современные проблемы и пути их решения в науке, транспорте, производстве и образовании’2012». – 2012. Одесса, Украина. – 18-27 декабря.

Структура и объем диссертации. Диссертация состоит из введения, 4 глав, выводов, библиографического списка из 208 наименований и 9 приложений. Общий объем работы составляет 333 страницы, включает 40 рисунков, 3 листинга и 9 таблиц.

Благодарности. Автор выражает глубокую благодарность научному руководителю профессору, д. т. н. А.Г. Ивашко, к. ф.-м. н. А.В. Григорьеву за наставление и помощь при выполнении диссертационных исследований; к. ф.-м. н. Е.Е. Золину за помощь и разъяснение тонкостей работы логического вывода дескрипционных логик.

Онтология и представление знаний

Все многообразие способов интеграции информационных систем принято классифицировать по таким признакам, как: технология [42; 55; 183], принцип [55; 75; 196] и уровень [55; 108; 137]; каждый из которых подразумевает интеграцию данных между приложениями информационных систем [137].

С точки зрения технологий интеграции информационных систем принято выделять системы межведомственной интеграции приложений и системы интеграции корпоративных приложений, а также технологии управления бизнес процессами [15; 42; 55; 75; 108; 118; 125; 138; 141].

Системы интеграции корпоративных приложений и системы межведомственной интеграции приложений применяются для организации событийно управляемого обмена данными между приложениями [15] одного [15; 42; 55; 75; 125; 141; 183; 198] или нескольких [15; 42; 55; 108; 118] предприятий, соответственно. Технологии управления бизнес процессами направлены на организацию процесса управления и обмена документами между приложениями различных систем [15].

Системы интеграции корпоративных приложений являются наиболее распространенными и эффективными при разработке комплекса программ [138]. Технологии управления бизнес процессами являются результатом развития систем межведомственной интеграции приложений и интеграции корпоративных приложений [15; 55].

В качестве принципов интеграции информационных систем принято определять принципы интерфейсно-ориентированной интеграции, процессно 13 ориентированной интеграции, сервисно-ориентированной интеграции и информационно-ориентированной интеграции [9; 55; 108; 121].

Принцип процессно-ориентированной интеграции направлен на организацию совместного использования внутренних прикладных процессов каждой их них [2; 9; 55; 75; 121; 203]. Принципы информационно-ориентированной, сервисно-ориентированной и интерфейсно-ориентированной интеграции характеризуются обеспечением совместного использования данных информационных систем, причем последние два допускают и использование функций каждой из них [2; 9; 55; 47; 75; 108; 117-118; 121; 125; 135; 138; 167; 183; 197].

Принцип процессно-ориентированной интеграции обладает высокими эффективностью, степенью масштабируемости и пригодностью систем интеграции [9; 55; 75; 121; 203]. Принцип сервисно-ориентированной интеграции характеризуется высокой степенью взаимодействия гетерогенных систем благодаря применению открытых стандартов вместо закрытых протоколов [9; 55; 75; 108; 138]; низкой стоимостью обслуживания, которая связана с тем, что задача интеграции имеет одно централизованное решение [9; 108; 121; 138; 183; 196]; и высокой эффективностью интеграции, по причине того, что решение задачи интеграции включает повторное использование разработанных сервисов [75; 108; 121; 138; 183; 196]. Принцип информационно-ориентированной интеграции является наиболее популярным благодаря высокой степени распространения и применения реляционных систем управления базами данных [4; 5; 9; 16; 37; 55; 121]. Принцип обладает низкой стоимостью и легкостью интеграции, которые связаны с тем, что решается только задача репликации информации систем [9; 55; 108; 121]. Принципы интерфейсно-ориентированной, процессно-ориентированной и сервисно-ориентированной интеграции характеризуются высокой ее сложностью [9; 55; 75; 121]. Сложность первого принципа связана с тем, что тесная связь иного графического пользовательского интерфейса с монолитным фреймворком сильно ограничивает его применение в сторонних приложениях [75; 121]. Принципы также обладают низкой эффективностью интеграции, по причине того, что задача организации совместного использования данных не решается [9; 55; 75; 121]. Принцип сервисно-ориентированной интеграции характеризуется высокой стоимостью интеграции, по причине необходимости реинжиниринга систем и создания необходимых для их взаимодействия интерфейсов [9; 55; 75; 183]. Принцип информационно-ориентированной интеграции не предлагает средства связи приложений, по причине отсутствия задачи обеспечения их взаимодействия [9; 121]. Принцип характеризуется высокими рисками несогласованности реплицированных данных и дублирования программного кода, которые связаны с отсутствием необходимых ограничений целостности и необходимостью обработки имеющих отличное представление одних и тех же данных разными способами [9; 121].

К уровням интеграции информационных систем принято относить интеграцию на уровнях бизнес-процессов, приложений, стандартов, платформ и данных [2; 55; 79].

Интеграция на уровне бизнес-процессов заключается в определении, реализации и управлении процессом обмена данными между различными системами с целью усовершенствования операций и оптимизации расходов в процессе их применения [2; 55; 137; 138]. На уровне приложений интеграция направлена на организацию процесса обмена данными или передачи функций между различными системами с целью обеспечения выполнения прикладной функции от их взаимодействия [2; 55; 108; 138; 141]. На уровне стандартов применяются стандарты представления данных к процессу информационного обмена между различными системами [2; 47; 55]. Интеграция на уровне платформ направлена на организацию процесса обмена данными приложений систем на различных аппаратно-программных платформах с целью их использования при их взаимодействии [2; 55]. Интеграция на уровне данных является наиболее популярной благодаря высокой степени распространения и применения реляционных систем управления базами данных в информационных системах [5; 9; 55; 108]. Такая интеграция заключается в идентификации и каталогизации данных различных систем с целью использования при их взаимодействии [2; 9; 47; 55; 75; 108; 137; 138]. На уровнях стандартов, платформ и данных реализуется принцип сервисно-ориентированной интеграции [2]. Принцип информационно-ориентированной интеграции реализуется на уровне приложений, а принцип процесно-ориентированной интеграции на уровнях бизнес-процессов, стандартов и платформ [2]. От интеграции на уровне данных зависит успешная реализация интеграции на уровнях бизнес процессов и приложений [55].

Следует отметить, что интеграция информационных систем, вне зависимости от выбранного способа ее реализации, связана с необходимостью обеспечения единого доступа или обмена разрозненной и повторяющейся структурированной информации различных систем [47].

Представление сущности и значения

Решение задачи интеграции данных во многом определяется требованиями к ней [36], и наиболее часто [118] включает такие технологии и инструменты, как [36; 47; 118]: конверторы данных, интегрирующие модели данных, механизмы отображения моделей данных, объектные адаптеры, медиаторы, метаданные, связанные данные и онтологические спецификации.

Реализация механизмов отображения моделей данных является неотъемлемым функциональным элементом систем интеграции данных [36; 39] и, в некоторых, случаях предполагает применение объектных адаптеров [31; 36]. Реализация конкретного адаптера может как зависеть, так и не зависеть от схемы базы данных, что определяется протоколом доступа к данных системы управления базами данных [36]. Такие адаптеры позволяют обеспечить интероперабельность интегрируемых баз данных, которые могут даже и принадлежать различным моделям данных [36; 72; 156].

В качестве интегрирующих моделей данных чаще всего используются широко распространенные модели данных [36], такие как: реляционная [86; 88], объектная или основанные на стандартах XML [12; 34; 35-36].

Вместе с тем, иногда может потребоваться разработка специальной интегрирующей модели данных [7; 32; 54; 56; 124; 126-127; 175; 181]. В качестве примера такой модели возможно привести модель сущность-связь [85; 86], которая предлагалась в качестве способа унифицированного представления данных [45; 66; 86; 176; 185; 193], на основе модели множества сущностей [86; 172], сетевой [64-65; 86; 105] и реляционной моделей.

Разработка новых информационных технологий для Semantic Web [171], которая поддерживаются консорциумом W3C [36; 47; 49], предлагает применение стандарта XML [77] как основы интегрирующей модели [36]. Например, такие разработки нашли свое применение в виде языка запросов XQuery [74], который воплощает функциональность, свойственную интегрирующей модели данных. Архитектура с медиатором является наиболее распространенной среди систем интеграции данных [36] и может быть условно разделена на два вида [36; 58; 148]: глобальное представление и локальное представление. Первый вид предполагает определение глобального представления интегрируемых данных в терминах их локальных представлений и является наиболее эффективным в том случае, когда множество интегрируемых баз данных не определено заранее [36; 148; 169; 205]. Другой вид, наоборот, подразумевает определение интегрируемых данных в терминах их глобального представления и допускает динамичность состава множества интегрируемых баз данных, каждая из которых может быть вовлечена как на стадии разработки, так и на стадии функционирования [36; 83;

Наиболее распространенный способ к семантической интеграции данных основан на применении онтологических спецификаций в качестве медиаторов [36; 49; 57; 100; 202]: для описания метаданных или связных данных [5; 36; 45; 47-49; 70; 82; 97; 107; 148; 202]. В этом случае, онтология предметной области используется в качестве глобальной концептуальной схемы [36]. Данный способ предоставляет возможности рассуждений в терминах онтологий [36] и возможности использования уже существующих онтологий для описания извлеченных метаданных [47].

В качестве примера применения технологий метаданных и связных данных в области объединения и анализа данных информационных систем возможно выделить следующие системы, технологии и онтологий [47]: HERMES [169], TSIMMIS [205], e-XMLMedia, PICSEL [143], C-Web [83] Agora [146], eCulture [48], IPISAR [49], SWHi [47], Dublin Core [101], FOAF [78], BIBO [94], AIISO [182].

Таким образом, возможно сделать вывод, что технологии онтологических спецификаций предлагают все необходимые механизмы для описания семантики данных в виде метаданных и связных данных, и рассуждений над ними, и позволяют наиболее эффективно, по сравнению с остальными, решить задачу семантической интеграции данных. Выводы

Обзор способов интеграции данных наглядно показал актуальность задачи выявления семантических конфликтов метаданных и конфликтов данных с применением онтологических спецификаций, в виду того, что: а) структурные конфликты метаданных не обязательно приводят к семантическим и, тогда, могут быть разрешимы; б) конфликты данных могут возникать и при отсутствии конфликтов метаданных, и приводить к семантическим противоречиям; в) технологии онтологических спецификаций предоставляют механизмы для описания семантики данных и наиболее эффективной их интеграции.

Явное основанное на концептуализации представление знаний предлагается понимать под онтологией [5-6; 8; 11; 43; 114], которую формально, в общем случае, принято определять как совокупность понятий и отношений меду ними, и функций их интерпретации (1.1) [8; 43]. О = Т,Я,Ф , (1.1) где О является онтологией; Т является множеством понятий; R является множеством отношений между понятиями; Ф является множеством функций интерпретации понятий. Любая онтология должна состоять из конечного множества ее элементов, где, прежде всего, должны быть описаны понятия: Т Ф , в то время, как вся информация о них, напротив, может быть упущена: R Ф и/или Ф ф [8]. В таких граничных случаях она обладает наименьшей выразительностью. Онтология может представлять спецификацию словаря, когда она описывает множество понятий в отрыве от отношений между ними, но с возможным пояснением их смысла (1.2) или без него (1.3) [8]. О = Г1иГ2,,Ф , (1.2) О = Т,, , (1.3)

Онтологическое моделирование концептуальных схем сущность-связь

Предлагается задать функциональность атомарных ролей [25; 27] (2.26), таким образом, чтобы, в совокупности с утверждениями (2.14), гарантировать отсутствие пар этих ролей, в которых повторяется их первый элемент. Такое ограничение для каждой конкретной роли или абстрактной роли, которая соответствует отображению 1:1 или m:1, должно быть определено через терминологическую аксиому, которая задает множество индивидов, такое, что для каждого индивида не может существовать более чем одной связи этой роли. Пусть Г4 является множеством таких аксиом (2.29). := { т Е Щ}і=и/, (2.27) где Т является универсальным концептом; 7?;- является конкретной ролью (2.26), которая ставится в соответствие атрибуту (2.22); абстрактной ролью (2.26), которая ставится в соответствие множеству связей с отображением 1:1 (2.17)-(2.19), множеству связей с отображением m:1 (2.17), (2.20); If - количество всех ролей Rt: If =\GN \+(2x\FN \), GN является множеством имен множеств связей (2.15), FN является множеством имен атрибутов (2.21).

В дескрипционной логике абстрактные роли задают такие пары, в которых первый индивид связан ролью со вторым, а второй никак не связан с первым [24]. В тоже время, множества связей и атрибуты задают такие отношения, в которых и первые, и вторые элементы связаны друг с другом. Очевидно, что для представления такого ограничения, связи одних индивидов с другими абстрактными ролями должны в каком-либо виде задавать их обращение. Следует отметить, что симметричные и инверсные роли позволяют моделировать взаимнообратные отношения, где одно отношение является обратным самому себе или другому отношению, соответственно [28; 145]. Совершенно ясно, что функциональные абстрактные роли (2.26)-(2.27) должны быть обращены сами себе, для представления отображения 1:1 й (2.18)-(2.19), (2.22)-(2.25), должны быть обращены соответствующим не функциональным абстрактным ролям (2.26), для представления отображения 1:n (2.20), (2.22)-(2.23).

Правило 7. Предлагается задать обращение абстрактных ролей [25; 28] (2.26), таким образом, чтобы гарантировать связь индивидов друг с другом этими ролями, если хотя бы один из них связан с другим одной из таких ролей. Такое ограничение для каждой абстрактной роли (2.26), в зависимости от сопоставляемого ей отображения, должно быть определено таким образом, чтобы для каждой концептуальной схемы CSl и ее онтологического представления выполнялись следующие условия: а) сообразная отображению 1:1 роль должна быть задана симметричной; б) сообразная отображению m:1 роль должна быть задана асимметричной и инверсной другой соответствующей обратному отображению роли.

Ограничение симметричности для каждой абстрактной роли [25] (2.26), сообразной отображению 1:1 (2.18)-(2.19), (2.23)-(2.25), должно быть определено через терминологическую аксиому, которая задает ее как множество связей двух индивидов, такое, что для любой связи такой ролью следует существование обратной связи этой же ролью. Пусть Г5 является множеством таких аксиом (2.28). := {Si Е Sf}i=TIs, (2.28) где Si, S[ являются абстрактными ролями (2.28), которые ставятся в соответствие отображению 1:1 (2.18)-(2.19), (2.23)-(2.25); Is - количество всех ролей S: Is = I GN0 + FN0 , GN0 С GN является множеством имен множеств связей с отображением 1:1 (2.17), (2.18)-(2.19), FN0 С FN является множеством имен уникальных атрибутов (2.22), (2.25).

Ограничение асимметричности для каждой абстрактной роли [25] (2.26), сообразной отображению m:1 (2.20), (2.24), должно быть определено через терминологическую аксиому, которая задает ее как множество связей двух индивидов, такое, что для любой связи такой ролью следует отсутствие существование обратной связи этой же ролью. Пусть Г6 является множеством таких аксиом (2.29). У6:= {StQ Sf}i=Tj?, (2.29) где Si, S[ являются абстрактными ролями (2.28), которые ставятся в соответствие отображению 1:n (2.20), (2.23); Г - количество всех ролей St: Г = GNm + FNm I , GNm С GN является множеством имен множеств связей с отображением 1:n (2.17), (2.20), FNm С FN является множеством имен не уникальных атрибутов (2.23)

Ограничение инверсности для каждой абстрактной роли [25] (2.26), сообразной отображению m:1 (2.20), (2.24), должно быть определено через терминологическую аксиому, которая задает ее как множество связей двух индивидов, такое, что для любой связи такой ролью следует существование обратной связи другой ролью. Пусть Г7 является множеством таких аксиом (2.30). Г7 : = {S. = Sj } i=jjr, (2.30) где Si, Sj являются абстрактными ролями (2.26), которые ставятся в соответствие отображению 1:n (2.20), (2.23); Г - количество всех ролей St: Г = GNm + FNm I , GNm С GN является множеством имен множеств связей с отображением 1:n (2.17), (2.20), FNm С FN является множеством имен не уникальных атрибутов (2.23).

Применение программного обеспечения C3S для проверки согласованности концептуальных схем сущность-связь

Каждая пара эквивалентных концептов, сообразных множествам сущностей, у которых совпадает описание атрибутов и множеств связей, должна быть определена через терминологическую аксиому, которая задает их эквивалентность. Пусть Г20является множеством таких аксиом (2.62). = {{[Aln = A%}n=Yjji}l h L}l=T , (2.62) где А1п , А% являются атомарными концептами онтологий Ж і, Жк соответственно; N1 - количество всех концептов А1п онтологии Ж(; L - количество всех онтологий Жг. Каждая пара эквивалентных концептов, сообразных множествам сущностей, у которых не совпадает описание атрибутов и/или множеств связей, должна быть определена через терминологическую аксиому, которая задает вложенность одного атомарного концепта в другой. При этом, атомарные концепты задаются как эквивалентные в неявном виде, при условии, что первый концепт вступает в транзитивную роль с другими концептами, эквивалентную отсутствующим ролям, в которые вступает второй. Пусть Э 1Хявляется множеством таких аксиом (2.63). 5Г21 := {{[А1п = А% п П л35?. А-1}п=Ш1}i h b\i=TJ, (2.63) где Aln , А% являются атомарными концептами онтологий Ж і, Жк соответственно; / - количество всех ролей R- онтологии Ж, определенных на концепте А , для которых не существует подобных ролей в онтологии «5ГЙ; L -количество всех онтологий Жг\ 5ГА является транзитивной абстрактной ролью онтологий «5ГЙ; N1 - количество всех концептов Aln; L - количество всех онтологий Ж.

В дескрипционной логике индивиды одного концепта могут быть одновременно и индивидами других, если явно не задать обратное [24]. В то же время, сущности и значения принадлежат определенным различным множествам сущностей (2.2) и множествам значений (2.5), соответственно. Ясно, что для представления такого ограничения, атомарные концепты различных онтологий, которые не были заданы как непререкаемые в неявном виде (2.7) не должны пересекаться.

Правило 16. Предлагается задать непересекаемость атомарных концептов (2.7), различных онтологий концептуальных объектов, таким образом, чтобы для каждого набора концептуальных схем CSt, ...,CSh и его онтологического представления Жь ...,«5ГЙ выполнялись следующее условие: каждый атомарный концепт, для которого не существует эквивалентного концепта, должен быть задан непререкаемым с остальными. Такое ограничение для каждого атомарного концепта, которому не существует эквивалентных концептов, должно быть определено через терминологическую аксиому, которая задает его вложенность только в универсальный концепт. Пусть Г22 является множеством таких аксиом (2.64). где А1п , АА являются атомарными концептами онтологий Ж1, Жк соответственно; Nh - количество всех концептов АА ; М1 - количество всех концептов А1п, для которых не существует эквивалентных концептов онтологии Жк; L - количество всех онтологий Ж{. 2.2.2 Объединение утверждений

В дескрипционной логике идентичные индивиды позволяют моделировать такой объект, который представлен различными именами [24]. В тоже время, одни и те же сущности могут быть представлены различными именами сущностей (2.11) на различных концептуальных схемах CSt,..., CSh. Ясно, что для представления такого ограничения, индивиды эквивалентных атомарных концептов (2.7) должны быть эквивалентными.

Правило 17. Предлагается задать эквивалентность индивидов атомарных концептов (2.13), различных онтологий концептуальных объектов, таким образом, чтобы для каждого набора концептуальных схем CSt, ...,CSh и его онтологического представления Жь ...,3h выполнялись следующее условия: каждой паре эквивалентных сущностей должна соответствовать ровно одна пара эквивалентных индивидов. Каждая такая пара эквивалентных индивидов должна быть определена через утверждение, которое задает их идентичными. Пусть з/5 является множеством таких утверждений (2.65). я/5 = {{{aj « af}j=Yj)i h L}i=\X, (2.65) где aj, aj1 являются индивидами онтологий Ж, Жк соответственно; J1 -количество всех индивидов aj; L - количество всех онтологий Ж. 2.2.3 Общая онтология концептуальных объектов Объединение онтологий концептуальных объектов Ж1,...,Жкс набором терминологических аксиом вида 19 20 21 22 и множеством утверждений вида ?5 предлагается называть общей онтологией концептуальных объектов Ж (2.66). Ж8 := (UI KL« /) и е и &е, (2.66) где Ж является общей онтологией концептуальных объектов; Жг является онтологией концептуальных объектов; L - количество всех онтологий Жг; Э g является набором терминологических аксиом: !Ге:= { 19 20 21 22}; является набором утверждений: s&e := {sf5}.

В качестве способа моделирования онтологии концептуальных схем сущность-связь предлагается алгоритм построения терминологических аксиом и утверждений дискреционной логики, в соответствии с правилами онтологической модели представления концептуальных объектов и ее расширения, исходя из семантического представления реляционных баз данных. Алгоритм позволяет преобразовывать концептуальные схемы сущность-связь реляционных баз данных в общую онтологию концептуальных объектов и включает выполнение двух ключевых этапов: конвертация концептуальной схемы сущность-связь реляционных баз данных в онтологию концептуальных объектов, объединение онтологий концептуальных объектов.

На первом этапе алгоритм предлагает выполнение 26 шагов, с применением правил онтологической модели представления концептуальных объектов, для построения терминологических аксиом и утверждений дескрипционной логики исходя из семантического описания каждой реляционной базы данных в отдельности. Такие шаги описаны в листинге