Содержание к диссертации
Введение
ГЛАВА 1. Постановка задачи обеспечения интероперабельности информационных систем 16
1.1. Цели интеграции ИС 16
1.2. Проблемы интеграции информационных систем 16
1.3. Интероперабельность ИС 24
1.3.1. Об интеграции и интероперабельности 26
1.3.2. Структурная и семантическая интероперабельность 27
1.4. Обзор и анализ подходов к интеграции ИС и существующих средств интеграции 30
1.4.1. Разработка буферного приложения-конвертора данных 31
1.4.2. Разработка модуля преобразования интерфейсов информационных систем 32
1.4.2.1. ERP-системы 33
1.4.2.2. Функции ERP-систем 33
1.4.2.3. Внедрение ERP-систем 34
1.4.2.4. Система планирования ресурсов предприятия SAP R/3 35
1.4.2.5. Результаты анализа ERP-систем 40
1.4.3. Использование метаданных в качестве базиса для интеграции ИС 40
1.4.3.1. Проект СІМ 45
1.4.3.2. Спецификация модели СІМ 46
1.4.3.3. Классы и связи модели СІМ 47
1.4.3.4. Результаты анализа модели СІМ 49
1.5.4. Результаты обзора различных подходов к интеграции ИС
и разработок в данной области 50
1.6. Выводы по главе I 51
ГЛАВА 2. Модели и языки представления метаданных информационных систем 53
2.1. Онтологический подход и его использование 53
2.1.1. Понятие онтологии 53
2.1.2. Стандарт онтологического исследования IDEF5 57
2.1.3. Использование онтологии предметной области при интеграции ИС 60
2.2. Классификация моделей и языков представления метаданных 60
2.3. Структурный уровень модели метаданных для решения задачи обеспечения интероперабельности информационных систем. XML подход 71
2.3.1. Моделирование данных XML 72
2.3.2. Метаданные и семантика XML 72
2.3.3. Использование XML для построения моделей информационных систем 73
2.3.4. Обоснование XML подхода 77
2.4. Семантический уровень модели метаданных для решения задачи обеспечения интероперабельности информационных систем. RDF подход 78
2.4.1. Проблема описания семантики и границы XML 78
2.4.2. Модель данных RDF 80
2.4.3. Принципы построения модели 81
2.4.4. Использование RDF для построения моделей информационных систем 83
2.4.4.1. Язык RDF Schema (RDFS) 87
2.4.4.2. Отличия RDF и RDFS от объектно-ориентированных языков 89
2.4.4.3. Описание системы концептов в модели метаданных 92
2.6. Выводы по главе 2 94
ГЛАВА 3. Разработка метамодели и алгоритмов интеграции информационных систем 95
3.1. Модель описания метаданных информационных систем 95
3.2. Разработанный алгоритм интеграции информационных систем 98
3.2.1. Построение схем данных 101
3.2.2. Построение концептуальных моделей информационных систем 103
3.2.3. Уточнение семантических соответствий 105
3.2.4. Построение единой метамодели ИС 107
3.2.4.1. Функции на концептах онтологии 108
3.2.5. Построение результирующих правил преобразования концептов 111
3.2.5.1. Однозначное соответствие концептов ИС-А и ИС-В 112
3.2.5.2. Неполное соответствие концептов ИС-А и ИС-В 113
3.2.5.3. Соответствие совокупности концептов в ИС-А одному концепту в ИС-В 116
3.2.5.4. Соответствие одному концепту в ИС-А совокупности концептов в ИС-В 117
3.2.5.5. Установление соответствия значений пары концептов ИС-А и ИС-В 118
3.2.5.6. Отсутствие соответствия концепта в ИС-В концепту из ИС-А 120
3.2.6. Схема процесса интеграции ИС 122
3.2.7. Разрешение противоречий 125
3.2.8. Оценка вычислительной сложности разработанных алгоритмов 129
3.3. Пример интеграции информационных систем ВУЗов 134
3.3. Выводы по главе 3 137
ГЛАВА 4. Процесс интеграции базы данных системы измерений параметров нефтеводогазовой смеси "Ультрафлоу" и информационной системы АДКУ 2000 138
4.1. Информационная система Var Pro 139
4.1.1. Инфологическая модель базы данных UltraBase 141
4.1.2. Даталогическая модель базы данных UltraBase 142
4.2. Информационная система АДКУ 2000 144
4.2.1. Инфологическая модель базы данных АДКУ 2000 147
4.2.2. Даталогическая модель базы данных АДКУ 2000 150
4.3. Интеграция информационных систем Var Pro и АДКУ 2000 152
4.4. Создание онтологии предметной области "Нефтедобыча" 153
4.5. Программа интеграции Информационных Систем Var Pro Integrator 157
4.5.1. Структура работы программы 157
4.5.2. Алгоритм ввода метаданных 159
4.5.3. Словарь концептов предметной области 160
4.5.4. Алгоритм поиска структурных и семантических отображений 162
4.5.5. Выполнение алгоритма поиска структурных и семантических отображений для ИС "Ультрафлоу" и АДКУ 2000 164
4.5.6. Результаты работы программы 171
4.6. Результаты интеграции информационных систем 174
4.7. Выводы по главе IV 176
Заключение 177
Литература
- Об интеграции и интероперабельности
- Стандарт онтологического исследования IDEF5
- Разработанный алгоритм интеграции информационных систем
- Информационная система АДКУ 2000
Введение к работе
В диссертационной работе исследованы и реализованы методы и программные средства обеспечения структурной и семантической интероперабельности информационных систем на базе метамоделей.
На основе полученных результатов предложена модель описания метаданных интегрируемых информационных систем и выполнена программная реализация разработанного алгоритма автоматизированной интеграции хранилищ данных с использованием онтологии предметной области.
Реализованный программный комплекс применён с целью интеграции хранилища данных измерительной системы и штатной информационной системы нефтяного месторождения.
Актуальность темы. Обеспечение интероперабельности
информационных систем представляет собой актуальную и вместе с тем весьма сложную проблему, возникающую при создании, эволюционировании и интеграции информационных систем. Эта проблема особенно обострилась в настоящее время, поскольку объём сведений, обрабатываемых информационными системами, постоянно увеличивается и необходимо обеспечивать обмен информацией между различными хранилищами данных [1]. Актуальность этой проблемы определяется также необходимостью повышения эффективности и упрощения формирования правил указанного обмена [2].
Сложность этой проблемы состоит в том, что информационные системы, как правило, представляют собой громоздкие программные комплексы, состоящие из значительного количества информационных единиц (сущностей, атрибутов, связей между ними и т.д.) [3]. Для организации обмена данными между хранилищами необходимо передавать не только отдельные значения конкретных переменных, но и большие массивы связанных между собой информационных единиц. Они должны сохранить свою внутреннюю связность и быть внедрены в систему сущностей другой информационной системе. Также в ходе процесса интеграции необходимо выполнять необходимые преобразования типов данных [4].
Традиционные методы и средства интеграции информационных систем, основанные на ручном построении правил обмена между хранилищами данных и создании соответствующих приложений-конверторов, не отвечают сегодняшним потребностям отрасли и современному уровню развития информационных технологий [5].
Применяемые приложения-конверторы требуют проведения предварительного детального анализа интегрируемых информационных систем (ИС), что является сложным и длительным процессом. К тому же, используемые программные продукты не обеспечивают гибкости обмена между ИС при изменении их состава, структуры или требований к ним, что приводит к необходимости повторной разработки такого рода приложений. Существенным недостатком такого подхода является невозможность повторного использования знаний об ИС. В результате при возможном осуществлении повторной интеграции ИС потребуется заново провести анализ систем. Отсутствие адаптивности указанного метода к изменяющимся входным условиям объединения хранилищ данных может привести к задержке и несвоевременной передаче или даже потере важной информации и создает предпосылки к возникновению аварийных ситуаций в ходе функционирования интегрируемых систем.
В настоящее время активно развивается подход, предполагающий использование метаданных для описания информационных ресурсов [6]. Однако в том виде, в котором данный подход используется многими разработчиками, он обеспечивает лишь описание структур информационных единиц, без анализа их смысла и назначения [7]. На основании такого описания невозможно делать корректные выводы об идентичности информационных единиц и их связей различных систем, функционирующих в одной предметной области. Для формирования заключений необходимо оперировать не только структурными характеристиками объектов хранилищ данных, но и их семантическими значениями, погружёнными в единое информационное пространство определённой предметной области [1].
Таким образом, можно сделать вывод, что задача разработки методов и средств обеспечения структурной и семантической интероперабельности информационных систем весьма остро стоит перед специалистами. Необходимо создание приемлемых по стоимости, простых и надежных программных продуктов, обеспечивающих интеллектуальную интеграцию хранилищ данных, функционирующих в рамках одной предметной области [8].
Следует отметить, что успешное решение задачи обеспечения структурной и семантической интероперабельности информационных систем на основе метамоделей связано с выполнением следующих основных требований:
необходимо автоматически извлекать схемы данных интегрируемых информационных систем из их серверов баз данных;
следует разработать алгоритмы разрешения возможных противоречий в условиях неполной или неточной информации;
необходимо обеспечить минимальные потери информации при осуществлении её передачи между хранилищами данных;
объём словаря общих знаний о предметной области должен быть достаточно велик;
приложение, осуществляющее интеллектуальную интеграцию ИС, должно быть высоконадежным и удобным в эксплуатации;
программный комплекс должен быть устойчив по отношению к изменяющемуся составу систем, и позволять с малыми временными затратами проводить повторную интеграцию в случае обновления систем или требований к ним;
должны быть обеспечены простота установки и низкие затраты на обслуживание разработанной системы;
К числу наиболее перспективных методов интеграции информационных систем, на базе которых может быть разработан программный комплекс, в значительной мере отвечающий перечисленным выше требованиям, относятся методы метаописания семантики информационных ресурсов [1]. Эти методы были положены в основу разработанного программного продукта обеспечения структурной и семантической интероперабельности информационных систем [8].
Выполненные исследования опираются на результаты работ в области искусственного интеллекта и интеграции информационных систем Д.А. Поспелова, И.А. Башмакова, А. И. Башмакова, Д.О. Брюхова, В.Н. Вагина, Т.А. Гавриловой, А.П. Еремеева, В.Ф. Хорошевского, А.С. Клещева, М.Р. Когаловского, Ю.Ф. Тельнова, В.И. Задорожного, Л.А Калиниченко., М.Ю. Курошева, С.С. Шумилова, И.П. Кузнецова, О.И. Россеевой и др., а также зарубежных учёных T.R. Gruber, М. Uslar, J.F. Sowa, P. Warren, V.R. Benjamins, D. Fensel, M.R. Genesereth, R.E. Fikes, A. Tannenbaum, H. Takeda, J. Ambrosio, T. Wendt, S. Barresi, Y. Rezgui, С Lima, F. Meziane, M. Ushold, M. Gruninger, G. Van Heijst, A.T. Schreiber, B.J. Wielinga.
Объектом исследования данной работы является обеспечение структурной и семантической интероперабельности информационных систем.
Предмет исследования - информационные системы, модели и методы интеграции информационных систем.
Целью работы является повышение эффективности процесса интеграции информационных систем. На основе исследований языков и методов описания метаданных требуется разработать и научно обосновать новый метод обеспечения структурной и • семантической интероперабельности информационных систем, создать программный комплекс, функционирующий на базе данного метода. Внедрить разработанный программный комплекс на нефтяных месторождениях России с целью интеграции информационно-измерительной системы определения расходных характеристик нефтеводогазового потока «Ультрафлоу» в состав штатного хранилища данных нефтяного месторождения.
Для достижения этой главной цели в диссертационной работе были поставлены и решены следующие основные задачи:
экспериментально исследована структура и семантика различных информационных систем нефтяных месторождений, включая ИС, контролирующие телемеханику кустов нефтяных скважин;
проанализированы различные языки представления метаданных об информационных ресурсах;
обоснованы и исследованы новые методы построения концептуальных моделей информационных систем, состоящих из двух уровней: структурной схемы данных и семантического описания;
разработана и экспериментально исследована информационная модель, устанавливающая взаимодействие между двумя интегрируемыми информационными системами;
разработаны новые эффективные алгоритмы для построения правил структурного и семантического преобразования системы связанных понятий при её передаче между хранилищами данных;
разработаны новые алгоритмы разрешения возможных противоречий, базирующиеся на использовании онтологии предметной области;
создана онтология предметной области «Нефтедобыча»;
создан программный продукт Var Pro Integrator, в составе разработанного программного комплекса Var Pro информационно измерительной системы «Ультрафлоу», для обеспечения
автоматизированной интеграции;
создана методика построения правил описания взаимодействия информационных систем;
разработан и внедрен программный комплекс Var Pro для информационно-измерительной системы «Ультрафлоу» контроля расходных характеристик потока на скважинах нефтяных месторождений;
проведены долговременные промысловые испытания разработанных программных продуктов на эксплуатационную надежность на нефтяном месторождении.
Научная новизна. Новые результаты, полученные в работе, заключаются в следующем:
1. Предложены, обоснованы и развиты научные основы нового метода обеспечения структурной и семантической интероперабельности информационных систем, основанного на использовании метаданных и онтологии предметной области,
2. Разработана и экспериментально исследована информационная модель, связывающая подмножества объектов различных хранилищ данных, функционирующих в рамках одной предметной области. Предложен новый подход к интеграции информационных систем, базирующийся на определении их концептуальных моделей и формировании на этой основе единой метамодели интегрируемых хранилищ данных.
3. Обосновано применение онтологии, в качестве системы общих знаний о предметной области.
4. Разработаны и обоснованы новые алгоритмы разрешения возможных противоречий при объединении концептуальных моделей информационных систем как на структурном, так и на семантическом уровне.
5. Предложена и обоснована двухуровневая схема организации концептуальной модели метаданных отдельных информационных систем.
6. Разработана и обоснована структура программного комплекса, выполняющего интеграцию информационных систем. 7. Создана методическая и экспериментальная база для описания метаданных различных информационных систем и расширения онтологии предметной области.
Достоверность результатов.
Обоснованность и достоверность научных положений, методов и выводов подтверждается использованием методов математического моделирования онтологии предметных областей, описания метаданных информационных ресурсов, данными компьютерного моделирования, а также результатами вычислительных экспериментов с помощью разработанного программного комплекса.
Практическая ценность и реализация результатов работы в промышленности.
Создан программный комплекс Var Pro Integrator в составе разработанной информационной системы Var Pro измерительной установки «Ультрафлоу», предназначенной для определения расхода компонентов нефтеводогазового потока. В программном комплексе достигнуто существенное улучшение возможности интеграции ИС Var Pro в состав штатных информационных систем нефтяных месторождений на основе: обеспечения автоматизированного построения концептуальных моделей интегрируемых ИС; реализации формирования единой метамодели информационных систем; использования онтологии предметной области с целью разрешения возможных противоречий, возникающих в процессе интеграции; создания правил преобразования систем связанных информационных ресурсов при их трансляции между хранилищами данных. В рамках данного проекта разработана онтология предметной области «Нефтедобыча».
Выполнены исследования разработанных алгоритмов и функционирования программного комплекса и измерительной системы «Ультрафлоу» в целом. Разработанный программный комплекс и измерительная система «Ультрафлоу» были установлены на кусте скважин Уньвинского месторождения Пермского края и внедрены в состав хранилища данных нефтяного месторождения, прошли опытно-промысловую эксплуатацию в течение четырёх лет и в настоящее время используются как штатная информационно-измерительная система. Система сертифицирована Федеральным агентством по техническому регулированию и метрологии РФ и включена в Государственный реестр средств измерений. ОАО «Арзамасский приборостроительный завод» приступил к серийному производству измерительных систем «Ультрафлоу», которые востребованы нефтедобывающими предприятиями. Первый серийный образец установлен на Чернушинском месторождении ООО «Лукойл-Пермь» в многофазной системе сбора и транспортировки продукции нефтяных скважин. Произведена интеграция показаний программного комплекса измерительной системы «Ультрафлоу» в информационную систему Чернушинского месторождения «Телескоп +».
На основе разработанных методов обеспечения структурной и семантической интероперабельности информационных систем создан программный комплекс Var Pro Integrator, предназначенный для автоматизированной интеграции информационной системы Var Pro в состав хранилищ данных нефтяных месторождений. Тем самым решена важная научно-техническая проблема, имеющая большое значение для отрасли информационных технологий.
Результаты работы использованы в НИР, выполняемых в рамках грантов РФФИ: проект №05-07-90232 «Исследование и разработка инструментальных средств создания экспертных систем поддержки принятия решений» (Научные руководители д.т.н., проф. Вагин В.Н., д.т.н., проф. Еремеев А.П.).
Апробация работы. Основные результаты диссертации докладывались и обсуждались: - на семинаре «Multiphase Flow Measurement Seminar». Франция, Париж (Кламар), 14-19 декабря, 2004;
- на 13-ой Международной выставке «Нефтегаз - 2005». Россия, Москва, Экспоцентр, 21-25 июня, 2005.
- на конференции «Нечёткие Системы и Мягкие Вычисления». Россия, Тверь, 20-22 сентября, 2006.
- на XV Международной студенческой школе-семинаре «Новые информационные технологии». Украина, Крым, Судак, 20-27 мая, 2007.
- на конференции «Dependability of Computer Systems». Poland, Szklarska Por§ba, June 13-17, 2007.
- на конференции «Технологии Microsoft в теории и практике программирования», Россия, Москва, 2-3 апреля 2007.
- на 8-й, 9-й, 10-й, 11-й, 12-й, 13-й научных конференциях аспирантов и студентов «Радиотехника, электроника, энергетика» в МЭИ (ТУ), г. Москва, 2002-2007 гг.,
- на «Научных сессиях МИФИ», г. Москва, 2002-2007гг.,
- на международных формуах информатизации МФИ-2003, МФИ-2004, МФИ-2005, МФИ-2006, МФИ-2007, международные конференции «Информационные средства и технологии», г. Москва, 2003-2007 гг..
Публикации.
Основные результаты, полученные при выполнении диссертационной работы, опубликованы в 18 печатных работах, включая 2 работы в изданиях, рекомендуемых ВАК.
Структура диссертационной работы.
В главе I проведен анализ существующих подходов к обеспечению интероперабельности информационных систем, сделан обзор научных работ, проводимых в данной области, выявлены нерешенные в этой области вопросы и на основе проведенного анализа сформулирована задача обеспечения интероперабельности информационных систем. В главе II предложен метод описания двухуровневой концептуальной модели информационных систем на основе схемы данных и онтологии предметной области. Рассмотрены методы описания метаданных и сделано обоснование для выбора конкретных методов в данной работе.
В главе III рассмотрены этапы разработанного алгоритма интеграции информационных систем и алгоритмов решения частных задач, возникающих в ходе построения решения, и разрешения возможных противоречий. Функционирование данных методов показано на примере интеграции информационных систем ВУЗа.
В главе IV рассмотрено практическое применение изложенных концепций и проведён анализ результатов исследований. Приведено подробное описание процесса интеграции информационной системы Var Pro нефтеводогазового расходомера «Ультрафлоу» и штатного хранилища данных нефтяного месторождения АДКУ 2000.
Об интеграции и интероперабельности
В настоящее время происходит интенсивное развитие технологии проектирования и создания открытых систем - технологии интероперабельных информационных систем. Ниже приводятся несколько важных определений.
Интероперабелъностъю компонентов информационных систем называется их способность к совместному использованию, совместной деятельности для решения задач [18].
Компонентами систем являются произвольные информационные ресурсы, такие, как программные компоненты, базы данных, базы знаний, файлы данных (включая мультимедийную информацию), компоненты существующих информационных систем, и др. независимо от аппаратно-программных платформ их реализации и размещения в пространстве.
Информационные ресурсы - автономные информационные или вычислительные службы, например: программные компоненты, базы данных, базы знаний, файлы данных, компоненты существующих информационных систем и др., рассматриваемые при конструировании систем независимо от аппаратурно-программных платформ их реализации и размещения в пространстве [1].
Интероперабельность как свойство компонентов систем (информационных ресурсов) необходимо для решения задачи их интеграции, т.е. объединения их в некоторую новую систему, функциональность которой превосходит простую сумму функціональностей отдельных компонентов. Таким образом: интеграция является задачей, которую надлежит решить, обеспечение свойства интероперабельности является решением задачи интеграции.
Термин «интеграция» может обозначать действие, процесс или итог объединения. Результатом применения интеграции как действия или процесса над компонентами, системами или ресурсами является интегрированная система.
Интегрированные системы — это системы, основанные на интероперабельном взаимодействии их компонентов.
Как известно, информационным системам (и программному обеспечению в целом) присущи как минимум два аспекта: смеантический (охватывающий смысл и назначение носителей информации в системе) и структурный (охватывающий структуры состояний компонентов системы). Соответственно, таким системам присуща и сложность как минимум двух видов: семантическая и структурная. Таким образом, при интеграции, т.е. обеспечении совместного функционирования информационных систем для решения общих задач, выделяется два аспекта интероперабельности: структурный и семантический. Структурный аспект интероперабельности систем означает способность к структурному согласованию сущностей систем. Семантический аспект означает возможность установления соответствия между смыслами единиц информационных систем. Существующие методы достижения интероперабельности, главным образом, касаются ее синтаксических (структурных) аспектов, т.е. направлены на согласование и преобразование структур данных за счет стандартизации их форматов и использования расширяемых метаязыков. Универсальные подходы к обеспечению интероперабельности ИС на семантическом уровне в настоящее время отсутствуют. Решения соответствующих задач являются частными, относящимися к конкретным ИС, и предусматривают ручное построение отображений между их сущностями, реализуемое в средствах преобразования данных [19].
Если структурная интероперабельность неразрывно связана со структурным анализом данных, то семантическая требует анализа самой информации, связи ее с общим информационным полем, установления соответствия терминов и словарей одной предметной области элементам другой.
Семантическая интероперабельность программного обеспечения, на данном этапе развития вычислительных систем, частично обеспечивается путём следования открытым стандартам на интерфейсы и протоколы. В частности, примерами таких стандартов на интерфейсы и протоколы являются упомянутые архитектуры распределенных вычислений, стандарты на интерфейсы доступа к реляционным данным (например, ODBC), стандарты на интерфейсы доступа к гетерогенным данным (например, OLE DB, ADO), стандарты на интерфейсы компонентов программных систем, выполняющих специфические (как правило, достаточно базовые для программных систем вообще или некоторых специальных предметных областей) функции (например, CORBA services консорциума OMG).
Стандарт онтологического исследования IDEF5
Существует стандарт онтологического исследования IDEF5 [60], который регламентирует этапы построения онтологии. Этапы построения онтологии [61, 62]: 1. Изучение и систематизация начальных условий: определение целей и контекста разработки онтологии; распределение ролей между членами проекта. 2. Сбор и накопление данных для построения онтологии. 3. Анализ и группировка собранных данных для облегчения согласования терминологии. 4. Начальное развитие онтологии. 5. Уточнение, проверка и утверждение онтологии.
Данный стандарт также содержит специальные онтологические языки: 1. Схематический язык (Schematic Language - SL); 2. Язык доработок и уточнений (Elaboration Language - EL).
Схематический язык (SL) - графический язык, служащий для формирования начального представления онтологии и дополнения существующих онтологии новыми данными [63].
Типы диаграмм и схем SL:
1. Диаграммы классификации - представляют классификации концептов ПрО (рис. 2.2) .
Для обеспечения более гибкого и наглядного представления онтологии целесообразно следовать регламентированным в стандарте 1DEF5 этапам построения онтологии и, в ходе разработки, выполнять построение схем на языке SL. С целью унификации [64] и упрощения работы с построенной онтологией, формальное описание онтологии следует проводить в разработанном формате для представления метаданных.
Онтология предметной области используется в качестве базы для интеграции информационных систем. Она позволяет создать единое информационное пространство, в котором функционируют хранилища данных. Также она необходима для описания метаданных интегрируемых информационных систем в одних терминах [65].
Онтология позволяет создать эталонную систему метаданных, к которой можно обращаться для разрешения возможных противоречий [66, 67], возникающих в ходе интеграции ИС.
При решении задачи обеспечения интероперабельности информационных систем необходимо опираться на использование метаданных об ИС и применение общих знаний о предметной области (ПрО).
Знания об интегрируемых ИС и знания о предметной области, в которой они функционируют, более эффективно задавать единообразно, в терминах единой модели метаданных для информационных ресурсов, для упрощения работы с ними.
Следовательно, для решения поставленной задачи, необходимо провести анализ существующих моделей представления знаний. Выбранная модель должна обеспечивать представление структуры и семантики информационных ресурсов информационных хранилищ данных. В случае неудовлетворения этим требованиям ни одной из существующих моделей, необходимо разработать соответствующую модель представления знаний об ИС.
Классифицировать существующие модели представления метаданных целесообразно по типам языков, лежащих в их основе. Это ведёт к их делению на следующие основные классы: языки, основанные на исчислении предикатов; HTML-подобные языки; XML- подобные языки [68].
Таким образом, в основе формализации онтологического знания, с одной стороны, лежат общепризнанные методы представления знаний, к которым в первую очередь относят методы исчисления предикатов и объектно-ориентированного подхода: семантические сети и фреймы. В частности, языки KIF (Knowledge Interchange Format) [69], основанный на исчислении предикатов, и фреймовые языки в соответствии с требованиями ОКВС (OpenKnowledge-Rare Connectivity), основанные на фреймовом представлении знаний, позволяют хорошо отображать логическое представление онтологии, транслируемое в конкретные модели представления знаний об информационных ресурсах.
С другой стороны, с учетом широкого применения в системах управления знаниями гипертекстовых средств навигации, подключения внешних источников знаний и распространения знаний в среде локальных и глобальных сетей, существуют расширения известных языков разметки HTML и XML методами описания онтологических знаний с помощью специальных семантических конструкций.
Разработанный алгоритм интеграции информационных систем
Пусть существуют две информационных системы ИС-А и ИС-В, функционирующие в рамках одной предметной области и необходимо провести интеграцию ИС-А и ИС-В. На рисунке 3.1 рассматривается процесс интеграции данных ИС. Задачей интеграции является обеспечение взаимодействия между ИС. Для этого необходимо определить соответствия сущностей ИС-А сущностям ИС-В и правила их преобразования.
С этой целью вначале из информационных систем извлекаются их схемы данных. Схема данных представляет структурную схему базы данных, систему типизированных связанных сущностей и их атрибутов [89].
При помощи анализа схем данных в отдельности, возможно установление лишь структурной интероперабельности, то есть правил преобразования типов полей и сущностей информационных систем друг в друга.
Для обеспечения семантической интероперабельности, требуется понимание назначения элементов ИС. Поэтому необходимо использовать вторую составляющую часть метаданных — концептуальную модель предметной области (ПО). Концептуальная модель является надстройкой над схемой данных и задаёт систему связей между концептами предметной области, установленную в данной ИС.
Построение данной модели осуществляется при помощи онтологии предметной области. Онтология содержит словарь концептов ПО и хранит общую сеть связей между этими концептами. То есть каждая концептуальная модель является подмножеством онтологии ПО [90]. Использование онтологии позволяет определять концептуальные модели в одних терминах и анализировать связи между их концептами. Онтология задаётся предварительно, перед началом интеграции информационных систем.
Далее на базе концептуальных моделей ИС-А и ИС-В осуществляется построение метамодели предметной области интегрируемых ИС. Данная метамодель объединяет и согласует в себе обе концептуальные модели. На этапе её построения также используется онтология [91]. Метамодель определяет соответствия сущностей ИС-А сущностям ИС-В и правила их преобразования, что позволяет установить взаимодействие между указанными информационными системами.
Формально метамодель интегрируемых ИС определяется следующим образом: M = (S,,S2,Rs), где Si - концептуальная модель ИС-А, S2 - концептуальная модель ИС-В, Rs - правила преобразования совокупностей концептов при их трансляции из ИС-А в ИС-В, построенные согласно рассматриваемому далее разработанному алгоритму интеграции ИС.
Входными данными алгоритма интеграции ИС являются: 1. Подключение к серверам баз данных, на которых размещенный интегрируемые ИС, 2. Наличие онтологии предметной области. Выходными данными являются: 1. Построенные соответствия сущностей ИС-А сущностям ИС-В и правила их преобразования. 2. Шаблоны запросов для трансляции данных из ИС-А в ИС-В.
Разработанный алгоритм интеграции информационных систем состоит из следующих основных этапов:
1. Анализ сущностей баз данных, их атрибутов и отношений между ними. На данном этапе приложением осуществляется построение схем данных [89].
2. Анализ семантических значений сущностей и атрибутов. На данном этапе строятся концептуальные модели информационных систем. Для получения и анализа семантических меток используется онтология предметной области [89].
3. Уточнение семантических соответствий. С помощью онтологии определяются недостающие связи между концептами [92].
4. Построение единой метамодели. Данная метамодель строится как объединение двух концептуальных моделей информационных систем [93]. На данном этапе онтология используется для разрешения возможных противоречий [94, 95].
5. Вывод результирующих отображений между сущностями и атрибутами информационных систем. Рассмотрим этапы алгоритма более подробно.
Информационная система АДКУ 2000
Программное обеспечение автоматизированной системы управления технологическими процессами добычи нефти Уньвинского и Сибирского нефтяных месторождений включает в себя: программное обеспечение (программный комплекс) диспетчерского пульта (ДП), реализующее функции визуализации параметров, хранения информации, генерации выходных форм и отчетов; программное обеспечение локальных систем контроля и управления (СКУ) на базе контроллеров SCADAPack, реализующее функции сбора информации и локального управления.
В качестве операционной системы компьютеров используется Windows 2000 с пакетом обновления SP5.
Прикладное программное обеспечение разработано с использованием среды разработки пакета InTouch 7.1 (Wonderware Corp., США), Delphi 5.0 (Borland Corp., США), Visual Basic 5.0 (Microsoft Corp., США). Программное обеспечение контроллеров SCADAPack разработано при помощи пакета TelePACE V.1.37 (Control Microsystems).
В структуре программного комплекса рабочей станции можно выделить следующие компоненты: Интерфейс оператора. Протокол обмена. База данных. Система отчетов.
Интерфейс оператора служит для отображения параметров технологических объектов в наглядной графической форме с использованием анимационных эффектов, ввода и корректировки параметров объектов, вызова отчетов. Он включает в себя набор окон со схематичным изображением технологических объектов, агрегатов и встроенной логикой отображения отдельных элементов окон, набор подпрограмм (script oB), в которых реализованы функции чтения и записи в базу данных, изменения режимов, вызова соответствующих окон.
Под протоколом обмена в данном проекте понимается приложение, служащее для взаимодействия с контроллерами, используя последовательный порт (СОМІ, COM2). Программное обеспечение контроллеров позволяет получать информацию не только о текущем состоянии параметра, но и формирует буфер "циклического опроса". В нем записаны сообщения о замерах, изменении состояния дискретных параметров, аварийные значения и т.д. с временными метками их возникновения. Информация о текущем состоянии параметров из буфера "циклического опроса" записывается в базу данных программного комплекса для ведения исторического журнала, используемого в отчетах и графических сводках. На рисунке 4.6 представлена обобщённая структура программного обеспечения диспетчерского пульта, предназначенного для сбора и анализа технологической информации по месторождению, а также управления программным и аппаратным обеспечением месторождения.
База данных в ИС АДКУ 2000 представляет собой компонент, в котором хранится структура технологического объекта, предыстория событий, нормативно-справочная информация, параметры для работы "Протокола обмена". База данных основана на реляционной модели. Доступ к ней осуществляется при помощи SQL - запросов, с использованием механизма ODBC. В проекте "АДКУ-2000" база данных реализована на основе реляционной клиент/серверной СУБД MS SQL-Server 2000.
По способу ввода информации в базу данных можно выделить следующие виды: Нормативно-справочная - вводится оператором; Приходящая — поступает с технологических объектов; Служебная - генерируется проектом "АДКУ-2000" или протоколом. По функциональному назначению информацию в БД проекта "АДКУ 2000" можно разделить по нескольким категориям: Таблицы текущего состояния технологических параметров объектов; Исторический журнал - таблицы, в которых хранится предыстория событий; Данные для приема, обработки параметров и генерации команд управления.
В дальнейшем для осуществления интеграции проектов Ультрафлоу и АДКУ-2000, в первую очередь будут рассматриваться таблицы текущего состояния технологических параметров объектов (приходящая информация) и таблицы исторического журнала.