Электронная библиотека диссертаций и авторефератов России
dslib.net
Библиотека диссертаций
Навигация
Каталог диссертаций России
Англоязычные диссертации
Диссертации бесплатно
Предстоящие защиты
Рецензии на автореферат
Отчисления авторам
Мой кабинет
Заказы: забрать, оплатить
Мой личный счет
Мой профиль
Мой авторский профиль
Подписки на рассылки



расширенный поиск

Разработка и реализация формальных онтологий пространственных данных и сервисов Динь Ле Дат

Разработка и реализация формальных онтологий пространственных данных и сервисов
<
Разработка и реализация формальных онтологий пространственных данных и сервисов Разработка и реализация формальных онтологий пространственных данных и сервисов Разработка и реализация формальных онтологий пространственных данных и сервисов Разработка и реализация формальных онтологий пространственных данных и сервисов Разработка и реализация формальных онтологий пространственных данных и сервисов Разработка и реализация формальных онтологий пространственных данных и сервисов Разработка и реализация формальных онтологий пространственных данных и сервисов Разработка и реализация формальных онтологий пространственных данных и сервисов Разработка и реализация формальных онтологий пространственных данных и сервисов Разработка и реализация формальных онтологий пространственных данных и сервисов Разработка и реализация формальных онтологий пространственных данных и сервисов Разработка и реализация формальных онтологий пространственных данных и сервисов
>

Диссертация - 480 руб., доставка 10 минут, круглосуточно, без выходных и праздников

Автореферат - бесплатно, доставка 10 минут, круглосуточно, без выходных и праздников

Динь Ле Дат. Разработка и реализация формальных онтологий пространственных данных и сервисов : диссертация ... кандидата физико-математических наук : 05.13.11 / Динь Ле Дат; [Место защиты: Моск. гос. ун-т им. М.В. Ломоносова]. - Москва, 2008. - 196 с. : ил. РГБ ОД, 61:08-1/53

Содержание к диссертации

Введение

ГЛАВА 1. Геоинформационные системы и современные технологии, проблемы поиска и интеграции распределенных пространственных ресурсов 16

1.1. Географические информационные системы (ГИС) 16

1.2. Обзор и анализ имеющихся современных решений и технологий, связанных с публикацией и поиском пространственных ресурсов в Интернете 18

1.2.1. Инфраструктура пространственных данных (ИПД) и геопортал, газеттер 18

1.2.2. Распределенные ГИС-системы 21

1.2.3. Веб-сервисы и геопространственные веб-сервисы 22

1.2.4. Интероперабельность и семантический веб (Semantic Web) 23

1.3. Онтологический подход к представлению пространственных ресурсов 26

1.3.1. Понятие онтологии 26

1.3.2. Языки описания онтологии и Web Ontology Language (OWL) 28

1.4. Открытые международные стандарты обмена пространственных ресурсов 30

1.4.1. Спецификации Открытого Геопространственного Консорциума (OGC) 30

1.4.2. OGC Web Map Server (WMS) и Web Feature Server (WFS) 32

1.4.3. Операция GetCapabilities и метаданные 33

1.4.4. Стандартно 19100 35

1.4.5. ISO 19119:2005 "Географическая информация - Сервисы" 35

1.4.6. Национальные стандарты по геоинформационным системам в России 37

1.5. Смежные работы 38

1.6. Проблемы разработки ГИС 39

1.6.1. Проблемы эффективного поиска 39

1.6.2. Семантическая интероперабельность 39

1.7. Выводы по главе 1 40

ГЛАВА 2. Стандарты, кодировки и онтологический подход к проблеме моделирования пространственных метаданных 42

2.1. Современное состояние и проблемы 42

2.2. Спецификация метаданных 43

2.3. Обзор и анализ международных спецификаций пространственных метаданных 44

2.3.1. ISO 19115:2003 "Географическая информация - Метаданные" 44

2.3.2. FGDC-STD-00I-1998 45

2.3.3. ГОСТ Р 52573-2006 46

2.3.4. CEN prEN 12657 47

2.3.5. Dublin Core 48

2.3.6. ANZLIC 49

2.3.7. UK GEMINI 50

2.3.8. Другие популярные спецификации 50

2.3.9. ISO 19139:2007 «Географическая информация - Метаданные - Спецификация реализации» 52

2.4. Формализации спецификаций метаданных 53

2.5. Онтологический подход моделирования пространственных метаданных 57

2.5. Выводы по главе 2 58

ГЛАВА 3. Формирование академического профиля пространственных метаданных и разработка онтологии пространственных данных и сервисов 61

3.1. Цели и задачи 61

3.2. Академический профиль метаданных «ГеоМЕТА» v3.0:2007 для пространственных данных и сервисов 61

3.2.1. Пакеты метаданных и отношения между сущностями 66

3.2.2. Совместимость и соответствие со стандартами ISO 19115:2003 69

3.2.3. Расширение элементов метаданных для описания сервисов на основе ISO 19119:2005 74

3.2.4. Расширение ядра ISO 19115:2003 77

3.3. Онтология пространственных данных и сервисов 78

3.3.1. Расширение OWL-схемы ЕНИП РАН 79

3.3.2. Расширение онтологии геоданных и научных ключевых слов GCMD 83

3.3.3. Расширение онтологии сервисов на основе ISO 19119:2005 86

3.3.4. Общее описание классов в онтологии пространственных данных и сервисов 88

3.4. Выводы по главе 3 95

ГЛАВА 4. Проектирование, программная реализация и апробация геоинформационно-аналитического web-портала на основе пространственных онтологии" пространственных данных и сервисов 97

4.1. Проектирование и выводы имеющихся наработок, понимание технологических направлений и решения «ГеоМЕТА» 97

4.2. Архитектура и основные возможности системы «ГеоМЕТА» 100

4.2.1. Общая архитектура системы «ГеоМЕТА» 100

4.2.2. Ядровый компонент системы «ГеоМЕТА» 104

4.2.3. Общая схема интеграция участников системы «ГеоМЕТА» 107

4.2.4. Веб-портал и возможности системы «ГеоМЕТА» .'-.-.: 109

4.2.5. Сервисные компоненты системы «ГеоМЕТА» 114

4.3. Применения системы «ГеоМЕТА» для решения прикладных информационно-аналитических задач 132

4.4. Дальнейшие шаги по развитию системы 133

4.5. Выводы по главе 4 134

Заключение 136

Список используемой литературы

Введение к работе

Эффективность использования геоинформационных систем (ГИС) и технологий в различных сферах трудовой деятельности человека определяется прежде всего тем фактом, что более 80% информации [148], с которой сталкивается человек в своей жизни, имеет территориальную привязку. Поэтому на сегодняшний день не вызывает сомнения потребность в разработке многопользовательских многофункциональных Интернет-ГИС-приложений, которые, в свою очередь, ставят задачу совершенствования существующих и разработку новых подходов к сбору, хранению, обработке и распространению растущего объема геопространственной информации и сервисов. Более того, ГИС в последние несколько лет совершили значительное продвижение в направлениях распределенной работы, совместного использования ресурсов и пр. При этом ввиду интеграции большого количества независимых информационных систем существенной проблемой является различная трактовка структуры и семантики информации в разных системах. Данные могут относиться к различным предметным областям, в рамках одной иметь разные выражение и интерпретацию.

Для того, чтобы управлять процессами создания, хранения, обновления и обработки колоссального объема пространственных данных и услуг, необходимо формировать метаданные. Однако достижения согласия по поводу одной единственной спецификации метаданных в мировом масштабе практически невозможно. Несмотря на рекомендации ISO/TC211, FGDC и OGC на использование стандартов пространственных метаданных [18], на рынке пространственных данных и сервисов сложилось так, что почти в каждой) стране создаются свои профили метаданных [23]. В итоге разные геоинформационные системы и каталоги поддерживают и рекомендуют свои профили метаданных. В частности, с 1 января 2007г. в России был введен в действие стандарт пространственных метаданных ГОСТ Р 52573-2006 «Географическая

информация. Метаданные» [3], который является профилем ISO 19115 -международного стандарта пространственных цифровых метаданных. К сожалению, Российский стандарт не имеет полной совместимости с исходным международным стандартом [4, 150], поэтому его необходимо откорректировать, чтобы не создавать новых технических барьеров. В связи с этим, разработка или адаптация спецификации метаданных, которая бы помогла описать формат и содержание данных для достижения интероперабельности, является актуальной задачей нескольких инициативных групп, представляющих различные науки о Земле [41, 42, 45, 85, 136, 149, 152, 153].

Наиболее эффективным способом обеспечения согласованного информационного обмена в таких условиях является обеспечение так называемой семантической интероперабельности систем на основе стека технологий Semantic Web: RDF, RDFS, OWL. Язык веб-онтологий OWL представляет развитые возможности для описания предметных областей взаимодействующих систем и дает машинно-интерпретируемые "определения фундаментальных понятий в предметной области и отношениях между таковыми в онтологии.

В рамках данного исследования анализируются международные и российские спецификации пространственных метаданных, лежащих в основе наиболее известных в мире Инфраструктур пространственных данных (ИПД) и предлагается простой, но» в то же время достаточно полный профиль метаданных для пространственных данных и сервисов, ориентированный на максимальную совместимость, адаптируемость и расширяемость как для российских, так и для зарубежных поставщиков и потребителей геоинформационных ресурсов, что и привело к онтологическому подходу формирования метаданных.

С другой стороны, основной целью проводимых исследований является создание в рамках Единого Научного Информационного Пространства РАН

геоинформационно-аналитической системы Web-портала «ГеоМЕТА», основанной на интеграции децентрализовано развиваемых пространственных ресурсов институтами, входящими в РАН, и запуск в работу онлайновых механизмов автоматического обмена пространственными метаданными между информационной системой РАН на базе ЕНИП РАН [5, 6, 8, 9, 10, 12]. Следовательно, решение проблемы повышения качества программного обеспечения ГИС в рамках ЕНИП также обуславливает актуальность решаемой в диссертации научной задачи.

Цель работы заключается в исследовании и разработке геоинформационно-аналитической системы интеграции распределенных неоднородных источников пространственных данных и сервисов на основе пространственных онтологии и решении проблемы семантической', интероперабельности, а также задачи управления метаданными и совершенствования поиска, доступа и обмена к растущему объему пространственной информации и сервисов, предоставляемых многочисленными источниками геоинформации.

В соответствии с целью работы были поставлены следующие задачи:

  1. Разработать онтологию пространственных метаданных для каталогизации, сбора и поиска геоданных и сервисов совместимо с ISO 19115:2003, ГОСТ Р 52573-2006 и ISO 19119:2005 «Географическая информация. Сервисы».

  2. Разработать онтологию, основанную на семантике существующих стандартов контента, таксономиях и ключевых словах в области наук о Земле.

  3. Расширить возможности описания геосервисов (метаданных услуг) за счет использования онтологии для придания значения контенту данных, улучшив тем самым семантическую функциональную совместимость.

  4. Создание и внедрение на практике геопортала и интеграции веб-ресурсов на основе разработанных онтологии для нахождения и обеспечения

простого доступа к имеющимся распределенным пространственным

данным и сервисам по стандартизованным протоколам (OGC, ISO/TC211

и W3C).

Объектом исследования являются проблема достижения интероперабельности, каталогизации и сбора метаданных пространственных ресурсов и технологии построения информационно-аналитических геопространственных Web-порталов.

Предметом исследования являются подходы и методы использования семантических технологий в геопространственных Web-порталах для реализации информационных процессов на семантическом уровне.

Методы исследования. В ходе диссертационного исследования были
использованы модели и методы, основанные на методологии представления и
обработки пространственно-распределенной информации в

геоинформационньгх Интернет-системах, теории метаданных и теории моделей, объектно-ориентированных методах построения и программирования программных систем.

Научная новизна работы заключается в следующем: 1. Предложен новый подход к процессу разработки геоинформационных

систем. Новизна подхода, прежде всего, заключается в использовании

онтологии пространственных метаданных. В отличие от существующих

методик, такой подход обеспечивает:

описание свойств классов объектов предметной области на языке веб-онтологий OWL, дающий машинно-интерпретируемые определения фундаментальных понятий в домене и отношениях между таковыми в онтологии, а не на языке программирования;

уникальное представление информационных объектов, создаваемых на основе описаний URI, для всех подсистем ГИС, что значительно упрощает построения распределенных геоинформационных систем;

упрощение процесса сопровождения ГИС, поскольку снижается
вероятность необходимости изменения программного кода и
структур баз данных при внесении изменений в иерархию классов
предметной области.

2. Предложена онтологическая модель данных для описания и организации многоуровневого хранилища, распределенных наборов пространственных данных, тематических слоев карт и геосервисов с развитыми средствами регистрирования, поиска и доступа к данным и сервисам, использующая предложенную автором онтологию пространственных метаданных. Её отличительными особенностями являются:

совместимость с международным стандартом ISO 19115:2003 и одновременно полная совместимость с российским стандартом ГОСТ Р 52573-2006;

совместимость с популярными международными стандартами, такими как стандарт FGDC-STD-001-1998 - Американский и Канадский ИПД, CEN prEN 12657 - Европейский INSPIRE и Французский ИПД, UK GEMINI vl.O - ИПД Великобритания, ANZLIC profile - Австралийский и Новозеландский ИПД, ESRI Profile of CSDGM - популярный коммерческий и т.д.;

расширение метаданных для описания OGC совместимых сервисов на основе ISO 19119:2005 и также расширение семантики описания ресурсов на основе разработанных онтологии геоданных и сервисов;

поддержки двуязычного (русский, английский) словаря терминов, семантически полного и удобного для совместного использования, так как он основан на онтологиях предметной области, которые описаны на OWL;

поддержки интероперабельности модели метаданных в XML-формате, соответствующей международному стандарту ISO 19139:2007 «Географическая информация - Метаданные - XML спецификация реализации». 3. Разработан комплекс программ геоинформационно-аналитического Web-портала, реализующего функции сбора, поиска, категоризации и управления пространственными метаданными, где основное внимание уделено на поддержке интероперабельности между спецификациями ГОСТ Р 52573-2006 и ISO 19115:2003 с возможностью описания семантики контента объектов и предоставления рекомендаций с учетом семантики их контента.

Практическая значимость исследования заключается: Построенная формальная онтологическая модель пространственных данных и сервисов представляет собой каноническую модель, позволяющую интегрировать распределенные неоднородные источники геоинформационных ресурсов.

Представленная автором онтология пространственных метаданных позволяет решать проблему «взаимопонимания» (т.е. семантической интероперабельности) геоинформационных систем, участвующих в распределенном взаимодействии. Более того, данная онтология нацелена на поддержку интероперабельности между стандартами ГОСТ Р 52573-2006 и ISO 19115:2003, а также расширение для каталогизации геосервисов основе ISO 19119:2005 и обмена метаданными в структурированном XML-формате по стандарту ISO 19139:2007.

Разработанный геопортал на основе онтологии пространственных данных позволяет оптимизировать сложные процессы формировании и управления пространственными метаданными через веб-интерфейс, обеспечивающий многоуровневую детализацию и поиск пространственных ресурсов на

семантическом уровне. Кроме того, геопортал обеспечивает двуязычные словари терминов (русский и английский) и ГИС-визуализацию. При этом созданные пространственные онтологии и геопортал имеют возможности использования в рамках ЕНИП РАН и системах управления знаниями.

Реализованные программные средства имеют широкий круг применения в области интеграции и поиска распределенных неоднородных источников пространственных данных и приложений для решения научных задач исследования Земли и каталогизации и автоматизации сбора распределенных пространственных метаданных на основе OGC-совместимых сервисов.

Полученные в диссертации научные результаты позволили сформулировать положения, выносимые на защиту:

  1. Предложены подходы семантического описания пространственных -. метаданных и онтологии геоданных и сервисов для решения семантической проблемы разделения, поиска и обмена пространственными данными и сервисами.

  2. Разработан академический профиль и OWL-онтология пространственных метаданных с поддержкой двуязычного словаря терминов с описаниями для интеграции распределенных наборов пространственных данных и сервисов, совместимых с международным стандартом ISO 19115:2003, ISO 19119:2005 и ГОСТ Р 52573-2006 в совокупности с набором программных и пользовательских веб-интерфейсов для регистрации/редактирования метаданных и доступа к его данным на основе протокола HTTP по стандартам OGC Web Map Service (WMS), Web Feature Service (WFS), включая возможность ГИС-визуализации.

  3. Предложены и реализованы схемы поиска и многоуровневая каталогизация распределенных пространственных данных и сервисов и автоматизированного сбора пространственных метаданных на основе OGC-совместимых сервисов.

  1. Реализован программный комплекс, включающий геоинформационный Web-портал, для проведения научных исследований на основе распределенных пространственных данных и сервисов - одна из первых в России онлайновых систем управления пространственными метаданными, нацеленная на поддержку интероперабельности между стандартами ГОСТ Р 52573-2006 и ISO 19115:2003 (а также совместимая со схемами метаданных, лежащих в основе наиболее известных в мире ИПД) с возможностью обмены метаданными в структурированном XML-формате по стандарту ISO 19139:2007.

  2. Разработанные онтологии, методы и технологии успешно использованы в ряде геоинформационных проектов отдела систем математического обеспечения ВЦ РАН.

Апробация. Основные результаты работы докладывались и обсуждались на следующих научных конференциях и семинарах:

Наука & Сотрудничество между Вьетнамом и Россией. VIII и IX международная научная конференция (Москва, 2006-2007).

XII международная GISnet конференция и выставка Геоииформатики (г. Хошимин, Вьетнам, 2006).

Научно-практический семинар отдела Геоинформационных систем Государственного геологического музея им. В.И. Вернадского РАН «Проблемы и решения задач в области наук о Земле в распределенной ИНТЕРНЕТ среде» (Москва, 2007).

Научные семинары лаборатории сетевых информационных технологий Геофизического центра РАН (Москва, 2007).

Международная конференция ECAI Congress of Cultural Atlases III Time & Space in Eurasia - SCI 2004 (Москва, 2007).

Научно-практический семинар семинар отдела картографии и аэрокосмических методов Московского филиала Русского

географического общества «Пространственные метаданные и

геопорталы как средства интеграции геоинформационных ресурсов

и сервисов» (Москва, 2008). - Научные семинары отдела систем математического обеспечения

Вычислительного Центра им. А.А. Дородницына РАН (Москва,

2006-2008). Предложены и апробированы на практике подходы и программно-технологические решения для создания интерактивных распределенных геоинформационных Интернет-систем интеграции главного геопортала Вычислительного центра РАН () и геопортала Государственного геологического музея им. В.И. Вернадского РАН ().

Публикации и личный вклад автора. По теме диссертации опубликовано 4 работ, в том числе 1 из списка изданий, рекомендованного ВАК РФ.

Структура и объем диссертации. Диссертация состоит из введения, 4 глав, заключения, списка литературных источников из 167 наименований и 4 приложений. Содержит 40 рисунков и 6 таблиц. Работа изложена на 151 страницах.

В первой главе приводится анализ возможностей, проблематики и необходимости современных геоинформационных систем (ГИС). Далее в главе рассматриваются открытые международные стандарты обмена пространственными ресурсами и отмечается важность серии стандартов ISO/TC211 19000, ГОСТ Р и спецификации передачи данных Открытого Геопространственного Консорциума (OGC). Далее рассматривается принципы применения технологий Semantic Web и OWL-онтологий для обеспечения семантической интероперабельности обмена пространственными ресурсами в распределенной среде Интернета, приводятся принципы формирования наборов

онтологий-стандартов для описания метаданных пространственных данных и сервисов. В результате анализа различных современных решений и технологий, сформированы технические и функциональные требования к геоинформационно-аналитическим системам на основе Web-портала. На основе анализа проблем взаимодействия компонентов распределенных ГИС-систем обоснована необходимость разработки специализированной онтологической модели пространственных данных и сервисов на основе единой (базовой) схемы метаданных.

Во второй главе анализируются и обобщаются спецификаций пространственных метаданных большинства существующих на данный момент ИПД и геоинформационных порталов, которые были вовлечены в исследовании для формирования^ академического профиля пространственных метаданных... Особое внимание уделяется в анализе таким стандартам и профилям пространственных метаданных, как международный стандарт IS 19115:2003 «Географическая информация. Метаданные», американский стандарт FGDC-STD-001-1998; российский стандарт ГОСТ Р 52573-2006; «Географическая информация. Метаданные», стандарт CEN (prEN 12657 Geographic Information — Metadata), который получил наибольшее распространение в Европе и австралийский и новозеландский профиль ИПД ANZLIC, профиль ИПД Великобритания- UK GEMINI и другие. Далее в главе освещены сильные и слабые стороны различных типов кодирования спецификаций метаданных. В данной главе описывается подход к интеграции данных геоинформационных систем, основанный на использовании онтологии пространственных данных и сервисов; задающей определения понятий?предметной области и^ связей между ними.

В' третьей главе описываются разработанные автором академического профиля метаданных «ГеоМЕТА» и реализации OWL-онтологии пространственных данных и сервисов: В рамках проведенного исследования

анализируются международные и российские спецификации пространственных метаданных и предлагается простой, но в то же время достаточно полный профиль метаданных для пространственных данных и сервисов, ориентированный на максимальную совместимость, адаптируемость и расширяемость как для российских, так и для зарубежных поставщиков и потребителей геоинформационных ресурсов. Особое внимание в процессе формирования профиля «ГеоМЕТА» уделяется решению проблемы совместимости стандарта ГОСТ Р 52573-2006 с международным стандартом ISO 19115 и предложен подход к решению этой проблемы. Задача интеграции распределенных неоднородных источников геоинформационных данных решается путем выделения единой (базовой) схемы метаданных, реализованной в виде OWL-онтологии на основе разработанного академического профиля метаданных «ГеоМЕТА» для обеспечения «взаимопонимания» (т.е. семантической интероперабельности) систем, участвующих в распределенном взаимодействии. Результатом интеграции станет единая среда, позволяющая осуществлять распределенный поиск геоинформационных данных и сервисов, визуализировать их, получать к ним доступ и обрабатывать необходимым образом.

В четвертой главе описывается на основе разработанной онтологии пространственных данных и сервисов программное средство геоинформационно-аналатической системы «ГеоМЕТА», представляющее собой платформу для интеграции распределенных неоднородных источников геоинформационных данных и сервисов доступных в мире. Архитектура системы разрабатывалась на основе тщательного анализа большинства существующих на данный момент ИПД и геоинформационных порталов. Основой программной реализации системы «ГеоМЕТА» стала система «Научный институт РАН», а созданная онтология пространственных данных расширила схему метаданных Единого Научно-Информационного

Пространства (ЕНИП) РАН, что обеспечило возможность включения портала системы «ГеоМЕТА» в ЕНИП РАН. При реализации ГИС-части системы использовались открытые решения, такие как MapBuilder, GeoServer и т.п.

Автор выражает благодарность профессору Серебрякову В. А. за внимание к работе, замечания и методическую помощь во многом способствовавшие улучшению качества окончательного варианта рукописи. Автор признателен доценту Бездушному А. Н. за ценные консультации и всестороннюю поддержку данного исследования.

Обзор и анализ имеющихся современных решений и технологий, связанных с публикацией и поиском пространственных ресурсов в Интернете

Инфраструктура Пространственных Данных (ИПД) (Spatial Data Infrastructure, SDI) берет свое начало с ранних девяностых [61], когда предложение по развитию национальной инфраструктуры пространственных данных получило общественное признание, признание частного сектора и сообщества пользователей. Сама ИПД определялась различными органами и различными исследователями неоднократно. Федеральный Комитет США по Географическим Данным (FGDC) определяет ИПД как технологии, политики и потребность людей в продвижении идеи разделения пространственных данных на всех правительственных уровнях, во всех частных и некоммерческих секторах, а также академическом сообществе [130].

В соответствии с определением, данным в [2, 61, 142], ИПД -информационно-телекоммуникационная система, обеспечивающая доступ граждан, хозяйствующих субъектов, органов государственной и муниципальной власти к распределенным ресурсам пространственных данных, а также распространение и обмен данными в общедоступной глобальной информационной сети в целях повышения эффективности их производства и использования.

ИПД стала очень важным фактором в определении того, как пространственные данные используются организациями, государствами или регионами, нациями, миром. Как отмечается в [ПО], текущие исследования показали, что ИПД многоуровневая по своей природе, сформирована из иерархии связанных между собой ИПД корпоративных, местных, государственных или академических, национальных, региональных и глобальных уровней. Так как информационные технологии развиваются стремительно, концепция ИПД также эволюционирует и приспосабливается к новым технологиям, что находит отражение в стремлении к удовлетворению меняющихся потребностей [110146].

Геопространственные Интернет-порталы (геопортал) - представляют собой веб-сайты, предоставляющие пользователю организованный; доступ к наборам информационных ресурсов, включая наборы данных, сервисов и услуг, инструменты и средства обработки, равно как и к организованным подборкам ссылок на множество; других сайтов, часто организованным с помощью сервис каталогов: Геопространственные порталы представляют собой шлюзы к наборам он-лайн ресурсов геопространственной информации. Геопространственные порталы обеспечивают возможности по размещению запросов на метаданные (метаданные по. [2];.. определены как данные ,о пространственных данных) по соответствующим данным и сервисам, а затем; напрямую устанавливают соединение с он-лайн контентом и с сервисами, как таковыми [81, 87]. Поэтому геопространственные порталы могут рассматриваться в; качестве своего рода «хабов», или «супермаркетов геопространственных ресурсов» во всемирной паутине геопространственных данных. Поставщики данных регистрируют свои данные и сервисы (услуги) в каталогах соответствующих сервисов для дальнейшего доступа к ним посредством такого портала [87]. Таким образом, геопространственные порталы являются ключевыми элементами ИПД [81].

Географический справочник «газеттер» представляет собой базовую подсистему некоторых архитектур ИПД; Хорошим примером служит Geospatial Portal Reference Architecture Открытого Геопространственного Консорциума (OGG - Geospatial Portal Reference Architecture) [103]. Данная модель привязки документирует базовый набор основанных на стандарте сервисов, которыми должна обладать геопространственная архитектура: сервисы портала по обеспечению точечного доступа, сервисы каталогов для определения местонахождения геопространственных ресурсов, изобразительные службы для отображения данных для пользователя, службы данных для предоставления содержимого данных и их обработки. Подсистема географического справочника (gazetteer) состоит из клиента географического справочника, который обеспечивает пользователю возможность изучения пространственно организованного набора снабженных именами объектов, служб справочника, позволяющих пользователю делать запросы по хорошо известным наименованиям мест для извлечения сведений об их свойствах, и модели контента географического справочника.

В настоящее время ИПД внедряется на различных уровнях для, обеспечения облегчения доступа к информации о наличии тех или иных сведений, равно как и для обеспечения доступа пользователей в геопространственным данным и сервисам. В таблице 1.1 приведены наиболее известные ИПД мира, которые являются предметом исследования данной работы.

Обзор и анализ международных спецификаций пространственных метаданных

ISO 19115 «Geographic information Metadata» - принятый как международный стандарт пространственных цифровых метаданных в мае 2003г. [143, 144], разработанный под комитетом ISO/TC 211 и представлен в виде диаграмм на UML - графическим языке, использование которого всячески поощряется Object Management Group (OMG). Набор метаданных ISO 19115 состоит из пакетов (UML), агрегирующих в каждом пакете сходные описания. Пакет состоит из UML классов. Например, один из пакетов называется MD_Metadata и он заключает в себе набор сущностей метаданных. ISO 19115 содержит более 400 элементов и атрибутов, сгруппированных в 95 классов, которые составляют атомарные единицы метаданных. Двадцать два элемента составили ядро, которое включает 7 обязательные, 4 условных и 11 опциональных элементов. Эти элементы имеют определенный тип данных (integer, string, date, Class) и предметную область (перечисление или конкретное имя класса). Например, элемент title тип символьной строки String и множетсво значений - свободный текст, а элемент date - это класс, т.е. имеет тип Class, а множество значений определено CIDate.

Национальный информационный центр по пространственным данным (the

National Geospatil Data Clearinghouse) был основан в 1994 году директивой 12906. Раздел три этой директивы формулировал необходимость разработки стандартизированной документации для данных. Такой разработкой является FGDC-STD-001-1998, которая определяет Content Standard for Digital Geospatial Metadata (CSDGM) [52, 131] и содержит более 200 элементов. Элементы в FGDC-STD-001-1998 организованы в иерархию составных элементов. Составные элементы включают в себя другие составные элементы или элементы данных. Элемент данных - это примитивный элемент, который определяется тип данных и область значений. Типы данных могут быть целыми, вещественными, текстовыми, датой или временем. Множество значений может быть списком допустимых или недопустимых значений или любым значением в зависимости от типа (например, любые данные, любые целые или любой текст).

Самым верхним составным элементом является элемент Metadata и он состоит из 7 других составных элементов. Ядро FGDC-STD-001-1998 состоит из 12 элементов, из которых 2 элемента являются обязательными: Identification Information и Metadata_Referenceinformation.

Хотя стандарты контента FGDC-CSDGM и ISO 19115 были разработаны в разное время и с разными целями, сама природа пространственных метаданных такова, что определенные условия или концепции, используемые для описания данных, используются неизменно, вне зависимости от стандарта контента. И потому многие поля метаданных в FGDC-CSDGM могут рассматриваться аналогичными или параллельными полям, определенным в ISO 19115 [129].

Как уже упоминалось выше, стандарт содержания пространственных метаданных необходим для обмена пространственными данными в рамках ИПД. В процессе стандартизации "и формирования стандартов ГОСТ Р в области-«Географическая информация/геоматика» РФ принимают участие такие органы, как Ростехрегулирование РФ, ФГУП «Госгисцентр», Технического комитета 394, Роскартография и др. С 1 января 2007г. в России был введен в действие стандарт пространственных метаданных ГОСТ Р 52573-2006 «Географическая информация. Метаданные» [3], который является профилем ISO 19115. К сожалению, Российский профиль не имеет полной совместимости с исходным международным стандартом [4, 145], поэтому его необходимо откорректировать, чтобы не создавать новых технических барьеров. С другой стороны, в российском профиле были отброшены большая часть (примерно 200 элементов) непопулярных элементов ISO . 19115 и добавлены новые элементы, специализованые словари для российских рынков геоданных - все это обеспечивает его простоту в использовании и удовлетворяет большинство интересов российских поставщиков пространственных данных и услуг, связанных с ними. ГОСТ Р 52573-2006 представлен в виде диаграмм на UML и разделен на 10 пакетов (UML), которые передают сходные данные, определенные в ISO 19115. Каждый пакет состоит из UML классов. В профиле содержатся 194 элементов и атрибутов, сгруппированны в более 50 классов. Ядро профиля ГОСТ Р 52573-2006 полностью наследует 22 элемента ядра ISO 19115.

Важно отметить, что при создании профиля пространственных метаданных на основе ГОСТ Р 52573-2006 в рамках данной работы были исследованы и предложены решения для достижения совместимости с ISO 19115. Более того, разрабатываемая система на этой профиль нацелена на поддержку интероперабельности между спецификациями ГОСТ Р 52573-2006 и ISO 19115 и тем самым обеспечивает удобный инструмент публикации и интеграции для российских постащиков данных на мировом рынке. Вопросы совместимости с международным стандартом и методики расширяемости профиля будут более подробно рассматриваться в главе 3.

Академический профиль метаданных «ГеоМЕТА» v3.0:2007 для пространственных данных и сервисов

Несмотря на рекомендации ISO/TC211, FGDC и OGC на использование стандартов пространственных метаданных, анализ, проведенный в главе 2, показывает, что достичь согласия по поводу одной единственной спецификации пространственных метаданных в мировом масштабе практически невозможно.

Мы поставили перед собой цель разработать простой, но в то же время достаточно полный профиль метаданных для пространственных данных и сервисов, ориентированный на максимальную совместимость, адаптируемость и расширяемость как для российских, так и для зарубежных поставщиков и потребителей геоинформационных ресурсов, что и привело к онтологическому подходу формирования метаданных.

Назначением онтологии является предоставление концептуализации информации и терминологии, что и будет использовано в этой работе. Онтологии предоставляют семантику предметной области и определяют набор концепций и отношения между этими концепциями внутри предметной области. Работа посвящена описанию нашего подхода по использованию множества онтологии для формирования семантических метаданных. Определяющими факторами, обосновывающими применения онтологического подхода для создания семантических схем метаданных, являются: Онтологии могут быть сконструированы таким образом, чтобы можно было создать общий многоязычный словарь терминов, описывающих наборы данных, таким образом определяя стандарт метаданных, который может быть использован всеми; Онтологии могут предоставлять концептуальную схему для любого набора ресурсов, независимо от формата, структуры или размера; Онтологии могут быть спроектированы таким образом, чтобы можно было семантически интерпретировать содержимое и структуру данных представленных в наборе данных; Онтологии могут помочь поставщикам данных и сервисов вводить метаданные в семантически достоверной форме; Взаимодействие между гетерогенными наборами данных и сервисов может быть достигнуто путем использования совместных онтологии; Онтологии считаются наиболее развитой моделью представления знаний; Онтология может быть использована в качестве основы для поиска и извлечения интересующих данных из набора данных. Мы представляем онтологии с помощью Web Ontology Language (OWL), который рекомендован консорциумом W3C для реализации Семантической Всемирной паутины. Семантическая Всемирная паутина - это будущее Интернета, когда информация будет хорошо семантически определена с использованием онтологии, таким образом допуская компьютерную обработку и распознавание имеющейся информации [33]. Семантическая Всемирная паутина и OWL предназначены для расширения синтаксического взаимодействия до уровня семантического взаимодействия. OWL наряду с формальной семантикой предоставляет обширный словарь и служит для организации межкомпьютерного взаимодействия. Семантические метаданные, сгенерированные с использованием OWL-онтологий записаны в качестве OWL-файлов и поэтому воспринимаемы компьютерами и могут быть использованы в будущем Семантической Всемирной паутине.

Задача интеграции распределенных неоднородных источников геоинформационных данных и сервисов решается путем выделения единой (базовой) схемы метаданных, реализованной в виде OWL-онтологии на основе стандартов ISO 19115:2003 "Географическая информация. Метаданные" [137] и ISO 19119:2005 "Географическая информация. Сервисы" [142], полностью включает в себя скорректированный российский стандарт ГОСТ Р 52573-2006 "Географическая информация. Метаданные" (а также профилей и схем метаданных, лежащих в основе наиболее известных в мире ИПД),) для обеспечения «взаимопонимания» (т.е. семантической интероперабельности) систем, участвующих в распределенном взаимодействии. Это демонстрируется на примере выполненной реализации геоинформационно-аналитической системы «ГеоМЕТА» с пользовательским Web-интерфейсом геопортала І (подробно описывается в главе 4).

Архитектура и основные возможности системы «ГеоМЕТА»

Геоинформационно-аналитический веб-портал «ГеоМЕТА» реализованный на технологии Java/J2EE представляет собой геоинформационно-поисковую систему распределенных пространственных данных и сервисов на основе онтологии, предоставляющую Интернет-доступ к ее данным и сервисам обработки. С другой стороны веб-портал «ГеоМЕТА» является пользовательский интерфейс доступа к наборам функций сервисного компонента системы «ГеоМЕТА» через Интернет по адресу http://eearth.ras.ru (или его зеркальный адрес http://geometa.dinhledat.com). На рисунке 4.6 представлена главная страница веб-портала «ГеоМЕТА». Основные методы доступа к наборам сервисов системы «ГеоМЕТА» осуществляет через простые ссылки на странице веб-портала, которые расположены в левом меню «НАВИГАЦИЯ» и также верхнее и нижнее меню.

Веб-портал «ГеоМЕТА» обеспечивает простую и расширенную формы поиска распределенных пространственных данных и сервисов, организаций. Также доступны интегрированные средства ГИС-визуализации, предоставляющие возможность получить картинное представление пространственных данных в виде слоев карт. Один из центральных моментов является возможность каталогизации метаданных на основе разработанного профиля «ГеоМЕТА» v3.0:2007 (см. приложение А и Б). На веб-портале предоставляет разнообразные формы с 3-х уровневой схемой для регистрации и редактирования метаданных пространственных данных и сервисов. Важно отметить, что способов структурной модели информации реализованы на основе пространственных онтологии «ГеоМЕТА», которые определяют структуру пакетов метаданных ISO 19115 (см. рисунок 3.2 и главу 3) и таксономии геосервисов ISO 19119 (см. главу 3). Кроме того, на портале доступна часть функциональности платформы ЕНИП РАН (см. рисунок 4.7) для научного учреждения в решении общих информационных задач, таких как почта, форумы, работа с новостями, управление структурой сайта, атрибутный поиск, регистрация и администрирование и т.д. Тем самым увеличивает значимость и функциональности система «ГеоМЕТА» в целом.

Рисунок 4.7. Левое меню доступа к сервисам портала «ГеоМЕТА» Ресурс системы имеет несколько вариантов содержания, иногда представленных в разных форматах, таких как RDF/XML метаданные, соответствующие ISO 19115/19119 или ГОСТ Р 52573-2006; (формат RDF/XML представления данных является функциональность системы ЕНИП), HTML стандарта FGDC, XML-формате ISO 19139:2007 (с помощью технологии XSLT преобразовании из формата RDF/XML). А также система предоставляет доступ к интегрированным пространственным данным участников типа 1 через OGC сервисов (WMS, WFS, WCS) на основе сервера данных «ГеоМЕТА» (см. рисунок 4.3).

Система является многоязычной благодаря мощности онтологического подхода к моделированию сущностей, объектов и словарей терминов системы. В настоящее время уже загружены данные и словарные термины на русском 112 языке. Важно отметить, что поддержка русского словаря терминов пространственных метаданных является одним из нововведений работы. Вследствие чего, для улучшения понимания терминов словари пространственных метаданных в соответствие с ГОСТ Р 52573-2006 и ISO 19115:2003 в интерфейсе пользователя параллельно с русскими терминами документируются английское описание терминов в скобках (см. рисунок 4.8).

Пример двуязычный описание терминов словари MD_TopicCategoryCode пространственных метаданных в форме поиска Исполнительная система обеспечивает следующие возможности:

просмотр пространственной информации и средства навигации по структуре пакетов ISO 19115 и ГОСТ Р 52573-2006;

локальный и распределенный поиск (т.е. комбинированный поиск по локальному репозиторию и распределенным репозиториям участников на основе интегрированных сервисов) пространственной информации по различным видам запросов в простой и расширенной форме и просмотр выданной по запросам информации; средства ввода, редактирования и сопровождения пространственной информации; средства администрирования информации.

Существенным обстоятельством системы «ГеоМЕТА» является то, что в ней реализован доступ ко всем перечисленным возможностям через Интернет посредством стандартного Web-браузера, поэтому он является основным (но не единственным) методом работы с системой.

Важно отметить, что за все доступные функции веб-портала и управления их работы отвечают конкретные реализованные сервисы в сервисном компоненте системы «ГеоМЕТА». Далее мы остановимся подробнее на функциональности сервисных компонент системы «ГеоМЕТА» и их соответствующих интерфейсов веб-портала.

Похожие диссертации на Разработка и реализация формальных онтологий пространственных данных и сервисов