Содержание к диссертации
Введение 5
Глава 1. Аналитическая геоинформационная технология и системы 14
Данные, задачи, элементы технологии 14
Сетевые технологические схемы 31
Проблемно-ориентированные сетевые аналитические 36
ГИС ГеоПроцессор, Компас, Декарт
1.3.1. Сетевая растрово-векторная ГИС ГеоПроцессор 36
Архитектура системы 37
Функциональные возможности системы 39
Проблемно-ориентированное преобразование геоданных 41
Аналитические методы исследования комплексных геоданных 46
Подготовка, описание структуры и визуализации 48
многослойных данных
1.3.2. Сетевая система для представления и комплексного анализа 52
векторной ГИ, ГИС Компас
Функции, поддерживаемые системой 54
Анализ комплексных данных
Подготовка и описание структуры и визуализации 56
многослойных данных
1.3.3. Сетевая векторная система Декарт 62
Интеллектуальная визуализация и анализ ГИ 63
Разработка проблемно-ориентированного приложения 67
Выводы 81
Глава 2. Анализ геолого-геофизических и аэрокосмических данных 83
Первичные данные 83
Картографическое представление и визуальный анализ многослойной .. 84 пространственно распределенной информации
Выявление свойств геоданных 90
2.3.1. Преобразование растровых геоданных 91
Преобразование точечных и линейных геоданных 93
Моделирование 3-ех мерной топографической модели 93
2.4. Поддержка принятия решений на основе методов правдоподобного 94
вывода
2.4.1. Формирование учебных выборок в виде совокупностей 94
единичных точек или полигонов
2.4.2. Районирование территории на основе оценивания сходства 95
с прецедентами
Выводы 98
Глава 3. Анализ социально-экономических процессов 99
Демографические показатели РФ, ГИС ПРООН-Компас 100
Маркетинговая Информационно-Аналитическая Система 106
МИАС-Компас
3.3. Графическое и аналитическое исследование данных 108
Интерактивное окно карты и тематических данных 109
Анализ пространственного образа ГИ и получение информации.... 112 об объектах
Анализ географических объектов по одному тематическому 113
показателю
Анализ распределения объектов относительно порога 114
Анализ распределения объектов по интервальной шкале 115
Анализ географических объектов по комплексу показателей: 116
оценивание сходства, классификация
3.3.7. Генератор отчета 119
Выводы 123
Глава 4. Мониторинг запасов и ресурсов углеводородов, 124
информационно-аналитическая система «Ресурс»
Мониторинг запасов и ресурсов - основные положения и задачи 124
Структура БД 127
Архитектура системы Ресурс 133
4.4. Пользовательские возможности системы РЕСУРС 136
Окно таблицы 138
Окно карты 143
Интерактивное визуальное исследование данных 145
Анализ показателей по карте раскрашенных областей 146
Анализ показателей по карте со столбчатыми диаграммами ... 147
Одновременный анализ карт нескольких показателей 148
Динамическая классификация по одному показателю 149
Динамическая классификация по двум показателям 150
Исследование групп объектов 151
4.4.4. Ввод тематических данных (СУБД РЕСУРС) 156
4.5. Предложения по организации корпоративной информационной 157
сети МПР РФ для мониторинга ресурсов углеводородов
4.6. Методика непрерывного контроля и учета запасов и ресурсов 161
углеводородов с использованием системы «РЕСУРС» на федеральном и территориальном уровне
Выводы 165
Заключение 167
Литература 171
Введение к работе
Экспоненциальный рост объема цифровой информации, ее всеобщность и необходимость для устойчивого развития экономики, природопользования и социальной сферы и быстрое развитие телекоммуникационных технологий вызвали необходимость смены парадигмы постиндустриального общества и создания информационного общества [8, 35]. Происходит переход от разобщенных и независимых информационных ресурсов к ресурсам, связанным сетями передачи данных, способными обеспечить информационное взаимодействие [34].
Считается, что 80% цифровой информации, используемой для принятия решений, имеет географическую привязку [95]. Географическая информация (ГИ) применяется для планирования, прогноза и поддержки принятия решений в важнейших областях человеческой деятельности, таких как экономика, безопасность, оборона, транспорт, связь, здоровье, образование, управление природными и техническими ресурсами и т.д. В связи с важностью и разнообразием областей применения ГИ рассматривается как одна из важнейших компонент информационного общества [88].
Национальные программы по созданию географической информационной инфраструктуры объявлены в США в 1994 г., а в Японии и в Европе в 1999 г. В рамках программ создается инфраструктура геоданных окружающей среды: топография и батиметрия, транспортные магистрали, реки и береговые линии, участки земли и инженерные сооружения, адреса и административные границы, природные ресурсы в масштабах от 1:100 000 до 1:1 000.
Понимание Европейским сообществом значимости ГИ для развития государств стимулировало разработку программы создания Европейской Географической Информационной Инфраструктуры (EGII) с точностью привязки данных 100 м, 10 м и 1 м. Разрабатываются политика в области ГИ, стратегия распространения и доступа к ГИ [92]. В настоящее время затраты правительственных, коммерческих и промышленных организаций Европы на сбор, обработку и применение ГИ оцениваются в 10 миллиардов EURO в год.
Создан ряд международных ассоциаций по ГИ, специальная организация EUROGI (European Umbrella Organization for Geographic Information) объединяет
более 20 национальных и европейских ГИ ассоциаций. В EUROGI представлено более 3000 научных и коммерческих организаций из 20 стран.
Теоретической основой изучения структуры и свойств ГИ, а также
информационных технологий ее сбора, представления, обработки, анализа и
моделирования является геоинформатика [1, 4, 33, 50, 75, 81]. Геоинформатика
является многодисциплинарной областью, объединяющей знания по
картографике, анализу и обработке данных, имитационному моделированию, искусственному интеллекту и по направлениям приложений в природной и общественной среде, технических системах [67]. Многодисциплинарность и разнообразие приложений геоинформатики приводит к необходимости разработки предметно ориентированных информационных технологий - геоинформационных технологий [52, 82, 90], которые реализуются в Географических Информационных Системах (ГИС) [52, 54, 61]. Проблемам геоинформатики, разработке геинформационных технологий, созданию инструментальных ГИС-сред и ГИС-приложений посвящено множество публикаций - монографий, журналов, трудов конференций.
В России уделяется значительное внимание ГИС-технологиям: выпускаются 3
периодических издания - ГИС обозрение, ГИС бюллетень [11] и ГИС ежегодник
[13], в котором представлен каталог наиболее распространенных отечественных и
западных ГИС-средств. ГИС ассоциация РФ проводит в год несколько
конференций, в 2000 и 2001 гг. прошли конференции "ГИС и Интернет" [9], практически на каждой конференции по информационным технологиям и искусственному интеллекту присутствует проблематика ГИС.
В зависимости от технологических и/или прикладных аспектов ГИ, которым уделяется большее внимание, существует ряд определений ГИС. Приведем некоторые из них:
«пространственно определенная система для сбора, хранения и манипулирования данными» [91];
«особый случай информационной системы, где база данных состоит из наблюдений за пространственно распределенными явлениями, процессами или событиями, которые могут быть определены как точки, линии и контуры» [65];
«интерактивные системы, способные реализовать сбор, систематизацию, хранение, обработку, оценку, отображение и распространение данных и как средство получения на их основе новой информации и знаний о пространственно-временных явлениях» [51];
«научно-технические комплексы автоматизированного сбора, систематизации, переработки и представления геоинформации в новом качестве с условием прироста знаний об исследуемых пространственных системах» [50];
«аппаратно-программный человеко-машинный комплекс, обеспечивающий
сбор, обработку, отображение и распространение пространственно-
координированных данных, интеграцию данных и знаний о территории для их
эффективного использования при решении научных и прикладных географических
задач, связанных с инвентаризацией, анализом, моделированием,
прогнозированием и управлением окружающей средой и территориальной организацией общества» [32];
«специализированная база данных, в которой пространственная координатная система является основным способом хранения и доступа к данным и информации и которая используется для решения разнообразных задач, связанных с пространственными и атрибутивными данными; технология, которая интегрирует различные методы: дистанционное зондирование, глобальное позиционирование, компьютерное проектирование, автоматизированное картографирование и средства обработки; основное назначение системы - поддержка принятия решений» [67].
При всем многообразии определений ГИС, связывающих их как с предметной областью, так и проблемной ориентацией, в них можно выделить несколько ключевых технологических операций с территориально распределенными данными (наличие координатной привязки существенно отличает ГИС от других информационных систем): сбор, обработка, отображение, моделирование и анализ, поддержка процессов принятия решений. Все перечисленные модули, как правило, присутствуют в инструментальных многофункциональных ГИС, с помощью которых создаются проблемно ориентированные ГИС-решения.
Как уже отмечалось, ГИС технологии и системы находят широкое применение в различных областях, современный диапазон которых можно оценить по
приложениям, представленным в программной экспозиции ГИ систем и технологий на крупнейшей Европейской выставке информационных и телекоммуникационных технологий CeBit'2001 [62], всего было представлено около 300 ГИС:
Как видно из приведенной статистики, ГИС-приложения связаны, в основном, с административным управлением на местном и региональном уровнях, планирова-нием объектов инфраструктуры, транспортными перевозками, геомаркетингом, оптимизацией бизнеса с использованием пространственной информации, планированием пространственно распределенных ресурсов и т.п. В таких приложениях основным является визуализация географической информации в виде карт и привязка к ним различных баз данных по инфраструктуре различных территорий (застройка, бытовые объекты, торговля, организации и предприятия, дороги, газопроводы, линии электропередачи и т.п.). В ГИС такого рода отражаются два взгляда на пространство: местоположение объекта или свойство местоположения, т.е. система отвечает на вопрос: Где расположен объект X? или Что расположено в месте X? Такие ГИС решают в основном коммуникативную функцию - продемонстрировать то, что уже известно, найдено и подготовлено специалистами в области ГИС ГИС-конструкторами и ГИС-аналитиками. Эти ГИС, как правило, содержат инструментарий для таких пространственных операций, как
пересечение географических объектов, вычисление расстояний, построение буферных зон, оценивание видимости, пространственная интерполяция и агрегирование.
Ориентация на приведенные приложения видимо объясняется тем, что: 1. Инструментальные средства для этих задач довольно хорошо проработаны в современных ГИС, для них разработчики ГИС-решений (ГИС-конструкторы) широко используют локальные и сетевые ГИС-продукты компаний ESRI, Maplnfo, Intergraph, Autodesk (США) [11, 13], 2. Такие приложения обеспечивают потребности ГИС-зрителей - самой многочисленной группы пользователей, для которых основным является просмотр исходных данных и результатов анализа, и которые по роду своей деятельности не должны и/или не могут самостоятельно проводить геоинформационный анализ и подготовить карту. К этой категории обычно относятся руководители среднего и высшего звена, которым нужен оперативный доступ к пространственной информации для принятия решения, а также потребители геоданных, размещенных на проблемно ориентированных ГИС-серверах.
Другой класс задач, которым занимаются ГИС-аналитики, связан с исследованием тематических, пространственных и временных свойств ГИ для выявления связей между свойствами объектов и между самими географическими объектами, а также использованием выявленных связей для обнаружения целевых, заранее неизвестных объектов и для прогнозирования заранее неизвестных свойств объектов. Такими задачами являются мониторинг, анализ и прогнозирование природных (экологическая опасность, природные катастрофы, полезные ископаемые) и социально-экономических (демографическая ситуация, последствия политических и экономических решений, развитие рынка товаров/услуг) процессов и явлений, геоинформационная поддержка которых имеет большое значение для принятия решений. Примерами систем с развитыми средствами для ГИС-аналитиков являются IDRISI (США) и ILWIS (Голландия), разработанные исследовательскими центрами.
В последние годы значительные усилия разработчиков геоинформационных технологий направлены на разработку сетевых ГИС [5, 41, 57, 60, 78, 79, 94]. Как
отмечает президент компании ESRI (крупнейший поставщик ГИС на мировом рынке, семейство ArcGIS) Д.Данджермонд: "Усовершенствование ГИС и работа по сетям будут способствовать повсеместному распространению и применению географических знаний. ГИС станут намного проще в использовании, более интуитивными, более аналитичными и более встроенными во множество других технологий" [24].
Представленная работа посвящена созданию аналитических
геоинформационных технологий и сетевых аналитических ГИС, в которых существенным является сравнение или сопоставление географических объектов между собой по комплексу тематических атрибутов, а также исследование свойств пространства по комплексу признаков, и созданию на их основе практических ГИС-решений в природной и социально-экономической предметных областях. Аналитическая ГИС - это средство исследования или моделирования явления, цель которых заключается в том, чтобы выявить, найти неизвестное (закономерность, аномалию, связь и т.п.). Функциональность разрабатываемых интерактивных интуитивно понятных аналитических средств предоставляет возможности исследовать свойства ГИ как ГИС-аналитикам, так и ГИС-зрителям в различных проблемных областях.
Достижение поставленной цели осуществляется путем решения следующих задач:
Разработка спецификации задач и функций аналитических ГИС.
Разработка спецификации методов и операций, поддерживающих комплексный анализ свойств ГИ.
Разработка интуитивно понятных операций для интерактивного представления, обработки и анализа ГИ.
Разработка архитектуры сетевой аналитической геоинформационной системы, обеспечивающей высокую интерактивность.
Разработка технологии описания ГИ для построения проблемно ориентированных сетевых ГИС-решений.
Разработка ГИС-решений и исследование операций аналитических ГИС для природных и социально-экономических проблемных областей.
При выполнении диссертационной работы использовались методы обработки и анализа данных [2, 27, 89] , искусственного интеллекта [3, 10, 30, 37, 47, 48] , распознавания образов и прогнозирования [27, 83], компьютерного моделирования и инженерии знаний [38, 45].
Диссертация состоит из введения, 4 глав, заключения и списка литературы из 95 наименований. Работа изложена на 178 страницах и содержит 63 рисунка и 3 таблицы.
В первой главе рассматривается структура и модель ГИ и определяются задачи и функции аналитических ГИС, предназначенных для визуального и аналитического исследования ГИ и выявления связей, как между географическими объектами, так и свойствами объектов. Предлагается спецификация и разрабатывается ряд операций аналитической геоинформационной среды для визуального, когнитивно-графического и аналитического исследования ГИ. рассматривается интеграция геоинформационных технологий с сетевыми технологиями, анализируются современные технологические схемы для сетевой реализации ГИС и обосновывается выбор архитектуры клиент сервер для решения задач аналитических ГИС. Предлагаются три технологии и системы для разработки сетевых аналитических ГИС: растрово-векторная система ГеоПроцессор и векторные системы Компас и Декарт [14-17, 56, 66, 71, 73, 93].
]. Для каждой ГИС рассматриваются способы описания структуры геоданных, технология представления и визуализации картографической и атрибутивной информации, а также подходы и методы анализа ГИ.
Во второй главе рассматривается технология анализа геолого-геофизической и аэрокосмической информации с использованием инструментальных средств системы ГеоПроцессор, аналитические функции которой, описанные в Гл. 1 (раздел 1.3), поддерживают принятие решения на основе совместного исследования растровой и векторной ГИ. Описываются средства представления растровых и векторных геоданных и проблемно-ориентированной обработки и визуального анализа многослойных растровых данных. Рассматривается технология выявления пространственных свойств геоданных на основе операций преобразования растровых полей и первичных векторных данных, представленных в виде точек и
линий. Преобразования отражают топологию географических и геологических объектов. Обсуждается технология районирования территории по точечным и площадным прецедентам на основе оценивания близости в многомерном признаковом пространстве. В системе ГеоПроцессор реализована геоинформационная технология, разрабатываемого в ИППИ РАН подхода к построению информационных моделей для картографического исследования и комплексного анализа свойств пространственно распределенных геоданных [7, 18, 19, 20, 21, 22, 68, 69, 70, 72]. ГеоПроцессор, по-видимому, является первой сетевой проблемно-ориентированной системой (1-я версия, 1998 г.), в которой в интерактивном режиме осуществляется совместная обработка и анализ слоев растровых и векторных геоданных.
В третьей главе предлагаются два ГИС-решения, созданные на основе системы Компас: 1. публикация и анализ тематических показателей о демографической ситуации в России в Интернете (ГИС ПРООН-Компас), 2. Корпоративная информационно-аналитическая ГИС для маркетинговых исследований (ГИС МИАС-Компас). Исследуется целесообразность применения аналитической ГИС-технологии для указанных приложений, а также структура, специфика и источники данных. Описываются способы интерактивного графического и аналитического исследования одномерных и многомерных показателей и приводятся примеры. В рассматриваемых приложениях подтверждаются цели разработки системы Компас, сформулированные в Гл. 1 (раздел 1.3.2): возможность простой настройки на проблемную область и предоставление интуитивно понятных интерактивных средств для анализа ГИ, которые были бы доступны широкому кругу пользователей, не являющимися профессионалами в области ГИС и анализа данных. Оба приложения отличаются тем, что географическая основа стабильна (слои географических объектов определены и не требуется их редактирование - ни изменение объектов, ни внесение новых объектов) и в основном фиксирован список и структура тематических атрибутов (новые показатели/понятия появляются редко), БД в основном актуализируется за счет временных индикаторов. Функциональные возможности систем позволяют решать следующие задачи: публикация ГИ в Интернет/Интранет, визуализация пространственных
свойств многослойной ГИ, комплексный интерактивный картографический и когнитивно-графический анализ ГИ, поддержка принятия решения на основе интерактивного представления и многомерного анализа ГИ.
В четвертой главе разрабатывается информационно-аналитическая система «Ресурс» и методология ее применения для решения задачи мониторинга и анализа запасов и ресурсов нефти и газа. Формулируются задачи мониторинга, и обосновывается необходимость создания информационной технологии для учета запасов и ресурсов в различных категориях и мониторинга их динамики для выработки стратегии и планирования поисковых работ и добычи. На основе рассмотрения структуры географических объектов учета обосновывается необходимость применения ГИС-технологии. В качестве базовой среды для построения ГИС Ресурс используется система Декарт, функциональные возможности которой и технология настройки на проблемную область рассмотрены Гл. 1 (раздел 1.3). Исследуются характеристики методов визуализации и картографического анализа показателей мониторинга и приводятся примеры. Рассматриваются вопросы и формулируются рекомендации по организации корпоративной информационной сети Министерства природных ресурсов РФ (МПР РФ) для мониторинга ресурсной базы углеводородов.
В заключении приводятся основные результаты диссертационной работы, а также сведения о практическом значении, реализации и апробации результатов.