Введение к работе
Актуальность темы диссертации. Одним из необходимых условий принятия эффективных решений при управлении сложными объектами, является своевременное обеспечение задействованных на разных уровнях управления лиц достоверной, полной и качественной информацией о текущем и прогнозируемом состоянии объекта. Это создает основу для выработки опережающих управленческих решений на базе прогнозных оценок состояния объекта управления.
Основные трудности при решении задач прогнозирования состояния природно-хозяйственных объектов обусловлены их сложностью, недостаточной изученностью протекающих в них процессов, ограниченными возможностями проведения активных экспериментов, сложностью и нескоординированностью процессов сбора исходных данных, их недостаточной доступностью, неадекватностью используемых моделей, а также рядом других причин. Данные, поступающие из различных источников, как правило, разнородны и для прямого использования, сопоставления и анализа, не пригодны.
В то же время разнообразие задач, для решения которых необходима информация о природных ресурсах и явлениях, разнообразие самих описываемых объектов, процессов и подходов к отображению информации о них не позволяют говорить о множестве информационных ресурсов данной группы как о единой системе.
Развитие концепции единого информационного пространства, научно-методологических основ информатизации, методов поддержки принятия решений в сложных организационно-технических системах, особенности формирования ведомственных и предметных ИС подробно рассмотрены в трудах ученых СПИИРАН (Юсупова P.M., Заболоцкого В.П.. Соколова Б.В.), теоретические основы гармонизации, интеграции и слияния данных, анализ и объединение данных для принятия решений (Городецкий В.И., Попович В.В.), онтологический подход к управлению знаниями (Смирнов А.В.). В ходе работы над диссертацией изучены и проанализированы труды отечественных и зарубежных ученых в областях: информатики, теории системного анализа и принятия решений, проектирования информационных технологий и систем (Багриновский К.А., Божко В.П., Гиляревский Р.С, Глушков В.М., Ю.Г. Данилевский, П. Друкер, Э.В. Евреинов, А.А. Емельянов, В.М. Жеребин, Д. Захман, С. Катлип, В.Н. Квасницкий, В.В. Кульба, А.Г. Мамиконов, Д. Мако, М.Месарович, В.А. Мясников, А.П. Пятибратов, А.Н. Романов, Т. Саати, С.Н.Селетков, И. Такахара, Ю.Ф. Тельнов, В.П. Тихомиров, М. Хаммер, Э.Н. Хотяшев и др.), создания информационных систем управления регионом, городом (Г.И. Марчук, Ф.И. Перегудов, А.А. Стогний, Ю.М. Черкасов, Ю.А. Черенков и др.), классификации и управления информационными ресурсами (Антопольский А.Б., Белов Г.В., Громов Г.Р., Копылов В. А., Ларин М.В., Саков А.А., Семилетов СИ., и др.).
Несмотря на значительное число работ и проектов, посвященных проблеме управления данными и интеграции информационных ресурсов, и значительные усилия центров обработки данных сформировать универсальные системы представления и предоставления данных (SDSS в Fermilab, ВаВаг в SLAC, BIRN в SDSC, Entrez-PubMed-GenBank в NCBI), сохраняется разрыв между многочисленными источниками, архивами данных и моделями, в которых эти данные предполагается использовать, особенно при проведении междисциплинарных исследованияй. Не все модели поддерживают вывод результатов в унифицированных форматах, удобных для использования в геоинформационных системах или системах научной визуализации (GRADS, Ferret, Surfer, AVS, IRIS Explorer, IBM Data Explorer, OpenMV). Крупные научные центры и центры обработки имеют сложившиеся информационные технологии и внутренние стандарты представления данных (например, SILAM/FMI, FIMR, JINR, SMHI, ММБИ, NESDIS) изменять которые сложно или нецелесообразно.
Другой проблемой, является дробление информационного пространства разрозненными информационно-вычислительными системами, что приводит к дублированию данных и потере достоверности.
Разрастание файловых систем до петабайтных архивов с миллиардами файлов, отсутствие единых стандартов представления данных, многообразие источников и форматов данных, необходимость интеграции новых и сложившихся информационных технологий, использование ассимиляции данных в модели для корректировки их поведения обусловливают актуальность сформулированной темы исследования, направленной на повышение эффективности информационного обеспечения систем прогнозирования с использованием моделей: разработка и формирование единого информационного пространства систем природопользования.
Цель работы и задачи исследования: разработка системной модели интеграции информационных ресурсов и реализация информационных систем природопользования на основе единого информационного пространства при моделировании природно-хозяйственных объектов для предупреждения возможных неблагоприятных ситуаций. Для достижения поставленной цели поставлены и решены следующие задачи:
анализ информационных ресурсов информационных систем природопользования и методов их интеграции в единое информационное пространство;
разработка онтологической модели единого информационного пространства систем природопользования и модели единого информационного пространства;
разработка метода интеграции данных в единое информационное пространство и ассимиляции данных в модели прогнозирования состояния природно-хозяйственных объектов;
реализация разработанного метода интеграции информационных ресурсов в решении практических задач.
Методы исследования
В работе использовались методы системного анализа, моделирования природных процессов, интеллектуального анализа данных, построения информационно-вычислительных систем, теории метаданных, онтологического анализа.
Положения, выносимые на защиту
Онтологическая модель информационных ресурсов систем природопользования, позволяющая определить основные понятия и связи между ними.
Метод интеграции информационных ресурсов в единое информационное пространство на основе онтологической модели.
Метод ассимиляции данных в задачах прогнозирования состояния природно-хозяйственных объектов и контроля качества данных.
Научная новизна
Разработана онтологическая модель информационных ресурсов систем природопользования, обеспечивающая взаимодействие разных групп пользователей (экспертов, ученых и J11 IP) на основе присвоенных им ролей.
Разработан метод интеграции информационных ресурсов в единое информационное пространство, отличающийся объективным анализом интегрируемых данных, модульной структурой моделей природно-хозяйственных объектов.
Разработан метод ассимиляции данных в модели прогнозирования состояния природно-хозяйственных объектов, включающий обработку и контроль «сырых» данных для обеспечения работы в реальном времени и динамическую корректировку поведения моделей природно-хозяйственных объектов на основе контроля отклонений параметров системы.
4. Разработано персональное рабочее пространство пользователя системы, позволяющее анализировать накопленную информацию в базе знаний и повысить оперативность принятия решений.
Обоснованность и достоверность основных выводов и результатов обеспечивается за счет анализа состояния исследований в данной области, подтверждается результатами экспериментов с моделями ПХО и при решении прикладных практических задач, а также апробацией основных теоретических положений диссертации в печатных трудах и докладах на научных конференциях.
Практическая ценность работы.
Разработанная модель информационной системы природопользования позволяет портировать накопленный опыт построения информационных систем в современную среду интеграции.
Разработанный метод интеграции информационных ресурсов автоматизирует рутинные процессы предварительной подготовки данных и повышает качество научных исследований, освобождая исследователя от знания информационных технологий. Применение метода динамического выбора схемы ассимиляции данных в модели повышает достоверность прогноза.
Разработанное программное обеспечение (информационная поддержка) и единый интерфейс подсистем моделирования позволяет в автоматизированном режиме конфигурировать модель прогноза на основе модульного принципа моделей принимать более качественные решения по выходу из проблемных ситуаций и их предотвращению на основании сравнения последствий разных вариантов принимаемых решений. Результаты исследований могут быть использованы и в других предметных областях.
Реализация результатов работы
Основные результаты диссертационной работы внедрены в виде информационного, алгоритмического и программного обеспечения системы поддержки принятия решений «Информационно-аналитическая система «Охрана окружающей среды Ленинградской области» и «Система мониторинга и прогнозирования распространения лесных пожаров» в Комитете по экологии и природным ресурсам Правительства ЛО, в ГМЦ Финляндии, в учебном процессе в СПбГУ и поддержана грантами: HYMNE - 2001-2002, Contract ICA-CT-2000-10034. Исследование влияния антропогенной нагрузки Санкт-Петербурга на состояние экосистемы Финского залива; INTAS/735 "The importance of sediments for the water quality of the gulf of Finland; INCO/516732, NISMIST. Management of environmental risk from landfills in seismic active regions in the New Independent States (NIS) of Central Asia, 2005-2008; Toxic wastes management /SIDA,2005-2006; An integrated monitoring and modelling system for wildland fires - IS4FIRES, FMI, 2007-2008.
Апробация результатов работы
Основные положения и результаты диссертационной работы докладывались и
обсуждались на следующих конференциях:
Klaipeda Baltic Sea conference, June 2004.
Конгресс ВестТейк-2007, Москва.
Международная конференция «Информационные технологии как основа управления в
сфере природопользования и охраны окружающей среды». - СПб, 2007.
XI Санкт-Петербургская международная конференция «Региональная информатика-2008»,
22-24 октября 2008 г, Санкт-Петербург.
Публикации
Основные положения и результаты исследования по теме диссертации опубликованы и непосредственно отражены в 9 работах, в том числе в 5 статьях, из них 4 - в изданиях, входящих в список ВАК, 4 - в материалах и трудах конференций.
Структура и объем работы
Диссертация объемом 125 машинописных страниц содержит введение, 4 главы, заключение, список литературы (105 наименований), 4 таблицы, 14 рисунков.