Содержание к диссертации
Введение
1. Проблема создания информационной инфраструктуры исследований в энергетике, существующие подходы и технологии 14
1.1. Исследования в энергетике 14
1.2. Структура исследований в энергетике 17
1.3. Эволюция информационных технологий, используемых в исследованиях энергетики 26
1.4. Современное состояние в области создания информационных инфраструктур 33
1.5. Существующие технологии поддержки интеграции информационных систем 40
1.6. Постановка задачи 53
1.7. Выводы 55
2. Предлагаемый подход к построению информационной инфраструктуры научных исследований 56
2.1. Системно-концептуальные соглашения 56
2.2. Модель информационной инфраструктуры и архитектура инструментальных средств ее поддержки 57
2.3. Модель данных Репозитария 63
2.4. Методические принципы преобразования, представления и использования метаданных 68
2.5. Выводы 83
3. Реализация и применение информационной инфраструктуры 84
3.1. Реализация системных компонентов информационной инфраструктуры 84
3.2. Реализация прикладных компонентов информационной инфраструктуры 96
3.3. Применение компонентов информационной инфраструктуры в исследованиях энергетики и в проектах по грантам РФФИ и РГНФ 113
3.4. Выводы 131
Заключение 132
Список литературы
- Эволюция информационных технологий, используемых в исследованиях энергетики
- Существующие технологии поддержки интеграции информационных систем
- Модель информационной инфраструктуры и архитектура инструментальных средств ее поддержки
- Реализация прикладных компонентов информационной инфраструктуры
Введение к работе
Актуальность. Для России в сложившихся социально-экономических условиях особенно важными являются исследования энергетики, как одной из базовых отраслей экономики, от состояния которой зависит функционирование других отраслей промышленности. В ИСЭМ СО РАН выполняются исследования систем энергетики (электроэнергетики, тепло-, газо-, угле-, нефте-, нефтепро-дуктоснабжения), исследования энергетической безопасности России, региональных проблем энергетики, взаимосвязей энергетики и экономики, а также исследования перспективных энергетических источников и систем, решаются задачи прикладной математики и информатики. В рамках основных научных направлений выполняются исследования развития и функционирования как отраслевых систем энергетики, так и топливно-энергетического комплекса (ТЭК) в целом. Результаты исследований отраслевых систем энергетики зачастую являются исходными данными для исследований ТЭК, а результаты исследований направлений развития ТЭК должны учитываться при исследованиях развития отраслевых систем энергетики. Работы выполняются для стран СНГ, России и ее регионов.
Для получения обоснованных выводов. и рекомендаций, подготавливаемых для внешних организаций, необходимы координация и согласование исходной и результирующей информации, а для этого необходимо создание интегрированной информационной и вычислительной среды исследований - ИТ-инфраструктуры научных исследований, которая состоит из информационной, вычислительной и телекоммуникационной инфраструктуры. Необходимость создания информационной составляющей ИТ-инфраструктуры обусловлена также актуальностью проблемы сохранения уникальных знаний ученых старшего поколения. Эта проблема связана, в первую очередь, с тем, что после распада СССР в 90-х годах по экономическим и социальным причинам произошел отток научных кадров из институтов Академии наук, в связи с чем в ИСЭМ СО РАН, как и во многих других институтах, наблюдается возрастной разрыв (недостаточное количество ученых среднего возраста при наличии большого контингента молодых ученых и аспирантов).
Вклад в работы связанные со структуризацией, хранением, обработкой данных внесли К. Дж. Дейт, Е.Ф. Кодд, Дж. Мартин, П.П. Чен,
В.В. Бойко, В.М. Савинков, Л.В. Щавелев и др., а также сотрудники ИСЭМ СО РАН Л.В. Массель, Н.Н. Макагонова, С.К. Скрипкин и др. Проектированием комплексов программ для решения энергетических задач занимались Л.А. Мелентьев, А.А. Макаров, А.П. Меренков, Ю.Д. Кононов, Л.Д. Криворуцкий, Б.Г. Санеев и др.
Актуальность создания информационной инфраструктуры научных исследований определяется следующими объективными факторами:
Мировыми тенденциями развития информационных технологий (использование Internet как информационной среды; создание информационных ресурсов в Internet; развитие технологий хранилищ данных и др.).
Важностью проблемы развития информационных и телекоммуникационных технологий в России, о чем свидетельствует появление проектов «Электронная Россия» (в масштабах страны), «Информационно-телекоммуникационные ресурсы СО РАН» (Сибирское отделение РАН) и др.
Необходимостью интеграции технологий хранения данных и знаний, используемых для научных исследований, с целью повышения эффективности этих исследований. Необходимостью представления результатов научной деятельности организаций РАН в едином информационном пространстве.
Цель работы: создание информационной инфраструктуры исследований энергетики для повышения эффективности и усовершенствования технологии их проведения.
Для достижения поставленной цели необходимо решить следующие задачи:
Разработать методические основы построения информационной инфраструктуры исследований энергетики.
Выполнить проектирование и реализацию программных компонентов -информационной инфраструктуры.
Разработать технологию работы в ИТ-инфраструктуре и провести апробацию на примере исследований одного из отделов Института систем энергетики им. Л.А. Мелентьева СО РАН.
Для решения этих задач необходимо:
Выполнить анализ и классификацию существующих подходов к описанию информационных ресурсов.
Провести исследования в области преобразований различных форматов метаданных.
Разработать концепцию хранения онтологии на основе реляционных баз данных и реализовать хранилище данных на основе Репозитария.
Разработать методический подход к представлению метаданных и их использованию в различных системах.
Разработать методический подход к построению приложений на основе современных интеграционных технологий и Репозитария.
Реализовать базовые компоненты, средства доступа к данным, средства преобразования, извлечения и загрузки метаданных.
Разработать и отладить технологию применения информационной инфраструктуры в исследованиях энергетики.
Методами и средствами исследования являются методы проектирования современных программных комплексов, теория систем баз данных, методы информационного моделирования и объектно-ориентированного программирования.
Новизна работы определяется следующим:
Впервые предложен подход к созданию информационной инфраструктуры исследований энергетики, интегрирующей не только описания исследований, но и данные для их проведения.
Разработан методический подход к построению информационной инфраструктуры, включающий:
системно-концептуальные соглашения;
модель информационной инфраструктуры исследований энергетики;
архитектуру инструментальных средств ее поддержки;
методику описания информационных объектов;
технологию использования информационной инфраструктуры.
3. Впервые предложено использование Репозитария не только как
хранилища метаданных, но и как активного ядра информационной
инфраструктуры, обеспечивающего интеграцию по данным
программных комплексов для исследований энергетики (на примере исследований проблемы энергетической безопасности). 4. Разработаны модель информационной инфраструктуры, модель данных Репозитария, методические принципы преобразований, представления и использования метаданных. На защиту выносятся:
Модель информационной инфраструктуры поддержки исследований энергетики.
Архитектура инструментальных средств поддержки информационной инфраструктуры.
Модель данных Репозитария для хранения метаданных, данных и знаний исследований энергетики.
Методические принципы описания информационных ресурсов и манипулирования метаданными, методика организации массовой загрузки данных.
Методика извлечения из Репозитария метаданных и данных информационных объектов.
Практическая значимость. Разработанные методики, программные компоненты и технологии были применены при выполнении работ в рамках проекта по программе Интеграционных фундаментальных исследований СО РАН №2003-3 «Методы, технологии и инструментальные средства создания вычислительной инфраструктуры в Internet» и при выполнении проекта «Создание телекоммуникационной распределенной вычислительной инфраструктуры научных исследований: разработка методических основ и их применение для исследований в энергетике» в рамках НИР (гос. per. номер 01.200.116491) «Интегрированные вычислительные среды, сети и информационные технологии для обеспечения научных исследований в области энергетики».
Кроме того, результаты диссертационной работы внедрены при выполнении грантов РФФИ №04-07-90401 (2004 - 2006 гг.), РГНФ №04-02-00271а (2004-2006 гг.) и используются при выполнении грантов РФФИ №07-07-00265а (2007-2009 гг.), РГНФ №07-02-12112в (2007-2009 гг.).
Методический подход и системные компоненты использованы при разработке автоматизированной информационной системы «Университет» Иркутского государственного технического университета, в которой автор принимал активное участие.
Апробация работы. Результаты работы докладывались на V Международной научно-практической конференции «Фундаментальные и прикладные проблемы приборостроения, информатики, экономики и права», г. Сочи, 2002 г.; IX Байкальской Всероссийской конференции «Информационные и математические технологии», г. Иркутск, 2004 г.; X Байкальской Всероссийской конференции «Информационные и математические технологии в науке, технике и образовании», г. Иркутск, 2005 г.; XI Байкальской Всероссийской конференции «Информационные и математические технологии в научных исследованиях», г. Иркутск, 2006 г.; XII Байкальской Всероссийской конференции «Информационные и математические технологии в науке и управлении», г. Иркутск, 2007 г.; Международной конференции «Вычислительные и информационные технологии в науке, технике и образовании», г. Павлодар (Казахстан), 2006 г.; 2-ой региональной зимней школе-семинаре аспирантов и молодых ученых, г. Уфа, 2007 г.; IX Всероссийской конференции «Современные методы математического моделирования природных и антропогенных катастроф», г. Барнаул, 2007 г.; XXXIV Международной конференции «Информационные технологии в науке, социологии, экономике- и бизнесе», Гурзуф (Крым, Украина), 2007 г.; XXXV, XXXVI и XXXVII конференциях молодых ученых ИСЭМ СО РАН, г. Иркутск, в 2005, 2006, 2007 гг.; а так же докладывались и обсуждались на заседаниях секций и Ученого Совета ИСЭМ СО РАН.
Личный вклад. Результаты, составляющие новизну и выносимые на защиту, получены лично автором.
Публикации. По теме диссертации опубликовано 13 работ, из них З в журналах, рекомендуемых ВАК РФ для опубликования научных результатов диссертаций на соискание степени кандидата наук.
Объем и структура работы. Диссертация состоит из введения, трех глав, заключения, списка литературы из 136 наименований, девяти приложений, основной текст изложен на 132 страницах, включает 4 таблицы и 33 рис.
Основное содержание работы
В первой главе рассматривается область исследований энергетики и одно из важных направлений - исследования проблемы энергетической безопасности. Отмечается взаимосвязанность всех энергетических
исследований и использование результатов, полученных на различных уровнях. Рассматривается эволюция используемых информационных технологий в исследованиях энергетики, а также программные комплексы, разработанные и применяемые в ИСЭМ СО РАН для поддержки исследований. Формулируется проблема создания информационной инфраструктуры. Описывается современное состояние в области создания информационных инфраструктур, существующие технологии поддержки интеграции информационных систем.
Во второй главе рассматривается предлагаемый подход к
построению информационной инфраструктуры исследований энергетики,
включающий системно-концептуальные соглашения, модель
информационной инфраструктуры, архитектуру инструментальных средств ее поддержки, технологию описания информационных объектов и технологию использования информационной инфраструктуры. Концепция создания ИТ-инфраструктуры методологически обосновывается с помощью фрактальной стратифицированной модели информационного пространства. Рассмотрены методические принципы манипулирования метаданными и построения процедур выгрузки, методика организации массовой загрузки данных. Описаны этапы проведения проверки и генерации SQL-ориентированного кода, описана семантика этого кода. Рассмотрены методические принципы построения распределенного Репозитария, автором предлагается технология синхронизации нескольких серверов под управлением InterBase/Firebird, которая позволяет организовать стратегию полной и транзакционной репликации.
В третьей главе рассмотрена реализация системных компонентов информационной инфраструктуры: программного ядра Репозитария, файлового хранилища, драйвера и программы администрирования Репозитария; рассмотрена реализация прикладных компонентов: программы извлечения данных и просмотра файлов, Web-приложения для просмотра Репозитария и построение распределенных программных комплексов с использованием протокола SOAP. Описывается применение информационной инфраструктуры для поддержки проведения исследований проблемы энергетической безопасности, а также применение компонентов инфраструктуры для поддержки математического моделирования в проектах по грантам РФФИ и РГНФ. Рассмотрено применение компонентов для организации хранения алгебраических сетей.
В заключении приводятся основные результаты работы, определено дальнейшие направление исследования.
Автор выражает глубокую благодарность своему научному руководителю, д.т.н. Л.В. Массель, а также всем сотрудникам отдела "Живучести и безопасности систем энергетики" Института систем энергетики им. Л.А. Мелентьева СО РАН за полезные замечания и помощь при выполнении диссертационной работы.
Эволюция информационных технологий, используемых в исследованиях энергетики
Как правило, информационные технологии исследований энергетики развивались в рамках одной из концепций, преобладавших в то время в данной области. Справедливости ради следует отметить, что эти концепции не накладывали особых ограничений на реализацию программно-инструментальных средств исследований, скорее последние выступали в роли прообразов или прототипов соответствующих систем в рамках очередной концепции.
Так, в 70-х - начале 80-х годов использовалась концепция автоматизированных систем научных исследований (АСНИ). Институт систем энергетики принимал активное участие в разработке автоматизированной системы плановых расчетов (АСПР) и автоматизированных систем диспетчерского управления электроэнергетическими системами (АСДУ), опираясь на разработанные сотрудниками Института математические методы и модели [25,60,81,99,100].
Разработка средств автоматизации энергетических исследований в Институте начиналась с создания первых экономико-математических моделей для оптимизации топливно-энергетического баланса страны, моделей автоматизации развития электроэнергетических и трубопроводных систем, моделей управления функционированием (оптимизации режимов) электроэнергетических систем.
В 80-х годы стала преобладать концепция автоматизированных рабочих мест (АРМ) специалистов [42]. По сути дела, большинство развитых информационно-программных комплексов, разрабатываемых в ИСЭМ СО РАН, можно считать прообразами или версиями таких АРМ для специалистов-исследователей или специалистов-энергетиков.
В конце 80-х - начале 90-х годов, с распространением технологии систем искусственного интеллекта, получила развитие концепция систем поддержки принятия решений (СПГГР). Сейчас идет второй виток развития этой концепции, обусловленный развитием сетевых технологий и появлением новых технологий аналитической обработки данных (Data Warehouse, Data Mining, Online Analytical Processing - OLAP и др. [9,87,135]). Согласно этой концепции, разрабатываемые в Институте систем энергетики программно-инструментальные средства и базы данных можно рассматривать как элементы или прообразы стратегических СППР [115], наряду с которыми развиваются и так называемые оперативные СППР — информационные системы руководства (ИСР).
Одновременно с этим в ИСЭМ СО РАН ведутся работы по исследованиям в области распределенных программных комплексов, построению Web-сервисов для постепенного перехода к сервис-ориентированной архитектуре (Service Orientated Architecture - SOA) и подготовке к переходу на новую парадигму Internet-программирования.
Развитие программного обеспечения в ИСЭМ СО РАН соответствует этапам, характерным для мирового компьютерного сообщества. От отдельных программ, разрабатываемым для ЭВМ БЭСМ-2 и БЭСМ-4, в 70-х годах (при переходе на БЭСМ-6) был осуществлен переход к пакетам прикладных программ, которые были, как правило, проблемно-ориентированными и обладали достаточно сложной структурой и широким спектром интерфейсных функций. В это же время получены большинство модельно-алгоритмических решений, которые легли в основу разработанных тогда пакетов прикладных программ, некоторые из них до сих пор являются интеллектуальной ценностью и составляют основу стратегических информационных ресурсов Института [41,78,98]. В дальнейшем, по мере смены технической базы (ЕС ЭВМ, персональные компьютеры), появлялись новые версии пакетов прикладных программ, ядром которых оставались уже проверенные вычислительные алгоритмы.
В 80-е годы был разработан ряд программно-вычислительных комплексов (ПВК): для исследований гидравлических систем (СОСНА) [128], производственной структуры ТЭК (ЭНЕРГИЯ) [26], оптимизации установившихся режимов электроэнергетических систем (СДО-5) [40], исследования перспектив развития угольной промышленности [108], оптимизации структуры единой энергосистемы (СОЮЗ) [114], исследований живучести систем газо- и нефтеснабжения (ГАЗЕЛЬ и НЕФРИТ) [109,129] и др.
К середине 90-х годов для решения задач развития и функционирования систем энергетики были созданы программно-инструментальные средства, некоторые из них продолжают использоваться. Эти средства объединены в пять групп по областям применения [111]:
1) ПВК для информационного обеспечения при управлении электроэнергетическими системами: включающие диалоговый комплекс программ выбора измерений в электроэнергетических системах «Расстановка ТМ-Д» (И.И. Голуб); ПВК ОЦЕНКА для оценивания состояния режимов электроэнергетических систем (Ю.А. Гришин, И.Н. Колосок, Л.В. Эм); автоматизированную систему АСКО-03 для контроля электрического оборудования и аппаратуры РЗА подстанции высокого напряжения (Н.А. Чернышев, Р.Н. Кузьмин, А.Л. Ракевич);
2) ПВК для комплексного анализа режимов при функционировании электроэнергетических систем: АНАРЭС для анализа электрических режимов и надежности электроэнергетических систем (Ю.Н. Кучеров, А.Е. Ушаков, Е.И. Ушаков, О.М. Кучерова, А.Ю. Гришин, AJB. Погребняк); ПВК СДО-6 для исследования режимов электроэнергетических систем (В.Е. Артемьев, О.Н. Войтов, В.А. Мантров, Б.Г. Насвицевич, Л.В. Семенова);
Существующие технологии поддержки интеграции информационных систем
Современные модели представления и интеграции информационных ресурсов активно развиваются и внедряются в практику. Важнейшим элементом современных информационных технологий являются онтологии (от греч. «OVTOG»— сущее, то, что существует и коуод» — учение, наука). Онтологии позволяют производить автоматизированную обработку семантики информации с целью её эффективного использования (представления, преобразования, поиска) [48,49,119]. Соответствующий принцип обработки данных базируется на представлении описания предметной области как базы знаний, содержащей понятия и взаимосвязи, и ориентирован не на осмысление информации человеком, а на обеспечение семантической-интероперабельности, т.е. автоматизированную интерпретацию и обработку информации. Под семантической интероперабельностью-понимается свойство информационных систем, которое обеспечивает взаимное использование информации на основе общего понимания ее значения. Онтологии способны точно и эффективно описывать семантику данных для некоторой предметной области [43,76,116] и решать проблему несовместимости и противоречивости понятий [49,119].
Онтологии получили широкое распространение в решении проблем представления знаний и инженерии знаний [49,77], семантической интеграции информационных ресурсов [43,50,117], информационного поиска и т.д.
Неформально онтология состоит из терминов и правил использования этих терминов, ограничивающих их значения в рамках конкретной области. На формальном же уровне, онтология это система, состоящая из набора понятий и набора утверждений об этих понятиях, на основе которых можно строить классы, объекты, отношения, функции и теории.
Концептуальное (или онтологическое) моделирование имеет дело с вопросом о том, как декларативным образом, допускающим повторное использование, описать предметную область, соответствующие словари типов, как ограничить использование этих данных, в предположении понимания того, что может быть выведено из этого описания [43].
Онтологии можно применять в качестве компонентов баз знаний, словарей, схем объектов в объектно-ориентированных системах, концептуальных схем базы данных, определения классов для программных систем. Онтологии позволяют соответствующим программным средствам автоматически (без участия человека) определять смысл терминов использованных при описании ресурсов и сопоставлять его со смыслом поставленной задачи. Формально онтология определяется как О = X,R,F , функций где X— конечное множество понятий (концептов) предметной области, R - конечное множество отношений между понятиями, F — конечное множество интерпретации, заданных на концептах и/или отношениях. При R—0 и F— 0 онтология трансформируется в простой словарь.
Выбор языка описания онтологии зависит от целей ее разработки. Выделяются три класса таких языков: традиционные языки спецификации онтологии (LOOM, ОКВС, OCML, Flogic, LBase); специальные языки спецификации онтологии (Ontolingua, CycL, SHOE); языки, основанные на Web-стандартах (UPML, DAML, OIL, XODL, XML, RDF, RDFS, OWL).
Основное назначение OWL (Web Ontology Language) - это использование в приложениях, которые должны не только представлять информацию человеку, но и обрабатывать ее. OWL спроектирован для хранения и отображения большого количества разнородной информации и знаний, а также для поддержки семантики и связей между этими знаниями. OWL предназначен для описания классов и отношений между ними, которые присущи для Web-документов и приложений.
Для описания онтологии достаточно простого языка - XML или RDF [17,19]. XML позволяет описать синтаксическую составляющую структурированных документов, но не имеет средств для отображения семантики документа. XML предназначен для хранения структурированных данных, для обмена информацией между программами, а также для создания на его основе более специализированных языков разметки. Целью создания XML было обеспечение совместимости при передаче структурированных данных между разными системами обработки информации, особенно при передаче таких данных через Internet. Важной особенностью XML также является применение так называемых пространств имен. RDF — это модель данных, основанная на описании объектов (ресурсов) и отношений между ними. Данная модель данных может быть представлена с помощью синтаксиса XML.
Таким образом, применение онтологии в информационных системах позволяет отразить реальную картину мира в виде понятий, отношений и проводить различную интерпретацию.
Модель информационной инфраструктуры и архитектура инструментальных средств ее поддержки
В составе ИТ-инфраструктуры научных исследований, разработка которой ведется в ИСЭМ СО РАН [65-67,69-75,89,91,131], выделяются: информационная, распределенная вычислительная _ и телекоммуникационная инфраструктуры. Концепция создания ИТ инфраструктуры методологически обосновывается с помощью фрактальной стратифицированной модели (ФС-модели) информационного пространства, предложенной Л.В. Массель [79,89]. ФС-модель позволяет описать информационное пространство, в которое отображается вся имеющаяся информация о данной предметной области, В виде совокупности непересекающихся слоев, объединяющих однотипные информационные объекты (обладающие одинаковым набором свойств, или характеристик). Каждый слой, в свою очередь, также может быть расслоен.
Использование ФС-модели позволяет представить информационную технологию как совокупность информационных слоев и их отображений, тогда инструментальные средства информационной технологии включают средства описания информационных слоев и средства поддержки отображений из любого слоя в каждый.
Графически ФС-модель ИТ-инфраструктуры (рис. 3) может быть представлена в виде совокупности вложенных сферических оболочек (слоев), определяемой тройкой {S, F, GJ, где S — множество слоев, F -множество отображений, G - множество инвариантов. ИТ-инфраструктура S, согласно фрактальной методологии, расслаивается (стратифицируется) на интеграционную информационную инфраструктуру (7) распределенную вычислительную инфраструктуру (Sc) и телекоммуникационную инфраструктуру (ST). В свою очередь, S{ расслаивается на слои данных и метаданных (SID ,S1M);SC - на слои программ и описаний программ (Scp , SCM). Вводятся отображения слоев: Flc :Sj —» Sc, F/ :SJ — ST, Fj :SC — ST. Инвариантами (G) являются цели системных исследований в энергетике, которые детализируются для каждого слоя. Для описания слоев предлагается использовать информационные модели, модели данных и онтологии; для реализации средств поддержки отображений - Web-сервисы. д ИТ-инфраструктура Ш\ S 11 \ \ \ Информационная /J-— І-Л инфраструктура ///№Г\ Sl / --/-—/ 1 \ V—- \ Вычислительная А с \ \ JK инфраструктура / // \ \ /Г А &С " с / \ \ А Телекоммуникационная У инфраструктура
Фрактальная стратифицированная модель ИТ-инфраструктуры.
Интеграционная информационная инфраструктура исследований энергетики [71] призвана объединить информацию обо всех разрозненных хранилищах данных, используемых для хранения основной, промежуточной и результирующей информации, и методах (алгоритмах), выполняющих какие-либо действия над информацией (программных комплексах, пакетах прикладных программ, различных сервисах), а так же описание хранилищ данных и методов, представимое в виде ERD (Entity-Relation Diagram), UML (Unified Modeling Language), XML (Extensible Markup Language). Информационная инфраструктура должна поддерживать выполнение следующих функций:
1. Создание и организацию хранения описаний ресурсов института, среди которых можно выделить: информационные - базы данных, хранилища данных, наборы данных, онтологии; вычислительные — программы и программные комплексы; трудовые — научные сотрудники института, разработчики баз данных и программных комплексов; научно-исследовательские - НИР, проекты, гранты и т.п.; сервисные - Web-сервисы, имеющиеся в институте; электронные — публикации; внутренние - вспомогательная информация для работы сервисов.
2. Поиск необходимого ресурса по метаданным (описаниям хранимых ресурсов).
3. Преобразование метаданных из внутреннего стандарта в общепринятые стандарты (например, DublinCore, RDF, XML и др.).
4. Создание и организация хранения онтологии предметных областей (для ИСЭМ СО РАН: как энергетики в целом, так и отдельных энергосистем), а также научных исследований, ведущихся в институте.
5. Организационная, информационная и вычислительная поддержка исследований энергетики. Аналогичным образом можно выполнить стратификацию информационной инфраструктуры Si, выделив слои: метаданных информационной инфраструктуры SiP, метаданных ИТ-инфраструктуры SIM (включающей слой описания программ SCM) И данных SID- Графически фрагмент фрактальной стратификации информационной инфраструктуры представлен на рис. 4.
Реализация прикладных компонентов информационной инфраструктуры
В настоящее время среди пользователей операционных систем Microsoft Windows достаточно широко распространены менеджеры файлов, такие как Windows Commander, Total Commander, FAR, обладающие возможностями расширения с помощью подключаемых модулей (плагинов).
Наиболее популярным менеджером является FAR, потому что предоставляет пользователям широкий спектр возможностей не доступных другим программным продуктам. С помощью FAR одинаково легкоможно копировать файлы, просматривать изображения, архивировать, проверять электронную почту, подключаться к удаленным компьютерам и даже играть. Такой технологический рывок относительно других разработок этот менеджер сделал, прежде всего, из-за наличия множества подключаемых модулей «на все случаи жизни». FAR имеет очень хорошее описание технологии разработки плагинов [16], которой пользуются сторонние разработчики. Однако создателям FAR пришлось не только описать, но и разработать весь этот механизм взаимодействия с плагинами, который является достаточно сложным для реализации и содержит множество «подводных камней».
Для FAR был реализован внешний программный модуль, способный подключаться к Репозитарию, показывать метаданные в виде эмуляции файловой системы и извлекать связанные файлы из хранилища. При подключении к Репозитарию через FAR пользователь должен выбрать из списка сервер и указать имя пользователя и пароль для входа (рис. 18).
В теге «faultcode» указывается источник ошибки - клиент или сервер. Тег «faultstnng» содержит строковое описание ошибки, «faultfactor» указывает URL, по которому обращался клиент, в «detail» содержится дополнительная информация об ошибке.
Объем реализации прикладных компонентов составляет 53 модуля (при среднем объеме компонента в 9 модулей), с объемом чистого программного текста 270 Кб в 8,2 тыс. строк.
Интеграционная информационная инфраструктура исследований энергетики объединяет информацию обо всех ресурсах института: информационных (базах данных, хранилищах данных, онтологиях), вычислительных (программах и программных комплексах), трудовых (научных сотрудниках института), научно-исследовательских (НИР, проектах, грантах), сервисных (Web-сервисах), электронных публикациях.
Технологию использования информационной инфраструктуры можно разбить на несколько этапов: построение модели метаданных - на этом этапе определяются «правила хранения» метаданных, внесение метаданных - выполняется описание информационных ресурсов в информационной инфраструктуре, извлечение метаданных и данных -использование инфраструктуры для поддержки проведения исследований как интегрированного источника получения информации. - Перечень технологических этапов, инструментальных средств их поддержки и результатов представлен в таблице 4.
Для отображения информационных ресурсов с целью описания исследований была разработана модель метаданных информационной инфраструктуры, затем была применена процедура извлечения метаданных (приведена в приложении 6), которая сформировала файл в формате ХТМ — XML Topic Maps 1.0 [22]. Формат ХТМ позволяет описывать модели и грамматику для представления структуры информационных ресурсов, определяющих понятия и связи между ними (ассоциации). Имена, ресурсы, и связи являются характеристиками абстрактных предметов реального мира и называются концептами. Концепты обладают своими характеристиками в пределах ограниченных областей: ограниченны контексты, в пределах которых имена, ресурсы и связи относятся к своим реальным именам, ресурсам, и характеристикам отношений. Затем, используя инструментальную систему CmapTools [7], было построено графическое представление модели в виде концепт-карты [88] (рис. 20).