Введение к работе
Актуальность работы
В настоящее время существует огромное количество информационных систем (ИС) в различных предметных областях, что ставит задачу по рациональному использованию необходимой специалистам информации, содержащейся в них, как для информационной поддержки принятия решения, так и для выявления закономерностей с целью формирования новых знаний и прогнозирования неизвестных значений параметров объекта, а так же задачу по обеспечению специалистов в области неорганических соединений высококачественной информацией о свойствах и методиках получения перспективных неорганических веществ. Современные тенденции таковы, что на сегодняшний день, невозможно представить работу химиков-технологов без использования специализированных информационных систем, осуществляющих удаленный доступ через интернет. Разработка информационных систем в области неорганических соединений и материаловедения ведется во всех развитых странах.
На сегодняшний день, существует тренд в разработке и интеграции уже существующих ИС. В России, одним из первых разработчиков такого рода систем является Институт металлургии и материаловедения им. А.А. Байкова РАН (ИМЕТ РАН), если рассматривать зарубежных разработчиков, то наиболее полноценные ИС, разработанные на современных платформах, предлагает NIST (National Institute of Standards and Technology - Национальный институт стандартов и технологий, США) и STN (The Scientific and Technical Information Network - Международная сеть научно - технической информации). Как правило, редко встречается, когда данные, хранящиеся в специализированных ИС и характеризующие целую предметную область, располагаются в одном месте, чаще они разделены и собраны в различных странах и организациях, так же большинство таких ИС имеют платный доступ, что существенно осложняет процесс качественной и полной интеграции ИС.
Интеграция уже существующих систем в области неорганического материаловедения является одним из важнейших и актуальнейших направлений в современной химической промышленности, которая позволит структурировать данные в единое целое, что позволит уменьшить затраты на разработку и поддержку ИС, а так же значительно сократит количество дублированных работ. Новая интегрированная ИС совместно с системой поддержки принятия решений позволит без реального синтеза проводить прогнозирование образования неорганических соединений и оценивать их различные свойства, что существенно облегчит и ускорит поиск специалистами в области неорганического материаловедения перспективных неорганических веществ, необходимых для решения конкретной задачи.
Степень разработанности проблемы
Вклад в изучение методик интеграции: A. Halevy (Levy), W. Inmon, D. Calvanese, M. Lenzerini, G. Gottlob, T. Gruber, A.H. Бездушный, Л.А. Калиниченко, В. А. Серебряков, С.A. Ступников и др. Задачи прогнозирования решали: R. Duda, P. Hart, К. Fu, L. Kuncheva, Л.А. Растригин, В.П. Гладун, Н.Г. Загоруйко, Ю.И. Журавлев, В.В. Рязанов, О.В. Сенько и др.
Цель работы Цель работы заключается в информационной поддержке принятия решений при прогнозировании свойств неорганических веществ на основе технологии хранилищ данных. Для достижения цели работы были поставлены следующие задачи:
провести системный анализ потоков данных при использовании различных технологий
интеграции гетерогенных информационных систем;
на основе системного подхода разработать архитектуру ИС, в частности разработать схему
хранилища данных, а так же разработать методику извлечения, трансформации и загрузки данных в ХД;
разработать методику построения хранилища данных по свойствам веществ для
использования конечными пользователями в процессе поддержки принятия решений;
разработать методику применения хранилища данных для прогнозирования свойств веществ;
получение прогнозов образования перспективных неорганических веществ.
Объект исследования Объектом исследования являются информационные системы в области неорганического материаловедения.
Предмет исследования Предметом исследования является использование технологий интеграции ИС с целью консолидирования информации в области неорганического материаловедения для компьютерного конструирования перспективных неорганических веществ.
Научная новизна
разработана архитектура ИС на основе ХД для поддержки принятия решений при
прогнозировании свойств веществ;
разработана реляционная структура ХД по свойствам неорганических соединений на основе
формализации предметной области;
разработана методика интеграции химической информации на основе технологии хранилищ
данных;
разработана методика применения созданного ХД в программном комплексе компьютерного
конструирования неорганических соединений.
Теоретическая и практическая значимость
В диссертации решается проблема консолидации данных по свойствам неорганических веществ на основе технологии хранилищ данных для информационной поддержки принятия решений при прогнозировании веществ в области неорганического материаловедения.
Разработан программный комплекс, реализующий интегрированную ИС, на базе платформы Microsoft, объединяющий информационные ресурсы по свойствам веществ и технологиям их получения. При помощи этого программного комплекса выполнена интеграция информационных ресурсов, разработанных ИМЕТ РАН совместно с другими организациями России: БД по свойствам неорганических соединений «Фазы», БД по фазовым диаграммам полупроводниковых систем «Диаграмма», БД по свойствам акустооптических, электрооптических и нелинейно-оптических веществ «Кристалл». Интегрированное ХД
позволяет пользователям получать доступ ко всей информации в рамках ХД и использовать его в качестве источника информации для программ компьютерного конструирования неорганических соединений и СППР.
Применение интегрированной ИС позволяет сократить время, затрачиваемое на поиск полной информации по свойствам и технологиям получения неорганических веществ.
Методология и методы исследования
Структуризация и формализация предметной области выполнена на основе методов структурного системного анализа. В основу решения поставленных задач положены: методология моделирования потоков данных DFD, методология функционального моделирования систем IDEF0, методология проектирования баз данных IDEF1X, теория реляционных баз данных. Для иллюстрации использования ИС в интеллектуальных системах использованы методы индуктивного вывода и компьютерного конструирования неорганических соединений, основанные на обучении ЭВМ распознаванию образов.
Апробация работы
Результаты диссертации обсуждались на научно-технических конференциях «Наукоемкие химические технологии 2011», МИТХТ им. М.В. Ломоносова, Москва, 2011, «Физика - химия и технология неорганических материалов», ИМЕТ РАН, Москва, 2011, «IV Всероссийская научно - практическая конференция с международным участием «Научное творчество XXI века», Научно - инновационный центр, Красноярск, 2011.
Публикации
Материалы диссертации опубликованы в 3 журналах, рекомендованных ВАК РФ для опубликования результатов диссертационных работ, 2 публикации в сборниках трудов и тезисов докладов конференций и семинаров.
Положения выносимые на защиту
методология интеграции данных в области неорганического материаловедения;
системный анализ потоков данных при использовании разных подходов к интеграции;
системный анализ потоков данных при использовании ETL подхода;
методика применения хранилища данных для прогнозирования свойств веществ.
Структура и объем диссертации