Введение к работе
Актуальность работы
Для обеспечения инновационного развития экономики страны необходима разработка новых материалов, обладающих заданными свойствами. Одним из наиболее перспективных методов решения этой проблемы является применение информационно-прогнозирующих систем, предназначенных для поиска информации об уже известных соединениях и прогнозирования еще не полученных веществ.
Для качественного информационного обеспечения специалистов-химиков были созданы сотни специализированных информационных систем (ИС) по свойствам неорганических веществ и материалов и процессам их получения. Разработка и использование таких ИС ведется во всех промышленно развитых странах мира. Наиболее мощные информационные системы, основанные на современных программно-аппаратных платформах, предлагают NIST (National Institute of Standards and Technology – Национальный институт стандартов и технологий, США) и NIMS (National Institute of Materials Science – Национальный институт материаловедения, Япония). Ни одна из разработанных ИС по свойствам неорганических веществ и материалов (ИС СНВМ) не способна предоставить исчерпывающую информацию обо всей совокупности свойств конкретного вещества. Для промышленного применения материалов специалисты вынуждены просматривать десятки ИС СНВМ, чтобы найти все необходимые им значения параметров заданного вещества. Одним из путей решения проблемы является интеграция информационных ресурсов с целью предоставления полной совокупности данных о материалах, как пользователям, так и прикладным программам. Применение последних позволяет использовать методы компьютерного анализа для поиска взаимосвязей в данных. Использование найденных взаимосвязей позволяет проводить компьютерное конструирование новых соединений, обладающих заданными свойствами. Получаемая с помощью интегрированной ИС консолидированная информация может быть использована специалистами для поддержки принятия решений при выборе того или иного вещества для применения в изделиях современной техники.
Актуальность интеграции в последние годы была осознана не только на национальном, но и на международном уровне, что вызвало появление специальной комиссии (Materials Task Group) в рамках международной организации CODATA (), одной из целей которой является выработка
стандартов для интеграции материаловедческих ИС. Однако, несмотря на предпринимаемые усилия, говорить об успехах в этой области преждевременно.
Степень разработанности проблемы. Существенный вклад в решение задач интеграции ИС внесли: Л.А. Калиниченко, С.А. Ступников, В.А. Серебряков, А.Н. Бездушный, А. Halevy (Levy), W. Inmon, D. Calvanese, M. Lenzerini, G. Gottlob, T. Gruber и др. Работы по созданию и использованию ИС СНВМ выполняли: Е.М. Савицкий, В.Б. Грибуля, Н.Н. Киселева, В.С. Иориш, Ф.А. Кузнецов, P. Villars, S. Le Clair, N. Chen, L. Bartolo, M. Yamazaki, Y. Xu и др. Задачи прогнозирования решали: Л.А. Растригин, В.П. Гладун, Н.Г. Загоруйко, Ю.И. Журавлев, В.В. Рязанов, О.В. Сенько, R. Duda, P. Hart, L. Kuncheva и др. Однако следует отметить, что работы по вопросам интеграции ИС и разработки ИС СНВМ не пересекаются, теоретические и методологические основы интеграции ИС СНВМ для компьютерного конструирования неорганических соединений рассмотрены недостаточно.
Исследования, проведенные в работе, вносят вклад в развитие информационных технологий, входящих в перечень критических технологий Российской Федерации, за счет создания интегрированной информационно-телекоммуникационной системы по свойствам неорганических веществ, относящейся к приоритетным направлениям развития науки, технологий и техники в Российской Федерации.
В диссертации на основе обобщения выполненных исследований решается научная проблема информационно-методологического обеспечения интегрированных информационных систем по свойствам неорганических веществ. Применение таких систем не только сокращает время доступа к разрозненным материаловедческим данным, но и позволяет применять средства поиска еще не полученных неорганических соединений с возможностью прогнозирования их свойств без реального синтеза.
Объектом исследования является интегрированная система для компьютерного конструирования неорганических соединений.
Предметом исследования является применение методов интеграции распределенных информационных систем для консолидации информационных ресурсов по свойствам неорганических веществ и материалов при компьютерном конструировании неорганических соединений.
Цель работы
Целью работы является повышение эффективности исследований при создании новых материалов для электроники на основе разработки методологии интеграции гетерогенных информационных систем по свойствам неорганических веществ.
Для достижения цели работы были поставлены следующие задачи:
анализ методов прогнозирования свойств неорганических веществ;
формализация процедуры прогнозирования состава, структуры и свойств неорганических веществ на основе многомерного анализа данных;
анализ мировых информационных ресурсов по свойствам неорганических веществ и материалов;
разработка методики использования интегрированных ИС для компьютерного конструирования неорганических соединений;
системный анализ методов интеграции гетерогенных ИС;
обоснование выбора метода интеграции в зависимости от требований, предъявляемых к результирующей интегрированной ИС;
разработка архитектуры интегрированной ИС СНВМ;
формализация понятия релевантной информации при интеграции ИС СНВМ;
разработка методики интеграции пользовательских интерфейсов ИС СНВМ;
разработка моделей данных для использования в интегрированной ИС СНВМ;
разработка алгоритмов для извлечения, преобразования форматов и загрузки данных в хранилище данных СНВМ;
разработка и реализация интегрированной ИС СНВМ, объединяющей российские и зарубежные информационные ресурсы, с учетом требований по масштабируемости, простоте реализации и гибкости;
применение интегрированной ИС СНВМ для решения задач компьютерного конструирования неорганических соединений, перспективных для использования в качестве материалов современной электронной техники.
Научная новизна
впервые формализована иерархия понятий, используемая в неорганической химии и материаловедении;
впервые дано определение релевантной информации в контексте интегрированной ИС СНВМ на уровне неорганических веществ и кристаллических модификаций;
разработана методология интеграции ИС СНВМ, объединяющая преимущества известных методов интеграции;
на основе системного анализа современных методов интеграции российских и зарубежных ИС предложена архитектура ИС СНВМ, обеспечивающей информационную поддержку компьютерного конструирования неорганических соединений;
разработана методика применения интегрированной ИС СНВМ в программном комплексе компьютерного конструирования неорганических соединений;
разработан и реализован алгоритм для обработки неопределенных значений в признаковых описаниях на основе метода “ближайших соседей”;
разработана методика консолидации данных по свойствам неорганических веществ, особенностями которой являются применение хранилищ данных и методов виртуальной интеграции;
разработаны реляционные модели данных по свойствам акустооптических, электрооптических и нелинейнооптических веществ, по ширине запрещенной зоны неорганических веществ, по информационным ресурсам в области неорганического материаловедения.
Практическая значимость
разработан и внедрен в Институте металлургии и материаловедения им. А.А. Байкова РАН (ИМЕТ РАН) программный комплекс, реализующий интегрированную ИС СНВМ, объединяющий российские и зарубежные информационные ресурсы по свойствам неорганических веществ и материалов;
разработана методика обеспечения информационной безопасности при переходе пользователя между узлами интегрированных ИС СНВМ;
создана единая точка доступа пользователей к информации, консолидированной в рамках интегрированной ИС СНВМ ();
разработаны и реализованы ИС по свойствам материалов для электроники: ИС “Кристалл” по свойствам акустооптических, электрооптических и нелинейнооптических веществ (русско- и англоязычные версии) и ИС “Bandgap” по ширине запрещенной зоны неорганических веществ;
разработана и реализована ИС “IRIC” по информационным ресурсам в области неорганического материаловедения;
определены перспективы практического применения ИС СНВМ для прогнозирования свойств неорганических веществ;
интегрированная ИС используется в учебном процессе МИТХТ при изучении курсов “Технология полупроводниковых материалов” и “Моделирование процессов полупроводниковой технологии”.
Методы исследования
Структуризация и формализация предметной области выполнена на основе методов структурного системного анализа, используются методологии семейства ICAM (IDEF0, IDEF1X) и DFD. Для определения релевантной информации в контексте интегрированной ИС СНВМ и построения модели понятий предметной области использован математический аппарат теории множеств. При разработке интегрированной ИС использованы: RAD-методология, теория построения баз данных (БД), Web-технологии, иерархические модели данных XML. Для иллюстрации применения ИС СНВМ в интеллектуальных системах использованы методы компьютерного конструирования неорганических соединений, основанные на распознавании образов по прецедентам.
Апробация работы
Основные результаты работы докладывались и обсуждались на следующих научно-технических конференциях и семинарах: Российских ежегодных конференциях молодых научных сотрудников и аспирантов “Физико-химия и технология неорганических материалов”, Москва, 2007-2013; 5-th International Conference “Information Research, Applications - i.Tech”, Bulgaria, Varna, 2007; XII Российской конференции по теплофизическим свойствам веществ, Москва, 2008; Symposium on Materials Database (MITS-2009), Tsukuba, Japan, 2009; 2-nd Asian Materials Database Symposium (AMDS-2010), Sanya, China, 2010; XIII Российской конференции по теплофизическим свойствам веществ, Новосибирск, 2011; 3-rd Asian Materials Database Symposium (AMDS-2012), Naha, Japan, 2012; 23-rd International CODATA Conference “Open Data and Information for a Changing Planet” (CODATA-23), Taipei, Taiwan, 2012.
Публикации
Результаты диссертационной работы опубликованы в 33 печатных трудах, в том числе в 1 монографии, 13 статьях в журналах, рекомендованных ВАК РФ для опубликования результатов диссертационных работ и 2 авторских свидетельствах.
Структура диссертации