Электронная библиотека диссертаций и авторефератов России
dslib.net
Библиотека диссертаций
Навигация
Каталог диссертаций России
Англоязычные диссертации
Диссертации бесплатно
Предстоящие защиты
Рецензии на автореферат
Отчисления авторам
Мой кабинет
Заказы: забрать, оплатить
Мой личный счет
Мой профиль
Мой авторский профиль
Подписки на рассылки



расширенный поиск

Компьютерное конструирование неорганических соединений, перспективных для применения в электронике, с использованием баз данных и методов искусственного интеллекта Киселева Надежда Николаевна

Компьютерное конструирование неорганических соединений, перспективных для применения в электронике, с использованием баз данных и методов искусственного интеллекта
<
Компьютерное конструирование неорганических соединений, перспективных для применения в электронике, с использованием баз данных и методов искусственного интеллекта Компьютерное конструирование неорганических соединений, перспективных для применения в электронике, с использованием баз данных и методов искусственного интеллекта Компьютерное конструирование неорганических соединений, перспективных для применения в электронике, с использованием баз данных и методов искусственного интеллекта Компьютерное конструирование неорганических соединений, перспективных для применения в электронике, с использованием баз данных и методов искусственного интеллекта Компьютерное конструирование неорганических соединений, перспективных для применения в электронике, с использованием баз данных и методов искусственного интеллекта Компьютерное конструирование неорганических соединений, перспективных для применения в электронике, с использованием баз данных и методов искусственного интеллекта Компьютерное конструирование неорганических соединений, перспективных для применения в электронике, с использованием баз данных и методов искусственного интеллекта Компьютерное конструирование неорганических соединений, перспективных для применения в электронике, с использованием баз данных и методов искусственного интеллекта Компьютерное конструирование неорганических соединений, перспективных для применения в электронике, с использованием баз данных и методов искусственного интеллекта
>

Диссертация - 480 руб., доставка 10 минут, круглосуточно, без выходных и праздников

Автореферат - бесплатно, доставка 10 минут, круглосуточно, без выходных и праздников

Киселева Надежда Николаевна. Компьютерное конструирование неорганических соединений, перспективных для применения в электронике, с использованием баз данных и методов искусственного интеллекта : Дис. ... д-ра хим. наук : 02.00.21 : Москва, 2004 333 c. РГБ ОД, 71:05-2/32

Содержание к диссертации

Введение

1. Разработка баз данных по материалам для электроники 22

1.1. Базы данных по веществам и материалам для электроники, созданные в мире 22

1.2. База данных по свойствам неорганических соединений «Фазы» 32

1.2.1. Структура базы данных З 3

1.2.2. Программное и аппаратное обеспечение БД «Фазы» 35

1.2.2.1. Архитектура БД 34

1.2.2.2. Подсистема редактирования информации БД 37

1.2.2.3. Подсистема поиска информации в БД 38

1.3. База данных по фазовым диаграммам систем с полупроводниковыми соединениями «Диаграмма» 41

1.3.1. Системы и свойства, заносимые в базу данных «Диаграмма» 43

1.3.2. Структура базы данных 47

1.3.3. Программное и аппаратное обеспечение БД «Диаграмма» 51

1.3.3.1. Архитектура БД 51

1.3.3.2. Система удаленного администрирования БД 53

1.3.3.3. Система удаленного доступа пользователей к БД «Диаграмма» из сети Интернет 53

1.3.3.4. Система визуализации графической информации 61

1.4. База данных по свойствам акустооптических, электрооптических и нелинейнооптических веществ «Кристалл» 67

1.4.1. Физические основы функционирования акусто-, электро- и нелинейнооптических материалов и обоснование выбора свойств веществ, заносимых в базу данных «Кристалл» 69

1.4.2. Критерии отбора материалов, информация о которых заносится в базу данных 71

1.4.3. Структура базы данных 75

1.4.4. Программное и аппаратное обеспечение БД «Кристалл» 78

1.4.4.1. Архитектура БД 78

1.4.4.2. Система удаленного администрирования БД 79

1.4.4.3. Система удаленного доступа пользователей к БД «Кристалл» из сети Интернет 80

1.5. Интеграция баз данных по веществам и материалам ИМЕТ РАН 86

2. Методы конструирования неорганических веществ 92

2.1. Квантовомеханические методы 93

2.2. Эмпирические методы 98

2.3. Методы поиска многомерных классифицирующих закономерностей 100

2.3.1. Автоматическая классификация 105

2.3.2. Обучение ЭВМ распознаванию образов 111

2.3.2.1. Статистические методы 114

2.3.2.2. Эвристические методы 115

2.3.2.3. Методы нейрокибернетики 118

2.3.2.4. Методы обучения ЭВМ процессу формирования понятий на основе растущих пирамидальных сетей 123

2.3.3. Поиск наиболее важных для классификации

признаков 136

2.4. Обзор исследований по конструированию

неорганических веществ и материалов 140

2.4.1. Прогноз типа диаграмм состояния физико-химических систем 142

2.4.2. Прогноз возможности образования соединений определенного состава в неорганических системах 148

2.4.3. Прогноз свойств неорганических соединений 151

2.4.3.1. Прогноз типа кристаллической структуры неорганических соединений 151

2.4.3.2. Прогноз физических свойств неорганических соединений 158

2.4.4. Применение методов распознавания образов в

промышленных разработках неорганических

материалов 165

3. Конструирование неорганических соединений, перспективных для применения в электронике 168

3.1. Методика конструирования новых неорганических соединений, используемая в настоящей работе 170

3.1.1. Выбор наборов признаков для описания физико-химических систем 170

3.1.2. Дискретизация признаков 171

3.1.3. Выбор примеров для обучения ЭВМ 173

3.1.4. Повышение достоверности прогнозирования за счет сравнения результатов прогноза с использованием разных наборов признаков 175

3.1.5. Классифицирующие закономерности 176

3.2. Конструирование соединений, перспективных для разработки новых полупроводниковых материалов 180

3.2.1. Соединения состава АВ2Х4 (X = S, Se, Те) 181

3.2.1.1. Прогноз возможности образования соединений состава АВ2Х4 182

3.2.1.2. Прогноз типа кристаллической структуры соединений состава АВ2Х4 189

3.2.2. Соединения состава АВХ2 (X = S, Se, Те) 204

3.2.2.1. Прогноз возможности образования соединений состава АВХ2 205

3.2.2.2. Прогноз соединений состава АВХ2 с

кристаллической структурой типа a-NaFe02 211

3.2.3. Соединения состава АВХ (X = Р, As, Sb, Bi) 214

3.3. Конструирование соединений, перспективных для использования в качестве новых сегнетоэлектрических, пьезоэлектрических, акустооптических, электрооптических и нелинеинооптических материалов 222

3.3.1. Халькопириты состава АВХ2 227

3.3.1.1. Халькопириты состава АВХ2 (A = Li, Na, К, Rb, Cs, Ag, Au, Zn, Cd, Hg; В = Al, Ga, In, Tl, Fe, Co, Ni; X = O, S, Se, Те) 228

3.3.1.2. Халькопириты состава ABX2 (A = Mg, Ca, Sr, Ba, Zn, Cd, Hg; В = Si, Ge, Sn; X = N, P, As, Sb, Bi, S, Se, Те) и CDY2 (С = Li, Na, K, Rb, Cs; D = P, As, Sb, Bi; Y = N, P, As, Sb, Bi) 231

3.3.2. Соединения состава АВОз с кристаллической

структурой искаженного ильменита и перовскита 233

3.3.2.1. Поиск эмпирических критериев существования перовскитной структуры 234

3.3.2.2. Прогноз возможности образования соединений состава АВОз 238

3.3.2.3. Прогноз типа кристаллической структуры соединений состава АВОз 240

3.3.3. Соединения состава ABF5 с кристаллическими структурами типа BaFeF5, BaGaF5 и CaFeF5 248

3.3.4. Соединения состава А2В2(Х04)з (X = S, Cr, Mo, W) с

кристаллической структурой типа лангбейнита 251

3.4. Конструирование соединений, перспективных для

использования в качестве новых магнитных материалов 255

3.4.1. Соединения состава АВ204 со структурой шпинели 255

3.4.1.1. Прогноз возможности образования соединений состава АВ204 256

3.4.1.2. Прогноз соединений состава АВ204 со

структурой шпинели 259

3.4.2. Соединения состава АВ2Х2(Х = Al, Si, Ge, Р, As, Sb) с кристаллической структурой типа ThCr2Si2 263

3.4.3. Фазы Гейслера состава АВХ2 267

3.5. Кибернетико-статистический подход к конструированию новых веществ с заданными свойствами 272

4. Заключение 278

4.1. Компьютерное конструирование неорганических веществ как способ автоматизации поиска новых материалов 278

4.2. Основные направления развития предложенного подхода 282

Выводы 289

Литература 292

Введение к работе

1. Постановка задачи

Задачу компьютерного конструирования новых неорганических соединений можно сформулировать следующим образом: найти совокупность химических элементов и их соотношение (т.е. качественный и количественный состав) для создания (при заданных внешних условиях) определенной молекулярной или кристаллической пространственной структуры соединения, позволяющей реализовать необходимые функциональные свойства. Исходной информацией для расчетов должны быть только свойства химических элементов и данные о других уже изученных соединениях.

Термин «компьютерное конструирование соединений» - «computer-aided compound design» - появился четверть века тому назад в связи с решением проблем поиска взаимосвязей между структурой и свойствами органических соединений [1,2]. Использование разнообразных методов компьютерного анализа экспериментальной информации о многочисленных органических соединениях позволило предсказывать молекулярную структуру, набор и положение заместителей в еще неполученных органических соединениях, которые обеспечивали бы заданные функциональные свойства. Соблюдение правил валентности для четырехвалентного углерода и одновалентного водорода в органических соединениях значительно упрощает решение задачи компьютерного дизайна органических соединений. С этой точки зрения проблема компьютерного конструирования неорганических соединений - более сложная, т.к. правило валентности строго соблюдается лишь в соединениях с ионным типом химической связи и частично - в ковалентных соединениях. Поэтому появившийся в девяностые годы термин «компьютерное конструирование неорганических соединений» [3-9] ассоциировался не только с разработкой молекулярной структуры, но и с поиском качественного и количественного состава еще неполученных соединений и с оценкой их возможных свойств на основе использования информации об образующих их элементах и других, уже полученных, соединениях. Следует отметить, что термин «компьютерное конструирование соединений» оказался очень удачным, поэтому он сейчас широко используется исследователями для обозначения разнообразных теоретических методов априорного (т.е. на основе только значений свойств компонентов) расчета новых веществ: от квантовоме-ханических методов [10] до эмпирических подходов, использующих методы компьютерного анализа данных [3, 4, 6, 7, 11-26].

Примеры задач компьютерного конструирования неорганических соединений:

- компьютерное конструирование химических систем с образованием и отсутствием соединений;

компьютерное конструирование химических систем с образованием соединений определенного количественного состава при заданных внешних условиях;

- компьютерное конструирование химических соединений с заданной кристаллической структурой при определенных внешних условиях;

- компьютерное конструирование химических соединений с заданными функциональными свойствами (температурой плавления, температурой перехода в сверхпроводящее состояние и т.д.).

Разработано несколько подходов к решению указанных выше задач:

- квантовомеханический подход [10, 27-37];

- простейшие эмпирические двух- и трехмерные критерии образования соединений с заданными свойствами [38-62];

- многомерные эмпирические классифицирующие закономерности, предназначенные для прогнозирования новых неорганических веществ [3-7, 11-26,63-153].

Как известно [10, 27-37], квантовомеханический подход к расчету химических соединений основан на уравнении Шредингера. Точное решение последнего для конкретных неорганических веществ связано с серьезными математическими трудностями, которые удалось преодолеть лишь для простейших систем. Для сложных атомов и систем в настоящее время возможно получение только приближенных решений.

В связи с многочисленными трудностями, возникающими при квантово-механических расчетах еще неполученных неорганических веществ, химики и материаловеды начали разрабатывать и использовать различные эмпирические критерии образования соединений с заданными свойствами [38-62]. Основная гипотеза, лежащая в основе методов поиска таких критериев и закономерностей в вышеуказанных работах: фундаментальные свойства неорганических соединений при различных условиях (температуре, давлении, соотношении компонентов и т.д.) связаны периодическими зависимостями с фундаментальными свойствами химических элементов, входящих в их состав. При этом предполагается, что многочисленные, известные к настоящему времени, неорганические вещества подчиняются этим зависимостям. В связи с этим задача сводится к поиску закономерностей на основе анализа информации об уже исследованных веществах. Технологию разработки эмпирических критериев легко пояснить с использованием представлений о пространстве свойств химических элементов, входящих в состав химических веществ. Каждое вещество представлено в этом пространстве точкой, координаты которой определяются значениями свойств элементов, входящих в состав вещества. Процесс создания эмпирических критериев основан на анализе расположения точек, соответствующих изученным веществам различных типов, в пространстве свойств элементов и поиске поверхностей, разделяющих классы (классификационных правил). Последние позволяют отделить в пространстве свойств элементов области химических веществ одного типа от областей веществ другого типа (например, разделить точки, соответствующие соединениям с кристаллической структурой перовскита от точек, относящихся к соединениям со структурами ильменита, арагонита, кальцита, ватерита и т.д.). В случае простейших эмпирических критериев анализ расположения точек, соответствующих химическим объектам, осуществляется в двух- или трехмерных пространствах свойств элементов. Как правило, подобная классификация является грубой, т.к. свойства химических соедине ний, особенно многокомпонентных, зависят от многих свойств элементов. Поэтому естественным развитием такого подхода был переход к многомерным классифицирующим закономерностям. Разработка последних возможна только с применением компьютеров и специальных программ поиска закономерностей в больших объемах данных.

В настоящей диссертации разработан подход к компьютерному конструированию сложных неорганических соединений, который использует методы искусственного интеллекта для анализа информации баз данных по свойствам неорганических веществ.

Впервые методы искусственного интеллекта использовали для прогноза новых двойных неорганических фаз Е.М.Савицкий с соавторами [12, 81]. Работы, проводимые в ИМЕТ с середины 60-х годов, стали естественным продолжением исследований по применению искусственного интеллекта в химии, начатых в конце пятидесятых годов, с самых первых шагов этого направления информатики. Уже тогда стало ясно, что новый компьютерный подход очень перспективен для решения плохо формализуемых задач химии. Первые приме-нения были связаны с органической химией и обработкой спектральной информации [2, 154, 155]. В 1965 г. в Станфордском университете Buchanan, Feigenbaum и Lederberg начали разработку одной из первых экспертных систем - DENDRAL, предназначенной для анализа спектральных данных об органических соединениях. В 1990 г. за работы по созданию принципов компьютерного дизайна органических соединений E.Corey получил Нобелевскую премию по химии [156].

Савицкий с соавторами использовали очень простые алгоритмы распознавания образов [157, 158], которые позволяли осуществлять прогноз только двойных соединений. Особенности алгоритмов [157, 158], обрабатывающих массивы целочисленных значений без пропусков в значениях, ограничили набор свойств элементов, используемых для описания двойных систем, только количеством электронов на электронных оболочках изолированных атомов. При переходе к более сложным соединениям: тройным, четверным и т.д. резко возрастало время анализа данных и требовался большой объем оперативной памяти ЭВМ. Вычислительная машина «Минск-22», используемая группой Савицкого, не обеспечивала такие возможности, поэтому все пионерские работы по конструированию неорганических фаз с применением алгоритма [157, 158] ограничились прогнозом двойных соединений, причем классифицирующие правила включали только информацию об электронном строении изолированных атомов. К сожалению, работы ИМЕТ по конструированию двойных соединений не получили дальнейшего развития в плане совершенствования программно-аппаратных средств, поэтому уже в начале восьмидесятые; годов, после смерти Е.М.Савицкого, они были прекращены.

Исследования по компьютерному конструированию многокомпонентных соединений, изложенные в настоящей диссертации, были начаты нами в начале 70-х годов в Московском университете и были основаны на другом подходе к анализу химических данных [67, 89, 159]. Было протестировано множество алгоритмов распознавания образов и проанализированы недостатки применяемого в ИМЕТ подхода. На основе этого было предложено использовать при анализе данных ассоциативные сетевые структуры, ускоряющие поиск классифицирующих закономерностей в больших информационных массивах и уменьшающие объем оперативной памяти ЭВМ для их обработки. Поиск существующих к тому времени программ обучения ЭВМ, которые использовали ассоциативные структуры для хранения данных, привел в Институт кибернетики АН Украины, где уже была разработана первая версия программной системы «Анализатор» для ЭВМ БЭСМ-6 [160]. В этой системе для хранения информации применялся особый тип ассоциативных структур - растущие пирамидальные сети, предложенные В.П.Гладуном [160]. Уже первые эксперименты по использованию системы «Анализатор» для прогноза возможности образования тройных соединений [159] показали, что она является эффективным инструментом для решения задач конструирования сложных соединений. При ее использовании снимались ограничения на компонентность соединений и стал возможным поиск многомерных классифицирующих закономерностей, вклю чающих любые свойства химических элементов и/или простых соединений, имеющие качественные (нечисловые), целые, действительные и т.д. значения, а также пропуски в значениях. Как показал тридцатилетний опыт работы с программными комплексами, основанными на растущих пирамидальных сетях, эти системы являются эффективными для применения в химии твердого тела. Предложенный подход, использующий сетевые ассоциативные структуры данных, получил большое распространение при конструировании неорганических веществ и стал уже обязательным атрибутом любой современной работы по применению искусственного интеллекта в химии и материаловедении [63-66, 161-163].

Изложенные в диссертации работы по компьютерному конструированию сложных неорганических соединений, начатые нами в МГУ [ 67, 89, 159 ] в 1976 г. были продолжены в ИМЕТ под руководством Е.М.Савицкого [67, 80, 87, 88, 90-92, 94-98, 106, 116, 120, 122-126, 138]. Программное обеспечение этих работ осуществлялось силами большой группы высококвалифицированных исследователей Института кибернетики (ИК) АН Украины [160, 164, 165]. Исследования, проводимые в ИМЕТ, позволяли совершенствовать разрабатываемые в ИК системы, а самые последние версии систем искусственного интеллекта обеспечивали прогресс работ по компьютерному конструированию неорганических веществ.

С самого начала исследований по компьютерному дизайну неорганических фаз стало ясно, что для получения качественных результатов необходима разработка и использование баз данных (БД) по свойствам неорганических соединений. Поэтому в настоящей работе изложены результаты разработки БД по неорганическим веществам и материалам. В конце восьмидесятых годов была разработана концепция информационно-прогнозирующих систем, предназначенных для поиска информации об уже известных соединениях и прогноза еще неполученных фаз [14]. Разработка таких систем позже начата в разных странах [46, 166]. Кроме того, опыт создания БД по свойствам неорганических соединений позволил разработать в рамках Государственной научно-технической про граммы "Новые материалы" (направление "Полупроводниковые и особочистые материалы") базы данных по свойствам материалов для электроники: БД по фазовым диаграммам систем с полупроводниковыми фазами и БД п свойствам акустооптических, электрооптических и нелинейно-оптических веществ [167-174]. Работы по созданию БД по свойствам электронных материалов проводились под научным руководством проф., д.т.н. В.С.Земскова. В разработке программного обеспечения БД участвовали инженеры-программисты ИМЕТ: В.А.Дударев, В.В.Прокошев, В.В.Хорбенко и Ю.И.Христофоров, а также студенты-дипломники МАТИ и МИЭМ: А.В.Гришаев, Д.П.Мурат, А.В.Столярен-ко. К сбору и оценке достоверности информации БД по материалам для электроники были привлечены специалисты из ведущих ВУЗов и академических институтов России: Р.Х.Акчурин и В.В.Арбенина (МИТХТ), А.А.Буш (МИ-РЭА), В.М.Глазов, Л.М.Павлова и А.С.Пашинкин (МИЭТ), В.А.Долгих, В.П.Зломанов и М.Н.Мамонтов (МГУ), И.С.Ковалева (ИОНХ РАН), В.Л.Кузнецов (ФТИ РАН), В.И.Косяков (ИНХ СО РАН), И.А.Стрельникова и С.Н.Чижевская (ИМЕТ РАН) и другие. Рецензирование собранной информации проводили В.С.Земсков и Л.Е.Шелимова (ИМЕТ РАН). Сверку введенных данных и обработку большей части графической информации провела И.Н.Белокурова (ИМЕТ РАН). Разработанные БД стали информационной основой работ по компьютерному конструированию новых соединений, перспективных для использования в электронике.

2. Актуальность темы

Актуальность темы обусловлена объектами для компьютерного конструирования - это материалы для электроники. Химия и материаловедение этих веществ являются одними и1 наиболее динамически развивающихся отраслей высоких технологий. Особенностью использования материалов в электронике является то, что в большинстве случаев они являются главной функциональной частью электронных устройств. Поэтому разработка новых материалов, процессов их получения и обработки в значительной степени определяет прогресс электроники. Автоматизация поиска новых веществ, перспективных для практического использования в качестве материалов электронной техники, позволяет ускорить процесс перехода от одного поколения электронных устройств к другому.

Настоящая диссертационная работа посвящена разработке методов конструирования новых неорганических веществ, основанных на использовании современных информационных технологий. Создание и применение таких методов является одним из актуальных направлений химии и материаловедения, которое в последние годы интенсивно развивается во всем мире.

Исследования по компьютерному конструированию неорганических соединений и разработке БД были поддержаны российскими и зарубежными фондами и организациями: РФФИ (гранты №99-07-90040 и №04-07-90086), Правительством Москвы (гранты №В 117 Программы «Поддержка инфраструктуры науки в г.Москве», №3-4 и 1.2.1 Программы «Инфраструктура и адресная поддержка науки»), International Scientific Foundation (ISF) (гранты МВМ000 и МВМЗОО), European Office of Aerospace Research and Developments (EOARD) (контракты SPC-94-4097, SPC-95-4016, SPC-95-4096, SPC-96-4067 и SPC-00-4014).

3. Положения, выносимые на защиту

1. Подход к компьютерному конструированию сложных неорганических соединений на основе использования баз данных по свойствам неорганических веществ и материалов и методов искусственного интеллекта для поиска зависимостей, связывающих свойства неорганических соединений со свойствами химических элементов, и результаты его применения на примерах соединений, перспективных для разработки новых полупроводниковых, сегнетоэлектриче-ских, пьезоэлектрических, акустооптических, электрооптических, нелинейно-оптических и магнитных материалов.

2. Результаты компьютерного конструирования неорганических соединений, подтверждающие гипотезу о том, что фундаментальные свойства многокомпонентных неорганическлх соединений (возможность образования соединения, тип кристаллической структуры и т.д.) при определенных условиях (температуре, давлении, соотношении компонентов и т.д.) связаны периодическими зависимостями с фундаментальными свойствами химически элементов, входящих в их состав. Использование многомерных зависимостей, включающих в качестве переменных множество свойств химических элементов и простых соединений, позволяет получить наилучшие результаты конструирования для еще неполученных фаз.

3. Критерии выбора алгоритмов искусственного интеллекта, которые предназначены для поиска сложных закономерностей в больших объемах информации, и выбор методов для компьютерного конструирования неорганических соединений, основанных на обучении ЭВМ и сетевых структурах данных.

4. Разработка и использование интегрированной распределенной системы БД по свойствам веществ и материалов для повышения достоверности и оперативности компьютерного конструирования неорганических веществ: БД по свойствам неорганических соединений, БД по фазовым диаграммам полупроводниковых систем и БД по свойствам акустооптических, электрооптических и нелинейнооптических веществ.

5. Результаты применения комплексного подхода к автоматизации процесса разработки новых материалов, включающего теоретические методы компьютерного конструирования веществ и расчетно-экспериментальные методы оптимизации технологических процессов, полученные при решение задачи поиска новых сверхпроводников со структурой фаз Шевреля.

4. Практическая значимость работы

1. Компьютерное конструирование неорганических соединений позволяет автоматизировать поиск новых неорганических соединений с заданными свой ствами. Полученные прогнозы уменьшают количество исследуемых составов при поиске веществ, перспективных для полупроводниковых, сегнетоэлектри-ческих, пьезоэлектрических, акустооптических, электрооптических, нелинеинооптических, магнитных и прочих применений.

2. Предложенный кибернетико-статистический подход позволяет не только осуществить прогноз новых соединений, но и найти оптимальные режимы получения и обработки материалов с заданными свойствами.

3. Использование интегрированной системы баз данных, объединяющей БД по свойствам неорганических веществ, БД данных по фазовым диаграммам систем с полупроводниковыми соединениями и БД по свойствам акустооптических, электрооптических и нелинеинооптических веществ, которые содержат информацию, собранную и оцененную специалистами, позволяет сократить затраты на разработку новых неорганических материалов за счет оперативного информационного обслуживания специалистов, уменьшения необоснованного дублирования работ и компьютерной обработки информации с целью конструирования новых соединений с заданными свойствами.

Программное и аппаратное обеспечение БД «Фазы»

В настоящее время в реляционных таблицах БД «Фазы» содержится краткая информация о тройных системах и свойствах тройных неорганических со-единений . Главными таблицами БД являются System, Compound, Strtype и Data. Все остальные таблицы БД условно разбиты на четыре группы, каждая из которых имеет общий внешний ключ, являющийся первичным ключом в таблице: 1. System, SysTab, ItsTab, QbsTab, BiblRef + Compound (ключ - Strl). 2. Compound, MeltType, TempMelt, TempBoil, TempDcmp + StrType (ключ - Str2). 3. StrType, Trans, SyngTab, SpGrTab, Ztab, TcTab, Hc2Tab (ключ - Str3). 4. Data, Authors и Years (ключ - N - номер литературной ссылки). Такая концептуальная структура БД позволила исключить избыточность информации и обеспечить целостность данных.

В Таблице 2 показана схема БД «Фазы». Цветные ячейки соответствуют пересечениям полей разных таблиц. Для представления в БД свойств тройных соединений разработаны следующие реляционные таблицы: System - набор трех атомных номеров элементов, образующих систему; SysTab - общая информация о системе (количество тройных соединений, степень изученности системы); ItsTab - температуры изученных изотермических сечений; QbsTab - обозначения изученных квазибинарных разрезов; BiblRef - номера литературных ссылок, из которых почерпнута информация о свойствах тройных соединений и системы; J Тройные соединения - неорганические соединения, образованные тремя химическими элементами. Таблица 2. Схема БД System Strl SysTab Strl ItsTab Strl QbsTab Strl BiblRef Data Strl 1 Compound 1 Authors Str2 MeltType Years Str2 TempMelt 1 TempBoil Str2 TempDcmp Str2 Strl StrType Str3 Trans Str3 SyngTab Str3 SpGrTab Str3 ZTab Str3 TcTab Str3 Hc2Tab Compound - состав тройного соединения и замечания эксперта; MeltType - тип плавления тройного соединения; TempMelt - температура плавления тройного соединения; TempBoil - температура кипения тройного соединения; TempDcmp - температура распада тройного соединения в твердой или газообразной фазах; StrType - тип кристаллической структуры (для каждой из полиморфных модификаций тройного соединения) и замечания эксперта; Trans - температура и давление, выше которых существует данная кристаллическая модификация; SyngTab - синтония; SpGrTab - пространственная группа симметрии; ZTab - число формульных единиц в элементарной ячейке (Z); TcTab - критическая температура перехода в сверхпроводящее состояние; Нс2ТаЬ - верхнее критическое магнитное поле при 4.2 К. Литературные ссылки представлены в БД «Фазы» тремя реляционными таблицами: Data - название журнала/сборника, том и номер журнала/сборника, начальная и конечная страницы для статьи, название статьи/книги, ссылка на реферативный журнал; Authors - фамилии авторов; Years - год издания.

Программное и аппаратное обеспечение БД «Фазы» 1.2.2.1. Архитектура БД При разработке программного обеспечения (ПО) БД использовалась распределенная модель для хранения данных «клиент-сервер», при которой реализуется разделение операций по обработке данных между сервером БД и персональным компьютером клиента - пользователя информационной системы [239]. Комплекс разработанного ПО состоит из двух подсистем: системы удаленного администрирования и системы удаленного доступа пользователей к БД из сети Интернет.

В процессе выбора методов доступа к БД ИМЕТ через сеть Интернет были проанализированы несколько подходов: Active Server Pages (ASP), PHP, Java Server Pages (JSP), ColdFusion, Common Gateway Interface (CGI), Internet Server Application Programming Interface (ISAPI) и Java Servlet API. Были отобраны технологии IS API и ASP [240-242]. Система доступа к БД "ФазьГ реализует классическую трехкомпонентную модель: "Сервер БД" - "Web-сервер" В разработке программного обеспечения БД «Фазы» принимали участие студенты-дипломники МИЭМ: Д.В.Мурат и А.В.Столяренко. "Пользователь" [241, 242] (рис.2). Эта модель реализации доступа была выбрана, потому что обладает рядом достоинств: минимальные требования, накладываемые на программно-аппаратные возможности удаленных пользователей БД; возможность раздельного контроля СУБД и Web-узла; относительная простота программной реализации; использование современных технологий на основе ASP и ISAPI.

Методы поиска многомерных классифицирующих закономерностей

Классическое применение математики в естественных науках ассоциируется с расчетом одних параметров объектов или явлений на основе значений других. Примеры таких приложений: закон Ома, закон Ньютона ивт.д. В этом случае каждый объект или явление могут быть описаны аналитическим выражением в форме уравнения или системы уравнений или неравенств. Формулы и использование точных процедур расчета часто создают впечатление высокого качества таких моделей. Дополнительную привлекательность им придает и возможность физической интерпретации полученных уравнений.

Более «неточный» с точки зрения, например, физика-теореїлка, подход связан с решением задач идентификации моделей. В этом случае модели процессов или объектов известны с точностью до параметров, т.е. известны набор наиболее важных характеристик и общий вид зависимостей между ними. Задача заключается в расчете (на основе использования экспериментальных данных) коэффициентов, показателей степени и других параметров модели. При этом делаются предположения о значениях искомых параметров, которые проверяются путем подстановки в модель известных экспериментальных данных. Критерий качества модели, как правило, основан на величине отклонений расчетных значений от экспериментальных данных. Такой подход не гарантирует строгих расчетов как в предыдущем случае пересчета одних параметров объектов или явлений в другие, т.к. используются некоторые эмпирические предположения о значениях неизвестных параметров и проверка этих гипотез экспериментальными данными [301]. Тем не менее, такой подход дает хорошие результаты в химии и материаловедении, например, при моделировании сложных химико-технологических процессов, кинетических или диффузионных явлений и т.д.

Появление кибернетики с ее концепцией «черного ящика» позволило по-дойти к решению очень сложных задач, в которых исследователь располагает только набором входных и выходных параметров и некоторым массивом их значений, но не знает ни вида модели, ни степени влияния друг на друга входных и выходных параметров. Именно такого рода задачи постоянно встают перед химиками и материаловедами. Примерами могут быть: предсказание неорганических соединений с заданными свойствами, разработка моделей очень сложных многостадийных технологических процессов и т.д. Совокупность подобных задач и методов их решения называют анализом данных [301] (помимо термина data analysis иногда встречается термин data mining [301, 302]). Наибо лее эффективный подход к анализу данных обеспечивают методы, получившие название методы искусственного интеллекта. С точки зрения, например, физика-теоретика, результаты моделирования с использованием методов искусственного интеллекта недостаточно строги как с точки зрения физических теорий, так и с точки зрения используемого математического аппарата. Более того, очень часто полученные модели не позволяют дать физическую интерпретацию процессов или явлений. Однако, в отсутствие хорошо обоснованных теоретических методов, альтернативой такому подходу может быть отказ от расчетов и использование только экспериментальных методов, что абсолютно необоснованно в современных условиях интенсификации научных исследований.

Следует отметить, что приведенная выше классификация меюдов поиска многомерных классифицирующих закономерностей достаточна условна. Очень часто выбор вида зависимости в задачах идентификации моделей слабо обусловлен природой объектов. В то же время различные методы анализа данных непосредственно направлены на решение задач идентификации моделей.Одним из наиболее часто применяемых и эффективных средств анализа данных является класс методов искусственного интеллекта, получивших название - распознавание (опознание) образов.

Первая работа, связанная с распознаванием образов, появилась в 1957 г., когда американский ученый Ф.Розенблатт попытался создать устройство, реализующее физиологическую модель зрения. Свою распознающую машину он назвал персептроном (от латинского percepto — понимаю, познаю). Персептрон распознавал (различал, опознавал) зрительные образы и обучался этому распознаванию. Отсюда и термин -распознавание образов. Розенблатт, физиолог по профессии, исходил из современных ему представлений о конструкции мозга, связей между слоями его нервных клеток и о самих нервных клетках, т.е. из положений, который он назвал принципами нейродинамики [303].

Выбор наборов признаков для описания физико-химических систем

Существенной проблемой при любой компьютерной классификации является отбор свойств для описания физико-химических систем. Эта процедура вряд ли будет полностью формализована, однако используемые нами алгоритмы обучения ЭВМ [160, 164 165] автоматически отбрасывают интервалы значений свойств, которые не являются важными для классификации. Естественно, что первоначальный набор свойств для компьютерного анализа создает химик, и желательно, чтобы система искусственного интеллекта формировала понятие из представительной совокупности исходных характеристик. Как правило, любому компьютерному эксперименту, описанному ниже, предшествует тщательный анализ литературы, посвященной прогнозируемым классам веществ. Учитывается физическая и химическая природа уже полученных веществ, существующие методы их синтеза и исследования, различия между классами веществ, теоретические выводы о типе химической связи и закономерностях проявления тех или иных свойств в зависимости от свойств компонентов и т.д. Этот этап конструирования неорганических веществ зависит от опыта и уровня информированности исследователя, работающего системой искусственного интеллекта.

Почему отбор признаков для описания физико-химических систем столь важен для правильного конструирования неорганических веществ и почему нерационально использовать для описания систем все известные свойства компонентов (химических элементов или более простых соединений)? Поясним это на примере проведенных нами исследований [20] по прогнозу двойных, тройных и четверных систем с образованием и без образования соединений. По требованию заказчика - USAF Wright Laboratory- в этой работе для описания физико-химических систем были использованы, практически, все известные свой 171 ства химических элементов (87 параметров). Объем обрабатываемых массивов информации, например, для четверных систем превышал 300 2700 чисел. Поиск закономерностей и экзаменационное прогнозирование с использованием алгоритмов [164, 165] длились несколько суток. Средняя достоверность экзаменационного распознавания в этом случае составила 87 %. В дальнейшем, исхо-дя из физико-химических представлений, из имеющихся свойств химических элементов были отобраны двадцать параметров и проведено обучение и экзаменационное распознавание на тех же обучающих выборках всего за несколько часов. При этом средняя достоверность прогнозирования была выше 92 %. Таким образом, правильный отбор свойств компонентов для описания физико-химических систем, основанный на понимании физической и химической природы исследуемых веществ, позволяет не только сократить время обработки данных, но и повысить правильность прогноза новых веществ.

Какие свойства компонентов используются для описания в настоящей работе? Во-первых, все фундаментальные свойства химических элементов: распределение электронов по энергетическим оболочкам изолированных атомов, потенциалы ионизации, ионные, ковалентные и атомные радиусы, температуры плавления и кипения (при 1 атм), стандартные энтропии индивидуальных веществ и т.д. Во-вторых, используются свойства простых соединений - оксидов, хальгогенидов, галогенидов и т.д. - в зависимости от состава прогнозируемых соединений.

Дискретизация признаков

Как и большинство алгоритмов, которые используют для организации данных ассоциативные сетевые структуры, алгоритмы, основанные на растущих пирамидальных сетях [160, 164, 165], обрабатывают информацию в виде некоторого упорядоченного набора символьных данных. В случае параметров химических элементов, таких как распределение электронов по энергетическим оболочкам изолированных атомов, проблема представления данных не вызывает трудностей. Например, железо может быть представлено в памяти ЭВМ в виде следующего набора символов: {Is2, 2s2, 2р6, 3s2, Зр6, 3d6, 4s2, 4p, 4d, 4f, 5s , 5p , 5d , 5r, 5g , 6s , 6p , 6d , 7s0}. Если числовой признак меняется в неко тором достаточно широком интервале значений (например, температуры плав ления или кипения, потенциалы ионизации элементов и т.п.), то при использо вании алгоритмов [160, 164, 165] такой квазинепрерывный признак нуждается в дискретизации, т.е. разбиении на фиксированные интервалы, каждый из кото рых обозначается определенным символом. «

Возможны два способа дискретизации признаков, имеющих непрерывные шкалы. Первый, который использовался нами в 70-80-х годах, предполагал разбиение ранжированного по возрастанию набора известных значений свойств компонентов на интервалы, в каждый их которых попадало одинаковое количество значений. При этом учитывались химические особенности объектов, например, такие как граница между цериевой и иттриевой подгруппами лантани-дов. При всей простоте и физико-химической обоснованности такого подхода, не всегда удавалось «поймать» границы между классами, поэтому в один интервал иногда попадали объекты из разных классов, что снижало дситоверность прогнозирования. Следует отметить, что задача дискретизации непосредственно связана с обучением ЭВМ классификации объектов и является, своего рода, предварительной обработкой данных. Такая предобработка позволяет в дальнейшем сократить время построения классифицирующей закономерности и прогнозирования, получить более короткие закономерности и повысить точность прогнозирования. Предложенная нами идея разработки системы дискретизации была практически реализована специалистами Института кибернетики НАНУ в виде системы DISCRET [165]. Этот способ дискретизации использовался при решении задач компьютерного конструирования неорганических соединений последние 10 лет, что позволило значительно повысить достоверность прогнозирования.

Основные направления развития предложенного подхода

Поиск закономерностей образования кристаллических фаз с различными типами структур при нормальных условиях (273 К и 1 атм) и прогнозирование проводились отдельно для каждого типа систем: сульфидных, селенидных и теллуридных. В ранней работе [91] была использована дихотомия: класс 1 - соединения состава АВ2Х4 (X или Se) со структурой шпинели и класс 2 - соединения с другими кристаллическими структурами (Таблица 19). В более поздней работе была осуществлена серия дихотомий:

Для сульфидных соединений (таблица 20): (1) - класс 1 - соединения состава AB2S4 со структурой шпинели и класс 2 - соединение состава AB2S4 не образуется или существует, но его кристаллическая структура отлична от шпинели; (2) класс 1 - соединения состава AB2S4 со структурой CaFe204 и класс 2 -соединение состава AB2S4 не образуется или существует, но его кристаллическая структура отлична от Саґ е204; 196 (3) класс 1 - соединения состава AB2S4 со структурой ТІ13Р4 и класс 2 -соединение состава AB2S4 не образуется или существует, но его кристаллическая структура отлична от ТП3Р4.

Для селенидных соединений (таблица 21): (1) - класс 1 - соединения состава AB2Se4 со структурой шпинели и класс 2 - соединение состава AB2Se4 не образуется или существует, но его кристаллическая структура отлична от шпинели; (2) класс 1 - соединения состава AB2Se4 со структурой CaFe204 и класс 2 -соединение состава AB2Se4 не образуется или существует, но его кристаллическая структура отлична от CaFe204; (3) класс 1 - соединения состава AB2Se4 со структурой ТІІ3Р4 и класс 2 -соединение состава AB2Se4 не образуется или существует, но его кристаллическая структура отлична от ТП3Р4; (4) класс 1 - соединения состава AB2Se4 со структурой NiCr2S4 и класс 2 -соединение состава AB2Se4 не образуется или существует, но его кристаллическая структура отлична от NiCr2S4. Сводные таблицы 20 и 21 содержат результаты разных дихотомий.

Для теллуридных систем была проведена одна дихотомия: класс 1 - соединения состава АВ2ТЄ4 со структурой TI13P4 и класс 2 - соединение состава АВ2Те4 не образуется или существует, но его кристаллическая структура отлична от TI13P4 (таблица 22).

Новая версия системы обучения ЭВМ формированию понятий Confor, основанная на растущих пирамидальных сетях [164, 165], позволила провести разделение всего множества объектов на несколько классов и последующее одновременное прогнозирование типа кристаллической структуры и возможности образования соединений состава AB2Se4 (таблица 23) [24]. Рассматривались 10 классов: 1 - соединения состава AB2Se4 со структурой шпинели; 2 - соединения состава AB2Se4 со структурой халькопирита; 3 - соединения состава AB2Se4 со структурой PbGa2Se4; 4 - соединения состава AB2Se4 со структурой YD3S4; 5 -соединения состава AB2Se4 со структурой Yb3Se4; 6 - соединения состава 197 AB2Se4 со структурой CaFe204; 7 - соединения состава AB2Se4 со структурой Th3P4; 8 - соединения состава AB2Se4 со структурой NiCr2S4; 9 - соединения состава AB2Se4 со структурой, отличной от приведенных выше; 10 - отсутствие соединения состава AB2Se4 в системе A-B-Se.

В таблицах 19-23 приведены результаты сравнения полученных прогнозов с новыми экспериментальными данными. За годы, прошедшие после публикации результатов компьютерного конструирования новых полупроводниковых соединений состава АВ2Х4 [14, 24, 91], была определена кристаллическая структура 357 соединений. В 32 случаях прогнозы не совпали с экспериментальными данными, т.е. ошибка прогнозирования равна 9 %, что почти в три раза ниже величины (25 %), полученной при экзаменационном распознавании в работе [91].

Кристаллическая структура типа шпинели наиболее характерна для кислородных соединений состава АВ204 (приблизительно 45% известных соединений этого состава являются шпинелями). Анализ полученных прогнозов показывает, что с увеличением ковалентного характера связей при переходе к сложным сульфидам, селенидам и теллуридам распространенность шпинелъной структуры у соединений АВ2Х4 (X=S, Se, Те) резко падает (например, известны только четыре теллуридные шпинели: v ZnMn2Te4, CuCr2Te4, ZnCr2Te4 и CdCr2Te4). В этих случаях конкурентоспособными становятся структуры типа Th3P4, CaFe204, PbGa2Se4, MnEr2S4, NiCr2S4, CaHo2Se4, CdAl2S4, халькопирита и т.д. При этом шпинельная структура предпочтительна для малых катионов А и В, в то время как структура типа Th3P4 и CaFe204 образуется большими катионами. Соединения со структурой типа NiCr2S4 характерны для элементов А и В с частично заполненными d-уровнями (Таблицы 21 и 23). Однако такие простые заключения о природе кристаллической структуры являются недостаточными для прогноза новых фаз

Похожие диссертации на Компьютерное конструирование неорганических соединений, перспективных для применения в электронике, с использованием баз данных и методов искусственного интеллекта