Введение к работе
Актуальность темы
В настоящее время существенное значение приобретает, проблема
направленного синтеза химических веществ с заранее заданными свойствами.
Для решения этой проблемы необходимо прогнозирование физико-
химических, биохимических и т.п. свойств еще не синтезированных
химических соединений. Прогнозирование свойств соединений, как правило,
выполняется на базе гипотез о причинно-следственных зависимостях между
свойствами веществ и особенностями структуры их молекул, построенных на
основе сведений об уже синтезированных и исследованных молекулах
соединений того же класса. '
В диссертационной работе рассмотрены методы выявления и анализа гипотез о причинно-следственных зависимостях "структура - свойство" для сложных органических соединений. Использован отличный от традиционного подход к анализу структуры молекул, основанный на учете конформационной лабильности молекул. При таком подходе учитывается не один энергетически наиболее выгодный конформер, а множество энергетически приемлемых конформеров, что приводит к неоднозначной зависимости между структурой молекулы и ее свойствами.
Традиционно для исследования зависимостей "структура - свойство" используются статистические методы, позволяющие построить математическую модель зависимости в виде функции, аргументами которых являются численные значения структурных параметров молекулы, а значением - проявляемая молекулой активность. Однако построить корректную модель удается далеко не всегда, в частности, из-за того, что взаимозависимости между различными структурными параметрами неизвестны. Отдельные проблемы возникают при исследовании неоднозначных зависимостей, связанных с конформационной лабильностью молекул.
В работе для формулирования гипотез о зависимостях "структура - свойство" предложены логические методы, обеспечивающие выявление причинно-
следственных связей между понятиями на основе ограниченного множества примеров.
Целью работы" является разработка методов, математических моделей и инструментальных средств для выявления причинно-следственных зависимостей "структура - свойство" для сложных органических соединений на основе индуктивного логического программирования.
, В этом плане ставятся и решаются следующие задачи:
построение обобщенной математической модели выявления слабо формализуемых причинно-следственных зависимостей;
логический анализ казуальных зависимостей, включая проверку непротиворечивости гипотез и разрешение противоречий;
разработка программного комплекса, поддерживающего индуктивный логический вывод гипотез о казуальных зависимостях;
разработка методики применения индуктивного логического программирования для исследования зависимостей "структура - свойство" для сложных органических соединений;
реализация и внедрение разработанного программного комплекса.
Методы исследования
В основу выполненных в работе исследований положены методы
приобретения и манипулирования знаниями на базе индуктивного логического
программирования. Экспериментальные исследования и реализация
программного обеспечения выполнялись с привлечением щзвестных методов логического программирования и теории реляционных систем.
Научная новизна
В диссертационной работе автором получены следующие научные результаты:
построена математическая модель выявления слабо формализуемых
причинно-следственных зависимостей, обеспечивающая проверку
непротиворечивости гипотез и разрешение противоречий;
разработаны алгоритмы проверки непротиворечивости гипотез и разрешения противоречий при выявлении казуальных зависимостей
разработана методика применения методов индуктивного логического программирования для исследования зависимостей "структура-свойство" для сложных органических соединений с учетом конформационной лабильности молекул.
Практическая значимость
Практическая значимость полученных в работе результатов заключается в следующем:
разработан и реализован программный комплекс для анализа зависимостей средствами индуктивного логического программирования;
выполнен анализ зависимостей "структура - свойство" для формирования гипотез о биологической активности ретиноидов;
выполнен анализ зависимостей "структура - свойство" для формирования гипотез о максимуме поглощения и адсорбционной способности тиамонометинцианинов.
Апробация работы
Основные положения работы докладывались и обсуждались на всероссийски и международных конференциях. Разработанное программное обеспечение демонстрировалось на 2-м конгрессе ЮНЕСКО по образованию и информатике (Edit-96) и передано в отраслевой фонд алгоритмов и программ.
Публикации
Полученные в работе результаты изложены в 3 опубликованных статьях и 2 алгоритмах, переданных в ОФАП.
Структура и объем диссертации
Диссертация состоит из введения, 4 глав, заключения и списка литературы.