Введение к работе
Одной из важных задач фармакологии, медицины и ряда других прикладных областей органической химии является определение связей между структурой химических соединений и их биологической активностью. В настоящее время большое значение имеют компьютерные методы молекулярного дизайна, в т.ч. прогнозирование свойств соединений ("структура - активность"), автоматическое конструирование лекарств, обработка данных и знаний о химических соединениях в базах данных (БД).
Одним из применяемых в настоящее время подходов к компьютерному прогнозированию биологической активности химических соединений является ДСМ-метод автоматического порождения гипотез [11]. Принцип работы этого метода основывается на анализе прецедентов (набора соединений с заранее известными свойствами).
Перспективным направлением в развитии интеллектуальных систем являются гибридные интегрированные интеллектуальные системы, содержащие представления объектов в БД в виде двухмерных или трехмерных образов, а также системы обнаружения закономерностей в БД. Системы, основанные на ДСМ-методе автоматического порождения гипотез, являются гибридными интегрированными интеллектуальными системами, используемыми для порождения закономерностей в базах данных с неполной информацией. В представленной диссертации решается ряд полезных задач в рамках указанных направлений развития интеллектуальных систем.
Целью исследований являлось создание алгоритмических и программных средств манипулирования данными, представляющими соединения органической химии и их фрагменты для решения задач в экспертных системах (ЭС) типа ДСМ. Исследования заключались в создании алгоритмов и программ ввода химических соединений и нахождения их сходства для прогнозирования биологической активности в ЭС типа ДСМ. В диссертации также была исследована возможность распараллеливания основного модуля решателя задач ЭС типа ДСМ.
Актуальность темы диссертации определяется тем, что в ней реализуется принцип сохранения структуры основных правил решателя, представляющих правдоподобные выводы, при варьировании структур
данных, и диссертации созданы алгоритмические и программные средства ЭС типа ДСМ для структуры данных, в которой объекты являются химическими (молекулярными) графами. Прежние версии ЭС типа ДСМ применялись для булевской структуры данных, в которой соединения органической химии (объекты БД) представлялись посредством множеств дескрипторов. В работе созданы основы для перехода от структуры данных с объектами, являющимися молекулярными графами (эта структура данных является дистрибутивной решеткой), к структуре данных, в которой объекты являются молекулярными графами в 3х мерном пространстве.
В процессе работы над диссертацией получены следующие научные результаты:
-
Создана система автоматизированного ввода представлений структурных формул органической химии, обеспечивающая интерфейс пользователю с экспертными системами типа ДСМ для задач порождения зависимостей "структура химического соединения - множество биологических активностей". Указанная подсистема содержит химический редактор WChar [8] и подсистему автоматического кодирования [5] структурных формул органической химии посредством языка ФКСП (фрагментарный .код суперпозиций подструктур, предложенный В.В. Авидоном) [1]. Созданная подсистема автоматического кодирования кодом ФКСП решает задачу преобразования молекулярных графов в булевскую структуру, что означает покрытие этих графов множеством дескрипторов, ориентированных на комплимен-тарность рецепторам.
-
Разработаны алгоритмические и программные средства реализации операции сходства и отношений вложения для химических графов [8], что означает создание инструментальных средств для применения ДСМ-метода автоматического порождения гипотез к структуре данных, в которой объектами являются молекулярные графы.
-
Проведен сравнительный анализ операций сходства, применяемый в решателе задач типа ДСМ, реализованных для химических соединений, представленных посредством кода ФКСП (в булевской структуре данных), и посредством химических графов (в структуре данных, являющейся дистрибутивной решеткой, но не булевской) [4].
-
Новая версия ЭС типа ДСМ для прогнозирования биологических активностей химических соединений, реализованная для химических графов, применена не только к задаче "структура химических соединений - множество биологических активностей", но и использована для прогнозирования биотрансформаций (метаболизма) химических соединений (средства представления знаний, решающие правила и формализация этой задачи разработаны Е.Ф. Фабрикантовой).
-
Рассмотрены возможные способы использования фильтров при поиске в БД по фрагменту структурной формулы, ориентированные на решение задач прогнозирования биологической активности химических соединений в ЭС типа ДСМ.
-
Решена задача распараллеливания решателя задач ЭС типа ДСМ (проведены эксперименты с этой целью с использованием транспьютера).
Научная новизна работы заключается в следующем:
-
Впервые созданы алгоритмические и программные средства для ЭС типа ДСМ, ориентированные на решение задач прогнозирования свойств химических соединений такие, что объектами в БД и базе знаний являются молекулярные графы, а не их фрагментарные представления. Для этого реализованы алгоритмические средства поиска сходства химических соединений, используемые для порождения гипотез о причинах биологической активности этих соединений, а также созданы средства автоматического представления химических соединений в коде ФКСП (как объектов булевской структуры данных).
-
При участии автора диссертации разработана новая версия ЭС типа ДСМ, объектами которой являются молекулярные графы. Данная ЭС используется в качестве инструмента молекулярного дизайна в исследовательских целях биохимиками и фармакологами.
Практическая значимость работы определяется значимостью задач молекулярного дизайна и компьютерного мониторинга химических соединений. Результаты исследований автора опубликованы в пяти статьях.