Введение к работе
Актуальность работы. Центральной проблемой теоретической химиї является нахождение зависимостей между структурой органических соединений і проявляемыми ими свойствами. В попытках ее решения широко используете: вычислительная техника, оснащенная программным обеспечением, позволяющии находить количественные корреляции "структура-свойство" (ККСС). Для построена в ЭВМ ККСС-моделей используют методы описания молекул, включающие вычисление топологических индексов, теоретико-информационных индексов наборов структурных фрагментов различных типов и т.п. Важным аспект создаваемых ККСС-моделей является задача выбора оптимального набор; признаков (дескрипторов) молекул для расчета данного свойства, а также задач; содержательной интерпретации параметров получаемых ККСС-моделей.
В настоящее время при описании структур молекул принято использоваті наборы заранее заданных дескрипторов, индексов, структурных фрагментов формакофоров, , дескрипторных центров и т.п. Наборы признаков могу дополняться, если в ходе решения ККСС-задачи выясняется, что реализованный ' программе набор признаков неадекватно описывает исследуемое свойство.
Как правило, набор признаков молекул, используемый для расчета одногс свойства, например, запаха, существенно отличается от набора, по котором; проводят вычисления другого свойства. Выбор признаков, адекватных данном; свойству, является одной из важных проблем, возникающих при решении ККСС задач.
В настоящей работе предлагается новый подход к решению проблемь адекватного выбора признаков для создания математической модели конкретногс свойства молекул. При этом не используются заранее предопределенные спиш признаков: дескрипторы молекул формируются автоматически по картинг електростатического поля, создаваемого молекулой, на основе рассчитанное квантовохимически реальной 3-мерной геометрии с учетом требований задаваемых экспертом. При этом картина создаваемого совершенно различным! молекулами электростатического поля может быть подобна и, соответственно появляется возможность объяснения схожих свойств молекул разных структурны: типов.
Целью работы является создание метода предсказания свойств органических соединений на основе автоматического формирования дескрипторов органических соединений, описывающих пространственную структуру, форму поверхности молекул и электростатическое поле на этой поверхности. В соответствии с целью были поставлены следующие задачи: і. Провести ' исследование различных вариантов формирования энумерационного представления пространственных структур и форм поверхности в виде набора признаков и обосновать методику выбора адекватного описания пространственных форм молекул и их электростатического поля для расчета данного вида биологической активности.
-
Разработать, отладить и оттестировать алгоритмы и программы, реализующие различные варианты предлагаемой методики.
-
Провести серию вычислительных экспериментов с целью установить оптимальные интервалы используемых в построении дескрипторов параметров, таких как: тип дискретизации представления поверхности и расстояния между точками дискретизации, заряды этих точек, поверхностные потенциалы и др.
-
Провести практическую проверку разработанных дескрипторов для построения ККСС-зависимостей различных видов биологической активности: мускусный запах, психотропная активность и других на обучающих выборках органических соединений разных классов, включая гетероциклические соединения.
Научная новизна работы:
1. Предложена и программно реализована новая методика полуавтоматического экспертного описания пространственных структур, форм поверхности молекул и - распределения молекулярного электростатического потенциала на этих поверхностях на основе перечисления всех пар "особых точек" с учетом их взаимного расположения. Точки выбираются по результатам расчетов квантовой
химии и отражают структурные, химические и иные особенности строениі молекул.
-
Предлагаемое описание формы поверхности молекул и распределена электростатического потенциала не является связанным с конкретныш атомами или структурными фрагментами, что позволяет производит! анализ соединений, принадлежащих к различным структурным классам.
-
Показано, что с целью получения адекватного описания пространственны: структур и форм поверхности молекул необходимо дискретизироваті величины расстояний, потенциалов и зарядов. Сформулированы правил; дискретизации потенциалов, зарядов и расстояний.
-
Сформулированы правила выбора особых точек, исследованы различны* варианты учета точек в представлении пространственных структур и форл поверхности молекул. Правила прошли успешную экспериментальнук проверку.,
-
Методика была успешно апробирована на следующих видах биологически: свойств: мускусный запах, психотропная активность.
Практическая ценность работы состоит в том, что
-
Разработаны и успешно применены оригинальные алгоритмы и программы предназначенные для создания описания пространственных структур форм поверхности молекул и картины молекулярного электростатической потенциала, построенных по результатам квантовохимических расчетов Показаны высокие прогностические свойства получаемых дескрипторов.
-
На основе предложенного подхода построены ККСС-модели для расчет; таких различных видов биологической активности соединений каї мускусный запах, психотропная активность на обучающих выборка: органических соединений различных химических классов. Полученньк модели могут быть использованы для оценки указанных выше видої биологической активности еще не исследованных соединений.
Публикации: Результаты работы содержатся в 7-ми публикациях.
Апробация работы: Результаты работы докладывались на семинар» академика Н.С.Зефирова (МГУ, 1994), на семинаре академика Ю.И.Журавлева і И.Б.Гуревича (Институт высокопроизводительных вычислительных систем, РАН
Москва, 1994), на семинаре профессора Ю.Г.Папулова (Тверской государственный университет, 1994), во Всероссийском онкологическом центре (Институт .экспериментальной терапии и диагностики опухолей, 1995г), на 7-ой Всероссийской конференции "Математические методы распознавания образов* (Пущино, 1995г), на ІХ-ом Европейском симпозиуме по органической химии (Варшава, 1995г).
Объем работы: Работа состоит из введения, трех глав, заключения, списка литературы и приложений.