Электронная библиотека диссертаций и авторефератов России
dslib.net
Библиотека диссертаций
Навигация
Каталог диссертаций России
Англоязычные диссертации
Диссертации бесплатно
Предстоящие защиты
Рецензии на автореферат
Отчисления авторам
Мой кабинет
Заказы: забрать, оплатить
Мой личный счет
Мой профиль
Мой авторский профиль
Подписки на рассылки



расширенный поиск

Математические модели прогноза и молекулярный дизайн биологически активных аналогов простагландинов Бетелина Ирина Борисовна

Математические модели прогноза и молекулярный дизайн биологически активных аналогов простагландинов
<
Математические модели прогноза и молекулярный дизайн биологически активных аналогов простагландинов Математические модели прогноза и молекулярный дизайн биологически активных аналогов простагландинов Математические модели прогноза и молекулярный дизайн биологически активных аналогов простагландинов Математические модели прогноза и молекулярный дизайн биологически активных аналогов простагландинов Математические модели прогноза и молекулярный дизайн биологически активных аналогов простагландинов Математические модели прогноза и молекулярный дизайн биологически активных аналогов простагландинов Математические модели прогноза и молекулярный дизайн биологически активных аналогов простагландинов Математические модели прогноза и молекулярный дизайн биологически активных аналогов простагландинов Математические модели прогноза и молекулярный дизайн биологически активных аналогов простагландинов
>

Диссертация - 480 руб., доставка 10 минут, круглосуточно, без выходных и праздников

Автореферат - бесплатно, доставка 10 минут, круглосуточно, без выходных и праздников

Бетелина Ирина Борисовна. Математические модели прогноза и молекулярный дизайн биологически активных аналогов простагландинов : Дис. ... канд. хим. наук : 02.00.17 Уфа, 2005 146 с. РГБ ОД, 61:06-2/88

Содержание к диссертации

Введение

1. Обзор литературы 11

1.1. Исследование зависимости между структурой и свойствами химических соединений 12

1.1.1. Предпосылки и возможности молекулярного дизайна и прогноза химических соединений с заданными свойствами 12

1.1.2. Компьютерные системы и вычислительные методы выявления связи между строением и свойствами химических соединении 17

1.1.3. Анализ зависимостей между строением и свойствами в ряду структурных аналогов простагландинов 35

1.2. Простагландини в ряду биологически активных веществ. Некоторые биологические и химические свойства простагландинов 38

1.2.1. Химическая характеристика простагландинов 38

1.2.2. Главные механизмы действия простагландинов 40

1.2.3. Особенности строения простагландиновых рецепторов 42

1.3. Механизмы биосинтеза простагландинов. Метаболизм простаглан динов и их аналогов 43

1.3.1. Биосинтез простагландинов 43

1.3.2. Метаболизм простагландинов и их аналогов 48

1.4. Биологическое и физиологическое действие простагландинов 49

1.4.1. Биологическое действие простагландинов 49

1.4.2. Физиологическое действие простагландинов 50

1.5. Заключение по обзору литературы 56

2. Обоснование и выбор материалов и методов исследования 58

2.1. Выбор объектов исследования 58

2.2. Выбор параметров 60

2.3. Выбор методов анализа связи «структура - активность» 60

3. Анализ влияния элементов строения аналогов простагландинов на биологические свойства 68

3.1. Анализ влияния признаков на противоязвенную активность 69

3.2. Анализ влияния признаков на утеротоническую активность 70

3.3. Комплексный анализ влияния признаков на противоязвенную и утеротоническую активность

3.3.1. Влияние циклических систем на биологическую активность про-стагландинов 71

3.3.2. Влияние ациклические фрагментов на биологическую активность простагландинов 73

3.3.3. Влияние стерических эффектов на биологическую активность простагландинов 74

4. Разработка, анализ и апробация математических моделей распознавания и прогноза биологической активности аналогов простагландинов 77

4.1. Формирование и анализ математических моделей 77

4.2. Апробация математических моделей 80

5. Определение направлений синтеза и молекулярный дизайн новых потенциально активных соединений 87

5.1. Анализ сходства с эталонами активности 89

5.2. Анализ направлений модификации и целенаправленного синтеза исследуемых соединений 93

5.2.1. Определение направлений химической модификации соединений с противоязвенной активностью 93

5.2.1. Определение направлений химической модификации соединений с утеротонической активностью 96

5.2.3. Общий анализ матриц очерёдности замены фрагментов в структурах исследуемых соединений 100

5.3. Молекулярный дизайн потенциально-перспективных соединений 101

5.3.1. Дизайн соединений с противоязвенной активностью 101

5.3.2. Дизайн соединений с утеротоническои активностью 103

5.3.3. Электронные и энергетические параметры базовых и сконструированных структур 104

5.4. Прогноз активности новых соединений 105

6. Методы проведения экспериментальных исследований 107

6.1. Математические методы исследования взаимосвязи структураактивность 107

6.2. Методы проведения квантово-химических расчётов 114

6.3. Биологические методы испытаний 114

6.3.1. Изучение утеротоническои активности аналогов простагланди-нов 114

6.3.2. Изучение противоязвенной активности аналогов простагландинов 114

Выводы 116

Введение к работе

Актуальность работы. Интерес к проблеме простагландинов (ПГ) химиков, биохимиков, фармакологов связан с высокой биологической активностью этих соединений, их прямым или опосредованным участием во многих физиологических процессах [1-3]. ПГ являются гидроксилированными продуктами превращения в организме полиненасыщенных жирных кислот: эк-затриеновой, экзатетраеновои и экзапентаеновои, отличающихся степенью ненасыщенности. Молекулы простагландинов состоят из двадцати атомов углерода и включают циклопентановое кольцо [4].

Существуют природные и синтетические ПГ. С клинической точки зрения все природные ПГ имеют следующие основные недостатки: быстрый метаболизм (ПГ легко теряют активность под влиянием специфических ферментов) и, следовательно, кратковременность действия; химическая нестабильность; дороговизна; исключительно широкий спектр фармакологического действия, обуславливающий обилие побочных эффектов при терапевтическом введении ПГ-содержащих препаратов [5]. В последнее время в медицине широко используются синтетические аналоги ПГ - вещества, сохраняющие свойства природных ПГ, но обладающие лучшей избирательностью действия, более высокими физиологической активностью и метаболической устойчивостью, что переводит их из разряда локально действующих биологических регуляторов в агенты, циркулирующие по всему организму [6]. Однако существующие препараты на основе синтетических ПГ тоже не лишены ряда побочных эффектов.

Область синтетической химии ПГ быстро развивается. Стимулирование родов, прерывание беременности, лечение бронхиальной астмы и сердечнососудистых заболеваний - вот далеко не полный перечень клинических показаний для применения ПГ. Огромную потребность в ПГ испытывает промышленное животноводство, где новые препараты используются для ускоре-

ния селекции сельскохозяйственных животных, для синхронизации половых циклов, для регулирования времени появления приплода [3].

Однако отечественные арсеналы лекарственных ПГ-препаратов на фоне списка препаратов, выпускаемых инофирмами и широко внедрённых в мировую клинику, а также сельское хозяйство, выглядят очень скромными [2]. В связи с этим задача создания новых высокоэффективных лекарственных ПГ-препаратов с селективным действием и минимальными побочными эффектами по-прежнему остается значимой и актуальной. Важным аспектом является поиск ПГ-содержащих препаратов для регулирования процессов развития беременности как у человека, так и у животных (утеротоническая активность), с противовоспалительным, противоязвенным и другими фармакологическими эффектами.

Синтез и биологические испытания аналогов ПГ представляет собой трудоёмкую задачу [2]. Имея ввиду то обстоятельство, что природные ПГ участвуют практически во всех процессах жизнедеятельности организма, реализация принципа селективности предполагает исчерпывающее изучение всех сторон потенциального взаимодействия аналогов ПГ с организмом. Сложность данной проблемы совершенно ясна. Современные требования к доклиническому исследованию токсичности и побочных эффектов включает проведение множества экспериментов по оценке состояния внутренних органов и поведения лабораторных животных, которым исследуемый препарат вводят в течение более длительного периода по сравнению с ожидаемой продолжительностью терапии. Стоимость выявления одного активного препарата, которая отражает синтез и биологические исследования примерно 4-100 тыс. соединений на один препарат, составляет десятки миллионов долларов. При этом вероятность проявления сопутствующих нежелательных эффектов даже в случаях применения известных препаратов весьма высока.

Очевидно, что сокращение объёма синтезируемых "впустую" соединений даже в 2-3 раза, позволит уменьшить затраты на синтез и биологические испытания новых соединений, существенно ускорить поиск оптималь-

7 ных, наиболее эффективных и безопасных соединений для целенаправленного синтеза, расширить сферу возможных ценных прикладных свойств и уменьшить риск от позднего выявления вредных воздействий применения новых препаратов. Для этого желательно выявить как можно более широкий спектр свойств ещё на стадиях выбора структур для синтеза и испытаний.

За последние годы при выборе структур для целенаправленного синтеза значительное распространение получили подходы, основанные на математических моделях, устанавливающих связь между структурой молекул и биологическим действием, которые реализуются с помощью компьютерных систем прогнозирования активности соединений. Они позволяют получать представления о механизмах биологически важных химических реакций, надежно прогнозировать возможную направленность и эффективность как физико-химических свойств, так и биологической активности новых, еще не синтезированных или синтезированных, но не испытанных на биологическое действие, соединений, проводить молекулярный дизайн структур с заданными свойствами и на этой основе давать рекомендации химикам-синтетикам [7]„ Поэтому несомненный интерес представляет вопрос изучения связи «структура - свойства» (ССС).

С учетом выше изложенного сформулированы основная цель и задачи исследований.

Цель работы. Создание математических моделей прогноза, молекулярный дизайн и прогноз аналогов простагландинов с противоязвенной и утеротонической активностью на основе анализа связи их строения и фармакологического действия. В соответствии с целью исследования были поставлены и решены следующие задачи:

  1. Выявление структурно-функциональных характеристик, оказывающих влияние на проявление противоязвенной (ПА) и утеротонической (УА) активности.

  2. Формирование, анализ и апробация моделей распознавания и прогноза.

  3. Выбор расчётных базовых структур как основы для молекулярного ди-

8 зайна, определение направлений химической модификации, молекулярный дизайн и прогноз потенциально перспективных соединений с ПАиУА.

Научная новизна. Впервые выявлены теоретические закономерности, связывающие строение синтетических аналогов ПГ с их ПА и УА, заключающиеся в том, что:

определены структурно-функциональные характеристики молекул простагландинов, оказывающие влияние на проявление ПА и УА (как для каждого вида активности отдельно, так и в комплексе);

а) выраженное положительное влияние на ПА оказывают следующие
группы: C=0-(CHz)n, С=0-0, S4-(CH2)n (при п>4); на УА: 0-С=С-С=С, О, О-
С=С, CH2sem.-CH-Sl;
отрицательными признаками для ПА являются С=С-СН-
S1, С=0-СН
2гет-СН2, CH-S1, для УА - СН3, СН3-(СЩСН, (CH^jrCHSl.

б) одновременное положительное влияние на проявление ПА и УА оказы
вают следующие фрагменты: сера и фрагменты её содержащие; О, Ph, O-Ph,
0-СЯ
ет> СНггет-O-Ph; 2,3,4-зам. циклопентанон, 2,3,4-зам. циклопентанон-
С=С, S4-2,3,4-3ctM. циклопентанон, ОН-2,3,4-зам. циклопентанон-84.
Отрица
тельное влияние на проявление как УА, так и ПА имеют фрагменты CHj-
(012)4...ю> CH
2-S4; 2,3~зам. циклопентанон как отдельно, так и в совокупности
с фрагментами СН2гет, С=С, СН-(С=С), S4, CH2-S4. Разнонаправленное воз
действие на два вида активности оказывают 2,3-зам. циклопентанон в сово
купности с фрагментом СН
2гет-(С=С); большинство сложных кислородсо
держащих фрагментов;
стерический параметр S4 как отдельно, так и в сово
купности с СИ, (С=0)-СН, ОН-2,3~зам, циклопентанон.

- сформированы математические модели распознавания и прогноза аналогов ПГ с ПА и УА, достоверность их при тестировании на структурах обучения и на экзаменационной серии высокая (соответственно от 85 до 98% и от 72 до 100%).

Впервые определены перспективные направления целенаправленного синтеза новых соединений класса ПГ, которые заключаются в том, что:

определены расчётные ранги ПА и УА для всех исследуемых соединений;

выявлены базовые структуры, модификации которых наиболее предпочтительны для целенаправленного синтеза потенциально перспективных аналогов ПГ;

количественно определены вклады фрагментов каждой из исследованных молекул ПГ в активность и расчётные места их модификации;

осуществлены молекулярный дизайн и прогноз аналогов ПГ с ПА и УА, результаты которых подтверждаются экспериментальными данными о проявлении ПА несколькими сконструированными соединениями.

Практическая ценность. В результате исследований сформированы модели прогноза ПА и УА, выявлены наиболее перспективные соединения, предпочтительные для модификации, заменяемые и вводимые функциональные группы, что является основой для целенаправленного синтеза новых структур с заданными свойствами. Осуществлён молекулярный дизайн и прогноз аналогов ПГ с ПА и УА.

Сформированы компьютерные база данных и база знаний, содержащие сведения, необходимые для дизайна и прогнозной оценки новых соединений. Они внедрены и используются в НИТИГ АН РБ. Результаты исследований применяются при целенаправленном синтезе и определении направлений биотестирования перспективных аналогов ПГ с ПА и УА в ИОХ УНЦ РАН, в образовательном процессе в УГНТУ и БГМУ.

Основные положения и результаты диссертационной работы докладывались и обсуждались на международных электронных конференциях «Информационно-вычислительные технологии в решении фундаментальных научных проблем и прикладных задач химии, биологии, фармацевтики и медицины» (Москва, 2004 - 2005 гг.); 2-й и 3-й всероссийских научных интернет-конференциях «Интеграция науки и высшего образования в области био- и органической химии и механики многофазных систем» (Уфа, 2004 - 2005 гг.); региональной научно-практической конференции «Информационные технологии в профессиональной и научной деятельности» (Йошкар-Ола, 2005 г.);

10 IV Всероссийском научно-методическом семинаре «Экологически ориентированная учебно-исследовательская и практическая деятельность в современном образовании» (Санкт- Петербург, 2004 г.)

Простагландини в ряду биологически активных веществ. Некоторые биологические и химические свойства простагландинов

ПГ являются исключительно мощными низкомолекулярными биорегуляторами липиднои природы широкого спектра действия [3]. Они совместно с гормонами играют важную роль в функционировании различных систем живого организма (репродуктивной, сердечно-сосудистой, дыхательной, пищевой, жировой ткани и др.) и оказывают сильное фармакологическое действие на множество физиологических функций организма, регулируя гемодинамику почек, сократительную функцию гладкой мускулатуры (утеротониче-ский эффект), секреторную функцию желудка (гастропротекторный, антисекреторный эффекты), водно-солевой обмен, агрегацию тромбоцитов и др. [5]. Влияя на деятельность практически всех жизненно важных органов и систем, ПГ во многом определяют состояние организма в норме и патологии. 1.2.1. Химическая характеристика простагландинов ПГ представляют собой полиненасыщенные жирные оксикислота [109], входят в семейство веществ, образующих так называемый каскад ара-хидоновой (экзатетраеновой) кислоты, рис. П 1.1. Сейчас известно около 30 природных простаноидов: из них около 20 ПГ и 10 тромбоксанов [3]. Молекулы ПГ [ПО] состоят из 20 атомов углерода, образующих лак-тонное пятичленное кольцо с присоединенными к нему двумя цепями - из семи (R7 (а-цепь): находится над плоскостью циклопентанового кольца) и восьми (Rg («-цепь): находится под плоскостью циклопентанового кольца) атомов углерода, содержащими гидроксильные группы и кратные связи, рис. 1.1. В зависимости от химической структуры пятичленного кольца и присоединённых к нему цепей, ПГ подразделяются на классы: А, В, С, D, G, Н, I, Е и F, из которых биологически наиболее важны два последние, поэтому их ино- гда называют основными ПГ. Краткое обозначение простаноидов складывается из двух букв английского prostaglandin и tromboxane или русского написания, третья буква в этом обозначении указывает на принадлежность к тому или иному классу, например: PGF, ГПТ - простагландин F; ТхА, ТксА - тром-боксан А. В каждый класс входят по несколько ПГ, различающихся расположением атомов и химических связей в боковых цепях [109]. При обозначении классов ПГ у каждой буквы указывается цифровой индекс, обозначающий общее число двойных связей в боковых углеводородных цепях, и индекс а или р, обозначающий расположение ОН-группы в положении 9С по отношению к горизонтальной плоскости молекулы.

Например, в серию Е входят простагландины: Ei (PGEi), который имеет только одну 13-14-транс-двойную связь, Е2 (PGE2) - имеет вторую цис-двойную связь в положении 5-6 и Ез (PGE3) -имеет третью цис-двойную связь. В молекуле простагландина PGF2a 9-ОН-группа имеет 8(a)-конфигурацию, в молекуле PGF2p - Я(р)-конфигурацию. Вследствие асимметрии молекулы ПГ существуют в нескольких изомерных формах [109]. Большинство природных простагландинов имеет сте-реохимическую структуру, при которой боковые цепи природных ПГ находятся в транс-положении относительно друг друга, т.е. на противоположных сторонах плоскости кольца, а гидроксильные группы имеет S(a)- конфигурацию в положении 9(11,15)С, т.е. расположены ниже плоскости кольца на той стороне, что и карбоксильная боковая цепь. Химическое восстановление кетогруппы PGE всегда приводит к образованию двух изомерных форм PGF, обозначаемых а и Р согласно расположению 9-ОН-группы (PGF2aHPGF2p). Этим не исчерпываются стереохимические особенности ПГ, например, они существуют в двух (четырёх) оптически активных формах. Т.о., молекулы ПГ имеют сложную стереохимическую структуру. Разнообразие функций ПГ и отсутствие в организме специального органа биосинтеза позволяют относить их к «местным», или клеточным, гормонам [4]. В отличие от гормонов, которые продуцируются железами внутренней секреции, ПГ синтезируются во всех клетках организма. В малых концентрациях ПГ присутствуют почти во всех органах, тканях и биологических жидкостях высших животных. Ещё одно отличие простагландинов от гормонов состоит в том, что гормоны способны проявлять своё действие на достаточно большом удалении от той железы, где они образовались, а физиологический эффект ПГ ограничивается главным образом местом их выработки, то есть, клеткой. В настоящее время биологическая роль и механизм действия ПГ не выяснены в полной мере. К изучению этого вопроса привлечено внимание многих учёных [3,111,112]. Серьёзно осложняется это изучение тем, что пока не определены функции ПГ в "физиологически нормальном" организме. Существенным недостатком многих экспериментальных работ в этой области является то, что в них не всегда учитывается "лёгкость", с которой ПГ образуются даже при самых незначительных воздействиях на органы и ткани.

Однако имеющихся сведений о ПГ достаточно для того, чтобы утверждать: эти вещества - регуляторы физиологических функций, осуществляю- щие своё действие на клеточном и молекулярном уровнях [5]. Установлено, что ПГ способны влиять на активность низкомолекулярного внутриклеточного регулятора - фермента аденилциклазы, переводящего аденозинтрифосфор-ную кислоту (АТФ) в циклический аденозин-3 , 5 -монофосфата (цАМФ) и регулирующего содержание цАМФ в клетке [113]. Поскольку гормональная регуляция осуществляется с участием цАМФ, один из возможных механизмов действия простагландинов заключается в корректировке (усилении или ослаблении) действия др. гормонов путём влияния на биосинтез цАМФ. и в малых количествах выполняют регуляторную роль в клетках и тканях [5]. Регулирующее влияние ПГ осуществляется с помощью образования молекул ПГ стимулирующего и тормозящего типа действия или путем изменения концентрации одного и того же ПГ, изменения образования внутриклеточного медиатора цАМФ, изменения кинетики кальция в клетке. Например, PGE2 расслабляет гладкие мышцы бронхов, a PGF2a вызывает их спазм. Простагландины F2a и Е2 в малых (пороговых) дозах уменьшают спазм сосудов, а в больших дозах увеличивают его. В последние годы было выявлено несколько типов простагландиновых рецепторов, специфичных для разных классов ПГ [ПО]. В настоящее время практически расшифрована структура некоторых простагландиновых рецеп торов. Существование классов простагландиновых рецепторов обусловлено различным аминокислотным составом белковой молекулы. Однако их распо ложение в клеточной мембране сходно. Они состоят из семи гидрофобных сегментов, которые погружены в клеточную мембрану. Молекула белка, об разующего рецептор, имеет три петли, которые находятся на наружной по верхности клеточной мембраны, и три петли на внутренней поверхности мембраны. Один конец белковой молекулы, содержащий аминогруппу, нахо дится на поверхности клетки, а другой конец, содержащий карбоксильную группу, находится во внутриклеточном пространстве: Амино, А внешняя поверхность мембраны -внутренняя поверхность мембраны А Ті Я Карбоксил 1-7 - гидрофобные участки А, Б, В - внутренние петли а, б, в - наружные петли Таким образом, ПГ содержатся во всех тканях и наряду с циклическими нуклеотидами и ионами Са2+ являются основными регуляторными компонентами клетки, относящимися к аутокоидам - веществам, содержащимся в тканях и обладающими высокой фармакологической активностью, но не выполняющих функцию нейромедиаторов или "классических" гормонов в данной ткани.

Выбор параметров

Выбор направлений модификации и целенаправленного синтеза биологически активных соединений может быть осуществлен с помощью теоретических моделей. Для их формирования существенную роль играет возможность представления структуры химического соединения на принятом языке описания. Поскольку любые параметры описания структуры соединения (физико-химические, квантово-химические характеристики и т.п.) обусловлены и происходят непосредственно из структуры соединения, то при выявлении связи «структура — активность» в качестве параметров могут быть непосредственно структурные фрагменты химических соединений. 2.1.3. Выбор методов анализа связи «структура - активность» При выборе математического метода формирования теоретических моделей распознавания и прогноза необходимо ориентироваться на то, что количественные данные представления исследуемых свойств могут отсутствовать. Зачастую они сводятся к качественному критерию, и оценивается «да» или «нет», т.е. обладает или не обладает исследуемым свойством, поэтому этот качественный критерий является вполне достоверным. С этих позиций методы теории распознавания образов допускают использование неколичественных показателей активности [12,126-129]. При использовании этих методов формирование теоретических моделей производится на обучающей последовательности (выборке), состоящей из двух групп химических соединений (альтернативные группы). Важной особенностью методов является возможность вычисления эталонов изучаемых групп соединений и количественное определение сходства исследуемых соединений с гипотетическим структурным эталоном. Это очень важно для принятия обоснованных решений при определении направлений модификации на стадии дизайна. Из компьютерных систем, применяемых в настоящее время для решения различных задач анализа «структура - свойства» (ССС), для данного исследования приемлема компьютерная система «SARD» (Structure Activity Relationship & Design) [28, 29]. Исходной информацией для SARD являются данные о структуре (структурные молекулярные формулы) и свойствах исследуемых химических соединений. Система состоит из аналитического блока, блока конструирования и блока прогноза, рис. П 1.2. Назначение аналитического блока - оценка влияния разнообразных структурных фрагментов соединения на исследуемые свойства и формирование дискретного решающего правила, позволяющего распознавать активные и неактивные соединения исследуемого ряда (формирование математических моделей распознавания).

Назначение блока конструирования - выбор модифицируемых структур, определение фрагментов их строения, вносящих минимальный вклад в проявление исследуемого свойства, генерация потенциально—активных структур путем замены этих элементов (молекулярный дизайн) и оценка сгенерированных структур на основе сформированных моделей прогноза. Блок прогноза используется для прогнозирования биологической активности соединений. Комплекс проведенных компьютерных исследований включал анализ по выявлению связи «структура — биологическая активность» синтетических аналогов ПГ: а) выявление характера влияния различных фрагментов соединений на ПАиУА; б) формирование моделей распознавания и прогноза активных и неак тивных соединений; в) молекулярный дизайн новых соединений; г) прогностическая оценка активности новых соединений (в том числе сконструированных). Для этого были выполнены следующие процедуры системы SARD: 1. Создание специализированной компьютерной базы данных, которая включает структурные формулы исследуемых соединений: структуры обучающей выборки и новых сгенерированных соединений. При зтом предусмотрена дихотомическая процедура разбиения исследуемых химических соединений на две группы (группа А "активных" соединений и группа В "неактивных" соединений). 2. Представление структур исследуемых соединений на принятом языке описания, т.е. в виде молекулярного графа. Для анализа используются непосредственно структурные фрагменты и их сочетания (субструктурные деск-рипторы) . Эта стадия включает: 1) автоматическое дезагрегирование структурных формул из базы данных, в соответствии с заданным в системе SARD словарем, т.е. образование исходных фрагментарных дескрипторов; 2) генерация из исходных фрагментов более сложных признаков: а) агрегированных фрагментарных, с участием двух или трех исходных при наличии между ними химической связи, и фрагментарных дескрипторов двойного и тройного окружения; -отдельные фрагменты структурных формул химических соединений и/или их сочетания, с помощью которых описываются исследуемые соединения. 63 б) сложных логических признаков в виде конъюнкций и дизъюнкций фрагментарных признаков без учета их взаиморасположения. 3. Оценка информативности (характера влияния на исследуемое свойство) признаков всех уровней. Характер влияния субструктурных дескрипторов на проявление активности описывается при помощи коэффициента корреляции (г): и не содержащих данный фрагмент; п3 и п4 - то же для группы В; N] и N2 - число структур в группах А и В; N3 — пі + п3; N4 = n2 + п4\ г изменяется от -1 до +1. Чем выше абсолютное значение г, тем больше вероятность влияния данного признака на проявление анализируемого свойства ("+" - положительное,"-" - отрицательное). 4. Формирование математической модели распознавания и прогноза (формирование решающего набора признаков).

Заключается в поиске и выделении такой совокупности признаков, при использовании которой в алгоритме распознавания достигается оптимальность всей распознающей системы. В процессе работы системы SARD генерируется и оценивается множество структурных дескрипторов, представляющих собой исходное признаковое пространство. Согласно теории распознавания образов отношение числа структур обучения к числу параметров в решающем наборе должно иметь величину к 3, в противном случае истинная картина разделения на классы искажается [12, 130]. Для этого применяются различные методы понижения размерности признакового пространства. В системе используется алгоритм, реализующий три принципа распознавания образов: принцип максимальной Конъюнкция - математическая логическая операция «И», отражающая наличие в структуре нескольких фрагментов, не соединенных химической связью. Дизъюнкция - логическая операция «ИЛИ», отражающее наличие хотя бы одного из фрагментов, составляющих логический признак. информативности, принцип минимальной взаимозависимости признаков и принцип "оптимального покрытия" (узнавания) анализируемых структур. Модели распознавания и прогноза представляют собой уравнения логического вида: А F(S), где А - активность; (S) - решающий набор признаков (РНП) - комплекс фрагментов структурных формул и их логических сочетаний типа конъюнкций, дизъюнкций, строгих дизъюнкций; F - алгоритм распознавания образов, по которому производится классификация исследуемых соединений по их активности: геометрический подход (1) и метод «голосования» (2). 5. Оценка сформированной модели производится по числу правильно распознанных структур обучения, а также структур из экзаменационной серии. Распознавание структур проведено с использованием двух методов теории распознавания образов - «геометрического подхода» и «голосования признаков». 1) По геометрическому подходу отнесение исследуемой структуры V; (І = 1,..., к) к классу активных или неактивных (А или В) происходит после опре деления расстояния этой структуры в евклидовой метрике до расчётных эта лонов: класса А и В. R vi МЭА Yu(vi } - ЭА;)2. Ryido3B = И(Уи} - 3Bj) f где Vij - это реализация j -того признака из РНП в анализируемой (і - той) структуре в элементах булевой алгебры (j = 1, если признак присутству ет в структуре, в противном случае j = 0). Если RVi,3A КУІ,ЗВ, то VtA, Яп,эв ЯГ,,ЭА то VtB. Эталоны рассчитаны по реализации признаков РНП в структурах соответственно классов А и В: ЭА/ = Уц/тА. 3B} Y, Уц/тву где тА и/ид-число структур обучения классов А и В.

Апробация математических моделей

Основным объектом проверки достоверности сформированных математических моделей является распознавание соединений, представляющих экзаменационную серию. Модели ПА апробированы на 25 экзаменационных соединениях (18 активных, 7 неактивных). С учётом ошибки первого и второго рода (пропуск цели или ложная тревога) достоверность распознавания экзаменационных соединений по всем трём моделям и по двум алгоритмам составила от 72 до 100%. В таблице 4.5 приведены данные прогноза и эксперимента по ПА для наиболее типичных представителей экзаменационной серии. Конструирование (молекулярный дизайн) структур соединений с различными видами биологического действия проведено по алгоритму «осторожного конструирования» [28,29], что означает конструирование структур, не содержащих или содержащих минимальное количество новых связей. Предлагаемая структура должна быть «новой», т. е. хотя бы одним элементом не повторять уже синтезированные и испытанные соединения массива обучения. Однако она не должна отличаться настолько, чтобы по ее элементам нельзя было бы сделать отнесения на уровне прогноза к классу активных или неактивных соединений. Именно такое отнесение, основанное на количественных оценках влияния признаков, присутствующих в структуре, соответствует понятию «потенциально-активные», «потенциально-неактивные» соединения. Любая новая потенциально-активная структура в совокупности описывающих ее элементов, имеет две группы признаков: новые признаки, не встречающиеся в обучении, и признаки, уже присутствовавшие в структурах обучающего массива. Среди второй группы должны преобладать «активные» фрагменты [28]. При конструировании ведется поиск не единственного соединения с максимальным значением целевой функции, а поиск множества структур, обладающих этим свойством (т.е., уменьшается вероятность синтеза структур, не обладающих заданной целевой активностью). Из этого множества производится как формализованный, так и неформализованный отбор по различным другим критериям (прогнозируемой активности, токсикологическим характеристикам, доступности реагентов, синтеза, и пр.) [29]. Основными процедурами, реализуемыми при конструировании, являются: - выбор базовых соединений для модификации, основанный на анали- зе структурного сходства исследуемых соединений с расчётными эталонами активности; - определение в них элементов строения, наиболее благоприятных для замены с точки зрения активности; - определение взаимозаменяемых фрагментов.

О выборе базовых соединений Для выбора базовых соединений, используемых для дизайна, найдены количественные критерии их структурного сходства с рассчитанными гипотетическими эталонами активности. Критерии основаны на вычислении расстояний всех исследуемых соединений до этих эталонов в пространстве признаков решающего набора в евклидовой метрике. Наиболее перспективными являются структуры, максимально приближенные к эталону класса активных соединений и одновременно удаленные от эталона неактивных. О выборе направлений модификации Поскольку мы не располагаем информацией о механизме проявления активности конкретной структурой и тонком участии каждого ее фрагмента, то для обоснования выбора предположим, что при взаимодействии активной химической структуры с рецептором биологического объекта каждый исходный фрагмент принимает участие в этом взаимодействии в виде производного признака, вносящего наибольший вклад в проявление активности. Тогда, согласно требованию конструирования с целью сохранения (усиления) биологического действия, можно ориентироваться на максимальный вклад, вносимый каждым исходным фрагментом в некотором, наиболее благоприятном для него окружении, т. е. удалять тот исходный элемент, который имеет минимальную из возможных максимальных информативностей своих производных признаков, и в лучшем случае, меньше всего приближает исходную структуру к гипотетическому эталону активности [28]. Этому предположению наилучшим образом соответствуют критерии, рассчитываемые с помощью методов теории игр. О признаках, используемых при дизайне С использованием четырёх критериев теории игр (минимаксного -«minmax», минминного - «minmin», максминного - «maxmin» и максмаксно-го - «тахтах») выявляются элементы строения молекул, определяющие оптимальные варианты дизайна. Для дизайна активных молекул первоочередной замене подлежит тот исходный фрагмент, который даже в наиболее благоприятном для него окружении имеет минимальную информативность (критерии «minmax», «minmin»). Решения, принимаемые на любом из этих этапов, базируются на количественных оценках, получаемых в результате исследований связи «структура — свойство» и формировании моделей распознавания. Для расширения структурного разнообразия конструируемых соединений, возможного перехода к новым химическим классам и возможности дизайна и прогноза по нескольким свойствам могут быть использованы результаты анализа связи «структура - свойство» (ССС) как одного, так и нескольких рядов соединений. Исследуемый ряд может быть сформирован с использованием разных мер структурного сходства: на основе небольшого структурного разнообразия анализируемых соединений, у которых общий характерный фрагмент является достаточно большим, и на основе достаточно большого структурного разнообразия (общий структурный элемент соединений исследуемого ряда является небольшой частью молекулы).

В случае конструирования на основе нескольких рядов, все данные, используемые для дизайна, должны быть сопоставлены и согласованы. 5.1. Анализ сходства с эталонами активности Для выбора базовых соединений, используемых для дизайна, найдены количественные критерии их структурного свойства с рассчитанными гипотетическими эталонами активности. Критерии основаны на вычислении расстояний всех исследуемых соединений до этих эталонов пространстве признаков решающего набора в евклидовой метрике. Наиболее перспективными для химической модификации являться структуры, максимально приближен- ные к эталону активных, и одновременно удалённые от эталона неактивных. Данные структуры определяют расчётный гипотетический эталон активности. Все исследуемые соединения ранжированы по отношению к этому эталону. Результаты ранжирования использованы для молекулярного дизайна потенциально-активных структур. Для соединений массивов I и И группы А проведён анализ сходства с эталонами активности, табл. 5.1, 5.2. Для повышения достоверности решений учтены результаты отдельных этапов дизайна по шести моделям (ранги близости к структурному эталону, на которые ориентирован выбор базовых структур, приоритет замены фрагментов в них и оценки влияния вновь вводимых фрагментов). Результаты ранжирования соединений по моделям Мій М4 существенно не отличаются от результатов расчёта по моделям М2, МЗ и М5, Мб, табл. П 3.1, ГТ 3.2. Для большей части соединений высших рангов (так же как и низших) данные совпадают. По модели Ml 33 исследуемых структур из группы активных соединений распределились в 13,5 расчетных рангов активности (РРА) по расстоянию до гипотетически идеальной структуры, табл. 5Л. По модели М4 27 исследуемых структур из группы А распределились в 11,5 РРА, табл. 5.2. Показано, что из соединений массива I группы А наиболее перспективны для модификации аналоги PGEb содержащие сложноэфирную группу этилового спирта в линейной а-цепи и 16-СН3, 16-ОН группы или диеновый фрагмент в ю-цепи при наличии либо отсутствии 11 -аОН заместителя в цик-лопентановом кольце, рис. 5, 1. Для соединений низшего ранга характерным является наличие карбоксильной группы в линейной насыщенной либо ненасыщенной а-цепи, диеновых фрагментов (соединения 18ПА, 19ПА), метальных заместителей (соединение ЗОПА) в ш-цепи при наличии либо отсутствии 11-аОН заместителя в циклопентановом кольце.

Молекулярный дизайн потенциально-перспективных соединений

Для конструирования структур с ПА использованы базовые структуры как с максимальной мерой сходства с гипотетическим эталоном активности (например, 22-ПЛ), так и со средней мерой (например, 28-ПА), для которых приведены далее схемы дизайна. РРА для 22-ПА равен 1, для 28-ПА 11 из 16. Наиболее перспективным направлением дизайна на базе 22-ПА (рис. 5) является модификация заместителя при циклопентаноне (замена 11- ОН либо Н в 11 -окси-группе). Важным моментом является то, что для сконструированных структур определены направления их дальнейшей модификации. Так, по данным прогноза структура К-1 имеет РРА равный 1. На её примере показаны пути дальнейшей модификации. На первом месте в К-1 предлагается модификация циклопентанона и замена ОН-группы в со-цепи. Интересно, что в данном случае происходит переход к другим классам соединений, содержащим 5-ти и 6-ти членные гетероциклы. В структуре 27-УА проведен молекулярный дизайн по трём местам: заменой метильной группы -СН3 (первое место), фрагмента -SO2-CH3 (второе место) или фрагмента -NH-SO2-CH3 (третье место) на различные заместители, табл. 5.6. Информативность заменяемых фрагментов: r(-CH3) = -0, 588, г(-SO2-CH3) = r(-NH-S02-CH3) = 0, 130. Схема химической модификации базовой структуры 27-УА приведена на рис, 5.6. Для выявления тенденций в изменении при модификации базовых структур некоторых физико-химических характеристик, в частности, электронных и энергетических параметров, которые могут отвечать за взаимодействие с рецептором, проведены квантово-химические расчеты для базовых (22-ПА, 28-ПА) и сконструированных структур (К-1, К-12), табл. 5.7 По данным расчётов максимальный положительный заряд сосредоточен на атоме углерода карбоксильной группы (для 22-ПА, К-1, К-12) или атоме углерода сс-цепи, соединённого с концевой окси-группой (для 28-ПА), максимальный отрицательный заряд в молекулах всех исследованных соединений сосредоточен на атоме кислорода концевой окси-группы а-цепи. Установлено, что атомы, имеющие высший приоритет к замене участвуют в образовании граничных орбиталей, являются наиболее благоприятными для изменений свойств молекулы в целом.

Выявлено, что оптимальные по вкладу в активность фрагменты базовых и сконструированных структур (О, С=0) имеют значительный вклад в образование НСМО, что характеризует акцепторные свойства при межмолекулярных взаимодействиях. Фрагменты с минимальными рангами замены (ОН, СН2) имеют значительный вклад в образование ВЗМО. Кроме того, отрицательное значение энергии низшей свободной молекулярной орбитали (НСМО) и относительно низкая разность энергий НСМО и ВЗМО свидетельствует о выраженной склонности к межмолекулярным взаимодействиям, т.е. возможному взаимодействию с рецептором. 5.4. Прогноз активности новых соединений Сформированные математические модели применены для прогноза сконструированных, а также ряда других соединений. Данные прогноза ПА некоторых прогнозированных соединений приведены в таблице 5.8. Активность всех сконструированных соединений (К-1 - К-13) подтверждается по прогнозу. Из 35 прогнозированных соединений (П-1 - П-35), син- тезированных ИОХ УНЦ РАН, по моделям прогноза тестированы как обладающие ПА 19 соединений. Из них наибольшей ПА обладают четыре соединения. Они предложены для более детальных дальнейших исследований ПА в ИОХ УНЦ РАН. Из множества сконструированных и прогнозированных соединений далее производится отбор соединений с учетом разнообразных других параметров: токсичности, интересов химиков, биологов, возможности синтеза и пр. Правомочность результатов дизайна и прогноза подтверждена тем, что сконструированные структуры К-1 и К-12, синтезированные и фармакологически тестированные в составе препаратов мизопростола (К-12) и 11-дезоксиимзопростола (К-1) в ИОХ УНЦ РАН, по экспериментальным данным обладают ПА. Исследования связи структура-активность проведены с помощью системы прогноза и дизайна структур с заданными свойствами SARD (Structure Activity Relationship & Design). Исходной информацией являются данные о строении и активности соединений; параметрами описания соединений служат непосредственно фрагменты структур (субструктурные дескрипторы). При работе системы используются методы теории распознавания образов, методы теории игр, теории графов [28]. Система состоит из трёх блоков, рис, П. 1.2. Аналитический блок предназначен для оценки влияния структурных фрагментов соединений на биологическую активность и формирования моделей прогноза активности, рис. 6.1. Блок конструирования используется для молекулярного дизайна потенциально активных структур. Блок прогноза используется для прогнозирования биологической активности соединений. Для формирования оптимальной модели по системе SARD проведено 15 серий полного комплекса расчётов. Основные этапы выявления связи структура-активность [94], при помощи системы SARD, процедуры и программные модули, использованные в рамках проведённых исследований, следующие: Процедура 1, Формирование массива обучения (обучающей выборки). Он формируется в виде в виде структурного банка данных (программные модули RIGA, INPUT).

Структурные формулы соединений обучающей выборки вводятся в банк при помощи интерактивного редактора ввода структурных формул - модуль RIGA. Особенности работы с этим редактором: структура вводится с экрана и представляется в традиционном для химика виде, а хранится и обрабатывается в виде свёрнутой матрицы смежности молекулярного графа. Программное взаимодействие блока анализа системы SARD-21 При формировании массива обучения по каждому исследуемому свойству по алгоритму системы SARD для анализа связи структура-активность, формиро-вания модели распознавания биологической активности и дизайна соединений, не проявляющих биологическую активность, предусмотрена дихотомическая процедура разбиения распознаваемых объектов (исследуемых химических соединений) на две группы с альтернативными свойствами (группа "активных" соединений и группа "неактивных" соединений). При выборе анализируемого класса учитывается потребность синтеза подобных соединений и наличие определённой информации (для конструирования необходимы определённое структурное сходство соединений и в то же время их разнообразие). Основные требования, предъявляемые к массиву обучения: достаточная информативность массива и глубина альтернативы по уровню противопоставляемых свойств; наличие достаточного числа объектов в каждой из альтернативных групп (не менее 20). Процедура 2. Представление структуры соединения на языке описания, принятом в системе. Эта стадия включает: дезагрегирование структур в соответствии с определённым словарём; образование сложных фрагментарных субструктур и их логических сочетаний (конъюнкций и дизъюнкций). На данном этапе происходит представление соединений на языке, пригодном для компьютерной обработки. В качестве формального языка описания соединений используются субструктурные дескрипторы. Предусмотрено образование субструктурных дескрипторов двух типов: фрагментарных и логических признаков. Первые подразделяются на исходные фрагменты (монады) и сложные агрегированные, образующиеся при участии нескольких исходных фрагментов, соединённых между собой химической связью (диады и триады). Исходные дескрипторы представлены отдельными атомами, группами атомов, функциональными группами, типами связи, местом положения заместителей, а также циклическими системами, которые генерируются из более простых фрагментов. Совокупность оригинальных дескрипторов составляет пространство исходных признаков. Фрагментарные признаки образуются при автоматическом разбиении структурных формул на составляющие их фрагменты в соответствии с заданным словарём, который содержит 100 ациклических фрагментов (словарь okasdesc.voc).

Похожие диссертации на Математические модели прогноза и молекулярный дизайн биологически активных аналогов простагландинов