Электронная библиотека диссертаций и авторефератов России
dslib.net
Библиотека диссертаций
Навигация
Каталог диссертаций России
Англоязычные диссертации
Диссертации бесплатно
Предстоящие защиты
Рецензии на автореферат
Отчисления авторам
Мой кабинет
Заказы: забрать, оплатить
Мой личный счет
Мой профиль
Мой авторский профиль
Подписки на рассылки



расширенный поиск

Исследование взаимосвязей между молекулярной структурой и гепатозащитной активностью химических соединений Габриелян Лилит Ильинична

Исследование взаимосвязей между молекулярной структурой и гепатозащитной активностью химических соединений
<
Исследование взаимосвязей между молекулярной структурой и гепатозащитной активностью химических соединений Исследование взаимосвязей между молекулярной структурой и гепатозащитной активностью химических соединений Исследование взаимосвязей между молекулярной структурой и гепатозащитной активностью химических соединений Исследование взаимосвязей между молекулярной структурой и гепатозащитной активностью химических соединений Исследование взаимосвязей между молекулярной структурой и гепатозащитной активностью химических соединений Исследование взаимосвязей между молекулярной структурой и гепатозащитной активностью химических соединений Исследование взаимосвязей между молекулярной структурой и гепатозащитной активностью химических соединений Исследование взаимосвязей между молекулярной структурой и гепатозащитной активностью химических соединений Исследование взаимосвязей между молекулярной структурой и гепатозащитной активностью химических соединений
>

Диссертация - 480 руб., доставка 10 минут, круглосуточно, без выходных и праздников

Автореферат - бесплатно, доставка 10 минут, круглосуточно, без выходных и праздников

Габриелян Лилит Ильинична. Исследование взаимосвязей между молекулярной структурой и гепатозащитной активностью химических соединений : Дис. ... канд. биол. наук : 03.00.02 Москва, 2005 117 с. РГБ ОД, 61:05-3/1004

Содержание к диссертации

Введение

Глава 1. Анализ связи структура-гепатозащитная активность как теоретическая основа отбора химических соединений для создания новых гепатоза-щитных средств 11

1.1. Проблема поиска гепатозащитных средств 11

1.2. Современные подходы к поиску веществ с заданным биологическим действием 14

1.3. Информация о зависимости гепатозащитного действия соединений

от их структуры 22

Глава 2. Материалы и методы исследования 26

2.1. Экспериментальное тестирование гепатозащитной активности..26

2.2. Молекулярные дескрипторы 28

2.3. Математические методы, использованные для анализа связи структура-гепатозащитная активность 38

Глава 3. Зависимость гепатопротекторного детоксицирующего действия производных адамантана от структуры 44

3.1. Биологическая активность производных адамантана 44

3.2. Применение топологических дескрипторов 51

3.3. Применение автокорреляционных, подструктурных и 3D-дескрипторов 54

3.4. Применение квантовохимических дескрипторов 60

Глава 4. Зависимость гепатопротекторного детоксицирующего действия производных индола от структуры 64

4.1. Введение 64

4.2. Применение подструктурных дескрипторов 64

4.3. Применение ЗБ-дескрипторов 72

4.4. Применение топологических и автокорреляционных дескрипторов 76

4.5. Применение квантовохимических дескрипторов 78

Глава 5. Особенности использования метода главных компонент при классификации биологически активных соединений по активности на основе молекулярных дескрипторов 82

Глава 6. Исследование зависимости между структурой химических соединений и гепатопротекторнои активностью, повышающей репаративные процессы в печени 90

Заключение 94

Выводы 96

Список литературы 98

Введение к работе

Актуальность темы. В последние десятилетия наблюдается повышение частоты заболеваний печени и расширение нозологических форм, что, с одной стороны, связано с совершенствованием методов диагностики и, в частности, возможностью выявления гепатита С, а с другой -с ухудшением экологической обстановки, злоупотреблением алкоголем и наркотиками, неумеренным использованием фармакологических средств, а также стрессорными воздействиями. Кроме того, известно, что гепато-токсическое действие оказывают также препараты длительного применения: противотуберкулезные, антидиабетические, антидепрессанты и противоопухолевые цитостатики. В гепатологии используется более 900 симптоматических лекарственных средств разных фармакологических групп, однако терапевтическая эффективность большинства препаратов низка. В настоящее время создан новый отечественный гепатозащитный препарат "Фосфоглив" (производитель - ГУ НИИ биомедицинской химии им. В.Н.Ореховича РАМН), у которого выявлена этиотропная противовирусная активность. Тем не менее, поиск и разработка новых эффективных специфических гепатозащитных безопасных фармакологических средств остаются актуальными.

Для изучения гепатозащитной активности во Всероссийском научном центре по безопасности биологически активных веществ (ВНЦ БАВ) были отобраны и испытаны более 1000 химических соединений с использованием трехэтапной системы, включающей оценку детоксицирующей, липидо-понижающей, репаративной и холатосинтезирующей активности при поражении печени крыс и мышей четыреххлористым углеродом [39,44]. Среди наиболее активных соединений оказались производные адамантана, синтезированные в ИФОХ АН БССР и Куйбышевском политехническом институте, а также синтезированные в ВНЦ БАВ производные индола [12-14].

В настоящее время при поиске и создании новых лекарственных средств наряду с развитием скрининговых систем, разрабатываемых в России под руководством академика Л.А.Пирузяна с 1972 г., все большее значение приобретают рациональные подходы, основанные на исследовании зависимости биологической активности химических соединений от молекулярной структуры. Взаимосвязь «структура-активность» (Structure-Activity relationship - SAR; Quantitative Structure-Activity Relationship - QSAR) может быть установлена анализом структуры и биологической активности уже изученных соединений и далее использована для предсказания активности нетестированных соединений с целью отбора более перспективных химических структур для последующих углубленных исследований [16,17,24,29,30,46-48,57,60]. Актуальной проблемой в каждом конкретном случае является выявление наиболее информативных параметров описания молекулярной структуры (молекулярных дескрипторов) и наиболее эффективных математических методов установления взаимосвязи структура-биологическая активность.

Сведения о зависимости гепатопротекторного действия различных химических соединений от их структуры немногочисленны и имеют в основном качественный характер. Поэтому определение таких взаимосвязей важно для теории и практики разработки новых эффективных гепатоза-щитных средств.

Цель и задачи исследования. Цель работы заключалась в разработке общих подходов к внеэкспериментальному прогнозированию гепатоза-щитной активности на основе структурных молекулярных характеристик для производных адамантана и производных индола. Выбор именно этих химических рядов среди многих других соединений, испытанных на гепа-тозащитную активность, обусловлен тем, что только для этих рядов может быть составлена представительная для изучения взаимосвязи структура-активность обучающая выборка, содержащая достаточное количество как активных, так и неактивных соединений.

Для достижения поставленной цели необходимо было решить следующие задачи:

- выявить информативные молекулярные дескрипторы, наиболее адекватно отражающие структурные особенности молекул, ответственные за проявление гепатозащитной активности;

отобрать наилучшие комбинации дескрипторов с максимальной предсказательной способностью гепатозащитного действия;

определить наиболее эффективные решающие правила отнесения новых соединений к классу активных или неактивных.

Научная новизна.

Впервые определены классификационные правила, позволяющие методами линейного дискриминантного анализа и к ближайших соседей с высокой эффективностью (80-96%) на основе расчетных молекулярных дескрипторов прогнозировать возможность гепатопротекторного детокси-цирующего действия для производных адамантана и индола.

Проведено сравнительное исследование эффективности нескольких сотен молекулярных дескрипторов различного типа (подструктурных, топологических, автокорреляционных, квантовохимических, 3D) при оценке гепатопротекторной детоксицирующей активности указанных соединений. Для каждого рассмотренного типа определены наилучшие комбинации дескрипторов, обладающие максимальной предсказательной способностью.

Для производных адамантана наиболее эффективны комбинации, составленные из подструктурных дескрипторов, представляющих число центрированных на атомах фрагментов определенного типа, наименее эффективны - комбинации из WHIM-дескрипторов. В целом, 2D-дескрипторы более эффективны по сравнению с отдельно взятыми 3D-дескрипторами разных типов. Автокорреляционные топологические дескрипторы на основе топологических характеристик вершин молекулярного графа более информативны, чем обычные топологические дескрипторы.

8 Наибольшей предсказательной способностью гепатопротекторного деток-сицирующего действия (92-96%) обладают дискриминанттные функции, вычисленные для комбинаций, содержащих дескрипторы различных типов с преобладанием 20-дескрипторов. Для производных индола наименее информативны автокорреляционные и топологические дескрипторы. Показано, что в этом случае классификационные правила, построенные на основе подструктурных, квантовохи-мических или 3D-дескрипторов, обладают достаточно высокой предсказательной способностью гепатопротекторной детоксицирующей активности (83-84% в среднем). Наиболее высокой предсказательной способностью (до 90%) обладают комбинации, составленные из подструктурных дескрипторов, представляющих число центрированных на атомах фрагментов, или GETAWAY-дескрипторов.

Оценено влияние различных структурных элементов молекул на гепато-протекторную активность исследованных соединений.

Проанализированы особенности использования метода главных компонент для снижения размерности исходного дескрипторного пространства при классификации рассмотренных соединений по уровню детоксицирующей активности.

Впервые для производных адамантана с помощью регрессионного анализа выявлена зависимость гепатопротекторной активности, повышающей репаративные процессы в печени, от структурных молекулярных характеристик. Наилучшие статистические характеристики имеет регрессионное уравнение, содержащее GETAWAY-дескрипторы. Практическая значимость.

Результаты работы имеют важное прикладное значение, так как полученные классификационные правила и регрессионные уравнения позволяют оценивать гепатопротекторную детоксицирующую активность новых нетестированных соединений в ряду адамантанов и индолов, а также способность производных адамантана стимулировать репаративный по-

9 тенциал печени, и поэтому могут быть использованы в процедурах виртуального скрининга для отбора перспективных соединений в указанных химических классах. Основные положения, выносимые на защиту:

  1. На основе сравнительного исследования информативности большого набора молекулярных 2D- и 3D-дескрипторов определены эффективные классификационные правила для предсказания гепатозащитной де-токсицирующей активности производных адамантана и индола.

  2. Наибольшей предсказательной способностью гепатозащитной активности указанных соединений обладают дискриминантные функции, содержащие подструктурные, или квантовохимические, или GETAWAY-дескрипторы.

  3. Эффективность применения главных компонент при классификации соединений по активности зависит как от количества, так и от выбора исходных молекулярных дескрипторов, использованных при построении главных компонент. Для корректной классификации необходимо также учитывать главные компоненты с малым вкладом в общую дисперсию исходных дескрипторов.

Апробация работы. Основные результаты работы были доложены на XI Всероссийском национальном конгрессе «Человек и лекарство» (Моск-ва,2004), III съезде биофизиков России (Воронеж,2004) и представлены на конференции «Информационно-вычислительные технологии в решении фундаментальных и прикладных научных задач» (Москва,2004). Публикации. По результатам, изложенным в диссертации, опубликовано 8 научных работ.

Объем и структура диссертации. Работа изложена на 117 страницах, содержит 18 таблиц. Диссертация состоит из введения, обзора литературы (глава 1), описания материалов и методов исследования (глава 2), изложения результатов собственных исследований и их обсуждения (главы 3-

10 6), заключения, выводов и списка цитированной литературы, включающего 206 источников.

Современные подходы к поиску веществ с заданным биологическим действием

Для поиска новых биологически активных веществ (БАВ) в настоящее время используют, главным образом, два альтернативных подхода: 1) экспериментальный скрининг[8,40,41,122,176]; 2) вычислительные методы «конструирования» БАВ [16,24,50,159].

Первый подход исторически прошел длительный и сложный путь и до недавнего времени доминировал. До 70-х годов 20 века обнаружение новых биологически активных структур существенно зависело от случайных наблюдений, удачных находок или было результатом трудоемкого систематического скрининга большого количества доступных химических соединений, полученных синтетическим путем или извлеченных из природных источников, с помощью разнообразных биологических тестов без использования каких-либо гипотез об их терапевтическом потенциале. Нахождение нового лекарства было подобно поиску иголки в стоге сена. Использовали два различных способа реализации систематического скрининга [198]: экстенсивный скрининг и случайный (неупорядоченный) скрининг. Экстенсивный скрининг означает обширное и всестороннее фармакологическое исследование небольшого числа новых химически сложных и оригинальных соединений с целью обнаружения в этих новых структурах полезных терапевтических свойств. Случайный скрининг, в отличие от экстенсивного скрининга, означает тестирование большого числа (несколько тысяч) химических соединений с использованием ограниченного числа экспериментальных моделей для фиксированной заранее терапевтической цели. Развитие роботики и миниатюризация методов тестирования in vitro в конце 80-х - начале 90-х годов привели к объединению обоих методов систематического скрининга в высокопроизводительный скрининг (HTS - highhroughput screening) [122,138,145,176], дающий возможность одновременно испытывать тысячи химических соединений на большом количестве биологических тестов. Однако узким местом стала подпитка скрининговых роботов новыми химическими соединениями, так как ресурсы существующих библиотек химических соединений оказались исчерпанными. Эта проблема была решена в результате развития комбинаторной химии [86,91,94,104,151,176,196], разнообразные методы которой позволяют за короткое время из небольших наборов исходных реагентов - химических «строительных блоков» - создавать большие массивы новых химических соединений, так называемые комбинаторные библиотеки. Методы высокопроизводительного скрининга и комбинаторной химии привели к резкому увеличению числа синтезируемых и тестируемых на биологическую активность соединений (на несколько порядков), однако ожидаемого существенного роста числа выявляемых кандидатов в лекарства не произошло, так как, во-первых, несмотря на огромную мощность, высокопроизводительный скрининг позволяет исследовать лишь незначительную долю возможного химического пространства, которое оценивается как 1060 соединений (по другим оценкам эта ве-личина может достигать 10 [150]), во-вторых, метод высокопроизводительного скрининга по сути своей иррационален. Случайность играет в данном методе значительную роль, несмотря на все возможные способы увеличить шансы обнаружения полезных с терапевтической точки зрения соединений. В условиях, когда нет данных как о строении возможной биомишени, так и о структуре активных соединений, без экспериментального скрининга не обойтись. Следует, однако, сказать, что стоимость оборудования для тестирования такого рода составляет миллионы долларов. Отмечалось [24], что в нашей стране нет ни одной установки для массового тестирования соединений методами робототехники.

В настоящее время все большее значение приобретают компьютерные методы, рационализирующие поиск новых биологически активных веществ путем: 1) компьютерного моделирования взаимодействий макромо-лекулярных мишеней с низкомолекулярными лигандами (виртуальный скрининг) [67,68,79,84,100,120,125,133,162,197,200,202]; 2) анализа взаимосвязей между молекулярной структурой и биологической активностью химических соединений [57,58,60,110,111]. Привлекательность виртуального скрининга заключается в том, что не требуются сами вещества, и исследования могут проводиться с использованием виртуальных библиотек химических соединений. Развитие виртуального скрининга стимулировали успехи в расшифровке генома человека [95,121,130,194] и становление новой области науки - биоинформатики, являющейся базовой дисциплиной для идентификации макромолекулярных мишеней, определения их пространственной структуры и функции [6,25,142].

В зависимости от характера имеющейся информации возможны различные способы реализации виртуального скрининга. Если определена трехмерная структура активного центра макромолекулы-мишени, то применяют прямые методы поиска или конструирования потенциального лиган-да, соответствующего данному активному центру как ключ замку. Этот подход, известный ранее как конструирование лекарств, основанное на структуре (structure-based drug design) [132,144,154], и использующий достаточно сложные и трудоемкие процедуры молекулярного докинга, трансформировался в виртуальный высокопроизводительный скрининг [120], позволяющий за счет введения ряда приближений и упрощения вычислительных процедур (быстрый докинг) проводить поиск новых лиган 17 дов путем скрининга молекулярных баз данных, содержащих тысячи соединений [74]. Более производителен виртуальный скрининг, использующий модель фармакофора, построенную на основе известной трехмерной структуры активного центра рассматриваемого рецептора, что дает возможность сканировать большие библиотеки соединений с ЗБ-структурами с целью поиска молекул, содержащих данный фармакофор [161,181]. Другой обещающий подход - автоматическая генерация новых базовых структур {de novo design) посредством размещения и связывания атомов или фрагментов в известной 3-мерной структуре связывающего сайта рецептора с целью найти гипотетические молекулярные структуры с высоким сродством к рецептору [180]. Наиболее сложной проблемой в вычислительном конструировании потенциальных лигандов является оценка энергии связывания комплексов лиганд-рецептор [64]. Точный расчет свободной энергии связывания лиганд-рецепторных комплексов методами статистической механики или квантовой химии в настоящее время невозможен. Энергия связывания, как правило, аппроксимируется с помощью так назывемых оценочных функций (scoring functions) [183]. Сообщалось [119,124], что к настоящему времени на клинические испытания было передано в совокупности около 50 соединений, выявленных в результате молекулярного моделирования взаимодействий низкомолекулярных соединений с макромолекулярными биомишенями, структура и функция которых были известны. Немалая часть этих кандидатов в лекарства успешно прошла клинические испытания, одобрена компетентными органами и выпущена на рынок. Вот некоторые из этих соединений, ставшие лекарствами: капотен (каптоприл) - гипотензивное средство; дорзоламид - против глаукомы; вирасепт (нелфинавир), ампренавир, алувиран - против ВИЧ-инфекции. Необходимо подчеркнуть, что сейчас все ведущие зарубежные фармацевтические компании содержат в штате группы специалистов по компьютерной химии и структурной биологии, активно участвующие в разработке новых лекарств. К сожалению, описанные методы молекулярного моделирования являются составной частью дорогостоящих коммерческих программных комплексов, практически недоступных в России.

Математические методы, использованные для анализа связи структура-гепатозащитная активность

Линейный дискриминантный анализ (ЛДА) используется в классификационных задачах. Целью дискриминантного анализа является определение комбинации параметров, в пространстве которых группы соединений с заданными уровнями (или видами) активности разделяются наилучшим образом. Отнесение соединения в одну из групп выполняется по оценке каждой вычисленной функции для данного соединения и нахождения группы, для которой это значение будет наибольшим. Для проверки гипотезы о реальном различии групп по активности в использованном пространстве т дескрипторов рассчитывали обобщенную D2 -статистику Махаланобиса. которая может быть использована как хи-квадрат с m(g-l) степенями свободы.

Поскольку число молекулярных дескрипторов, как правило, заметно превышало число соединений в обучающей выборке, использовали пошаговую процедуру. На первом шаге в программу пошагового дискриминантного анализа вводили один из наиболее значимых по D2 -статистике дескрипторов, а на каждом последующем шаге к уже имеющимся дескрипторам добавляли тот из оставшихся, который в совокупности с уже введенными дескрипторами с наименьшей ошибкой классифицировал обучающую выборку. В случае, когда несколько дескрипторов из числа оставшихся с одинаковой минимальной ошибкой классифицировали обучающую выборку, выбирали дескриптор, дающий в совокупности с уже введенными дескрипторами наибольшее значение /У-статистики. Так как результат пошагового дискриминантного анализа зависит от того, с какого дескриптора начинается пошаговая процедура, для каждого из исследуемых массивов получали несколько иерархических последовательностей дескрипторов. Для окончательного отбора наилучшей комбинации дескрипторов, обеспечивающей максимально возможную на данном множестве молекулярных дескрипторов предсказательную способность при минимальном числе дескрипторов, использовали метод скользящего контроля (скользящего экзамена). Этот метод заключается в том, что одно из соединений исключается из обучающей выборки и используется для классификации с помощью дискриминантных функций, вычисленных по оставшимся в выборке соединениям. Затем это соединение включают в обучающую выборку, а для контроля используют другое исключенное соединение и т.д. до тех пор, пока не будут по очереди исключены и классифицированы все соединения в обучающей выборке. Для оценки предсказательных возможностей полученных дискриминантных функций использовали также процедуру многократного исключения части соединений (до 20%) из обучающей выборки (cross-validation) с последующим тестированием их с помощью дискриминантных функций, вычисленных по оставшимся в выборке соединениям. Результаты прогноза усредняли по всем вариантам. В некоторых случаях предсказательную способность дискриминантных функций оценивали с помощью контрольной выборки, содержащей соединения, не участвовавшие в процедуре отбора наилучщих комбинаций дескрипторов.

Классификация по К ближайшим соседям (КБС). Метод К ближайших соседей является стандартным методом теории распознавания образов, сочетающим простоту и высокую эффективность [20,193]. В этом методе классификация нового объекта (соединения) производится по большинст 40 ву голосов К ближайших соседей в обучающей выборке в «-мерном пространстве. Новый объект относят к тому классу, к которому принадлежит большинство его ближайших соседей. В качестве меры близости обычно используют расстояние в «-мерном эвклидовом пространстве. Возможно использование и любых других метрик. Число ближайших соседей должно быть нечетным. Метод КБС имеет преимущество перед линейными классификаторами в том, что, во-первых, является многоклассовым классификатором, во-вторых, его выполнение не зависит от характера распределения данных, в-третьих, нет необходимости в обучении, так как процедура классификации включает все объекты исходной выборки. В наших исследованиях использовали самый простой вариант метода КБС с К=\.

Поскольку используемые молекулярные дескрипторы могут по величине отличаться на несколько порядков, большие по величине дескрипторы при расчете эвклидового расстояния в «-мерном дескрипторном пространстве могут подавлять малые дескрипторы. Для устранения этого эффекта при использовании метода КБС применяли стандартизованные дескрипторы Х І/. Х у = (Xjj-XicpJ/Sj , где Xtj - исходное значение /-го дескриптора для 7-го соединения, Xicp - среднее значение /-го дескриптора в обучающей выборке, Si - стандартное отклонение /-го дескриптора в обучающей выборке.

В нашем случае зависимая переменная — некоторая мера физиологической активности, независимые переменные — параметры описания молекулярной структуры. Задача линейного регрессионного анализа заключается в построении такого уравнения регрессии, которое минимизирует сумму квадратов отклонений экспериментальных значений физиологической активности, выраженных в тех или иных единицах, от вычисленных по рассматриваемому уравнению. Оценка параметров регрессии Ь{ производится по обучающей выборке методом наименьших квадратов (МНК).

Мерой линейной зависимости служит множественный коэффициент корреляции R (О R 1). Квадрат множественного коэффициента корреляции, называемый коэффициентом детерминации, представляет собой долю дисперсии зависимой переменной, «объясненную» регрессией, т.е. является мерой качества подгонки. Значимость регрессионного уравнения оценивают с помощью F-статистики (критерия Фишера), равной отношению среднего квадрата, относящегося к регрессии, к среднему квадрату отклонений от регрессии. Если величина F превосходит некоторое критическое значение, соответствующее принятому уровню значимости, делают вывод, что полученное уравнение регрессии адекватно описывает экспериментальные данные по физиологической активности на данном уровне значимости. Характеристикой качества подгонки является также стандартная ошибка оценки S, равная корню квадратному из среднего квадрата отклонений от регрессии.

Применение топологических дескрипторов

На начальном этапе исследований связи структура-детоксицирующая активность для адамантанов использовали достаточно простые параметры описания молекулярной структуры соединений - топологические дескрипторы, широко применяемые в исследованиях такого рода. Для каждой молекулы обучающей выборки были рассчитаны значения 85 интегральных топологических дескрипторов (индексы Винера, Балабана, индексы молекулярной связности различных порядков, теоретико-информационные индексы, индексы молекулярной формы и др.), описывающих молекулу в целом, и значения локальных топологических дескрипторов для каждого из атомов, входящих в молекулу (электротопологические состояния вершин молекулярного графа, дистанционные сложности вершин и другие подобные индексы, вычисленные с использованием известного уравнения Шеннона из теории информации). В исходную матрицу данных, содержащую 218 дескрипторов, кроме интегральных (85 дескрипторов) были включены локальные дескрипторы для атомов углерода, составляющих адамантановый каркас (70 дескрипторов), и некоторые локальные дескрипторы, характеризующие всю молекулу или ее часть (минимальные и максимальные значения, а также суммы значений данного локального дескриптора на атомах адамантанового каркаса, заместителя и во всей молекуле )-63 дескриптора. Для определения классификационных правил использовали линейный дискриминантный анализ (ЛДА) и метод к ближайших соседей (к = 1). Среди использованных топологических дескрипторов оказался лишь один, для которого различие между средними значениями в активной и неактивной группах на основе величины -статистики Махаланобиса статистически значимо с доверительной вероятностью Р = 0,95. Этот дескриптор wuncfmax представляет собой максимальное значение нормированной на максимальное расстояние дистанционной сложности вершины графа (см. раздел 2.2) для взвешенных расстояний среди вершин, не входящих в адамантановый каркас. Методом ЛДА с использованием пошаговых процедур и скользящего контроля отобраны комбинации дескрипторов и вычислены соответствующие линейные дискриминантные функции, предсказательная способность которых в отношении детоксицирующего действия производных адамантана, оцененная с помощью скользящего контроля, составляет в среднем около 80%. Эти комбинации дескрипторов приведены в таблице 3.2

. Подстрочные индексы "raw" и "гаах" в обозначениях дескрипторов (см. раздел 2.7) означают минимальное и максимальное значения соответствующего дескриптора для вершин всей молекулы (надстрочный индекс "/"), адамантанового каркаса (надстрочный индекс "я"), заместителей (надстрочный индекс V). Надстрочный индекс "и " указывает на то, что при вычислении дескриптора использовали матрицу взвешенных расстояний. Как видно из таблицы 3.2, наилучшие комбинации состоят преимущественно из локальных дескрипторов, а первая комбинация содержит только локальные дескрипторы, что может быть важно для определения механизма действия адамантанов.

Далее эти комбинации дескрипторов были подвергнуты более жесткой проверке. Из начальной обучающей выборки с помощью генератора случайных чисел были исключены 5 соединений, которые использовались для прогноза гепатопротекторнои детоксицирующеи активности на основе дискриминантных функций, полученных при анализе оставшихся 25 соединений. Было рассмотрено 10 вариантов исключения по 5 соединений из начальной обучающей выборки. В таблице 3.2 приведены усредненные по всем 10 вариантам результаты прогноза. Оцененная таким способом предсказательная способность отобранных комбинаций молекулярных дескрипторов несколько хуже, чем при использовании метода скользящего контроля, и, возможно, в большей степени отражает реальное положение дел, хотя для комбинации дескрипторов №3 результаты оценки обоими способами очень близки. Таблица 3.2. Наилучшие комбинации топологических дескрипторов для прогнозирования гепатопротекторного детоксицирующего действия производных адамантана. № Комбинации дескрипторов Предсказательная способность ДФ (%) по методу скользящего контроля Предсказательная способность ДФ (%) методом многократного исключения части соединений из обучающей выборки

Поскольку большинство соединений рассматриваемого ряда содержат заместители, обладающие значительной конформационной гибкостью, для расчета ЗО-дескрипторов по программе DRAGON использовали молекулярные структуры, геометрия которых была предварительно полностью оптимизирована методом ССП МО ЛКАО в валентном приближении AMI.

Были отдельно исследованы следующие матрицы данных: автокорреляционные топологические дескрипторы (М = 80), подструктурные дескрипторы 1-го типа ( М =35), подструктурные дескрипторы 2-го типа (М =22 ), объединенные подструктурные дескрипторы (М = 55), объединенные 2D-дескрипторы (М = 137), геометрические дескрипторы (М = 36), WHIM-дескрипторы (М = 99), GETAWAY-дескрипторы (М = 196), наилучшие объединенные ЗО-дескрипторы (М = 286), наилучшие объединенные 2D- и 3D-дескрипторы (М = 134). Для определения классификационных правил, как и ранее, использовали линейный дискриминантный анализ (ЛДА). Среди рассмотренных дескрипторов указанных типов выявлены только два дескриптора подструктурного типа, для которых различие между средними значениями в активной и неактивной группах на основе величины D2 -статистики Махаланобиса статистически значимо с доверительной вероятностью Р= 0,95. Это подструктурный дескриптор 1-го типа С- 025 (число фрагментов R- -CR- -R, где R - любая группа, связанная через атом С, - - означает ароматическую связь) и подструктурный дескриптор 2-го типа НАсс (число протоноакцепторных атомов для образования водородных связей (N, О, F)). Среди дескрипторов других типов таковых не оказалось. Здесь и далее используемые обозначения дескрипторов соответствуют обозначениям, принятым в программе DRAGON. Методом ЛДА с использованием пошаговых процедур и скользящего контроля для каждой из вышеуказанных матриц данных отобраны наилучшие комбинации дескрипторов и вычислены соответствующие линейные дискриминантные функции. Эти комбинации дескрипторов и их предсказательная способность в отношении детоксицирующего действия производных адамантана, оцененная с помощью скользящего контроля, приведены в таблице 3.3. Там же приведены оценки предсказательной способности указанных комбинаций дескрипторов, полученные выбрасыванием из обучающей выборки части соединений, как это описано выше. Оцененная таким способом предсказательная способность отобранных комбинаций дескрипторов несколько меньше, чем при использовании метода скользящего контроля; а для подструктурных и автокорреляционных дескрипторов даже немного больше. В таблице 3.4 дано описание дескрипторов, вошедших в наилучшие комбинации. Строчные буквы в обозначениях WHIM- и GETAWAY-дескрипторов указывают тип взвешивания при расчете этих дескрипторов: и - отсутствие взвешивания, т -атомная масса, v - вандерваальсовский объем, е - электроотрицательность, р - поляризуемость, s - электротопологическое состояние атома.

Применение подструктурных дескрипторов

В предыдущей главе при исследовании гепатопротекторной детоксицирующей активности производных адамантана было показано, что наиболее эффективны для классификации этих соединений по активности дис-криминантные функции, построенные на подструктурных дескрипторах. Это послужило основанием выбора подструктурных дескрипторов на начальном этапе исследования гепатопротекторной активности производных индола.

С использованием пошаговых процедур и метода скользящего контроля для каждого типа дескрипторов отобраны наилучшие комбинации, дающие наименьшую ошибку при реклассификации обучающей выборки (табл. 4.2), и вычислены соответствующие линейные дискриминантные функции. Физический смысл отобранных дескрипторов представлен в табл. 4.3. Коэффициенты парной корреляции между дескрипторами, входящими в наилучшие комбинации, не превышают 0,6 для дескрипторов 1-го типа и 0,5 для дескрипторов 2-го типа.

Предсказательная способность полученных ЛДФ в отношении детокси-цирующего действия производных индола была оценена методом много 68 кратного исключения части соединений из обучающей выборки и использования их в качестве контрольных с помощью ЛДФ, вычисленных Таблица 4.2 Наилучшие комбинации подструктурных дескрипторов для прогнозирования методом ЛДА гепатопротекторного детоксицирующего действия производных индола.

Было рассмотрено 10 вариантов исключения из начальной обучающей выборки по 6 соединений. В табл. 4.2 приведены усредненные по всем 10 вариантам результаты прогноза. Оцененная таким способом предсказательная способность ЛДФ в отношении детоксицирующего действия производных индола для представленных в табл. 4.2 комбинаций дескрипторов достаточно высока и составляет в среднем 85%. В табл. 4.4 представлены результаты классификации на основе полученных ЛДФ соединений контрольной выборки, которые не были использованы Таблица 4.3. Физический смысл подструктурных дескрипторов из наилучших комбинаций. [18].

В табл. 4.5 представлены результаты классификации рассматриваемых соединений методом КБС. Максимальное распознавание обучающей выборки составляет 90% для подструктурных дескрипторов 1-го типа и 93,3% для дескрипторов 2-го типа и достигается для комбинаций, содержащих 3-5 дескрипторов. Последующее пошаговое добавление к этим комбинациям других дескрипторов не изменяет или ухудшает результат классификации соединений обучающей выборки. Отобранные комбинации дескрипторов достаточно хорошо предсказывают активность соединений контрольной группы, не использовавшихся при поиске наилучших комбинаций. Как можно видеть из таблиц 4.2 и 4.5, наилучшие комбинации, полученные двумя различными методами, содержат мало отличаю 72 щиеся наборы дескрипторов, что дополнительно подтверждает важную роль структурных элементов, представленных этими дескрипторами, в проявлении гепатозащитного действия. Таблица 4.5 . Наилучшие комбинации подструктурных дескрипторов для классификации производных индола методом КБС № Комбинации дескрипторов Реклассификация обучающей выборки (%) Прогноз контрольной выборки (%).

Аналогичными способами была исследована информативность молекулярных ЗО-дескрипторов при распознавании гепатопротекторной деток-сицирующей активности производных индола. Перед вычислением 3D-дескрипторов (геометрических, WHIM, GETAWAY) по программе DRAGON пространственная молекулярная структура производных индола, как и в случае производных адамантана, была полностью оптимизирована полуэмпирическим квантовохимическим методом AMI. Найдено, что в данном случае, в отличие от исследованных ранее производных адамантана, для каждого из трех указанных типов 3D-дескрипторов существует значительное число дескрипторов, для которых различие между средними значениями в активной и неактивной группах статистически значимо на основе величины D2 -статистики Махаланобиса. Среди геометрических дескрипторов по этому критерию статистически значимы 8 дескрипторов (26%), среди WHIM - 16 дескрипторов (16%), среди GETAWAY - 97 дескрипторов (49,5%). Однако информативность отдельно взятых статистически значимых ЗБ-дескрипторов недостаточна для надежного прогнозирования активности новых соединений. Кроме того, многие из значимых дескрипторов достаточно сильно коррелируют между собой. Поэтому методом пошагового дискриминантного анализа для каждого из этих типов ЗЭ-дескрипторов получено соответствующее количество иерархических последовательностей, начинающихся со статистически значимых для дискриминации дескрипторов. Найденные с помощью пошаговой процедуры иерархические последовательности, алгоритм получения которых был ориентирован на максимальное распознавание обучающей выборки, содержали также немалую долю дескрипторов, которые сами по себе были статистически незначимы, но в совокупности со статистически значимыми дескрипторами приводили к максимальному распознаванию обучающей выборки. Наилучшие комбинации 3D-дескрипторов с максимальной предсказательной способностью гепатопро-текторной детоксицирующей активности были отобраны с помощью метода скользящего контроля, многократного исключения части соединений из обучающей выборки с усреднением результатов и экзамена на контрольной выборке. Полученные результаты представлены в таблицах 4.6-4.8

Похожие диссертации на Исследование взаимосвязей между молекулярной структурой и гепатозащитной активностью химических соединений