Электронная библиотека диссертаций и авторефератов России
dslib.net
Библиотека диссертаций
Навигация
Каталог диссертаций России
Англоязычные диссертации
Диссертации бесплатно
Предстоящие защиты
Рецензии на автореферат
Отчисления авторам
Мой кабинет
Заказы: забрать, оплатить
Мой личный счет
Мой профиль
Мой авторский профиль
Подписки на рассылки



расширенный поиск

Информационная технология прогноза формакологической активности химических соединений Васильев, Павел Михайлович

Информационная технология прогноза формакологической активности химических соединений
<
Информационная технология прогноза формакологической активности химических соединений Информационная технология прогноза формакологической активности химических соединений Информационная технология прогноза формакологической активности химических соединений Информационная технология прогноза формакологической активности химических соединений Информационная технология прогноза формакологической активности химических соединений Информационная технология прогноза формакологической активности химических соединений Информационная технология прогноза формакологической активности химических соединений Информационная технология прогноза формакологической активности химических соединений Информационная технология прогноза формакологической активности химических соединений Информационная технология прогноза формакологической активности химических соединений Информационная технология прогноза формакологической активности химических соединений Информационная технология прогноза формакологической активности химических соединений
>

Диссертация - 480 руб., доставка 10 минут, круглосуточно, без выходных и праздников

Автореферат - бесплатно, доставка 10 минут, круглосуточно, без выходных и праздников

Васильев, Павел Михайлович. Информационная технология прогноза формакологической активности химических соединений : диссертация ... доктора биологических наук : 14.00.25 / Васильев Павел Михайлович; [Место защиты: ГОУВПО "Волгоградский государственный медицинский университет"].- Волгоград, 2009.- 445 с.: ил.

Содержание к диссертации

Введение

Глава 1. Компьютерные технологии в поиске фармакологически активных веществ (обзор литературы) 17

1.1. Развитие методов скрининга биологически активных соединений 17

1.2. Проблемы поиска новых лекарственных веществ 21

1.3. Методы в поиске новых фармакологически активных соединений 23

1.4. Российские системы поиска биологически активных веществ 39

1.5. Недостатки систем поиска биологически активных соединений 42

Глава 2. Материалы и методы исследований 46

2.1. Банки данных по структуре и фармакологической активности известных лекарственных и биологически активных веществ 47

2.2. Банк данных по структуре канцерогенных соединений 61

2.3. Новые химические соединения 63

2.4. Методы экспериментального изучения фармакологической активности 68

2.5. Банки данных по структуре и фармакологической активности новых химических соединений 85

Глава 3. Теоретические основы, методы и программы информационной технологии компьютерного прогноза фармакологической активности химических соединений «Микрокосм» 95

3.1. Теоретические концепции 96

3.2. Язык С)Ь фрагментарного кодирования структуры химических соединений 112

3.3. Методы и стратегии прогноза 121

3.4. Фармакофоры-образы 140

3.5. Программный комплекс 142

3.6. Заключение 146

Глава 4. Прогноз фармакологической активности синтетических органических соединений 148

4.1. Прогноз и экспериментальная проверка вида фармакологической активности структурно-разнородных соединений 149

4.2. Прогноз и экспериментальная проверка уровня фармакологической активности структурно-разнородных соединений 166

4.3. Прогноз и экспериментальная проверка вида фармакологической активности структурно-сходных соединений 173

4.4. Прогноз и экспериментальная проверка уровня фармакологической активности структурно-сходных соединений 207

4.5. Заключение 268

Глава 5. Прогноз фармакологической активности и исследование свойств сложных молекулярных систем 270

5.1. Прогноз и экспериментальная проверка фармакологической активности солей органических соединений 271

5.2. Прогноз и экспериментальная проверка фармакологической активности молекулярных комплексов 278

5.3. Прогноз и экспериментальная проверка фармакологической активности смесей природных биологически активных веществ 285

5.4. Построение моделей сайтов связывания рецепторов и исследование механизмов действия 294

5.5. Заключение 304

Глава 6. Прогноз токсических свойств химических соединений 307

6.1. Прогноз и экспериментальная проверка острой токсичности новых азотсодержащих гетероциклических соединений 307

6.2. Прогноз и экспериментальная проверка канцерогенной опасности производных сульфенамида 312

6.3. Заключение 318

Глава 7. Обсуждение результатов 319

Выводы 355

Литература 362

Приложение (с оглавлением) 429

Приложение на CD-ROM

Введение к работе

Актуальность проблемы. Фундаментальная проблема соотношения биологической активности и структуры химических соединений и поиск на этой основе новых высокоактивных лекарственных веществ имеет принципиальное значение для современной фармакологии. На 01 марта 2008 г. получено свыше 34 млн. химических соединений [CAS, 2008], выявлено более 5,6 тыс. видов рецепторов и ионных каналов [IUPHAR, 2008; EMBL-EBI, 2008] и почти 4,7 тыс. видов ферментов [IUBMB, 2008], а число видов биологической активности превысило 7,5 тыс. [Poroikov V. V. et al., 2005; Лагунин А. А., 2001]. Для поиска фармакологически активных веществ используются разные подходы, например, нейрохимические [Закусов В. В., 1973; Вальдман А. В. и др., 1987; Петров В. И. и др., 1997, 2001, 2003; Воронина Т. А., Середенин С. Б., 1998, 2002], биофизические [Пирузян Л. А., Ландау М. А., 1998], методы протеомики [Archakov A. I. et al., 2003], классический QSAR [Кабанкин А. С., 2004], математическое моделирование физиологических процессов [Ataullakhanov F. I. et al., 2005]. Выявление одного перспективного лекарственного вещества требует изучения не менее 10 тыс. соединений [Kubinyi H., 2001], разработка нового лекарства длится 12 - 15 лет, а затраты на это составляют от 500 млн. до 1,9 млрд. долл. [Chemoinformatics, 2003; Кубиньи Г., 2006]. Поэтому в настоящее время начальным этапом поиска фармакологически активных веществ, как правило, является использование доэкспериментальных методов in silico, предваряющих экспериментальные исследования in vitro и in vivo. Для этих целей разработаны специализированные информационные технологии и на их основе созданы интегрированные системы и программные среды [SYBYL, 2008; Discovery Studio, 2008; Flex* Software Library, 2008; Poroikov V. et al., 2005; Palyulin V. A. et al., 2000]. Российской академией наук на период с 2007 по 2011 гг. утверждены как приоритетные следующие направления фундаментальных исследований: математические модели в биологии, биоинформатика; химические проблемы создания фармакологически активных веществ нового поколения; в информационных технологиях – системный анализ, системы распознавания образов, принятие решений при многих критериях [Распоряжение Президиума РАН …, 2007]. Российская академия медицинских наук определила в качестве одного из перспективных направлений развития медицинской науки на период до 2025 г. разработку на основе технологий биоинформатики и компьютерного конструирования лекарств методов оценки безопасности и эффективности лекарственных препаратов [Прогноз развития медицинской науки …, 2008].

Таким образом, разработка и внедрение информационных технологий прогноза фармакологической активности химических соединений и компьютерного поиска новых лекарственных веществ является перспективным приоритетным направлением современной науки и имеет высокую степень актуальности.

Диссертационная работа выполнена в рамках Федеральной целевой научно-технической программы «Исследования и разработки по приоритетным направлениям развития науки и техники гражданского назначения» (№ государственной регистрации 01200116045). Тема утверждена на заседании Ученого Совета ВолГМУ (протокол № 7 от 09 марта 2005 г.) и включена в план НИР.

Цель исследования. Создание информационной технологии компьютерного прогноза фармакологической активности химических соединений на основе комплексного подхода к прогнозу; использование этой технологии для направленного поиска веществ с высокой фармакологической активностью, прогноза их взаимодействия с сайтами связывания биомишеней и оценки их токсических эффектов.

Основные задачи исследования.

  1. Разработать теоретические основы новой информационной технологии – комплексную методологию компьютерного прогноза фармакологической активности химических соединений.

  2. В рамках комплексного подхода создать специализированный язык описания структуры химических соединений; разработать на основе теории распознавания образов и теории принятия решений математические методы, стратегии и алгоритмы прогноза; создать комплекс компьютерных программ для прогноза биологической активности химических соединений.

  3. Сформировать банки и базы данных: а) по структуре и различным видам активности известных лекарственных и биологически активных веществ; б) по структуре, фармакологической активности и острой токсичности новых производных конденсированных азотсодержащих гетероциклов, адамантана, ГАМК и пирролидона; в) по структуре и канцерогенной опасности известных химических соединений.

  4. Исследовать применение новой информационной технологии для прогноза наличия/отсутствия и уровня рецепторного, пострецепторного, мембранного и иных видов фармакологической активности структурно-разнородных и структурно-сходных соединений разных химических классов, взаимодействующих с различными типами биомишеней, а также солей, молекулярных комплексов и смесей индивидуальных веществ – с экспериментальной проверкой результатов прогноза.

  5. Исследовать применение новой информационной технологии для анализа механизмов взаимодействия лигандов с сайтами связывания биомишеней и построения моделей этих сайтов.

  6. Исследовать применение новой информационной технологии для прогноза наличия/отсутствия и уровня токсических эффектов соединений разной химической природы, с экспериментальной проверкой результатов прогноза.

  7. Провести с использованием новой информационной технологии направленный поиск новых высокоактивных веществ по актуальным видам фармакологической активности среди неиспытанных соединений.

Научная новизна.

Cформировано научное направление в решении фундаментальной проблемы соотношения химической структуры и биологической активности на основе комплексного подхода к прогнозу фармакологической активности химических соединений. Впервые создана принципиально отличающаяся от существующих QSAR-подходов новая комплексная методология прогноза, основанная на совместном использовании различных по физико-химическому смыслу способах описания химической структуры, различных по сложности уровней этого описания и расширяющейся по параметрам избыточности такого описания; разных по математическому содержанию методов классификации; концептуальных по результату схем принятия решений. Разработаны основные теоретические концепции новой методологии.

Созданное научное направление расширяет представления о взаимодействии биологически активных веществ с живыми системами и открывает дополнительные возможности построения новых концепций, моделей и подходов, которые могут быть использованы для решения задач, связанных с проблемой «структура – активность». Комплексный подход к прогнозу и составляющие его теоретические концепции являются методологической основой для создания новых методов, компьютерных систем и информационных технологий прогноза биологической активности химических соединений.

Впервые создана новая информационная технология компьютерного прогноза фармакологической активности химических соединений (ИТ «Микрокосм»), основанная на комплексном подходе к прогнозу. Создан новый специализированный мультидескрипторный иерархический многоуровневый язык описания химической структуры QL. На основе теории распознавания образов разработаны четыре метода прогноза в коррелированных пространствах сверхбольшой размерности. На основе теории принятия решений созданы три стратегии прогноза – способы формирования интегральных решающих правил по спектру промежуточных прогнозных оценок. Разработаны соответствующие алгоритмы, создан специализированный программный комплекс.

С применением новой информационной технологии выполнен эффективный прогноз наличия и уровня различных видов фармакологической активности структурно-разнородных и структурно-сходных соединений разных химических классов.

Доказана возможность эффективного использования ИТ «Микрокосм» для прогноза наличия и уровня различных видов фармакологической активности простых и сложных солей и молекулярных комплексов структурно-разнородных и структурно-сходных химических соединений.

Впервые с помощью новой информационной технологии выполнен прогноз фармакологической активности смесей индивидуальных веществ, с учетом синергизма компонентов.

На основе 2D-фармакофоров-образов в ИТ «Микрокосм» выполнен анализ механизмов взаимодействия лигандов с сайтами связывания H1-, H2- и H3-гистаминовых рецепторов и построены их содержательные модели.

Доказана эффективность использования разработанной информационной технологии для прогноза острой токсичности и канцерогенной опасности соединений различных химических классов.

Научно-практическая значимость.

Созданная информационная технология используется: а) для направленного поиска новых высокоактивных веществ среди рассмотренных классов соединений по изученным видам фармакологической активности; б) для планирования синтеза новых высокоактивных веществ путем прогноза уровня заданного вида фармакологической активности предполагаемых к синтезу соединений; в) для оптимизации поиска высокоактивных соединений других химических классов и прогноза иных видов фармакологической активности, помимо рассмотренных в настоящем исследовании; г) для исключения соединений, обладающих нежелательными токсическими эффектами.

Технология позволяет оптимизировать вид солеобразующих остатков в органических солях, число и химическую структуру образующих молекулярные комплексы соединений, количественный состав смесей и химическую структуру входящих в них индивидуальных веществ – с целью достижения максимального уровня изучаемой фармакологической активности; она может быть применена для создания с использованием явления синергизма высокоэффективных и низкотоксичных многокомпонентных лекарственных средств.

ИТ «Микрокосм» позволяет проводить на основе языка QL анализ фармакофоров испытанных соединений и использовать выявленные признаки высокой активности для модификации структуры веществ-лидеров с целью повышения их активности, а также для выработки мотивированных заключений о возможных механизмах действия изучаемых соединений и построения моделей сайтов связывания взаимодействующих с этими соединениями биомишеней.

Созданы банки и базы данных: а) по структуре и 33 видам активности 10,3 тыс. известных лекарственных и биологически активных веществ; б) впервые по структуре и уровню 33 видов фармакологической активности и острой токсичности новых химических соединений – 1312 производных конденсированных азотсодержащих гетероциклов, 123 производных адамантана, 52 производных ГАМК и пирролидона; в) по структуре и канцерогенной опасности 492 известных соединений.

Впервые с помощью новой информационной технологии проведен эффективный направленный поиск новых высокоактивных соединений: среди производных азотсодержащих гетероциклов найдено 48 веществ с высокой антиагрегантной активностью, 35 веществ с высокой антиаритмической активностью, 24 вещества с высокой антиоксидантной активностью, 23 вещества с высокой гемореологической активностью, 18 веществ с высокой P2Y1-антипуринергической активностью, 22 вещества с высокой -опиоидной агонистической активностью, 2 вещества с высокой 5-HT3-антисеротониновой активностью; среди производных адамантана найдено 3 вещества с потенциально высокой антиортовирусной активностью, 3 вещества с ноотропной активностью и 1 вещество с высокой антиоксидантной активностью; среди производных ГАМК и пирролидона найдено 3 вещества с высокой противоишемической активностью. Применение новой информационной технологии в направленном поиске новых высокоактивных веществ позволяет существенно, в несколько раз, сократить временные, финансовые и материальные затраты на поиск таких соединений. Тридцать наиболее активных из найденных в результате компьютерного прогноза веществ рекомендованы для углубленного изучения.

Реализация результатов исследования. Разработанная информационная технология и полученные с ее помощью методические рекомендации используются: в направленном поиске и при планировании синтеза новых химических соединений с высокой фармакологической активностью на кафедре фармакологии ВолГМУ, в НИИ фармакологии ВолГМУ, в Волгоградском НЦ РАМН и АВО, Волгоградском государственном техническом университете, Волжском политехническом институте ВолгГТУ, Кубанском государственном медицинском университете, НИИ физической и органической химии Южного федерального университета; в научно-производственной деятельности ОАО «Волжский оргсинтез». Наиболее существенные результаты работы легли в основу элективного курса «Молекулярные аспекты создания лекарственных препаратов» кафедры фармакологии ВолГМУ, включены в лекционные курсы на кафедрах фармацевтической и токсикологической химии, фармакологии и биофармации ФУВ ВолГМУ, в учебно-методические материалы на кафедрах технологии органического и нефтехимического синтеза ВолгГТУ, химии и общей химической технологии ВПИ ВолгГТУ.

Основные положения, выносимые на защиту.

  1. Комплексный подход к прогнозу и составляющие его теоретические концепции являются методологической основой для разработки компьютерных систем прогноза биологической активности химических соединений. В рамках комплексной методологии создана ИТ «Микрокосм» – высокоэффективная информационная технология прогноза фармакологической активности химических соединений.

  2. Новая информационная технология позволяет с высокой точностью проводить прогноз наличия и уровня 33 видов фармакологической активности структурно-разнородных соединений и 30 видов фармакологической активности структурно-сходных соединений и осуществлять на этой основе эффективный направленный поиск высокоактивных веществ с заданным фармакологическим действием – в том числе, для солей и молекулярных комплексов этих соединений.

  3. Разработанная информационная технология успешно использована для прогноза наличия и уровня фармакологической активности смесей индивидуальных веществ, с учетом синергизма компонентов.

  4. На основе созданной информационной технологии проведен анализ механизмов взаимодействия лигандов с сайтами связывания H1-, H2- и H3-гистаминовых рецепторов и построены содержательные модели этих сайтов.

  5. С помощью новой информационной технологии с высокой достоверностью выполнена оценка канцерогенной опасности производных сульфенамидов и уровень острой токсичности производных конденсированных азотсодержащих гетероциклов.

  6. С применением новой информационной технологии среди производных конденсированных азотсодержащих гетероциклов, адамантана, ГАМК и пирролидона в эксперименте найдены 182 вещества с высоким уровнем следующих видов активности: -опиоидной агонистической, P2Y1-антипуринергической, 5-HT3-антисеротониновой, антиагрегантной, гемореологической, антиаритмической, антиоксидантной, антиортовирусной, ноотропной, противоишемической; из них 30 соединений рекомендованы для углубленных экспериментальных фармакологических исследований.

Апробация работы. В 2000 - 2009 гг. материалы диссертации докладывались и обсуждались на V традиционной научно-технической конференции стран СНГ «Процессы и оборудование экологических производств», Волгоград, 2000; 13-й Международной научной конференции «Математические методы в технике и технологиях», Ростов-Великий, 2000; 1-й Российской электронной конференции по биоинформатике, Москва, 2000; Международном экологическом конгрессе «Новое в экологии и безопасности жизнедеятельности», Санкт-Петербург, 2000; Международной научно-технической конференции «Современные информационные технологии», Пенза, 2000; Международной научно-практической конференции «Компьютерные технологии в науке, производстве, социальных и экономических процессах», Новочеркасск, 2000; Международной научно-практической конференции «Современная техника и технологии в медицине и биологии», Новочеркасск, 2001; Международной научно-практической конференции «Развивающиеся интеллектуальные системы автоматизированного проектирования и управление», Новочеркасск, 2001; Международной научной конференции «Химия и технология каркасных соединений», Волгоград, 2001; Первой Национальной конференции «Информационно-вычислительные технологии в решении фундаментальных научных проблем и прикладных задач химии, биологии, фармацевтики, медицины», Москва, 2002; Международных научно-технических конференциях «Информационные технологии в образовании, технике и медицине», Волгоград, 2000, 2004; I и II Российских школах-конференциях «Молекулярное моделирование в химии, биологии и медицине», Саратов, 2002, 2004; Третьей Всероссийской с международным участием школе-конференции по физиологии кровообращения, Москва, 2004; 16-th International Congress of Chemical and Process Engineering, Praha, 2004; 1-м Международном форуме «Актуальные проблемы современной науки», Самара, 2005; X и XI Международных научно-технических конференциях «Наукоемкие химические технологии», Волгоград, 2004, Самара, 2006; II и III Всероссийских конференциях с международным участием «Новые информационные технологии в медицине», Волгоград, 2006, 2008; 2-й, 3-й, 4-й, 5-й и 6-й Всероссийских конференциях «Молекулярное моделирование», Москва, 2001, 2003, 2005, 2007, 2009; Fourth International Symposium on Computational Methods in Toxocology and Pharmacology Integrating Internet Recources, Moscow, 2007; III Съезде фармакологов России «Фармакология – практическому здравоохранению», Санкт-Петербург, 2007; IX, XI, XIV, XV и XVI Российском Национальном конгрессе «Человек и лекарство», Москва, 2002, 2004, 2007, 2008, 2009.

Публикации. По теме диссертации опубликованы 152 печатные работы, в том числе 1 монография, 9 авторских свидетельств, 1 депонированная рукопись и 67 статей, из которых 15 статей в ведущих рецензируемых научных журналах, рекомендованных ВАК Минобрнауки РФ.

Объем и структура работы. Диссертация изложена на 428 страницах, иллюстрирована 84 таблицами и 56 рисунками, состоит из введения, обзора литературы (глава 1), экспериментальной части (главы 2 - 6), обсуждения результатов (глава 7), выводов, приложения и приложения на CD-ROM. Список литературы включает 218 отечественных и 404 зарубежных источника.

Методы в поиске новых фармакологически активных соединений

Проблема массовых испытаний химических соединений на различные виды фармакологической активности стала актуальной в 1940-х годах в связи с бурным развитием синтетической органической химии и установлением механизмов действия уже известных лекарственных веществ [Барлоу Р., 1959]. Первоначально в поиске новых биологически активных соединений преобладали так называемые «рациональные» подходы, основанные на модификации известных природных соединений, либо эндогенных регуляторов, таких, как нейромедиа- торы, гормоны, ферменты [Вальдман А. В., 1987; Ковалев Г. В. и др., 1989; Петров В. И. и др., 1997; Sneader W., 1996], а фармакологические эксперименты проводились на целых животных, системах организма или на изолированных органах [Закусов В. В., 1973; Гацура В. В., 1974; Харкевич Д. А., 1998; Середенин С. Б. и др., 1998]. Развитие фармакофорной концепции и выявление значительного числа фармакофоров привело к разработке методов направленного поиска соединений с высоким уровнем фармакологической активности [Pharmacophore Perception ..., 2000] и внедрением в практику методов in vitro с использованием ферментов [Bush К., 1983; Copeland R. А., 2005], изолированных рецепторов [Williams М., 1993; Сергеев П. В. и др., 1999; G Protein-Coupled Receptors ..., 2006] и клеточных культур [Hertzberg R. Р., 1993; Castel D. et al., 2006]. Резкий рост числа новых синтезированных или выделенных из природных источников веществ (с 1,75 млн. в 1961 г. до 2,7 млн. в 1969 г.) породил идею их «тотального» скрининга на все возможные виды биологической активности на основе иерархии экспериментальных тестов: физико-химических, биофизических, биохимических, клеточных, на изолированных органах, системах организма, на целых животных [Голендер В. Е. и др., 1978; Нижний С. В. и др., 1985; Баренбойм Г. М., Маленков А. Г., 1986]. Осознание того, что такие широкомасштабные экспериментальные исследования потребуют огромных затрат, привело в середине 1960-х годов к появлению доэкспериментальных вычислительных методов оценки биологической активности новых химических соединений [Hansch С. et al., 1964; Drug Design, 1971]. Развитие биоинформатики вызвало в 1980-х годах разработку методов высокопроизводительного скрининга [Highhroughput Screening ..., 2006], основанных на определении афинности к специфическим биомишеням веществ, полученных методами комбинаторной химии [Combinatorial Chemistry, 2000]. Современные системы скрининга характеризует отход от экспериментов на животных [Кубиньи Г., 2006] и широкое применение методов ш vitro (в том числе, на микропланшетах) с использованием ферментов, изолированных рецепторов, мембран, специфических клеточных культур, тромбоцитов, эритроцитов и т. п. [Handbook of Drug Screening, 2001]. Тем не менее, массовый экспериментальный скрининг до сих пор остается трудоемкой и дорогой процедурой. В связи с этим в настоящее время широкое распространение получил виртуальный скрининг in silico [Virtual Screening ..., 2005] с использованием методов QSAR и молекулярного моделирования [Computational Medicinal Chemistry ..., 2004; Gupta S. P., 2008], как правило, сопровождаемый направленным молекулярным дизайном высокоактивных структур [Schneider G. et al., 2008].

В отличие от экспериментов с использованием животных, в которых фармакологический эффект возникает из-за действия вещества одновременно на несколько мишеней, высокопроизводительный скрининг на основе изолированных биомишеней дает более точные данные, а рассчитанные на их основе QSAR- зависимости получаются более достоверными. На сегодня в биоинформагике выявлено 518 фармакологически релевантных белков-мишеней [Swindells M. В. et al., 2002], из которых для 324 известны действующие на них и производимые в мире 1204 лекарственных вещества [Overington J. P. et al., 2006]. Эти мишени составляют 75 подсемейств, объединенных в семь основных классов: G-протеин сопряженные рецепторы, ионные каналы, ядерные рецепторы, рецепторные ки- назы и протеазы, ферменты, транспортеры/транслокаторы, нуклеиновые кислоты. Многие биомишени состоят из нескольких субъединиц и имеют несколько сайтов с разными механизмами связывания. Многообразие биомишеней и развитые возможности комбинаторной химии определили широкое распространение методов высокопроизводительного скрининга с применением специальных микропланшетов двух типов: на основе очищенных белков-мишеней; с использованием культур клеток со встроенными клонированными генами генома человека, отвечающими за продуцирование конкретных биомишеней. Примерами HTS- систем первого типа являются технологии AlphaScreen, DELFIA и LANCE [PerkinElmer, 2008]; примерами HTS-систем второго типа — платформы R-SAT для скрининга веществ, действующих на ЦНС [ACADIA Pharmaceuticals, 2008] и клеточные рабочие станции JANUS и LumiLux [PerkinElmer, 2008]. Хотя современные HTS-комплексы способны обрабатывать до 60 тыс. проб в день, первым этапом всех систем высокоскоростного скрининга, как правило, является виртуальный скрининг in silico на основе методов QSAR.

Формирование QSAR как научного направления началось в 1962 г., когда впервые была установлена корреляционная зависимость ростостимулирующей активности производных феноксиуксусной кислоты от электронных и липо- фильных параметров ее заместителей [Hansch С. et al., 1962]. Развитие этого подхода привело к появлению классической парадигмы Хэнча, согласно которой биологическая активность химических соединений есть функция их электронных, стерических и липофильных параметров [Hansch С. et al., 1964, 1985]. В течение 10 лет эта концепция была преобладающей, а основным методом расчета QSAR-уравнений являлся множественный регрессионный анализ [Drug Design, 1971; Quantitative Structure-Activity ..., 1976]. В начале 1970-х годов появились подходы, основанные на методах ТРО [Авидон В. В. и др., 1974, 1978; Chu К. С. et al., 1975; Голендер В. Е. и др., 1978], в частности, использующие дискрими- нантный анализ [Franke R. et al., 1976; Ландау М. А., 1981; Nakache J. Р., 1981]. К этому же периоду относятся первые работы по расчету электронного и пространственного строения различных фармакофорных групп [Kier L. В., 1970; Molecular Orbital ..., 1970]. Нейросетевое моделирование в QSAR стало применяться с конца 1980-х годов [Zupan J. et al., 1991; Баскин И. И. и др., 1993, 1993-а]. Электронные, стерические и энергетические характеристики ЗО-моделей, построенных методами молекулярной механики и квантовой химии, использовались в

Банки данных по структуре и фармакологической активности известных лекарственных и биологически активных веществ

Являются логическим результатом объединения двух основных способов представления химической структуры. При использовании классических методов исследования зависимостей заранее неизвестно, какие именно параметры будут «значимыми» в будущей QSAR-модели. Поэтому в смешанных 20-системах при формировании первичного описания обучающей выборки обычно порождается как можно большее число структурных, топологических и физико-химических дескрипторов, как фрагментных, так и интегральных. Примерами могут служить расширенная версия системы MFTA [Радченко Е. В. и др., 2006; Палюлин В. А. и др., 2007; Palyulin V. A. et al., 2007], системы Cerius2 [Cerius2, 2008; Gasteiger J. et al., 1990; Cheng A. et al., 2003], TOPOSIM [Kearsley S. K. et al., 1996], Daylight [Daylight v4.94, 2008].

Ниже приводятся примеры использования смешанных 20-систем. С помощью расширенной системы PLS-MFTA выявлены QSAR-зависимости, связывающие ингибирующую в отношении обратной транскриптазы ВИЧ-1 активность производных тетрагидроимидазобензодиазепинона с их структурными и физико-химическими параметрами, точность прогноза составила 69 %; полученные закономерности использованы для направленного компьютерного конструирования новых высокоактивных соединений [Радченко Е. В. и др., 2006]. Система МОЕ совместно с множественной регрессией и основанном на ядрах SVM-методом была применена для оценки способности «лекарственно- подобных» соединений проникать через гематоэнцефалический барьер; общая точность прогноза SVM-модели составила 80 - 84 %, против точности прогноза 65 % для регрессионной зависимости [Kortagere S. et al., 2008]. Система Cerius2 совместно с методом PLS-дискриминатного анализа использована для прогноза наличия/отсутствия у 1 тыс. соединений гепатоспецифических канцерогенных свойств; общая точность прогноза составила 61 % [Beger R. D., 2004].

В общем можно утверждать, что 2В-системы являются одним из важнейших и широко используемых в настоящее время классов программ для поиска in silico фармакологически активных соединений.

Вопрос о том, какие 2Б-системы обладают наиболее мощной прогностической способностью, в настоящее время активно обсуждается. Большинство исследователей считает, что более эффективными являются подструктурные методы, поскольку физико-химические параметры рассчитываются по фраг- ментным схемам [Zefirov N. S. et al., 2002; Varnek A. et al., 2005; Fragment-Based Approaches 2006; Bartoli S. et al., 2006; Villar О. H. et al., 2007; Sutherland J. J. et al., 2008]. В частности, большинство использующих «отпечатки» систем виртуального скрининга основаны на 2Б-подструктурной фрагментации молекул [Оргеа Т. I. et al., 2004; Kellenberger Е. et al., 2004; Klon A. E. et al., 2007].

Сотрудниками фирмы Novartis [Gedeck P. et al., 2006] на 944 выборках по различным видам фармакологической активности общим объемом 143 тыс. соединений на основе PLS-регрессионных QSAR-моделей исследована прогностическая способность семи различных систем дескрипторного представления химической структуры. 486 «точных» выборок включали соединения с точным значением уровня фармакологической активности; 458 «полных» выборок содержали также приближенные полуколичественные данные; общий объем 944 выборок составил более 570 тыс. значений (1/1С50) различных видов активности. Всего было рассчитано 17 тыс. С АЯ-зависимостей, точность прогноза каждой из которых была оценена в независимом тестировании «интерполяционным» и «экстраполяционным» способами. Прогностическую способность системы характеризовал процент адекватных ( БАЯ-зависимостей, имеющих по данным тестирования квадрат коэффициента корреляции Я ргеС1 0,5; величина К2ргес1 характеризует долю соединений, активность которых с использованием конкретного ( БАЯ-уравнения была спрогнозирована правильно.

Результаты приведены в табл. 1.3.1, из которой видно, что три лучших по точности прогноза системы являются 20-подструктурными, а ЗБ-смешанная система, использующая подструктурные и физико-химические дескрипторы, оказалась практически не работоспособной.

В сравнении с ЗБ-системами, 2О-08АЯ-системы обладают следующими основными преимуществами: 1) отсутствие каких-либо обязательных граничных условий для их использования; 2) минимальные требования к исходным химическим данным; 3) простота и высокая скорость обработки химической информации; 4) универсальность в отношении соединений любой структуры; 5) возможность очень быстро получать до 90 % сведений об основных фармакологических свойствах прогнозируемого вещества; 6) возможность обработки больших массивов химических структур; 7) невысокая цена и доступность для использования на обычных персональных компьютерах; 8) не меньшая, чем у ЗЭ-методов, точность поиска новых высокоактивных соединений.

Главный недостаток 20-систем заключается в том, что они не всегда позволяют исследовать in silico тонкие механизмы специфического взаимодействия высокоактивных веществ с комплементарными к ним биомишенями. Однако подобную работу целесообразно проводить только для наиболее активных соединений и на стадии их углубленного изучения; в первичном скрининге такого сложного моделирования не требуется. Кроме того, если действие высокоактивного соединения на живой организм носит неспецифический характер, необходимость в ЗБ-моделировании вообще представляется проблематичной. За последние 15 лет разработано значительное число систем, основанных на методах молекулярного моделирования. Обязательным условием их использования является построение для изучаемых соединений достаточно адекватных трехмерных молекулярных моделей. В зависимости от степени детализации исходных данных, ЗБ-системы подразделяются на две большие группы.

Прогноз и экспериментальная проверка уровня фармакологической активности структурно-разнородных соединений

Таким образом, итоги тестирования показывают, что 20-методы сопоставимы, а часто и превосходят по точности ЗО-подходы. В сравнении с 20-, ЗО-системы основаны на более сложных моделях с жесткими ограничениями; намного более трудоемки, требуют значительно большего объема вычислений; для них часто необходимо знать структуру белков; их применение для обработки больших баз данных в ряде случаев невозможно. Программные среды MM-ЗD-QSAR стоят очень дорого, а точность прогноза при их использовании увеличивается незначительно. Все это привело к кризису ЗО- методов, возникла даже проблема «ЗD-QSAR иллюзий» [Т)о\уеуко А. М., 2004]. Поэтому в последнее время активно разрабатываются и используются не только 3D-, но, прежде всего, 20-системы, основанные на самых разных способах описания химической структуры [Todeschini R. et al., 2000; Karelson M. 2000]. Например, в программе DRAGON [2008] рассчитывается более 3200 видов дескрипторов, в системе МОЕ [2008] - более 300 видов, в CODESSA [2008] - 116 типов, в Cerius2 [2008] - 56 типов. Большинство современных QSAR-технологий являются фрагментно-ориентированными, причем наблюдается значительный рост числа систем, использующих в качестве основного подструктурное описание химических соединений, дополняемое физико-химическими фрагментными дескрипторами [Zefirov N. S. et al., 2002; Niwa Т., 2004; Fragment-Based Approaches ..., 2006; Fechner U. et al., 2006; Givehchi A. et al., 2006; Bartoli S. et al., 2006; Structure-Based Drug Discovery, 2007; Mauser H. et al., 2007; Villar О. Н. et al., 2007; Kuz min V. E. et al., 2008; Захаров А. В. и др., 2008; Sutherland J. J. et al., 2008; PASS Professional, 2008], с использованием нескольких методов QSAR-анализа [Палюлин В. А. и др., 2007, 2007а]. В качестве примеров можно привести оригинальные QSAR-системы, разработанные в Российской Федерации.

В лаборатории структурно-функционального конструирования лекарств ГУ НИИ биомедицинской химии им. В. Н. Ореховича РАМН разработано семейство 2D-QSAR-nporpaMM [ИБМХ, 2008]. Программа PASS прогнозирует спектр биологической активности веществ [Poroikov V. V., 1997; Филимонов Д. А. и др., 2006, 2006а] на основе 20-подструктурных MNA- дескрипторов [Filimonov D. et al., 1999] с использованием статистического подхода [Глориозова Т. А. и др., 1998]. Версия PASS Professional 9.1 [PASS, 2009] рассчитывает вероятность наличия/отсутствия 3750 видов активности по базе данных из 205873 соединений. Средняя точность прогноза составляет 94,7 %, минимальная - 63,1 %, максимальная - 100 %. Программа PharmaEx pert [Лагунин А. А. и др., 2006] позволяет устанавливать взаимосвязи между прогнозируемыми в PASS фармакологическими эффектами и механизмами действия соединений; возможно использование обеих программ через Интернет [Лагунин А. А. и др, 2001; Sadym A. et al, 2003а]. Программа METAPREDICT на основе 20-подструктурных RMNA-дескрипторов [Рудик

A. В, 2007] дает возможность прогнозировать классы и сайты более 900 видов биотрансформации веществ [Borodina Y. V. et al, 2003; Поройков В. В. и др, 2004; Рудик А. В, 2007] со средней точностью 87 %. Программа SIMEST на основе MNA-дескрипторов оценивает степень сходства веществ [Filimo- nov D. et al, 1999] с 600 низкомолекулярными эндогенными биорегуляторами [Бородина Ю. В, 1998; Borodina Y. et al, 1999] со средней по 98 видам рецепторов точностью прогноза 87 % для агонистов и 76 % для антагонистов. Программа GUSAR предназначена для расчета QSAR-уравнений на основе 20-фрагментных физико-химических дескрипторов QNA [Захаров А. В. и др, 2008] методом самосогласованной регрессии [Филимонов Д. А. и др, 2004] с возможностью предсказания биологической активности новых веществ [Захаров А. В. и др, 2006].

B. Ломоносова разработан комплекс программ, также основанных на 2D- подходах. Программа FRAGMENT предназначена для генерации описания структур химических соединений 20-фрагментными структурными дескрипторами [Баскин И. И. и др, 1991; Palyulin V. A. et al, 1995; Zefirov N. S. et al, 2002]. Программа MFTA позволяет строить молекулярный суперграф и порождать на его основе описание структур химических соединений 2D- фрагментными структурными и физико-химическими дескрипторами [Палю- лин В. А. и др, 1997; Palyulin V. A. et al, 2000, 2007]. Программа NASA WIN выполняет расчет количественных QSAR-зависимостей и прогноз свойств новых соединений методом нейронных сетей на основе многослойного пер- цептрона [Баскин И. И. и др, 1993, 1993а; Baskin I. I. et al, 1997]. Программа SANALOGP осуществляет прецизионный расчет липофильности log Po/w на основе 2Э-подструктурных дескрипторов FRAGMENT и QSAR- зависимостей, полученных с использованием программы NASAWIN [Арте- менко Н. В. и др., 2002].

В ГУ НИТИ гербицидов и регуляторов роста растений АН Республики Башкортостан разработана система SARD [Тюрина JI. А. и др., 2007] для прогноза биологической активности соединений по 2Б-подструктурным дескрипторам на основе методов ТРО: геометрического расстояния и вероятностного голосования. Система успешно используется для направленного дизайна высокоактивных веществ; средняя точность прогноза колеблется от 72 % до 98 %.

В Институте физиологически активных веществ РАН разработан пакет программ MOLPRO [2008] для прогноза фармакокинетических свойств соединений. Программа DISCON рассчитывает методом сходства по 2D- подструктурным дескрипторам константы диссоциации рКа веществ. Программа HYBOT вычисляет параметры водородной связи соединений на основе 2D- и ЗО-структурных дескрипторов [Раевский О. А., 2006; Raevsky О. A. et al., 1997, 2002]. Программы В ALPS и SLIPPER выполняют количественный прогноз на основе физико-химических дескрипторов и параметров водородной связи методами сходства и множественной регрессии: липо- фильности log Po/w, растворимости в воде log S, оральной биодоступности, клеточной проницаемости, проницаемости через гематоэнцефалический барьер и кожной проницаемости нейтральных (BALPS) и диссоциирующих в воде (SLIPPER) веществ [Raevsky О. A. et al., 2002а]. Точность прогноза этих фармакокинетических показателей варьируется от 81 % до 94 % [Раевский О. А., 2006].

Прогноз и экспериментальная проверка фармакологической активности молекулярных комплексов

Фактографической основой ИТ «Микрокосм» являются данные о структуре и фармакологической активности испытанных химических соединений. Достоверность этой информации имеет определяющее значение для получения в дальнейшем адекватных, точных и воспроизводимых результатов. Поэтому первоначально в ходе выполнения настоящего исследования было сформировано несколько верифицированных банков данных, содержащих общую информацию о структуре и фармакологической активности известных лекарственных и биологически активных веществ - из доступных первоисточников: специализированных справочников, каталогов, энциклопедий и монографий, публикаций в профильных научных журналах, официальных сайтов в Интернет.

После верификации первичные данные должны быть структурированы и представлены в виде набора файлов формата ИТ «Микрокосм», пригодных для генерации решающих правил и прогноза активности новых соединений. С этой целью на основе созданных банков данных общего назначения были сформированы специализированные базы данных отдельно по каждому виду прогнозируемой фармакологической активности, с указанием для каждого соединения ее полуколичественной оценки (обучающие выборки). С помощью специально разработанных программ файлы обучающих выборок в исходных форматах были конвертированы в файлы формата ИТ «Микрокосм».

Для формирования по первоисточникам достоверных банков данных были разработаны следующие критерии верификации первичной химической и фармакологической информации: 1) структурная формула из основного первоисточника должна восприниматься однозначно и не допускать двойственных интерпретаций; 2) структурные формулы из разных первоисточников должны совпадать; 3) в случае наличия солеобразующего компонента, в первоисточнике должна быть приведена его структурная формула или название; 4) в первоисточнике должны быть указаны брутто-формула и молекулярный вес соединения; 5) рассчитанные компьютерной программой по структурной формуле брутто-формула и молекулярный вес соединения должны совпадать с брутто- формулой и молекулярным весом из первоисточника; 6) в первоисточнике должен быть указан номер CAS [2008]; 7) в первоисточнике должно быть приведено систематическое название соединения по номенклатуре IUP АС [2007]; 8) систематическое название соединения в первоисточнике должно соответствовать его структурной формуле; 9) систематическое название из первоисточника должно совпадать с систематическим названием IUP АС, порожденным специализированной компьютерной программой по структурной формуле соединения; 10) если таковые есть, в первоисточнике должны быть указаны тривиальные и коммерческие названия данного лекарственного или биологически активного вещества, либо препаратов на его основе; 11) в случае неоднозначной интерпретации, наличия ошибки или отсутствия структурной формулы соединения в основном первоисточнике, она должна быть восстановлена по систематическому, тривиальному или коммерческому названию с использованием других первоисточников и специальных компьютерных программ; 12) в основном первоисточнике для соединения обязательно должен быть указан присущий ему вид (виды) фармакологической активности, желательно, по номенклатуре IUPHAR [2008]; 13) в первоисточнике для лекарственного препарата должны быть приведены количественные клинические данные об уровне активности (разовая доза, суточная доза, уровень эффекта в фиксированной дозе и т.п.), а для биологически активного вещества - описана методика определения активности, указан ее показатель и числовое значение (эффективная или минимальная доза/концентрация, процент эффекта в фиксированной дозе/концентрации и т.п.); 14) при отсутствии количественных данных, в первоисточнике должны быть приведены полуколичественные оценки уровня активности соединения (низкоактивно, умеренноактивно, высокоактивно, оценка в баллах и т.п.); 15) если в первоисточниках для разных веществ уровень конкретного вида активности представлен различными способами и показателями, должна быть произведена унифицированная оценка ее градаций для каждого соединения по шкале «высокоактивно - умеренноактивно - неактивно».

Химическая и фармакологическая информация вводилась в компьютер с помощью специализированного экранного редактора GRR СУБД ИТ «Микрокосм» в виде набора файлов формата .shf, .str, .cmn [Кочетков А. H. и др, 1991], а также с использованием химических экранных редакторов MDL ISIS/Draw [Symyx MDL, 2008] и ACD/ChemSketch Freeware [ACD/Labs, 2008] в виде файлов формата .skc и .sk2. С помощью этих же программ каждую нарисованную на экране дисплея структурную формулу проверяли на отсутствие химических ошибок и рассчитывали для нее брутто-формулу и молекулярный вес. Генерацию систематического названия IUPAC по проверенной структурной формуле осуществляли с помощью встроенного модуля ACD/Name Freeware программы ACD/ChemSketch Freeware [ACD/Labs, 2008]. На рис. 2.1.1 - 2.1.3 приведены примеры ввода структурных формул и сопутствующей информации с помощью указанных программных средств.

В соответствии с описанной методикой были сформированы следующие банки данных общего назначения: основной банк данных по структуре и видам фармакологической активности известных лекарственных веществ (почти 12 тыс. структур, 1110 видов активности); банк данных по структуре соединений с ноотропной активностью (275 структур); банк данных по структуре соединений с антивирусной активностью (около 2 тыс. структур, 7 видов активности). Верификация химических, фармакологических и токсикологических данных проводилась квалифицированными экспертами (химиками, фармакологами и токсикологами), имеющими большой опыт работы с соответствующими группами веществ. Для обеспечения обмена информацией между различными программами все банки и базы данных записаны в память компьютера в виде файлов стандартного коммуникативного формата .sdf [CTfile Formats, 1998].

Похожие диссертации на Информационная технология прогноза формакологической активности химических соединений