Содержание к диссертации
Введение
Глава 1. Обзор литературы 10
1.1. Методы рациональной разработки лекарств 10
1.2. Белки-мишени урокиназа и PAK-1: структура, роль в организме, наличие известных ингибиторов 20
1.2.1. Роль урокиназы в организме 20
1.2.2. Структура урокиназы 21
1.2.3. Известные ингибиторы урокиназы и особенности их взаимодействия с протеолитическим центром урокиназы 24
1.2.4. Роль PAK1 в организме 26
1.2.5. Структура протеинкиназы PAK1 28
1.2.6. Известные ингибиторы PAK 30
Глава 2. Методы исследования 35
2.1. Докинг, скоринг и виртуальный скрининг – основа технологии разработки новых ингибиторов. Программа SOL 35
2.2. Постпроцессинг 42
2.2.1. Общие положения: локальная оптимизация и уточнение энергии связывания белка и лиганда. Программа Discore 42
2.2.2. Методы квантовой химии 45
2.3. Прямой докинг. Программа FLM 49
2.4. Экспериментальная методика тестирования ингибирования урокиназы in vitro 52
2.5. Экспериментальная методика тестирования ингибирования протеинкиназы PAK1 in vitro 53
Глава 3. Применение методов компьютерного моделирования для разработки новых ингибиторов урокиназы 55
3.1. Создание молекулярной модели урокиназы 55
3.2. Поиск оптимальных параметров генетического алгоритма 56
3.3. Проверка качества позиционирования программой докинга SOL 63 3.4. Проверка качества оценки энергии связывания урокиназа-лиганд программой докинга SOL 67
3.5. Способность программы докинга SOL находить реальные ингибиторы из множества неактивных лигандов 72
3.6. Виртуальный скрининг баз данных готовых соединений 73
3.7. Валидация и применение постпроцессинга с помощью программы Discore 77
3.8. Применение прямого докинга в рамках программы FLM 84
3.9. Применение полуэмпирических квантово-химических методов для расчета свободной энергии связывания урокиназа-лиганд 86
3.10. Дизайн и синтез новых ингибиторов 90
3.11. Обсуждение результатов главы 95
Глава 4. Компьютерная разработка новых ингибиторов PAK1 102
4.1. Определение связывающего центра протеинкиназы PAK1. Докинг молекулы BPIPP в белок PAK1 102
4.2. Докинг базы данных NCI и результаты экспериментальной проверки.. 118
4.3. Проведение квантово-химических вычислений для соединений, отобранных из базы данных NCI Diversity 123
4.4. Обсуждение результатов главы 125
Глава 5. Применение докинга и постпроцессинга в международном конкурсе CSAR 132
Заключение 137
Список литературы
- Известные ингибиторы урокиназы и особенности их взаимодействия с протеолитическим центром урокиназы
- Общие положения: локальная оптимизация и уточнение энергии связывания белка и лиганда. Программа Discore
- Поиск оптимальных параметров генетического алгоритма
- Докинг базы данных NCI и результаты экспериментальной проверки..
Введение к работе
Для решения задач, связанных с рациональной разработкой новых лекарственных средств, в настоящее время все чаще прибегают к методам молекулярного моделирования, поскольку все стадии разработки нового лекарственного вещества, как правило, требуют значительных финансовых затрат и занимают порядка 10 лет. На первом этапе разработки нового лекарственного соединения необходимо предсказать структуры молекул-ингибиторов, которые обычно представляют собой низкомолекулярные органические соединений и которые избирательно связываются с активными центрами белков, обуславливающих болезнь, блокируя их активность. Для этих целей в настоящее время все чаще используются методы рационального компьютерного in silico дизайна, которые позволяют уменьшить как временные, так и материальные затраты за счет сокращения числа соединений, которые необходимо синтезировать и экспериментально тестировать в процессе разработки нового лекарства.
В настоящее время существует множество методов для моделирования взаимодействия лекарственных соединений с соответствующими мишенями и вычисления энергии связывания ингибитора и белка. Сущность вычислительного аспекта проблемы заключается в необходимости вычислять энергию взаимодействия лиганд-мишень с высокой точностью (1-2 ккал/моль или 0.05-0.1 эВ), и с высокой скоростью, позволяющей оперативно проводить расчеты, по крайней мере, десятков тысяч соединений.
Одним из ключевых методов в данной работе является докинг – поиск положения лиганда (молекулы-ингибитора или кандидата в ингибиторы) в активном центре белка-мишени, соответствующего минимальному значению энергии системы белок-лиганд. Преимущество докинга состоит в том, что, отличаясь от эмпирических методов QSAR достаточно высоким качеством прогнозирования, он также позволяет производить расчеты нескольких тысяч соединений в день, что недоступно пока методам молекулярной динамики.
Однако наряду с повышением скорости вычислений для современных методов компьютерного моделирования стоит также проблема повышения точности вычислений. Для этих целей часто используются методы постпроцессинга, в которых производится более точная оценка энергий связывания для выбранных в результате
4 скрининга молекул. Эти методы обычно включают в себя локальную оптимизацию молекул (то есть поиск локального минимума в окрестности найденного глобального минимума), которая может происходить, например, с использованием силовых полей, а также более аккуратный учет составляющих свободной энергии связывания лиганда и белка (например, более аккуратный учет растворителя, энтропийного вклада и т.д.). На этом этапе также могут быть применены, например, более точные, и одновременно более ресурсоемкие, методы квантовой химии.
В процессе работы были выбраны два белка: сериновая протеаза урокиназа (uPA) и серин/треониновая протеинкиназа PAK1. Каждый из рассмотренных белков представлял интерес в качестве мишени для новых ингибиторов, способных в дальнейшем стать основой для лекарственных средств, в том числе и противоопухолевых.
Основное внимание в диссертационной работе уделено новой реализации методики докинга и постпроцессинга, её тестированию, использованию полуэмпирических квантово-химических методов для уточнения энергии связывания белок-лиганд, а также применению этих методов для разработки новых ингибиторов урокиназы и протеинкиназы PAK1. Возможность использования высокопроизводительных вычислений также рассмотрена в данной работе. Во всех случаях расчеты выполнялись на суперкомпьютерных ресурсах МГУ им. М.В. Ломоносова «Чебышев» и «Ломоносов».
Цели и задачи работы.
Целью работы является повышение эффективности рациональной разработки лекарств с помощью методов молекулярного моделирования (молекулярного докинга, методов локальной оптимизации (постпроцессинга) лиганда в силовом поле белка, методов квантовой химии).
В соответствии с поставленной целью решались следующие задачи:
-
Разработка и использование методов молекулярного моделирования для решения задачи поиска новых ингибиторов урокиназы и протеинкиназы PAK1.
-
Построение молекулярных моделей активных центров белков урокиназы и PAK1.
-
Исследование влияние параметров генетического алгоритма на качество докинга (в рамках программы докинга SOL).
4. Тестирование методов молекулярного моделирования применительно к
выбранным белкам-мишеням.
-
Сравнение различных методов расчета энергий связывания в силовых полях (докинг и постпроцессинг) и с помощью методов квантовой химии, а также оценка энергий сольватации, полученных разными методами.
-
Поиск ингибиторов урокиназы и PAK1 в базах данных готовых соединений с помощью процедуры виртуального скрининга.
-
Дизайн новых структур ингибиторов урокиназы.
Научная новизна результатов:
1. Исследована возможность применения совокупности методов докинга и
полуэмпирической квантовой химии (в рамках недавно разработанного метода PM7,
реализованного в программе MOPAC и применяемого для поиска новых ингибитров
впервые) для расчетов энергий связывания белок-лиганд. Такая методика
демонстрирует высокую эффективность при поиске новых ингибиторов.
2. С помощью молекулярного моделирование впервые определено
расположение некаталитического активного центра протеинкиназы PAK1,
связывающего соединение BPIPP (5-(3-бромофенил)-5,11-дигидро-1,3-диметил-1H-
индено[2',1':5,6]пиридо[2,3-d]пиримидин-2,4,6(3H)-трион).
3. Найдены новые ингибиторы белков урокиназы и протеинкиназы PAK1.
Научная и практическая значимость данной работы заключается в том, что
на основе полученных данных выдвинуты предположения о структуре некаталитического активного центра белка PAK1, а также разработаны новые ингибиторы белков урокиназа и PAK1. Для разработки новых ингибиторов был впервые применен полуэмпирический квантово-химический метод PM7 из программного комплекса MOPAC, в котором учтены как водородные связи, так и дисперсионные межмолекулярные взаимодействия, что позволяет увеличить точность расчетов энергии связывания и эффективность разработок новых ингибиторов и новых лекарств на их основе.
Результаты данной работы могут быть применены, в частности, для прогнозирования структур новых ингибиторов урокиназы, PAK1 и других белков-мишеней, а уже найденные в данной работе соединений могут быть использованы для
6 проведения дальнейших доклинических и клинических испытаний с целью введения новых лекарственных средств в клиническую практику.
Положения, выносимые на защиту.
-
При найденных в работе оптимальных параметрах генетического алгоритма, качество позиционирования лигандов программой SOL достигает желаемого высокого уровня: 70-80% лигандов после докинга имеют среднеквадратичное отклонение от нативного положения менее 3 .
-
Программа докинга SOL и программа постпроцессинга DISCORE показывают высокое качество предсказания ингибирующей активности лигандов, не уступающее многим зарубежным аналогам по результатам международного конкурса CSAR.
-
Применение полуэмпирического метода PM7 из программного пакета MOPAC продемонстрировало хорошие результаты для задач расчета энтальпии связывания белка и лиганда, и показывает лучшую корреляцию с экспериментом, нежели аналогичные расчеты в силовом поле MMFF94. На этом основании предложен комбинированный метод молекулярного моделирования, включающий в себя докинг (программа SOL) в совокупности с постпроцессингом в рамках квантово-химического полуэмпирического метода PM7 (программный пакет MOPAC). Такой комбинированный метод дает возможность эффективно предсказывать ингибирующую активность низкомолекулярных лигандов для заданных белков-мишеней.
-
Найденные на основе методов молекулярного моделирования новые соединения, ингибирующие урокиназу и PAK1, в экспериментах in vitro, демонстрируют микромолярную (ингибиторы урокиназы) и субмикромолярную (ингибиторы PAK1) активность.
Личный вклад диссертанта заключается в сборе и анализе литературных данных, разработке путей решения поставленных задач, отработке и тестировании методов докинга и постпроцессинга применительно к выбранным мишеням, проведении скрининга баз данных готовых соединений, анализе результатов и выдвижении предположений о возможной структуре новых ингибиторов белков урокиназы и PAK1, проведении вычислений полуэмпирическими методами квантовой химии в программном комплексе MOPAC, интерпретации результатов,
7 подготовке публикаций и докладов по теме диссертационной работы. Все результаты, составляющие основное содержание диссертации, получены автором самостоятельно.
Апробация работы и публикации. Материалы диссертации были представлены на международной конференции "Ломоносов" (Москва, 2009), на научных конференциях «Ломоносовские чтения» (Москва, 2011, 2013 гг.), на Московском международном конгрессе «Биотехнология: состояние и перспективы развития» (Москва, 2011), на XIX Российском национальном конгрессе "Человек и лекарство" (симпозиум «Биоинформатика и компьютерное конструирование лекарств», Москва, 2012), на IV съезде фармакологов России «Инновации в современной фармакологии» (Казань, 2012), на 2-ом Русско-Французском семинаре по хемо- и биоинформатике (2nd French-Russian Workshop on Chemoinformatics and Bioinformatics, Казань, 2012), на 224-ой национальной конференции Американского химического общества (244th ACS National Meeting, Филадельфия, Пенсильвания, 2012).
Основные результаты диссертационной работы опубликованы в 15 печатных изданиях, в том числе в 5 статьях в изданиях из перечня ведущих рецензируемых научных журналов и изданий ВАК РФ, в 8 тезисах докладов на конференциях и в 2 сборниках трудов.
Структура диссертации. Диссертация состоит из введения, 5 глав, заключения и списка цитируемой литературы из 154 наименований. Работа изложена на 155 страницах машинописного текста и включает 21 рисунок и 26 таблиц.
Известные ингибиторы урокиназы и особенности их взаимодействия с протеолитическим центром урокиназы
В настоящее время к широко используемым фармацевтическими компаниями методам можно отнести экспериментальную проверку биологической активности новых соединений в тестовых системах. С развитием комбинаторной химии, созданием обширных библиотек химических соединений, а также автоматизацией и информатизацией процессов тестирования новых веществ, на первый план вышли методы так называемого высокопроизводительного скрининга (automated high throughput screening) [5], при котором производится экспериментальное сканирование большого количества соединений из комбинаторных библиотек. Однако далеко не всегда в результате удается получить соединение, способное стать основой для нового лекарственного вещества. Также при этом необходимо учитывать, что методами комбинаторного синтеза возможно синтезировать далеко не все классы химических соединений. Альтернативой может стать виртуальный высокопроизводительный скрининг баз данных (virtual high throughput screening – vHTS) [6], который значительно снижает временные и финансовые затраты и основой для которого является молекулярное моделирование.
Существуют различные методы поиска лекарственных соединений в случае, если структура белка-мишени неизвестна, такие как поиск по подобию, или на основе соотношения структура-активность (Quantitative Structure – Activity Relationship (QSAR)) [7], которые применяется для моделирования фармакофора (то есть «набора пространственных и электронных признаков, необходимых для обеспечения оптимальных супрамолекулярных взаимодействий со специфической биологической мишенью, которые могут вызывать (или блокировать) ее биологический ответ» по определению ИЮПАК [8]). Подобные методы пользовались популярностью до 70-х годов прошлого века и требовали наличия уже известных соединений, активных в отношении исследуемого белка, а также опирались в основном на двухмерное изображение соединений. Тем не менее, к настоящему моменту, благодаря совершенствованию методов рентгеноструктурного анализа и ядерного магнитного резонанса, уже известны многие трехмерные структуры белков и рецепторов, а также их комплексов с лигандами (например, в базе данных Protein DataBase [9] сейчас имеется более 100 000 таких структур), что позволяет проводить моделирование уже в трехмерном пространстве и получать куда более точные и физически-обоснованные результаты. Таким образом, структурно-ориентированный дизайн лекарственных средств (основывающийся на трехмерных структурах биологических макромолекул) становится мощным инструментом для поиска новых лекарств.
Наиболее точным образом описать взаимодействия в молекулярной системе возможно с помощью решения уравнения Шредингера, однако на настоящий момент такой подход возможен только для систем состоящих из небольшого числа атомов. Для биологических систем, интересных с точки зрения поиска новых лекарственных веществ, применяются упрощенные модели, в которых рассчитываются атом-атомные взаимодействия. В зависимости от поставленной задачи, от требуемого уровня точности и от желаемой скорости расчетов эти модели могут быть разными.
Например, метод молекулярной динамики наиболее широко распространен для изучения конформационной подвижности белков и эволюции системы лиганд-белок. Однако это довольно медленный метод, который не подходит для скрининга большого числа соединений. Обычно его применяют для уточнения решений, найденных другими способами. Он заключается в том, что атомно-молекулярная система представляется в виде набора взаимодействующих частиц, для каждой из которых записываются классические уравнения движения этих частиц в поле сил остальных частиц. Численное интегрирование этих уравнений позволяет получить траекторию системы, то есть набор координат и импульсов атомов системы как функции времени и по этим траекториям вычислить энергию взаимодействия белок-лиганд. Также нередко с помощью метода молекулярной динамики получают ансамбль структур белков, на основании которого уже проводят докинг, таким образом, анализируя возможную подвижность белка во время связывания его с лигандом. Наряду с методами молекулярной динамики стоит упомянуть и метод Монте-Карло, в котором поиск конформаций системы производится не на основании решений уравнений Ньютона, а на основе случайного изменения координат.
Для расчета свободной энергии связывания при помощи молекулярной динамики используют подходы термодинамического интегрирования и метода термодинамической теории возмущений. В первом случае свободная энергия системы принимается зависимой от безразмерного параметра , причем за счет изменения этого параметра система переводится из первого состояния во второе. Для расчета свободной энергии связывания проводится интегрирование среднего по траектории, соединяющей начальное и конечное состояние системы, значения свободной энергии по этому параметру [10]. В случае если первое и второе состояния системы находятся близко, то применяют метод термодинамической теории возмущений, в котором свободные энергии конечного и начального состояний представляются через канонические распределения, а свободная энергия взаимодействия вычисляется как среднее по ансамблю при переводе системы из начального в конечное состояния с помощью уравнения Цванцига [11].
Общие положения: локальная оптимизация и уточнение энергии связывания белка и лиганда. Программа Discore
Вычислив свободную энергию Гиббса для комплекса белок-лиганд, для белка и для лиганда, можно вычислить свободную энергию связывания белок-лиганд как разность свободной энергии комплекса и суммы свободных энергий белка и лиганда.
Основной вклад в статистическую сумму (5) вносят низкоэнергетические состояния системы, и вообще говоря, не только глобальный минимум энергии системы белок-лиганд, но и близкие к нему по энергии локальные минимумы будут давать вклад в свободную энергию связывания белка и лиганда. На основе этого предположения была реализована программа прямого бессеточного докинга FLM (Finder of Local Minima), которая отыскивает локальные минимумы системы с помощью метода Монте-Карло: начальное состояние системы задается при помощи случайных торсионных деформаций лиганда и его вращений-трансляций как целого, затем проводится локальная оптимизация полученного положения. В процессе работы программы генерируется множество таких начальных состояний. Согласно заданным параметрам в программе FLM, количество сохраненных локальных минимумов не превышает 1024 (это различные локальные минимумы с самыми наименьшими энергиями из всех полученных к текущему моменту).
Далее, по найденным локальным минимумам рассчитывается свободная энергия молекулярной системы в мультигармоническом приближении: строится аппроксимация потенциальной энергии полиномом второй степени в каждом локальном минимуме, то есть система в каждом минимуме представляется в виде гармонического осциллятора. Затем вычисляются частоты собственных колебаний гармонического осциллятора и статистическая сумма Zv [136]. Также в статистическую сумму молекулярной системы входит интегрирование ее по шести степеням свободы, связанным с вращением и трансляцией как целого - Zr и Zr [137]. В итоге, выражение для свободной энергии гармонического осциллятора с учетом трансляций и ротаций как целого принимает вид:
G = -kTln(Z) = E0+G + Gr + GV, (15) где Ео - потенциальная энергия в минимуме осциллятора, а G\ Gr и Gv -вклады в свободную энергию, обусловленные трансляциями и вращением лиганда как целого и его колебаниями соответственно.
Затем для каждого локального минимума рассчитываются его энергетические характеристики (Gb Ht и TS,), а затем по энергетическим характеристикам всех локальных минимумов рассчитывается суммарные энергетические характеристики системы (G, Н и TS). Если G1 - энергии, соответствующие этим гармоническим осцилляторам, то суммарная энергия системы может быть получена по следующей формуле:
Еще одной особенностью программы FLM является отсутствие подгоночных коэффициентов - все вычисления энергии проводятся в рамках выбранного силового поля MMFF94. Эта особенность выделяет программу FLM из ряда большинства программ докинга, в которых дается лишь оценка скоринг-функции (иногда даже и не в энергетических единицах) - энергии связывания белок-лиганд.
В данной работе программа FLM была использована как дальнейшее развитие докинга для повышения точности вычисления свободной энергии связывания системы белок-лиганд. Докинг, реализованный в программе FLM, можно назвать бессеточным прямым обобщенным докингом по следующим причинам. Бессеточным и прямым он является потому, что в отличие от программы докинга SOL (и большинства существующих программ докинга) в программе FLM не используется сетка заранее рассчитанных потенциалов взаимодействия пробных атомов с белком, а взаимодействие лиганда в каждой позе с белком вычисляется напрямую в рамках силового поля MMFF94, и поэтому имеется возможность проводить локальную оптимизацию энергии по атомам белка и лиганда. Обобщенным этот докинг называется потому, что в результате докинга находится не один предположительно глобальный минимум энергии системы белок-лиганд, а целый спектр низкоэнергетических локальных минимумов лиганда в белке и в свободном состоянии. Отметим, что в отличие от большинства существующих программ докинга в программе FLM находится и глобальный минимум энергии свободного лиганда, что позволяет вычислять энергию внутренних напряжений лиганда – разность между энергией лиганда в связанном и в свободном состоянии, которая входит в свободную энергию связывания белок-лиганд; расчеты показывают, что эта энергия может варьироваться от нескольких единиц до нескольких десятков ккал/моль, и поэтому она играет важную роль при вычислениях свободной энергии связывания белок-лиганд.
Поиск оптимальных параметров генетического алгоритма
Еще одним критерием оценки качества докинга может быть оценка кластеризации, показывающая, объединяются ли решения для разных независимых запусков программы в один или несколько кластеров близких друг к другу поз лиганда, или же все они отличаются друг от друга, что говорит о том, что глобальный минимум, вероятно, не был найден. Этот критерий также имеет значение, поскольку в программе SOL эвристический генетический алгоритм докинга не позволяет однозначно утверждать, что полученный в результате поиска минимум является глобальным. Однако если при многих независимых запусках каждый раз находится приблизительно одно положение лиганда, то уверенность в том, что это положение действительно находится в глобальном минимуме энергии, возрастает. В программе докинга SOL в один кластер собираются решения, RMSD-расстояния между которыми по всем атомам не превышают 1 . Населенность первого кластера и характеризует успешность нахождения глобального минимума: чем больше решений в этом кластере, тем чаще алгоритм сходился к данному минимуму. В таблице 4 также указано количество кластеров и населенность первого кластера (N / N1).
Для 45 нативных комплексов урокиназа-лиганд в большинстве случаев в первый кластер (кластер с минимальной энергией) попадает довольно большое число лигандов, что говорит о том, что при независимых запусках программы алгоритм сходится к одному и тому же решению, которое при этом обладает минимальной энергией. Тем не менее, для нескольких комплексов не удалось достичь большого числа лигандов в первом кластере (например, для комплексов 1ejn, 1f92, 1gjb, 1sc8, 1vj9, 2vio, 2vip, 2vnt, 3ig6 населенность первого кластера меньше 10 лигандов). Однако для комплексов 1ejn, 1gjb, 2vio, 2vip, 2vnt при этом нашелся кластер, обладающий большим количеством лигандов в нем, а лиганды комплексов 1f92 (16 степеней свободы), 1sc8 (15 степеней свободы), 1vj9 (19 степеней свободы) и 3ig6 (11 степеней свободы) обладали большим количеством степеней свободы, что очевидно затрудняло их позиционирование. 3.4. Проверка качества оценки энергии связывания урокиназа-лиганд программой докинга SOL
Качество оценки энергии связывания урокиназа-лиганд программой докинга SOL проводилось на основании известных экспериментальных данных об активностях используемых лигандов. Для этого было проведено сравнение энергий лигандов (скоринг-функций программы SOL), полученных при докинге, с экспериментальными энергиями связывания этих же лигандов. Активности 45 нативных лигандов были получены из литературы (таблица 4). В таблице приведены константы ингибирования Kt и соответствующие свободные энергии связывания, вычисленные из констант ингибирования по формуле:
Однако подавляющее большинство нативных лигандов являются «хорошими» ингибиторами урокиназы, тогда как для проверки того, насколько программа докинга способна отделить «хорошие» лиганды от «плохих» необходимо также использовать «плохие» лиганды (не являющиеся ингибиторами урокиназы или являющиеся слабыми ингибиторами урокиназы). Для этого набор из 45 нативных лигандов был дополнен еще 44 лигандами, заказанными на первом этапе поиска новых ингибиторов урокиназы (см. параграф 3.6 «Виртуальный скрининг баз данных готовых соединений»), проверенными в эксперименте и не показавшими активности в отношении урокиназы или показавшими слабые активности в отношении урокиназы.
Все эти лиганды были подготовлены для докинга: получены их трехмерные структуры, определены зарядовые состояния и добавлены атомы водородов в соответствии с данными зарядовыми состояниями. Для докинга этих лигандов, а также для дальнейшей работы (в том числе - проведения докинга, постпроцессинга, расчетов с помощью квантовой химии и FLM) среди нативных белков урокиназы из базы данных PDB был выбран белок из комплекса с номером в PDB - 1sqo [139]. Основанием для данного выбора послужило то, что эта структура имеет довольно хорошее разрешение, среднеквадратичное отклонение от положения нативного лиганда 0,74 и хорошую кластеризацию. Помимо этого для нативных лигандов был проведен кроссдокинг – то есть докинг нативного лиганда из одного комплекса в белки из других комплексов урокиназы. Эта процедура позволяет понять, насколько сильно активный центр подстраивается под конкретный лиганд. Для разных белков среднеквадратичное отклонение между значениями энергий для нативного лиганда, «задоченного» в свой белок, и того же лиганда, «задоченного» в выбранный белок оставило от 0,5-1 ккал/моль. Это означает, что некоторая подвижность атомов белка урокиназы все же присутствует, однако ее влияние не является критическим.
Далее был проведен докинг этих 44 лигандов программой SOL. Результаты представлены в таблице 6. Стоит отметить, что критерий, отделяющий «плохие» лиганды от хороших был выбран следующим образом. Ингибиторами урокиназы будем считать такие ингибиторы, у которых константа ингибирования Ki 100 M. Используя формулу (19), можно предположить, что в этом случае кандидаты в ингибиторы должны иметь значения рассчитанной энергии связывания (скоринг-функции) -5.5 ккал/моль (то есть более отрицательные, чем -5.5 ккал/моль).
Докинг базы данных NCI и результаты экспериментальной проверки..
Белок был взят из Protein Data Bank (PDB ID – 1f3m) и приготовлен для докинга, при этом все остатки, для которых в рассматриваемой структуре пропущены тяжелые атомы (в рассматриваемой структуре 1F3M таких остатков всего 8: три в цепи C – Ser249, Asp250, Lys542 и пять в цепи D – Ser249, Asp250, Glu539, Thr541 и Lys542), удалялись в текстовом редакторе. Эти остатки все лежат на концах соответствующих цепей и находятся сравнительно далеко от всех рассматривавшихся областей докинга. На этом же основании из цепи D удаляется и остаток Ala540 (поскольку удаляются остатки и до него и после него). Далее было проведено добавление в структуру атомов водорода с помощью программы APLITE. Поскольку для лигандов рассматривались различные зарядовые состояния в зависимости от кислотности среды, то и для белка протонирование было выполнено при различных pH.
Для начала была рассмотрена кислотность среды с pH=8. В данном случае все гистидины не заряжены (т.е. они не протонированы), отрицательно заряжены аспарагиновая и глютаминовая кислоты, а аргинин и лизин заряжены положительно. На поверхности белка PAK1 было выбрано несколько областей связывания, так называемых кубов докинга, имеющих различные координаты центра и различные длины ребер. Сначала выбирался куб докинга с большими длинами ребер, так, чтобы в него попал почти весь белок, далее на основании анализа положений структур BPIPP после докинга размеры и координаты куба докинга изменялись, и проводился новый докинг.
Первым таким кубом докинга стал куб k8 (рисунок 13). Координаты центра куба и длина его ребра (в ангстремах): (X, Y, Z; a)=(9.0, 22.0, 47.0; 70).
Поскольку сетка потенциалов, создаваемая в кубе докинга программой SOLGRID, имеет 101 точку по каждой стороне куба, то расстояние между точками сетки в данном случае составляет 0.7 А. Положение и размер (большой) куба к8 выбирался так, чтобы обе AID (автоингибиторный домен) цепи, А и В, целиком поместились в нем, цепь D вошла примерно на половину в этот куб, а цепь С вошла в этот куб значительной своей частью.
Был проведен докинг всех конформеров и изомеров молекулы BPIPP, получены значения скоринг-функций, оценены кластеризации (чем большее число решений попало в первый кластер, тем больше уверенности в том, что был найден глобальный минимум в данной области), а также проанализированы положения «задоченных» структур в белке (таблица 20).
Оказалось, что всё многообразие рассмотренных лигандов (всего 19 структур) при докинге укладывается всего в три области, обозначенные в таблице 20 как I, II и III. Детальное описание этих областей приведено ниже. В дальнейшем при докинге в кубы меньшего размера (см. ниже), когда сетка потенциалов более аккуратно описывает энергетическую поверхность взаимодействия белок-лиганд, эти области, I, II и III, где расположены лучшие по энергии позы лигандов, фактически сохраняются.
Сравнивая с результатами докинга в кубы меньшего, чем k8 размера, видим, что качество докинга в куб k8 значительно хуже – это видно как по характеристикам кластеризации (при докинге в k8 больше кластеров и меньше населенность 1-ого кластера), так и по регулярному ухудшению скоринг-функции (по сравнению, скажем, с результатами докинга в кубы k9 или k11 – см. ниже).
Далее был проведен докинг в куб k9 структуры с водородами, расставленными при pH=8. Координаты центра куба и длина его ребра (в ангстремах) (X, Y, Z; a)=(12.0, 12.0, 47.0; 32). Эта область докинга выбрана заметно (более чем в 2 раза по длине ребра куба) меньше по сравнению с областью k8, а её центр выбран так, чтобы все лучшие позы окисленной формы BPIPPox и всех зарядовых состояний BPIPP, полученные при докинге в k8, помещались и в k9.
Как видим (таблица 21), качество докинга в меньший куб k9 значительно улучшилось по сравнению с докингом в больший куб k8: населенность первого (лучшего по энергии) кластера для многих лигандов увеличилась, число кластеров уменьшилось, а скоринг-функции (энергии связывания белок-лиганд) улучшились – стали более отрицательными.
ОкисленнаяформаBPIPPoxpH 7 (кислаясреда) bpippo -4.75 50/1 I Следующим шагом стал докинг в куб k11 (pH=8) (рисунок 14). Координаты центра куба и длина его ребра (в ангстремах) (X, Y, Z; a)=(12.0, 6.0, 47.0; 32). Этот куб был выбран так, чтобы в него поместились все лучшие позы (из лучшего по энергии 1-ого кластера) всех рассматриваемых лигандов BPIPP и BPIPPox, «задоченные» в куб k9, и при этом эти позы были бы дальше от граней куба докинга, чем это было в k9, а также использовались более «крутые» параметры генетического алгоритма, которые могли бы обеспечить нахождение более глубоких минимумов энергии белок-лиганд, соответствующих более выгодным положениям лигандов в белке.