Электронная библиотека диссертаций и авторефератов России
dslib.net
Библиотека диссертаций
Навигация
Каталог диссертаций России
Англоязычные диссертации
Диссертации бесплатно
Предстоящие защиты
Рецензии на автореферат
Отчисления авторам
Мой кабинет
Заказы: забрать, оплатить
Мой личный счет
Мой профиль
Мой авторский профиль
Подписки на рассылки



расширенный поиск

Молекулярное моделирование динамики и механизмов действия АТФаз семейства TIP49 Афанасьева Арина Сергеевна

Молекулярное моделирование динамики и механизмов действия АТФаз семейства TIP49
<
Молекулярное моделирование динамики и механизмов действия АТФаз семейства TIP49 Молекулярное моделирование динамики и механизмов действия АТФаз семейства TIP49 Молекулярное моделирование динамики и механизмов действия АТФаз семейства TIP49 Молекулярное моделирование динамики и механизмов действия АТФаз семейства TIP49 Молекулярное моделирование динамики и механизмов действия АТФаз семейства TIP49 Молекулярное моделирование динамики и механизмов действия АТФаз семейства TIP49 Молекулярное моделирование динамики и механизмов действия АТФаз семейства TIP49 Молекулярное моделирование динамики и механизмов действия АТФаз семейства TIP49 Молекулярное моделирование динамики и механизмов действия АТФаз семейства TIP49 Молекулярное моделирование динамики и механизмов действия АТФаз семейства TIP49 Молекулярное моделирование динамики и механизмов действия АТФаз семейства TIP49 Молекулярное моделирование динамики и механизмов действия АТФаз семейства TIP49 Молекулярное моделирование динамики и механизмов действия АТФаз семейства TIP49 Молекулярное моделирование динамики и механизмов действия АТФаз семейства TIP49 Молекулярное моделирование динамики и механизмов действия АТФаз семейства TIP49
>

Диссертация - 480 руб., доставка 10 минут, круглосуточно, без выходных и праздников

Автореферат - бесплатно, доставка 10 минут, круглосуточно, без выходных и праздников

Афанасьева Арина Сергеевна. Молекулярное моделирование динамики и механизмов действия АТФаз семейства TIP49: диссертация ... кандидата физико-математических наук: 03.01.02 / Афанасьева Арина Сергеевна;[Место защиты: Санкт-Петербургский политехнический университет Петра Великого].- Санкт-Петербург, 2015.- 126 с.

Содержание к диссертации

Введение

Глава 1. Обзор литературы 11

1.1. Биологическая роль белков TIP49a и TIP49b 11

1.1.1. TIP49a и TIP49b - компоненты хроматин ремоделирующих комплексов 14

1.1.2. TIP49a и TIP49b участвуют в транскрипции 16

1.1.3. Участие TIP49a и TIP49b в сборке snoRNP и митозе 17

1.2. Биохимические исследования белков TIP49a и TIP49b 18

1.2.1. Исследования АТФазной активности TIP49a и TIP49b 18

1.2.2. Участие TIP49a/TIP49b в процессинге ДНК

1.3. Структура и свойства белков семейства TIP49 20

1.4. Исследования белков TIP49 методами численного моделирования 22

Глава 2. Динамика и механизмы взаимодействия гетерогексамерных кольцевых комплексов белков TIP49a/b с дн-ДНК 24

2.1. Методы исследования динамики ДНК в комплексе с гексамером TIP49 25

2.1.1. Моделирование молекулярной динамики с применением метода GPU PMEMD 28

2.2. Динамика фрагментов днДНК в гетерогексамерных комплексах TIP49 31

2.3. Динамика комплекса TIP49a/b – днДНК с АТФ в АТФ-связывающих центрах белка 38

2.4. Обсуждение результатов исследования структурных характеристик растяжения ДНК в гексамерном комплексе TIP49 41

Глава 3. Исследование динамики активной воды в АТФ-связывающих центрах гексамеров TIP49a/b 44

3.1. Методика исследования динамики активной воды в АТФ-связывающих белках семейства TIP49 44

3.2. Механизмы гидролиза АТФ в белках mkTIP49

3.2.1. Исследование конформационной подвижности мономеров mkTIP49 с помощью методов молекулярной динамики 47

3.2.2. Структурная организация АТФ-связывающего центра в мономерах mkTIP49 49

3.2.3. Конформационная подвижность АТФ-связывающих центров в гексамерах белков mkTIP49 52

3.2.4. Динамика литической воды внутри АТФ-связывающего центра гексамеров TIP49 3.3. Исследование динамики литической воды в АТФ-связывающих центрах гексамеров человеческого TIP49a/b в комплексе с днДНК различного состава 61

3.4. Результаты исследования динамики активной воды в АТФ-связывающих центрах гексамеров TIP49a/b 67

Глава 4. Исследование мотивов гидратации активных центров АТФаз и влияния структурной воды в активном центре на связывание лигандов 70

4.1. Научное обоснование проблемы 72

4.2. Программная реализация метода поиска структурной воды в активных центрах белков 4.2.1. Минимизация энергии методом Монте-Карло 76

4.2.2. Метод молекулярного докинга 77

4.3. Исследование воспроизводимости результатов разработанной процедуры поиска структурной воды 78

4.4. Создание репрезентативного набора пространственных структур АТФ-связывающих белков человека 82

4.4.1. Анализ структуры центров связывания АТФ в различных человеческих АТФ-связывающих белках и выявление уникальных структурных характеристик для каждого белка 84

4.5. Результаты исследования активных центров АТФ-связывающих белков человека разработанным методом поиска структурной воды 89

4.5.1. Исследование мотивов гидратации АТФ-связывающих центров 90

4.5.2. Исследование влияния присутствия структурной воды в активном центре на связывание лигандов 98

4.6. Заключение по результатам работы разработанного метода поиска структурной воды в активном центре 102

Основные результаты и выводы 104

Благодарности 105

Список сокращений и условных обозначений 106

Список публикаций по теме диссертации 107

Список литературы

Введение к работе

Актуальность. АТФазы играют ключевую роль в трансформации химической энергии в важнейших биологических процессах живой клетки. Активные центры этих белков устроены таким образом, чтобы осуществлять связывание и гидролиз молекулы АТФ с образованием АДФ и свободного фосфат-иона. В ходе реакции дефосфорилирования выделяется энергия, которая реализуется ферментами для осуществления химических реакций, протекание которых без этой дополнительной энергии было бы невозможным, а также для механической работы. Множество различных типов АТФаз присутствует в живой клетке. Наиболее широкий класс представляют собой АТФазы Уолкер-типа, которые характеризуются наличием консервативных участков структуры Уолкер-А (или P-loop, фосфат связывающая петля) и Уолкер-B мотивы. Именно эти структурные участки осуществляют связывание и гидролиз АТФ молекул.

Белки семейства TIP49, относящиеся к суперсемейству ДНК-зависимых АТФаз ААА+, являются неотъемлемыми для жизнедеятельности эукариотических клеток и архей. Как часть комплексов ремоделирования хроматина TIP60, SWR1 и INO80 они играют важную роль в большинстве процессов жизнедеятельности клеток, таких как транскрипция, репарация ДНК, митоз и апоптоз. Недавно было показано, что эти белки играют ключевую роль в канцерогенезе, а селективные ингибиторы АТФазной активности этих белков являются перспективными лекарственными средствами в борьбе с несколькими видами рака человека.

Механизм гидролиза АТФ в белках семейства ААА+ предполагает протекание нуклеофильной атаки активированных молекул воды на -фосфат АТФ и образование пяти-координированного переходного состояния. Отрицательный заряд, накапливающийся вблизи -фосфата, компенсируется зарядом иона Mg2+ и зарядами доноров водородных связей из окружающих аминокислотных остатков боковых цепей активного центра (АЦ) белка. Следовательно, АЦ таких АТФаз должны включать остатки, способные к нуклеофильной активации воды, и электрофильные группы для стабилизации отрицательно заряженного переходного состояния, а также группы, осуществляющие координацию иона Mg2+, который является необходимым кофактором реакции. АЦ АТФаз, как правило, содержат один или несколько «сенсоров», которые могут участвовать в реакции с АТФ, однако основная их функция заключается в получении информации о наличии или отсутствии -фосфата и в передаче сигнала к удаленным АЦ белка путем некоторых конформационных перестроек.

Исследование механизмов действия белков семейства TIP49 приведет к более глубокому пониманию их функций в клетке, а также их роли в составе макромолекулярных комплексов, и откроет новые перспективы в лечении заболеваний, ассоциированных с нарушениями работы

этих белков.

Цели работы:

выяснение механизмов предполагаемой геликазной и ДНК-зависимой АТФазной активности белков семейства TIP49 с помощью теоретических методов молекулярного моделирования и молекулярной динамики в периодическом водном боксе.

разработка метода расчета позиций структурной воды в АЦ АТФаз путем исследования мотивов гидратации АТФ.

Для достижения этих целей были поставлены следующие задачи:

  1. Исследование механизма гидролиза АТФ в белках семейства TIP49 методом молекулярной динамики

  2. Анализ гидратации АЦ белков на примере репрезентативного набора кристаллических структур АТФаз человека.

  3. Выявление характерных мотивов гидратации лигандов в АЦ белков из репрезентативного набора.

  4. Разработка метода расчета возможных положений структурной воды в АЦ белка и сравнение полученных результатов с кристаллографическими данными (Protein Data Bank).

  5. Сравнительное исследование эффективности докинга (структурно-ориентированного метода поиска низкоэнергетических конформаций лигандов в АЦ белков) в зависимости от включения молекул структурной воды, определенной разработанным методом.

Объектом исследования этой работы являются белки TIP49, относящиеся к семейству ДНК-зависимых АТФаз ААА+ и являющиеся неотъемлемыми для жизнедеятельности эукариотических клеток и архей. Кроме того для исследования характерных мотивов гидратации АТФ-связывающих центров использовался репрезентативный набор кристаллических структур АТФаз человека высокого разрешения. В качестве методов исследования использованы различные методы компьютерного моделирования: метод молекулярной динамики (МД) в периодическом водном боксе, минимизация энергии методом Монте-Карло, метод молекулярного докинга, а также методы собственной разработки с использованием их различных комбинаций.

Научная новизна работы.

В работе впервые была получена регуляризованная структура гетерогексамерного комплекса TIP49a/b с коротким фрагментом дн-ДНК внутри центрального канала с помощью молекулярного докинга, выполненного в программном пакете ICM-Pro. Конформационная стабильность комплекса была исследована путем рассчета МД траектории исследуемой молекулярной системы (350000 атомов, включая атомы воды) в водном окружении на протяжении 50 наносек. В ходе МД наблюдались значительные структурные изменения ДНК в результате взаимодействия с положительно заряженными аминокислотными остатками белка (Arg+ и Lys+). Это взаимодействие привело к локальному раскручиванию центральной части спирали ДНК, находящейся внутри канала, образованного гексамерным комплексом белков со стороны большой бороздки ДНК. Важным и неоднократно воспроизводимым результатом оказалось то, что присутствие АТФ в составе комплекса оказывает значительное влияние на структурные изменения в ДНК, приводя к разрыву некоторых комплементарных связей между основаниями ДНК, особенно в случае днДНК с высоким АТ-содержанием, что может играть значительную роль в механизмах геликазной активности этих белков.

В ходе работы был впервые разработан новый метод исследования динамики водного окружения в АЦ АТФаз, который проливает свет на роль динамики воды в активных центрах белков TIP49, на их каталитическую активность и, таким образом, дает более глубокое представление о механизмах их действия. Кроме того, этот подход может быть весьма полезным для исследования механизмов каталитической активности не только ДНК зависимых АТФаз, но и ферментов других классов.

Разработан новый метод поиска всех возможных конформаций тесно-связанной (структурной) воды в АЦ АТФаз, основанный на расчетах параметров водородных связей воды с белком, а также расчетах свободной энергии молекулы воды в белковом комплексе методом Монте-Карло. Эффективность метода исследована на репрезентативном наборе кристаллических структур АТФаз человека. Продемонстрировано повышение эффективности молекулярного докинга при учете структурной воды в АЦ, полученной с помощью разработанного подхода.

Теоретическая и практическая значимость В данной работе предложен молекулярный механизм функциональной активности белков семейства TIP49, который проясняет роль этих белков в составе хроматин-ремоделирующих комплексов в клетке. Разработанный в ходе работы метод исследования динамики водного окружения в АЦ АТФаз может быть использован для исследования механизмов каталитической активности не только ДНК-зависимых АТФаз, но и других ферментов.

Разработанный метод поиска структурной воды в АЦ значительно улучшает эффективность методов докинга лигандов в активных центрах различных белков и поэтому является

практически важным для конструирования высоко-специфичных лигандов белков методами компьютерного моделирования.

Положения, выносимые на защиту.

  1. ДНК-зависимая АТФазная активность гексамерных комплексов белков TIP49 обусловлена ассоциативным механизмом реакции гидролиза АТФ.

  2. Локальное раскручивание спирали ДНК является результатом взаимодействия с положительно заряженными белковыми петлями в центральном канале кольцевого гексамерного комплекса исследуемых белков.

  3. Присутствие АТФ в АЦ гексамера TIP49 в процессе моделирования МД влияет на динамику и конечную структуру днДНК, приводя к разрыву части комплементарных связей в AT-богатых последовательностях ДНК.

  4. Присутствие ДНК в комплексе приводит к значительному увеличению как заселенности атакующей позиции в активном центре гексамерного комплекса TIP49 молекулами литической воды, так и вероятности формирования водородных связей с такими молекулами воды, и, таким образом, может увеличивать скорость гидролиза АТФ.

  5. Учет структурной воды в активном центре белка, полученной с помощью разработанной утилиты AquaBridge на базе программного пакета молекулярного моделирования ICM-Pro, приводит к улучшению точности результатов молекулярного докинга.

Апробация работы и публикации. По материалам диссертации опубликованы 14 работ (в том числе 3 статьи в рецензируемых международных и отечественных научных журналах [1, , ]).

Основные результаты работы были представлены на 38м, 39м и 40м международном конгрессе Федерации Европейского Биохимического Общества, FEBS (Санкт-Петербург, Россия, июнь 2013; Париж, Франция, сентябрь 2014; Берлин, Германия, июль 2015) [, , , , , ], XXI и XXII Российском национальном конгрессе «Человек и лекарство» (Москва, Россия, апрель 2014 и апрель 2015) [, ], III Всероссийском Конгрессе Молодых Ученых, ВКМУ ИТМО (Санкт-Петербург, Россия, апрель 2014) [], 20м международном симпозиуме «EuroQSAR, Понимание Химико-Биологических Взаимодействий» (Санкт-Петербург, Россия. Сентябрь 2014) [13], 2й международной конференции Pontin&Reptin (Оэйраш, Португалия, октябрь 2014), международном научно-практическом семинаре «Ресурсы для компьютерной разработки лекарств» (Хинкстон, Англия, ноябрь 2014), а также международной конференции

молодых ученых «Экспериментальная и теоретическая биофизика’12» (Пущино, Россия, октябрь 2012) [].

Личный вклад автора. состоял в проведении компьютерного моделирования исследуемых молекулярных систем, в обработке, анализе и интерпретации полученных результатов, а также в подготовке докладов и публикаций.

Структура и объем диссертации. Диссертационная работа состоит из введения, трех глав, выводов, списка цитируемой литературы (105 наименований). Работа изложена на 126 страницах, включает 33 рисунка, 9 таблиц и 1 приложение.

Биохимические исследования белков TIP49a и TIP49b

TIP49a и TIP49b регулируют транскрипцию не только путем ассоциации с хроматин-ремоделирующими комплексами, но также посредством взаимодействия с различными факторами транскрипции и РНК-полимеразой II холоферментным комплексом. Впервые TIP49a и TIP49b были обнаружены благодаря взаимодействию с ТАТА-связывающим белком [26, 35] и большим холоферментным комплексом РНК-полимеразы II [37], который содержит более 50 компонентов и отвечает за транскрипцию белок-кодирующих генов. Позже TIP49a/b, также были определены по физическому взаимодействию с белком -катенином, ассоциированным с транскрипцией [27, 15], и с транскрипционными факторами с-Тус [20], Е2F1 (только TIP49a [45]) и ATF2 (только RuvBL2 [46]). С тех пор для их гомологов в млекопитающих были определены по крайней мере два онкогенных пути, первый связан с с-Myc, второй с -катенином. Среди транскрипционных факторов с онкогенным потенциалом с-Myc является одной из наиболее популярных мишеней для мутаций в исследованиях рака человека [47, 47]. N-концевой фрагмент с-Myc содержит два высоко консервативных участка, которые называются Myc гомологичный бокс I (MbI) и Myc-гомологичный бокс II (MbII). MbII домен необходим практически для всех видов биологической активности с-Myc, включая онкогенную трансформацию, апоптоз и способность блокировать дифференциацию и стимулировать клеточную пролиферацию [48, 49, 50, 51]. Было показано, что этот участок связывает TIP49a и TIP49b [20]. Myc-связывающий мотив в белках TIP49a и TIP49b состоит из аминокислот 136-187 [20]. Миссенс-мутация в АТФазном структурном мотиве TIP49a приводит к доминантному ингибированию онкогенной активности c-Myc, но не нарушает нормальный рост клеток, что указывает на необходимость функционирования TIP49a в процессе онкогенной трансформации c-Myc [45, 20]. TIP49a также был идентифицирован в качестве ключевого модулятора апоптотической активности как для c-Myc, так и для Е2F1. В самом деле, было показано, что TIP49a также связывается с доменом трансактивации Е2F1 и модулирует, таким образом, трансформационную и апоптотическую активности [45]. Не смотря на то, что для TIP49b не было обнаружено никакой функциональной роли в этих системах, предлагается, что N-концевой участок c-Myc предназначен для связывания как TIP49a, так и TIP49b для осуществления контроля транскрипции генов-мишеней, необходимых для клеточной трансформации.

SnoRNP (small nucleolar ribonucleoprotein) – комплексы, состоящие из небольших фрагментов ядерной РНК (snoRNA) и ассоциированных с ними белков. Эти комплексы перемещаются в клеточном ядре после синтеза в нуклеоплазме. Функции snoRNP заключаются в модификации и процессинге пре-рибосомной РНК и, таким образом, необходимы для биогенеза рибосом [52]. TIP49a и TIP49b участвуют в сборке snoRNP и ее последующем созревании в нуклеоплазме [53, 54]. Показано, что TIP49b связывается исключительно с прекурсорным комплексом snoRNP [54], в то время как TIP49a связывается со snoRNP на стадии созревания. Взаимодействие с TIP49b представляет собой промежуточные ассоциации на ранних стадиях биогенеза, связывая синтез snoРНК со сборкой snoRNP и локализацией. Было предположено, что TIP49a выступает в качестве ремоделирующего фактора, приводящего к структурным изменениям в ходе финальной стадии созревания snoRNP в нуклеоплазме. Однако TIP49a не связывается со зрелой формой комплекса в ядре. Эти данные позволяют предположить, что TIP49a и TIP49b могут напрямую взаимодействовать с РНК, однако это предположение требует проверки.

Список предполагаемых функций TIP49a и TIP49b был расширен благодаря наблюдениям ассоциации обоих белков с центросомами и элементами митотического аппарата в ходе митоза [55, 56]. В случае TIP49a показано, что эти ассоциации происходят через взаимодействие с тубулином [55]. Интересно различие локализации TIP49a и TIP49b во время телофазы и цитокинеза [56]. На основе этих данных можно предположить, что TIP49a и TIP49b могут иметь различающиеся индивидуальные функции в процессе митоза, которые отличаются от их роли в транскрипции и ремоделировании хроматина. Взятые вместе TIP49a и TIP49b участвуют во многих жизненно важных клеточных процессах. Однако механизм их функционирования до сих пор неясен.

Несколько групп показали наличие АТФазной активности в экспериментах in vitro как для TIP49a, так и для TIP49b белков человека, что соответствует принадлежности этих белков семейству ААА+ АТФаз. Наблюдаемые индивидуальные показатели АТФазной активности были менее 0,1 (моль гидрализованной АТФ / моль мономера в минуту) [28, 38]. Интересно, что показатели индивидуальной АТФазной активности TIP49a и TIP49b были значительно выше в первые минуты экспериментов, после чего белки практически не демонстрировали АТФазную активность, либо она была очень низкой. Такой низкий уровень АТФазной активности согласуется с наблюдениями в кристаллических структурах TIP49b, где высвобождение АДФ блокируется формированием гексамера [57]. Более того, для смешанного двойного гексамера TIP49a/b было показано значительное увеличение АТФазной активности в экспериментах in vitro, в связи с чем, было предположено, что такая форма белка является каталитически активной в клетке. Значение АТФазной активности комплекса составляло до 1 моль гидрализованной АТФ / моль мономера белка в минуту, что примерно в десять раз превышает показатели АТФазной активности отдельных белков [28, 38]. Было показано, что оба TIP49a и TIP49b связывают и гидролизуют АТФ в составе гексамерного комплекса, и формирование этого комплекса может быть необходимым для высвобождения АДФ в последующих циклах гидролиза [38]. Можно предположить, что наличие некоторых пост-трансляционных модификаций TIP49a/TIP49b или их взаимодействие с другими белками или субстратами может приводить к увеличению АТФазной активности отдельных белков или комплекса TIP49a/b.

Для дрожжевых аналогов TIP49a и TIP49b в составе комплекса было показано стимулирование АТФазной активности в присутствии одноцепочечной ДНК, а также геликазная активность в экспериментах in vitro [58], хотя 5 -3 направленность геликазной активности комплекса в этих экспериментах не совпадает с данными для комплексов TIP60 и INO80 (компонентами которых они являются). Кроме того, в нескольких исследованиях, было продемонстрировано отсутствие ДНК-зависимой геликазной активности для человеческих TIP49a и TIP49b in vitro [57, 38, 59, 37]. В отличие от экспериментов с человеческим TIP49, для крысиных аналогов TIP49a/TIP49b было показано стимулирование АТФазной активности в присутствие одноцепочечной ДНК для отдельных белков, а также показана противоположно направленная геликазная активность белков in vitro [26, 36]. Было сделано предположение о возможности наличия некоторых загрязнений в ходе очистки белков, повлиявших на результаты экспериментов по измерению ДНК-стимулированной АТФазной и геликазной активности TIP49 [38, 59, 37].

Наличие АТФазной активности TIP49a/TIP49b для всех аналогов, найденных в различных организмах, не подлежит сомнению; однако, геликазная активность этих белков до сих пор является спорным вопросом. Различные результаты в разных экспериментальных группах не позволяет окончательно сформировать выводы о функциях TIP49a и TIP49b в живой клетке.

Динамика фрагментов днДНК в гетерогексамерных комплексах TIP49

Интересно, что самые стабильные взаимодействия (по значению их заселенности) образуют R339 и R334 из различных субъединиц гексамера TIP49a/b. В основном, происходит взаимодействие с фосфатной цепью ДНК, только аргинин из субъединицы A взаимодействует непосредственно с основаниями ДНК G11 из I цепи и G29 из II цепи, поскольку петля из субъединицы A расположена напротив большой бороздки ДНК.

Мы также исследовали изменение структурных характеристик днДНК в процессе МД, чтобы понять, как происходит процесс раскручивания спирали ДНК. На рис. 2.4 а) показано изменение шага спирали, усредненное по трем участкам ДНК (центральный участок, расположенный внутри гексамерного канала: 6-15 пары оснований, и концевые участки, по 5 пар оснований, расположенные за пределами гексамерного кольца). Шаг спирали начальной структуры ДНК равен 32,4 A (классическая B-форма), в процессе динамики шаг спирали центральной части днДНК увеличивается до 61,4 ± 5,4 A , при этом примерно до 20-й нс молекулярной динамики значение шага спирали равномерно возрастает, а затем видимо достигает равновесного значения, и мы наблюдаем на графике флуктуации около среднего. В то же время за время моделирования МД шаг спирали хвостовых участков незначительно отклоняется от начального (среднее значение в течение всего времени динамики 35,6 ± 2,3 A и 37,2 ± 5,2 A для первого и второго концевых участков соответственно), что свидетельствует об устойчивости конформации участков ДНК, не взаимодействующих с белком. На рис. 2.4 (б-г) графики основных структурных характеристик центрального (растянутого) участка ДНК: угол поворота пар оснований относительно главной оси ДНК (характеризует скрученность спирали), расстояние между соседними парами оснований вдоль главной оси ДНК и количество пар оснований, приходящихся на один виток спирали. Видно, что все характеристики претерпевают значительные изменения в процессе динамики, однако спиральный подъем изменяется в меньшей степени по сравнению со значением скрученности, особенно на фоне тепловых флуктуаций значения спирального подъема. График шага спирали (рис. 2.4 а) похож на инвертированный график спиральной скрученности (рис. 2.4 в), таким образом, основные структурные изменения ДНК связаны с уменьшением скрученности спирали ДНК, т.е. наблюдается раскручивание днДНК. Рис. 2.4. Изменение основных структурных характеристик ДНК в процессе молекулярной динамики: а) шаг спирали для различных участков ДНК, б) расстояние между соседними парами баз ДНК для центрального участка, в) угол скрученности относительно спиральной оси, г) число пар оснований, приходящихся на один спиральный оборот

Проводилась также серия экспериментов по молекулярной динамике комплекса смешанного гетерогексамера TIP49a/b с фрагментами днДНК как в присутствии, так и в отсутствии АТФ в АТФ-связывающем центре. Результаты этих вычислительных экспериментов показали, что присутствие АТФ в комплексе сильно влияет на динамику связанного в центральном канале смешанного гетерогексамера TIP49a/b днДНК (рис. 2.5). В частности, для днДНК со 100%-м AT составом (повторяющийся АТАТ мотив) наблюдается разрыв части водородных связей между основаниями, ведущих к потере спаренного состояния на ограниченном участке ДНК (7-10-я пары оснований), при этом в комплексах без АТФ в этом случае наблюдается только раскручивание спирали ДНК с сохранением сопряженного состояния ДНК оснований. (рис. 2.6) Можно предположить, что такие структурные изменения является результатом изменения электростатического потенциала в присутствии АТФ в комплексе, дополнительный отрицательный заряд которого приводит к смещению электростатического потенциала на протон-донорных группах ДНК оснований в сторону более отрицательных значений.

Этот эффект приводит к ослаблению и разрушению водородных связей между парами оснований ДНК в том месте центрального канала, где сдвиг потенциала максимальный. В результате разрыва комплементарных связей, потерявшие спаренное состояние основания проникают друг под другом с образованием стэкинг-взаимодействия азотистых оснований. Электростатический потенциал белковой поверхности был рассчитан с помощью алгоритма REBEL для решения уравнения Пуассона методом граничных элементов в программном пакете ICM-Pro. Расчеты электростатического потенциала в точке, расположенной на центральной оси центрального канала в наиболее электроотрицательной зоне, показали, что в исследуемом мульти-молекулярном комплексе в отсутствие АТФ в АТФ-связывающих центрах значение электростатического потенциала -5.9 ккал/e, а в присутствии это значение уменьшается до -9.0 ккал/е. Этот сдвиг электростического потенциала на -3.1 ккал/е может объяснить наблюдаемую разницу в динамике днДНК в центральном канале смешанного гетерогексамера TIP49a/b.

Конформационная подвижность АТФ-связывающих центров в гексамерах белков mkTIP49

В качестве объекта для исследования молекулярных механизмов гидролиза АТФ мы составили репрезентативный набор кристаллических структур АТФ-связывающих белков человека, при этом на выбор структур в репрезентативный набор накладывался ряд ограничений, таких как низкий уровень гомологии по последовательности, высокое разрешение структуры, наличие АТФ/АДФ в АЦ и другие. Поиск всех АТФ связывающих белков осуществлялся с помощью базы данных пространственных структур PDB (Protein Data Bank [100]), при этом отбирались все структуры белков, содержащие в качестве лиганда молекулы АТФ или АДФ, также ставилось ограничение на принадлежность к таксономической группе Homo sapiens и на качество структур (отбирались только структуры, полученные методом рентгеновской кристаллографии разрешением не хуже 3 A ), таким образом, были отобраны 342 кристаллические структуры АТФаз и АТФ-связывающих белков. Однако среди этих структур есть множество одинаковых и близкородственных белков. Поэтому для получения репрезентативного набора была произведена процедура сравнения аминокислотных последовательностей белковых доменов, содержащих интересующие нас АТФ-связывающие центры, и рассчитан коэффициент парной идентичности (alignment ID) белковых последовательностей. Далее были отобраны только те структуры, идентичность которых друг с другом, не превышает 30%, что означает, что данные белки не являются гомологичными по структуре, данный подход соответствует правилам составления репрезентативного набора, описанным в работе [102]. Таким образом, был получен набор из 92 белков. Затем из этого набора были также удалены структуры, содержащие в составе активного центра фрагменты полинуклеатидов (ДНК/РНК цепей) (такие структуры следует рассматривать отдельно), а также структуры, имеющие неустранимые структурные нарушения и разрывы главной цепи вблизи АЦ. В результате осталось 57 структур комплексов белков с АТФ или АДФ в качестве лиганда. (см. таблицу в Приложении 1). Мы провели сравнение и анализ АТФ – связывающих центров белков из нашего репрезентативного набора. Так как составленный нами репрезентативный набор представляет собой комплексы белка с молекулой АТФ/АДФ, определение АЦ сводится к выделению области белка вокруг молекулы АТФ/АДФ, то есть в качестве АТФ-связывающего центра были выбраны все аминокислотные остатки белка, входящие в ближайшее окружение АТФ/АДФ (расстояние до лиганда менее 10 A ).

Для анализа структурной схожести центров связывания АТФ была произведена процедура наложения (суперимпозирования) центров связывания на основе метода APF (Atomic Property Fields) [103]. Концепция метода APF основана на расчете мульти-компонентной системы потенциалов, отражающих различные атомные свойства в каждой точке расчетного пространства. Учитываются семь свойств атомов, определенных из эмпирических физико-химические компонент (донорно-акцепторные свойства, sp2 гибридизация, липофильность, размер молекулярной системы, электроотрицательность и заряд). Суперимпозирование молекулярных объектов (в нашем случае АЦ, определенные как некоторая область вокруг лиганда – АТФ/АДФ) осуществляется с помощью минимизации энергии методом Монте-Карло в поле комплексного потенциала атомных свойств, включая энергию стандартного силового поля ICMFF. Так как результирующее значение APF функции для пары объектов включает в себя размерный коэффициент, проводить сравнение этих значений для разных пар объектов в таком виде нельзя. Поэтому для этих целей используют коэффициент похожести, рассчитываемый по формуле: i j S ii S j j где Si j, S ji – APF функции для АЦ i и j белков, и наоборот j и i белков (в связи с особенностью алгоритма этой процедуры эти величины оказываются похожими, но неодинаковыми), Sii, S j j – APF скоры при суперимпозировании белкового АЦ на себя, расчет этой величины необходим для нормировки по размеру (так как разные АЦ содержат разное число аминокислот, APF скор будет зависеть от размера АЦ).

В результате расчета попарных коэффициентов похожести белков из нашего репрезентативного набора данным методом мы получили матрицу значений от 0 до 1, где 1 соответствует идентичным объектам (в нашем случае, суперимпозирование белкового АЦ на себя), а 0 соответственно абсолютно непохожим белковым АЦ (57 57). На рис. 4.2 представлены результаты расчета коэффициента похожести (Similarity) для 57 белков репрезентативного набора (i, j – порядковые номера белков в наборе), из этих данных видно, что в нашем наборе есть структурно похожие АЦ (говорить о структурно похожих АЦ можно при значениях коэффициента Simij 0.45 примерно, при этих значениях совпадают основные фрагменты вторичной структуры белковых АЦ).

На рис. 4.3 приведен пример пары структурно похожих АЦ (Simij = 0,65), при этом данные белки имеют низкий уровень совпадения аминокислотной последовательности (alignment ID белковых доменов менее 15%, alignment ID внутри АЦ 26%), тем не менее, эти белки осуществляют схожие функции: hCINAP по функциям относится к киназам и трансферазам, PAPS также относится к киназам и нуклеотидтрансферазам, участвует в метаболизме серы. Оба белка содержат в АЦ структурный мотив характерный для АТФаз – P-loop участок (петля, связывающая фосфаты (Phosphate-binding loop), Уолкер-A). Предположительно, такие белки должны связывать похожие лиганды, так как АЦ структурно похожи и выполняют схожие функции. Рис. 4.2. Матрица результатов расчета парных коэффициентов похожести АТФ-связывающих центров на основе метода APF, i, j – порядковые номера белков в репрезентативном наборе (табл. в Приложении 1)

Процедура APF помогла выявить основные способы организации АТФ-азных центров, среди них есть два структурных мотива, встречающиеся наиболее часто. Первый мотив содержит Уолкер-A и Уолкер-Б структурные элементы (Уолкер А представляет собой -спираль и участок петли, на изгибе которой, находятся аминокислотные остатки, способные связывать фосфатные группы АТФ/АДФ молекул последовательность: GXXXXGK(T/S); Уолкер-Б мотив включает в себя аспартат и глутамат в составе DEAD/DEAH аминокислотных последовательностей, присутствует в большинстве геликаз. Аспартат участвует в координировании иона магния, а глутамат необходим для протекания гидролиза АТФ). Второй мотив представляет собой два фрагмента -листов, в полости между которыми располагается молекула АТФ/АДФ (рис. Рис. 4.3. Пространственные структуры суперимпозированных методом APF АЦ двух белков: hCINAP (Q5F2S9_HUMAN) (покрашен желтым) и человеческой 3 -фосфоаденозин-5 -фосфосульфат синтетазы 1 (PAPS1_HUMAN) (покрашен синим). Также приведен результат выравнивания аминокислотных последовательностей АЦ этих белков 4.4), также встречаются другие способы укладки цепи в структуре АТФ-азного центра, не похожие на эти два.

В общем случае, на основе данных о структурной схожести можно кластеризовать белки по группам, однако для нашего набора АТФ-связывающих белков процедура кластеризации не удается, так как нет явных групп, внутри которых все АЦ были бы в одинаковой степени похожи друг на друга. Однако в дальнейшем мы исследовали на примере полученного репрезентативного набора мотивы гидратации АТФазных центров. На основе кластерного анализа удалось выявить несколько групп белков, сходных по мотивам гидратации АТФ.

Исследование воспроизводимости результатов разработанной процедуры поиска структурной воды

Следующим этапом работы было исследование влияния структурной воды на результаты молекулярного докинга. С этой целью мы провели серию экспериментов молекулярного скрининга (докинг большой базы низкомолекулярных соединений, при котором боковые цепи остатков в рецепторе зафиксированы) с использованием обучающей выборки DUD (a Directory of Useful Decoys), данная выборка включает для каждого белка набор известных лигандов, а также набор декоев, полученных методами компьютерного конструирования (низкомолекулярные соединения, схожие по строению с лигандами, однако отличающиеся по физико-химическим свойствам и заведомо не связывающиеся в данном АЦ) [90]. Базы данных типа DUD предназначены для тестирования алгоритмов докинга. DUD содержит в общей сложности 2.950 активных соединений (лигандов) для 40 белковых мишеней. На каждый лиганд, приходится 36 соединений-декоев с аналогичными физическими свойствами (например, молекулярный вес, рассчитанный LogP), но разнородных по топологии.

Мы исследовали результаты молекулярного скриннинга наборов соединений из DUD базы данных для белковых структур с тремя типами предварительной обработки: 1) после удаления всех молекулы воды из АЦ; 2) после оптимизации воды, имеющейся в кристаллической структуре, средствами ICM-Pro. 3) после обработки АЦ белка с помощью утилиты AquaBridge. (рис. 4.9) Метод молекулярного скрининга основан на ранжировании базы данных химических соединений, участвующих в процессе, по значениям скора Графики ROC кривых (reciever operating characteristic), демонстрирующих эффективность докинга для гликогенфосфорилазы 1) без воды, 2) с оптимизированной кристаллической водой, 3) со структурной водой, полученной методом AquaBridge докинга (рассчитывается с помощью встроенной функции, как описано в п. 4.2.2. Метод молекулярного докинга), при этом оптимально, большая часть активных соединений (лигандов) должна иметь ранг выше, чем ранг большинства соединений-декоев. На основе полученных данных, мы проанализировали эффективность скрининга путем построения графиков приемно-операционных характеристик (так называемые ROC кривые). На рисунке 4.9 показаны ROC-кривые, построенные по результатам скрининга рецептора гликогенфосфорилазы с набором из 52 лигандов и 2140 декоев из базы данных DUD.

Площадь под ROC кривой (AUC – Area Under Curve) характеризует эффективность докинга в целом, чем выше значение AUC, тем эффективнее данный алгоритм докинга. Лучшее значение AUC было получено для докинга белка, со структурной водой в АЦ, полученной в результате обработки с помощью AquaBridge (на рис. 4.9 кривая 3), значение AUC(ROC3) = 84%, без воды в АЦ значение AUC довольно близкое AUC(ROC1) = 83% и для белка с предварительно обработанной кристаллической водой в каталитическом центре значение AUC(ROC2) = 75%. Другой важной характеристикой ROC-кривой является скорость насыщения функции, то есть значения функции при малых значениях абсциссы 5 и 10%, которые характеризуют долю лигандов, попавших в топ 5 и в топ 10% по значениям скоров докинга. Этот фактор отражает эффективность алгоритма докинга правильно обнаруживать активные соединения из используемой базы данных по сравнению с методом случайного выбора. Для рецептора гликогенфосфорилазы мы получили следующие значения функций для 5% и 10%: ROC110% = 59.6%, ROC210% = 57.7%, ROC310% = 75.0%, ROC15% = 50.0%, ROC25% = 57.7%, ROC35% = 65.4%. Таким образом, наибольшие значения ROC5% и ROC10% были получены в случае докинга с учетом структурной воды в АЦ, следовательно, такой подход приводит к увеличению селективности поиска лигандов методом молекулярного докинга.

Другой важной характеристикой эффективности докинга является точность предсказанной конформации лиганда в АЦ. Мы протестировали докинг АТФ в АЦ белков из нашего репрезентативного набора человеческих АТФ-связывающих белков в присутствии и отсутствии структурной воды, и сравнили полученные конформации АТФ с конформациями, известными из кристаллических данных. Для оценки точности полученной конформации мы рассчитывали значение RMSD (Root-mean-square deviation) – величина, характеризующая среднее квадратичное расстояние между эквивалентными атомами двух конформаций молекулы. На рис. 4.10 показаны значения RMSD между конформациями АТФ, кристаллической и полученной в результате докинга, для 10 кристаллических структур АТФ-связывающих белков человека. В большинстве случаев мы наблюдали значительное улучшение точности определения конформации лиганда при учете структурной воды, полученной с помощью утилиты AquaBridge (рис. 4.10).

Водное окружение, как известно, играет важную роль при связывании лигандов в АЦ белков. В данной работе мы разработали новый метод и соответствующее программное обеспечение для поиска всех возможных конформаций структурной воды в АЦ и протестировали эффективность метода на репрезентативном наборе кристаллических структур АТФ-связывающих белков человека. Во многих случаях, позиции структурной воды, найденные нашим методом, совпадают с теми, которые имеются в кристаллических структурах (RMSD атомов кислорода в пределах 1 A ). Также обнаруживается некоторое количество низкоэнергетических конформаций воды в АЦ, которые отсутствуют в кристаллических структурах. Показано что, учет гидратации АЦ белков приводит к значительному улучшению результатов докинга. Таким образом, разработанная нами утилита AquaBridge является полезным инструментом для многих задач молекулярного моделирования, структурно-ориентированных компьютерных методов разработки лекарственных средств и теоретического предсказания энергии связывания комплекса белок-лиганд.