Содержание к диссертации
Введение
Глава 1. Обзор литературы 14
1.1. Рецепторные системы клетки и роль трансмембранных (ТМ) доменов 14
1.2. Концепция мотивов димеризации. Гликофориновый мотив 22
1.3. Структура трансмембранного димера гликофорина А и её особенности 26
1.4. Роль липидной мембраны в процессах димеризации мембранных белков 28
1.5. Методы изучения олигомеризации ТМ-доменов мембранных белков 30
1.6. Предсказание пространственной структуры мембранных белков с помощью вычислительных методов
1.6.1. Поиск предполагаемых трансмембранных доменов в аминокислотных последовательностях 33
1.6.2. Моделирование структуры мембранных белков по гомологии 33
1.6.3. Предсказание пространственной структуры димеров и олигомеров -спиральных доменов в мембранном окружении 34
1.6.4. Особенности учёта мембранного окружения при предсказании структуры мембранных белков
1.7. Оценка свободной энергии ассоциации трансмембранных доменов белков в липидном бислое с помощью компьютерного моделирования 40
1.8. Использование “крупнозернистого” приближения для моделирования динамики мембранных белков 42
1.9. Заключение 44
Глава 2. Материалы и методы 45
2.1. Аминокислотные последовательности пептидов и состав модельных мембран 45
2.2. Построение моделей пространственной структуры изучаемых систем
2.2.1. Построение моделей липидных мембран без пептидов 46
2.2.2. Построение моделей мономеров ТМ-пептидов 48
2.2.3. Построение моделей димеров ТМ-пептидов з
2.3. Расчёты траекторий молекулярной динамики 50
2.3.1. Оценка стабильности мономеров и димеров в липидном бислое 50
2.3.2. Расчёты свободной энергии ассоциации -спиралей 50
2.3.3. Разложение профилей свободной энергии димеризации на компоненты 51
2.3.4 Расчёты свободной энергии ассоциации -спиралей в “крупнозернистом” представлении 2.4. Расчёты распределения плотности липидов в продольных срезах бислоя 52
2.5. Расчёты распределения плотности липидов в цилиндрических координатах 54
2.6. Оценка гетерогенности распределений плотности липидов 55
Глава 3. Результаты 56
3.1. Стабильность пептидов в липидном бислое 56
3.2. Роль аминокислотной последовательности в димеризации трансмембранных доменов
3.2.1. Природная последовательность GpA как пример оптимизации белок-белковых взаимодействий 60
3.2.2. Искусственные пептиды проявляют разный характер в белок-белковых и белок-липидных взаимодействиях 61
3.2.3. Точечные мутации G83A и T87V по-разному влияют на димеризацию GpA 62
3.2.4. “Крупнозернистое” представление теряет часть информации о взаимодействиях в димере GpA 64
3.2.5. Роль состава липидного бислоя 65
3.3. Распределение свойств липидной мембраны вблизи поверхности пептидов 66
3.3.1. Мономеры GpA, PolyALA и PolyLEU связывают липиды на своей поверхности 66
3.3.2. Особенности взаимодействия липидов с димерами GpA, PolyALA и PolyLEU 69
3.3.3. Распределение средней по времени плотности липидов вблизи поверхности белка 71
3.4. Изменение степени гетерогенности распределений плотности липидов при
димеризации белков 73
Глава 4. Обсуждение 75
4.1. Различный механизм влияния мутаций на димеризацию ТМ-доменов GpA 75
4.2. Влияние состава мембраны на димеризацию GpA и его мутантных форм 78
4.3. Приближения вычислительного подхода, анализ сходимости результатов 80
4.4. Взаимное влияние белков и мембраны друг на друга 81
Заключение 84
Выводы 85
Список сокращений 86
Список опубликованных работ по теме диссертации 87
Список литературы 88
Благодарности
- Концепция мотивов димеризации. Гликофориновый мотив
- Построение моделей липидных мембран без пептидов
- Природная последовательность GpA как пример оптимизации белок-белковых взаимодействий
- Влияние состава мембраны на димеризацию GpA и его мутантных форм
Введение к работе
Актуальность темы
К настоящему времени накоплены экспериментальные данные о взаимодействии трансмембранных (ТМ) доменов различных белков в мембранном окружении. Показано, что липидный бислой способен тем или иным образом влиять на свойства формирующихся димеров и олигомеров. Взаимодействие ТМ-доменов лежит в основе функционирования жизненно важных мембранных белков: ионных каналов и рецепторных тирозинкиназ (РТК). С дисфункцией последних связано развитие таких опасных патологий как рак, диабет II типа и нарушения развития организма. Общепринятым фактом является непосредственное участие ТМ-доменов в активации рецепторов и передаче сигнала через мембрану. Это справедливо как для РТК, так и для более сложных G-белок сопряжённых рецепторов. Механизм взаимодействия спиральных ТМ-доменов в липидном окружении, таким образом, является основополагающим при передаче сигналов через мембрану клетки. Более того, экспериментально продемонстрирована возможность воздействия на РТК с помощью специально сконструированных “пептидов-перехватчиков”, которые могут как активировать, так и ингибировать тот или иной целевой белок. Основным преимуществом такого подхода считается воздействие на одну конкретную молекулярную мишень (так называемая “таргетная терапия”). В то же время, несмотря на весь достигнутый прогресс в этой области, нет полного понимания механизма действия окружения на мембранные белки. В частности, концепция “мотивов димеризации” выглядит устаревшей на фоне имеющихся научных достижений. Несмотря на растущее число фактов обнаружения функционально значимых сайтов связывания липидных молекул у крупных мембранных белков, поиск подобных объектов в случае РТК практически не ведётся. Тем не менее, описано влияние свойств липидного окружения на процесс димеризации одиночных ТМ-доменов. Разработка перспективных “перехватчиков” димеризации ТМ-доменов РТК в
настоящее время базируется на поиске оптимальных фрагментов природных
последовательностей и методов их доставки. Мембране в этом процессе отводят второстепенное значение, поэтому задача подстройки ТМ-пептида под окружение остаётся нерешённой.
Гликофорин А человека (GpA) является хорошей моделью для изучения димеризации ТМ-спиралей по так называемому “гликофориновому мотиву”, одному из самых широко распространённых типов упаковки ТМ-димеров. Такая структура детально описана с точки зрения формирования белок-белковых контактов. В рамках концепции “мотивов димеризации” проведён широкий скрининг мутантных форм и описаны эффекты точечных замен аминокислотных остатков, однако большая часть данных никак не обсуждается в терминах взаимодействий белок-мембрана. Рассмотрение роли липидного бислоя выглядит целесообразным в соответствии с последними данными о спонтанной кластеризации липидов и о наличии сайтов связывания липидов у других белков. Существующие экспериментальные методы лишь ограниченно позволяют оценивать взаимное влияние белков и их окружения, поэтому перспективными для решения подобных задач являются методы компьютерного моделирования. Для оценки структурно-динамических параметров мембранных систем существует много хорошо разработанных алгоритмов. Различные варианты метода молекулярной динамики демонстрируют возможность детектирования отдельных “нанокластеров” из нескольких липидных молекул и позволяют наблюдать формирование крупных рафтоподобных структур в присутствии мембранных белков. Развитие этих подходов раскроет фундаментальные принципы, лежащие в основе белок-липидного взаимодействия в мембранах.
Настоящее исследование затрагивает актуальную тему современной молекулярной биологии и биофизики, рассматривает фундаментальные проблемы белок-белкового взаимодействия в мембранах и использует для решения поставленных задач современные методы компьютерного моделирования. Полученные результаты лягут в основу нового метода анализа в компьютерном эксперименте свойств липидного окружения ТМ-доменов РТК и
других белков. В частности, детальное исследование белок-липидных взаимодействий позволяет в широком смысле описывать влияние точечных мутаций в ТМ-доменах на их димеризацию и может быть применено для поиска новых модуляторов активности РТК. Это даст возможность характеризовать перспективные “пептиды-перехватчики” в терминах их совместимости с мембранным окружением и проводить дополнительную оптимизацию их аминокислотной последовательности перед процедурой химического синтеза.
Цели и задачи исследования
Целью настоящей работы являлось изучение на молекулярном уровне различных факторов, влияющих на димеризацию трансмембранных -спиралей белков, в первую очередь, — мембранного окружения — на примере гликофорина А человека (GpA), его мутантных форм и модельных пептидов. Были поставлены следующие задачи:
-
Сравнить структурно-динамические параметры мономеров и димеров трансмембранных доменов GpA с аналогичными характеристиками искусственных полипептидов на основе полиаланина и полилейцина и мутантных форм GpA T87V и G83A.
-
Количественно оценить свободную энергию ассоциации исследуемых трансмембранных пептидов и получить вклады в неё различных типов межмолекулярных взаимодействий (белок-белок, белок-липид, белок-вода).
-
Произвести декомпозицию свободной энергии димеризации по аминокислотным остаткам пептидов — рассчитать их индивидуальные вклады в полную энергию и таким образом оценить влияние точечных мутаций на димеризацию GpA.
-
Провести анализ свойств мембраны вблизи встроенных молекул белка, выявить сайты связывания различных фрагментов липидов на поверхности трансмембранных спиралей и произвести оценку энтропийного вклада мембранного окружения в димеризацию белка.
Научная новизна результатов и практическая значимость работы
Настоящая работа призвана ответить на ряд актуальных вопросов о взаимном влиянии ТМ-доменов белков и их ближайшего липидного окружения. Для разработки и тестирования методик описания такого влияния была выбрана наиболее широко известная модельная система: ТМ-домен гликофорина А (GpA), для которого имеются данные о влиянии широкого набора точечных мутаций на процесс димеризации, однако молекулярный механизм их воздействия на формирование димера остаётся непонятным. Существует ряд фактов, говорящих в пользу непосредственного участия мембраны в процессах белок-белкового взаимодействия. Таким образом, ранее полученные данные нуждаются в дополнительном обсуждении в рамках новой концепции. Выбранные в настоящей работе модельные объекты могут рассматриваться как характерные примеры ТМ-последовательностей, встречающихся в природе.
В настоящей работе показана возможность выделения энергетических вкладов взаимодействий белок-белок, белок-липид и белок-вода как для целых пептидов, так и для отдельных аминокислотных остатков, входящих в их состав. Выявлено, что липидное окружение вносит значительный вклад в свободную энергию димеризации ряда ТМ-пептидов, и при этом существуют два основных фактора, обусловливающих взаимодействие пептидов в мембране: формирование выгодных белок-белковых контактов и эффект среды, имеющий энтропийную природу. При этом природная последовательность “реализует” оптимальную (наиболее плотную) упаковку мономеров и сочетает в себе оба механизма стабилизации структуры димера. Разработанные в настоящей работе методы позволяют предсказывать локализацию на поверхности ТМ-пептидов сайтов связывания липидных молекул, а также характеризовать степень возмущений, вносимых в липидный бислой при встраивании пептидов.
Научная новизна подтверждается публикацией основных результатов диссертационной работы в виде 4 статей в международных реферируемых
научных журналах.
Оценка белок-липидных взаимодействий при рациональном дизайне “пептидов-перехватчиков” и других терапевтических агентов, нацеленных на мембранные белки, позволит дополнительно повысить их эффективность и селективность. Это является перспективным направлением в рамках исследования рецепторных тирозинкиназ и поиска новых методов воздействия на их онкогенные формы. Поскольку взаимодействия ТМ-сегментов белков в мембранном окружении являются ключевыми в работе множества рецепторов и ионных каналов, выводы работы затрагивают широкий класс белковых молекул.
Положения, выносимые на защиту
Для гликофорина А и ряда модельных пептидов разделение свободной энергии димеризации ТМ -спиралей в мембранном окружении на компоненты, соответствующие взаимодействиям типа белок-белок и белок-окружение для отдельных аминокислотных остатков, позволяет охарактеризовать энергетические параметры образующихся димеров более детально, чем в стандартных подходах.
Предложены два базовых механизма спонтанной ассоциации ТМ-пептидов в липидном бислое и показано, что природная аминокислотная последовательность GpA оптимально сочетает в себе оба из них. При этом с помощью точечных аминокислотных замен можно непосредственно влиять на каждый из компонентов, стабилизирующих ТМ-димеры в мембранах.
Выявлены сайты связывания липидов на поверхности мономеров природных ТМ-доменов GpA и модельных пептидов и показано, что у мономеров они соответствуют потенциальным мотивам димеризации, а в случае димеров липиды способствуют стабилизации пространственной структуры.
Липидная мембрана выступает в качестве активной среды, обеспечивающей взаимодействие ТМ-пептидов и модулирующей их склонность к ассоциации в зависимости от аминокислотной последовательности.
Апробация работы
Результаты работы были представлены на международном симпозиуме KSCMBS-2016 (г. Худжанд, Таджикистан, 2016), международной конференции “Biomembranes 2016. Mechanisms of Aging and Age-Related Diseases” (г. Долгопрудный, 2016), национальном конгрессе “Человек и лекарство” (г. Москва, 2016), конференции БФФХ-2016 (г. Севастополь, 2016), XXVIII молодёжной научной школе “Перспективные направления физико-химической биологии и биотехнологии” (г. Москва, 2016), V съезде биофизиков России (г. Ростов-на-Дону, 2015), VII симпозиуме “Белки и пептиды” (г. Новосибирск, 2015), международном симпозиуме “4th IGER” (г. Нагоя, Япония, 2015), международных конференциях “Structure and Functions of Biomembranes” (г. Долгопрудный, 2014), “Ломоносов-2014” (г. Москва, 2014), 7-м русско-японском международном семинаре MSSMBS-2014 (г. Москва, 2014), международном семинаре “Computational and Theoretical Modeling of Biomolecular Interactions” (г. Дубна, 2013), 5-м русско-японском международном семинаре MSSMBS-2012 (Дубна, 2012) и 55-й научной конференции МФТИ (Долгопрудный, 2012).
Публикации
По материалам диссертации опубликована 21 печатная работа: 4 статьи в профильных международных научных журналах, индексируемых Web of Science и SCOPUS, 1 статья в российском научном журнале, индексируемом РИНЦ, 2 главы в сборниках результатов симпозиумов и 14 тезисов конференций.
Структура диссертации
Диссертация состоит из Введения; раздела “Основное содержание”, включающего главы: “Обзор литературы”, “Материалы и методы”, “Результаты” и “Обсуждение”; Заключения; Выводов; Списка используемых сокращений; Списка опубликованных работ по теме диссертации; Списка литературы.
Число страниц 103, рисунков 32, таблиц 7, ссылок 162.
Концепция мотивов димеризации. Гликофориновый мотив
Биологические мембраны – это один из древнейших компонентов живых систем. Основной и важнейшей функций плазматической мембраны клетки является барьерная. Плазматическая мембрана отделяет цитоплазму клетки от внешней среды и является непроницаемой для большинства химических веществ, что позволяет поддерживать внутри неё постоянные условия среды. Ключевую роль в формировании барьера играют молекулы липидов. Однако это не единственная функция мембраны. Так как клеткам необходимо взаимодействовать друг с другом и с внешней средой, в составе мембраны содержится множество мембранных белков (МБ), созданных для этих целей. Среди них есть рецепторы, отвечающие за передачу сигналов, транспортные белки и каналы, осуществляющие транспорт ионов и молекул (включая воду), белки-маркеры, участвующие в клеточном распознавании, структурные белки и многие другие. Факторы внешней среды имеют различную физическую и химическую природу, при этом сигнальным молекулам необходимо проникнуть через плазматическую мембрану клетки, чтобы произвести необходимый эффект. Некоторые из них (гидрофобные молекулы) способны преодолеть этот барьер самостоятельно и непосредственно влиять на внутриклеточные компоненты, тогда как для других мембрана является непреодолимым препятствием [1–4]. Для распознавания внешних сигналов (преимущественно химической природы) клетка включает в состав мембраны специализированные белки-рецепторы, которые при взаимодействии с лигандом во внеклеточной среде инициируют каскады химических реакций на внутренней стороне мембраны, приводящие в результате к активации того или иного клеточного ответа [5]. Около четверти всех белков, производимых живой клеткой, являются мембранными [6]. Этот огромный класс молекул, в свою очередь, делится на два подкласса по типу структурной организации: периферические и интегральные МБ. Первые находятся на поверхности мембраны и прикреплены к ней за счёт невалентных взаимодействий с полярными головками липидов или другими МБ. Некоторые из них содержат гликозилфосфатидилинозитольный (ГФИ) “якорь”, удерживающийся в гидрофобной области мембраны. Среди интегральных МБ, пронизывающих мембрану насквозь, выделяют битопические и политопические, при этом у первых полипептидная цепь пересекает мембрану один раз, а у вторых — несколько (рисунок 1). Благодаря такой организации, они способны выполнять рецепторные и транспортные функции. Большинство МБ работают в составе супрамолекулярных комплексов, в основе формирования которых лежат белок-белковые взаимодействия.
В составе интегральных МБ выделяют внеклеточный, трансмембранный (ТМ) и цитоплазматический домены. У рецепторных белков во внеклеточном домене происходит узнавание и связывание лиганда, а внутриклеточный домен является отправной точкой для каскада химических реакций. ТМ-домен служит для закрепления белка в мембране и поддержания его правильной ориентации, но может обладать и рядом специальных функций. Поскольку большинство МБ ответственны за поток веществ и информации через клеточную мембрану, нарушения в их функционировании приводят к развитию патологических состояний организма, и все такие МБ являются потенциальными мишенями действия фармакологических средств [5; 7; 8]. Перспективным считается непосредственное воздействие на ТМ-домены МБ как на одну из наиболее функционально значимых частей этих молекул. Зачастую нарушение работы МБ связано с точечными мутациями в ТМ-сегментах, что, в свою очередь, приводит к нарушению белок-белковых взаимодействий в мембране. В этой ситуации классическое воздействие на внеклеточные лиганд-связывающие домены может не давать желаемого эффекта, поскольку сигнал от них не может быть передан внутрь клетки через неверно функционирующий ТМ-домен. Также на плазматической мембране клетки представлено большое число МБ, при этом существуют близкие формы одних и тех же белков у различных типов клеток, что требует от перспективных терапевтических молекул наличия высокой селективности по отношению к ним. Это, в свою очередь, достижимо только при полном понимании механизма взаимодействия фармакологического средства с его мишенью на молекулярном уровне. В природе одни и те же лиганды могут связываться с различными белками и таким образом инициировать разные сигнальные пути, поэтому и для терапевтических средств, “нацеленных” на внеклеточные домены, возможны побочные эффекты. Воздействие же на ТМ-домен конкретного белка позволит точечно регулировать его активность. Здесь следует отметить, что часто именно ТМ-домен является вариабельной частью молекулы МБ наряду с внеклеточным доменом. Внутриклеточные домены, наоборот, являются наиболее консервативными, поэтому селективное воздействие на них затруднено.
Известно, что передача рецептором сигнала через мембрану подразумевает каскад конформационных перестроек в молекуле, берущих своё начало во внеклеточном домене и переходящих посредством ТМ-доменов на другую сторону мембраны [9]. У ионных каналов ТМ-домен участвует в формировании проводящей поры. Стоит отметить, что наиболее часто ТМ-домены МБ состоят из -спиралей, намного реже встречаются структуры типа -бочонка (у бактерий, а также в мембранах митохондрий и хлоропластов) [10]. В плазматической мембране эукариотических клеток представлены только -спиральные МБ. Формирование пространственной структуры политопических, а также олигомеризация битопических МБ, таким образом, определяются преимущественно взаимодействиями типа спираль-спираль в мембране [6; 11]. Задача описания молекулярного механизма димеризации ТМ-доменов с учётом всех факторов является фундаментальной, и её решение позволит выявить основополагающие принципы функционирования многих МБ, а также заложит основу для рационального дизайна пептидных лекарственных молекул, “нацеленных” на эти домены. За последние годы достигнут значительный прогресс в данном направлении, причём особое внимание уделяют рецепторным тирозинкиназам (РТК) как наиболее биологически важному и большому классу МБ [9; 12].
Все РТК относятся к битопическим МБ и имеют сходную пространственную организацию: внеклеточный и цитоплазматический киназный домены связаны ТМ-доменом, представленным одной -спиралью (рисунок 2). Между киназой и C-концом ТМ-домена выделяют примембранный домен, который у некоторых белков может иметь -спиральную конформацию и участвовать в процессе димеризации. Для РТК спираль-спиральные взаимодействия в мембране являются особенно важными, поскольку непосредственно определяют переходы большинства из них между активной и неактивными формами. В то же время показано значительное влияние свойств липидного окружения на этот процесс. У человека насчитывается 58 различных РТК, объединённых в 20 семейств (рисунок 3) [9].
Построение моделей липидных мембран без пептидов
Растущее число известных пространственных структур МБ, определённых с помощью экспериментальных методов, позволяет широко использовать моделирование на основании гомологии. В качестве наиболее популярных объектов исследования выступают ионные каналы и G-белок сопряжённые рецепторы [108]. Для предсказания структуры этим методом требуется наличие информации о пространственной организации шаблона: белка, имеющего высокую степень гомологии с изучаемым объектом. Степень идентичности и точность выравнивания последовательностей оказывают значительный эффект на результаты моделирования [109]. Также для улучшения выравнивания используют методы предсказания вторичной структуры и положения ТМ-доменов в последовательности. После того, как произведено выравнивание последовательностей, начинается непосредственное отнесение пространственной структуры. В качестве примеров средств моделирования можно привести такие программы как Rosetta [110], MODELLER [111] и веб-сервер SWISS-MODEL [112]. Моделирование по гомологии хорошо работает для белков, имеющих более 25% идентичных аминокислотных остатков в последовательности, для белков с более низкой степенью гомологии результат моделирования, как правило, не достоверен. Для таких случаев существуют методы распознавания доменов и типов укладки полипептидной цепи на основании базы данных известных структур. Этот подход основан на эволюционной консервативности доменной структуры белков и использует специализированные базы данных известных типов укладки полипептидной цепи (“фолдов”). С помощью специально сконструированной оценочной функции производится поиск наиболее вероятного типа укладки для анализируемой аминокислотной последовательности [113; 114]. Широкое распространение получили наборы утилит, доступные в форме веб-сервисов, включающих различные алгоритмы для предсказания физико-химических свойств белков по их последовательности, для произведения множественного выравнивания, моделирования по гомологии и предсказания типов укладки полипептидной цепи. Примерами таких сервисов могут служить веб-серверы IASSER [115] и SWISS-MODEL [112]. Алгоритмы и их реализации в составе этих комплексов постоянно модифицируются и улучшаются, добавляются новые возможности для анализа и визуализации данных. Тем не менее, расширение предсказательных возможностей не даёт ответа на вопрос о принципах укладки полипептидной цепи МБ, и потому в ряде случаев данные методы оказываются неприменимы. Моделирование по гомологии хорошо работает для глобулярных белков, а также для хорошо структурированных внеклеточных и внутриклеточных доменов МБ. В случае ТМ-доменов и их взаимодействий результаты оказываются менее надёжными из-за необходимости учёта влияния мембраны и привлечения дополнительных данных о мембранной организации [105].
Для многих МБ ключевым моментом в их работе являются переходы между различными состояниями, связанные с конформационными перестройками в белковой молекуле и, в частности, в их трансмембранной части. Такие молекулярные движения невозможно детально изучить без построения трёхмерной модели молекулы в каждом из этих состояний. Особое внимание при этом заслуживают структурно-динамические параметры, такие как подвижность отдельных доменов и петель, экспонированность сайтов связывания, белок-белковые контакты и т.д. Среди методов de novo предсказания структур можно выделить три основных категории, основанных на различном принципе исследования конфигурационного пространства: молекулярный докинг, метод Монте-Карло (МК) и молекулярная динамика (МД), а также комбинации этих методов [97–99]. Поскольку большинство ТМ-доменов МБ представлены -спиралями или их пучками, далее будет рассматриваться вопрос спираль-спирального взаимодействия в мембранах.
Метод молекулярного докинга разработан для поиска оптимальной конформации связанного состояния лигандов в активном сайте рецептора. При этом в классическом докинге предполагается, что сайт связывания известен, а сам рецептор, или “мишень”, является жёсткой молекулой, то есть его конформационная подвижность не рассматривается, в отличие от лиганда. В дальнейшем алгоритм модифицировали для учёта подвижности “мишени”, были созданы версии для предсказания структуры димеров ТМ-доменов, показавшие корректные результаты, однако не получившие на настоящий момент широкого распространения [116; 117].
Для оптимизации взаимного расположения пары -спиралей может применяться метод случайного поиска Монте-Карло (МК) с использованием в качестве оценочной функции энергии ван-дер-ваальсовых белок-белковых взаимодействий в приближении потенциала Леннарда-Джонса. Позже для более точной оценки энергии были разработаны более совершенные оценочные функции и так называемые эмпирические силовые поля, позволяющие описать различные типы валентных и невалентных взаимодействий молекул, оптимизированные на основе экспериментальных данных. При этом в качестве начального состояния может использоваться случайное положение мономеров [118; 119]. Одна из реализаций данного алгоритма предполагает использование поиска оптимальной упаковки полипептидной цепи путём случайного изменения двугранных углов. При этом два мономера могут быть заданы в составе одной длинной полипептидной цепи, соединённые с помощью участка “псевдоостатков” (т. е. остатков, состоящих из атомов, не взаимодействующих между собой и с другими атомами системы, рисунок 7) [120]. Такой метод упрощает программную реализацию алгоритма случайного поиска.
Схематичное представление начальной и конечной стадий поиска структуры димера с помощью метода Монте-Карло. Показан ход полипептидной цепи ТМ-доменов, чёрной линией показан участок из “псевдоатомов”, служащий для упрощения реализации алгоритма. Серым цветом отмечена область, соответствующая мембране [120]. Метод молекулярной динамики (МД) основывается на представлении моделируемой системы в виде набора взаимодействующих частиц. При этом силы, действующие между ними, определяются заданным набором параметров – силовым полем. На каждом шаге расчёта производится численное интегрирование уравнений движения частиц в приближении классической механики. Одним из наиболее распространённых подходов является полноатомное представление системы, когда в качестве взаимодействующих частиц выступают атомы молекул, а параметры силового поля описывают все валентные (изменения длины химических связей и величины валентных углов, вращение вокруг химических связей) и невалентные (электростатические, ван-дер-ваальсовы) взаимодействия. При моделировании МБ с помощью методов МК и МД широкое применение нашли модели неявно заданного окружения, в значительной степени упрощающие описание ТМ димеров за счёт снижения вычислительной сложности расчётов [56; 65; 120; 121]. Данные методы используют для описания свойств среды так называемые атомные константы (параметры) сольватации, выведенные на основании значений свободной энергии переноса соединений в двухфазных системах, например, газ-циклогексан, газ-вода и циклогексан-вода [122–124]. В качестве моделей димеров рассматривают набор структур с минимальными значениями оценочной функции, полученные с помощью метода МК, при этом проводят их кластеризацию для объединения близких по геометрическим параметрам моделей. Для уточнения и дальнейшего ранжирования моделей используют методы МД, позволяющие оценить стабильность полученных структур во времени в явно заданном мембранном окружении. Такую комбинацию этих подходов широко применяют в настоящее время, что позволяет воспроизводить известные экспериментальные структуры с высокой точностью [56; 90; 120; 121; 125]. Недостатком алгоритма МД является высокая вычислительная сложность процесса исследования конформационного пространства, что ограничивает размер исследуемых систем.
Известно, что при формировании ТМ димеров соблюдается принцип взаимного соответствия свойств поверхностей мономеров, который является общим для любых межмолекулярных взаимодействий [126]. Это свойство можно использовать при предсказании взаимной ориентации взаимодействующих молекул в пространстве. В качестве примера реализации такого подхода можно привести алгоритм PREDDIMER, реализованный в виде веб-сервиса (http://model.nmr.ru/preddimer) и позволяющий предсказывать пространственную структуру димеров спиральных ТМ-доменов на основании соотнесения геометрических параметров упаковки и принципа гидрофобного соответствия. При этом используют понятие молекулярного гидрофобного потенциала (МГП), характеризующего сродство молекул или отдельных химических групп к водному, либо неполярному окружению [127]. Концепцию МГП также применяют в анализе результатов молекулярного докинга и решении других задач [126; 128]. Алгоритм PREDDIMER оперирует упрощённым представлением поверхности спиралей в виде двумерной карты: проекции свойств на поверхность цилиндра, соосного с -спиралью белка [91]. В отличие от классического метода Монте-Карло, этот метод использует всего три координаты: угол скрещивания спиралей, угол их поворота вокруг собственной оси и смещение друг относительно друга (рисунок 8). Несмотря на значительные упрощения, метод показал хорошую предсказательную способность на выборке из белков, структура димеров которых уже определена экспериментальными методами. Важно отметить, что использование в качестве оценочной функции степени взаимного соответствия поверхностей позволяет получать близкие к нативным (природным) решения на первом месте [93].
Природная последовательность GpA как пример оптимизации белок-белковых взаимодействий
Для оценки свободной энергии ассоциации ТМ-доменов использовали метод “зонтичной” выборки (“umbrella sampling” molecular dynamics, USMD) с 32 “окнами” (см. таблицу 5). В качестве координаты реакции выбрали расстояние между центрами масс мономеров белка. Создавали набор состояний димера, характеризующихся различным расстоянием между мономерами (32 точки, от 7,5 до 22,0 с шагом 0.5 ). Начальные состояния получали путём параллельного переноса мономеров на заданное расстояние вдоль прямой, проходящей через их центры масс, и это состояние использовали для задания мягких ограничений в МД-релаксации. Уравновешивание производили в течение 50 нс, длина анализируемой траектории также составляла 50 нс. Для каждого из состояний рассчитывали значение средней силы, действующей между мономерами белка. Профили свободной энергии получали интегрированием средней действующей силы. В полученных энергетических профилях оценку ошибки производили путём независимого их расчёта для 5 неперекрывающихся фрагментов каждой траектории МД. Для каждой из систем проводили по 2 независимых расчёта, результаты которых сравнивали между собой. Визуализацию профилей проводили в программе Grace версии 5.1. 2.3.3. Разложение профилей свободной энергии димеризации на компоненты
Для разложения суммарного энергетического профиля на составляющие использовали следующий подход: производили перерасчёт сил, действующих на атомы, учитывая лишь часть моделируемой системы (только белок или белок и липиды) с помощью опции -rerun утилиты mdrun программного пакета Gromacs. Значения сил в каждый момент времени получали с помощью утилиты g_traj из программного пакета Gromacs. Проводили их суммирование для аминокислотных остатков, а затем усредняли по длине траектории МД, проецировали на направление, соответствующее координате реакции, и интегрировали, как и в случае расчёта профилей свободной энергии для всей системы. Для построения диаграмм распределения вкладов отдельных аминокислотных остатков выбирали значения энергии, соответствующие глобальному минимуму в суммарном профиле свободной энергии ассоциации рассматриваемого димера. Оценки частичных вкладов фрагментов последовательности белка получали суммированием вкладов соответствующих аминокислотных остатков.
Для проверки возможности применения “крупнозернистых” моделей в оценках свободной энергии нами были построены две модели димеров ТМ-доменов GpA дикого типа и его мутантной формы T87V. Стартовые конформации были получены путём перевода тяжёлоатомных моделей в “крупнозернистые” с помощью программы martinize.py с использованием параметризации martini2.2p для белка, martini2.0 для липидов и поляризуемой модели воды [142]. Для получения профилей свободной энергии применяли метод “зонтичной” выборки USMD, как описано выше. Параметры запуска расчётов МД были оптимизированы с использованием рекомендаций авторов силового поля MARTINI [142]. Длина траекторий в каждом “окне” выборки составляла 500 нс, шаг интегрирования 20 фс. Оценку ошибки вычисления значений потенциала средней силы производили путём независимого их расчёта для 5 неперекрывающихся фрагментов каждой траектории МД.
Для первичной оценки влияния пептидов на свойства липидного бислоя проводили сравнение вида кривых функции радиального распределения, рассчитанных для молекул липидов и их частей (полярных головок и ацильных цепей) с помощью утилиты g_rdf из программного пакета Gromacs. В качестве полярных головок рассматривали атомы, входящие в состав холина, фосфата и глицерина до сложноэфирной связи. Всю остальную часть молекулы относили к ацильным цепям. Для картирования распределения плотности липидов использовали траектории МД в “тяжёлоатомном” приближении длиной 200 нс. Область, соответствующую липидному бислою, делили на 5 срезов, параллельных плоскости XY. Толщина каждого среза составляла 10 , при этом за точку отсчёта брали центр мембраны, который определяли как середину отрезка между максимумами распределения плотности атомов фосфора вдоль оси Z. Центрирование производили на каждом шаге анализа траектории МД. Центральный срез (№3 на картах плотности липидов) соответствовал середине бислоя и включал преимущественно концы ацильных цепей. Срезы №2 и 4 соответствовали центральной части молекул липидов и включали в себя ацильные цепи. Крайние (№1 и 5) срезы содержали полярные головки (см. рисунок 12). Шаг ортогональной сетки по осям X, Y составлял 0,5 . В случае анализа липидного бислоя со встроенной молекулой белка центр (по координатам X, Y) анализируемой области соответствовал центру масс молекулы белка, в расчётах учитывали периодические граничные условия системы. Также тестировали вариант алгоритма, учитывающий поворот молекулы белка вокруг своей оси (рисунок 13). Показано, однако, что для большинства траекторий амплитуда вращательных движений ТМ-спирали не превышает 5 градусов, что позволило применять более простую версию алгоритма без поворота системы координат. Плотность рассчитывали как отношение суммарной массы всех атомов, попадающих в ячейку, к объёму этой ячейки. При этом молекулы белка и воды не рассматривали (если это не указано отдельно) при расчёте плотности, что приводило к появлению на картах характерного белого пятна, соответствующего белку. Более того, для ускорения расчёта файлы траекторий предварительно уменьшали, удаляя из них информацию о молекулах воды. Значения плотности в ячейках сохраняли на каждом шаге анализа, а затем усредняли. Для исследования влияния времени усреднения на вид получаемых карт распределения плотности использовали различные участки траекторий МД длиной 5, 10, 20, 50 и 200 нс. Максимальное число МД конфигураций для усреднения составляло 200000 и соответствовало 200 нс МД. Расчёт и визуализацию средней плотности липидов проводили с помощью программы, написанной на языке программирования Python с использованием библиотек numpy и pyplot. В случае GpA на карты дополнительно наносили метку, показывающую его интерфейс димеризации. Также для пептидов на картах показывали среднее положение C-атомов. Расчёты повторяли для трёх независимо рассчитанных траекторий каждой из исследуемых систем.
Влияние состава мембраны на димеризацию GpA и его мутантных форм
Настоящая работа сочетает в себя различные стратегии обработки данных вычислительного эксперимента. С помощью метода оценки свободной энергии ассоциации ТМ-доменов в мембранном окружении было продемонстрировано, как две точечных мутации в ТМ-последовательности гликофорина А человека способны в значительной степени повлиять на его склонность к димеризации, а затем путём декомпозиции свободной энергии ассоциации выявлен характер нарушений белок-белкового и белок-липидного взаимодействия в каждом из этих случаев. Несмотря на то, что проведено множество исследований эффектов точечных мутаций на димеризацию этого белка (см., например, [85; 87; 159]), механизм их влияния на процесс ассоциации до настоящего времени был не до конца понятен. В настоящей работе на примере широко известной тестовой системы был применён анализ различных энергетических термов, составляющих энергию димеризации, а также оценка вкладов отдельных остатков. В результате предложены два различных механизма для мутаций T87V и G83A, описанных в литературе ранее. Выбор именно таких объектов исследования был обусловлен, в первую очередь, удобством тестирования на них предлагаемых новых алгоритмов: эти мутации не слишком сильно влияют на структуру димера и позволяют мутантным ТМ-доменам димеризоваться, пусть и с меньшим выигрышем в свободной энергии. В литературе имелись данные о том, что на мутантные формы GpA оказывает влияние состав мембранного окружения, поэтому было выбрано направление анализа свойств липидов. Обе мутантные формы GpA хорошо укладывались в концепцию мотивов димеризации и потому не вызывали дополнительных вопросов у исследователей. Опубликованные ранее данные оперировали значениями свободной энергии ассоциации, измеренными в эксперименте, либо рассчитанными теоретически. Понятно, что такие суммарные значения не позволяли понять, какой именно молекулярный механизм лежит в основе процесса димеризации ТМ-сегментов. Вместе с распространённым мнением об инертности клеточной мембраны это поддерживало гипотезу, что ассоциация ТМ-доменов определяется лишь остатками, лежащими на интерфейсе. Однако нами показано, что в основе нарушений ассоциации ТМ-доменов может лежать не только принцип комплементарности белок-белковых контактов, но и адаптационные возможности мембранного окружения. Первая из рассмотренных мутаций (T87V), как и предполагалось ранее [50; 67], затрагивает межмолекулярную водородную связь, играющую ключевую роль в непосредственных белок-белковых взаимодействиях (рисунок 29). Невозможность её формирования при такой замене обусловливает значительное изменение глубины минимумов на профилях свободной энергии ассоциации для полной системы и белок-белковых взаимодействий.
Пространственная структура моделей димеров ТМ-доменов GpA дикого типа (А) и мутантных форм T87V (Б) и G83A (В). Серым цветом показаны неполярные остатки, зелёным — полярные, синим — положительно заряженные, красным — отрицательно заряженные. Остаток 87 окрашен в соответствии с типом атомов: голубой — углерод, красный — кислород, синий — азот, серый — полярные протоны. В модели димера дикого типа выделена водородная связь. Область межмолекулярного контакта в увеличенном масштабе дополнительно представлена в правой части каждой картинки. Мембрана условно показана в ленточном представлении.
Эффект влияния водородной связи на димеризацию косвенно подтверждается тем фактом, что результат не воспроизводится при использовании “крупнозернистой” модели белка, в которой образование водородных связей не может быть описано, и такая мутация практически перестаёт влиять на параметры димера. Дополнительно можно сделать вывод об ограничении применения “крупнозернистых” моделей для изучения тонких эффектов, связанных с минорными изменениями в свойствах исследуемого белка. Тем не менее, в литературе описаны факты успешного применения подобных моделей для получения энергетических оценок в крупных системах сложного состава, которые сложно исследовать с помощью молекулярной динамики в полноатомном приближении [146]. Однако, в отличие от настоящей работы, в указанной статье авторы использовали для проверки подхода системы, обладающие значительными различиями: описанная мутация G83I, предположительно, в значительной степени нарушает формирование димера GpA из-за стерических затруднений, которые хорошо моделируются в “крупнозернистом” приближении, тогда как при мутации T87V различается лишь химическая природа остатков, но не их размер. Тем не менее, приведённые в настоящей работе результаты по сравнению природного димера GpA с искусственным пептидом PolyLEU хорошо согласуются с результатами, полученными Вассенаром и др. [146].
Замена G83A в димере GpA не приводит к значительному изменению профиля для взаимодействий белок-белок, однако при учёте эффектов среды этот димер оказывается “слабее” нативной формы примерно в 2 раза, что может быть обусловлено, преимущественно, нарушением связывания липидов. Результаты оценки энергии димеризации полиаланина, являющегося моделью искусственного пептида с короткими боковыми цепями аминокислотных остатков, тоже говорят в пользу этой гипотезы. Для него оценки энергии димеризации также показали в значительной степени выгодные белок-белковые контакты, “ослабленные” за счёт невыгодного взаимодействия с липидной мембраной. Последняя, в свою очередь, всегда стремится привести ТМ-пептиды в состояние с наиболее плотной упаковкой, которое лучше всего реализуется для эволюционно оптимизированной последовательности GpA дикого типа. В случае G83A сближение мономеров приводит к стерическим наталкиваниям боковых цепей остатков, лежащих в центре его интерфейса димеризации (в первую очередь, Ala83 и Val84), чего не происходит в димере дикого типа.
Мутантная форма T87V, несмотря на значительно ослабленные белок-белковые взаимодействия, однако не теряет возможности связываться с липидами, вероятно, из-за более свободной структуры, способной подстраиваться под мембранное окружение. Дополнительный анализ свойств липидов вблизи этой формы показал, однако, что белок-липидные взаимодействия здесь ослаблены как в случае мономерной, так и в димерной форме белка, в то время как для G83A нарушение связывания липидов наблюдается лишь у димера. Интересным фактом также является то, что область контакта мономеров в димере в значительной степени соответствует наиболее протяжённому сайту связывания липидов у мономерной формы белка. Можно предположить, что потенциальные сайты димеризации должны обладать склонностью к связыванию и иммобилизации других молекул (различных фосфолипидов, холестерина или ганглиозидов), однако на настоящий момент данная гипотеза требует дополнительной теоретической и экспериментальной проверки.