Содержание к диссертации
Введение
1 Обзор литературы 4
1.1 Молекула воды, водородная связь в жидкой воде 4
1.2 Методы моделирования 6
1.3 Метод Монте-Карло 8
1.4 Метод молекулярной динамики 9
1.5 Методы Coarse-graining 10
1.6 Потенцалы взаимодействия 11
1.7 Моделирование белков, модели "силовых полей"(forcefields) 16
1.8 Взаимодействие белка с гидратным слоем 19
1.9 Понятие топологии структуры. 22
1.10 Кристаллографические и параметрическая модель связанной воды 23
Цели работы 26
2 Исследование процесса динамики водных кластеров 27
2.1 Методы исследования 27
2.2 Сравнение алгоритмов 32
2.3 Анализ стабильности получившейся структуры при увеличении температуры 33
2.4 Описание кластеров, исследуемых в работе 34
2.5 Моделирование динамики водных кластеров 37
2.6 Итоги раздела 50
3 Топология связаннойсбелком воды, поиск циклов 52
3.1 Традиционный алгоритм поиска циклов в ширину (breadth-first search - BFS) 55
3.2 Итоги раздела 62
4 Распределения ”валентных” и торсионных углов в гидратных оболочках белков 63
4.1 Распределение внутренних параметров структуры гидратной оболочки белков (”валентные” и торсионные углы, статистика по гексациклам) 64
4.2 Топологически различные частицы в гидратных оболочках . 72
4.3 Итоги раздела
Функции плотности и электростатического потенциала в гидратных оболочках белков 79
5.1 Проведение компьютерных экспериментов. 79
5.2 Итоги раздела 82
Результатыивыводы 90
Благодарности 90
Список литературы
- Метод Монте-Карло
- Анализ стабильности получившейся структуры при увеличении температуры
- Традиционный алгоритм поиска циклов в ширину (breadth-first search - BFS)
- Топологически различные частицы в гидратных оболочках
Введение к работе
Актуальность темы.
Процесс гидратации белков чаще всего рассматривается с энергетической точки зрения, но структуры с различными распределениями внутренних параметров («валентных» и торсионных углов, функции плотности и электростатического потенциала) могут не отличаться друг от друга энергетически, а лишь иметь топологические различия. Рассмотрение топологии структур гидратных оболочек белков важно для понимания свойств водного слоя, процесса гидратации, а также для понимания причин функциональных различий белков, в связи с чем тема работы является актуальной.
Литературные данные о гидратации белков свидетельствуют о существовании водной оболочки, средняя плотность которой на 10% больше, чем в объёмной воде при аналогичных условиях []. Таким образом, на поверхности макромолекул появляется слой связанной воды, физические свойства которой существенно отличаются от свойств объёмной воды.
В данной работе гидратная оболочка белка рассматривается не с точки зрения статистических закономерностей, а с точки зрения детерминированных координат (положения в пространстве и скоростей), основной характеристикой при рассмотрении параметрических структур являются паттерны связывания модулей.
Цель исследования.
Целью диссертационной работы является исследование существования
водных кластеров, построенных в рамках параметрической модели, с учётом тепловых колебаний, установление факта наличия параметрических структур в гидратных оболочках белков, сравнение структур гидратных оболочек белков и объёмной воды, объяснение возможных причин существующих характерных особенностей разных систем.
Предмет и объект исследования.
Объектом исследования в диссертационной работе являются смоделированные биологические структуры. Предмет исследования состоит в анализе различных структур, установлении характерных различий и объяснении найденных особенностей.
В нашей работе для исследования были выбраны белки, по-разному взаимодействующие с водой: белки коллагена и его фрагменты, определённые с различным разрешением (структуры взяты из PDB-банка). Результаты, полученные для структурных белков, коллагенов, сравнивались с аналогичным характеристиками для небольшого белка убиквити-на.
В работе проводилось изучение следующих структур:
1CAG.pdb — тройная спираль коллагена, определённая с разреше- нием 1.9 A, длина каждой цепочки — 30 аминокислот, количество
молекул растворителя — 10062
1BKV.pdb — тройная спираль коллагена, определённая с разрешением 2 A, длина каждой цепочки — 30 аминокислот, количество молекул растворителя — 7164
1ITT.pdb — тройная спираль коллагена, определённая с разрешени- ем 1.9 A, длина каждой цепочки — 7 аминокислот, количество молекул растворителя — 2292
1UBQ.pdb — белок убиквитин, определённый с разрешением 1.8 A,
количество молекул растворителя — 9630
Убиквитин — один из самых распространённых белков в природе, синтез данного белка происходит во всех эукариотических клетках. Одна из
форм убиквитина является маркером деградации белков, выполнивших свою функцию. Однако система убиквитина вовлечена и в другие важные процессы в клетке, например, развитие, реакция на стресс и т.д.
Структура и функции коллагена достаточно хорошо изучены. Экспериментальные данные дают нам представление об основных мотивах (паттернах) третичной структуры коллагена. Вода играет важную роль в формировании структуры нативной конформации коллагена. С помощью различных экспериментальных техник (например, ЯМР и диэлектрической релаксации) было показано, что молекулы воды в структурах волокон коллагена менее подвижны, чем в объёмной воде []. Экспериментальные исследования подтверждают, что молекулы воды формируют цепочки водородных связей вокруг молекулы коллагена [].
Всё это дало основания для выбора коллагена в качестве основного объекта исследования, и сравнения характеристик коллагенов с характеристиками убиквитина.
Методы исследования.
При выполнении диссертационного исследования использовались современные методы математического моделирования биосистем: применялись готовые программные пакеты (NAMD, SOLVATE, HyperChem, библиотека CGAL, Gromacs), а также были разработаны собственные библиотеки на языках Python, C++, Matlab с применением численных схем решений уравнений движения высоких порядков.
Научная новизна.
При экспериментальном исследовании гидратации белков топология связанной воды не подвергается подробному анализу, чаще всего доминирует представление о связанной воде как о структуре льда. В теоретических исследованиях, как правило, анализируются парные взаимодействия ближнего порядка, поэтому вопрос о топологии также не рассматривается. Определение топологии или характера связей молекул воды в гидрат-ной оболочке — непростая задача для численного моделирования, а также для доказательства соответствия результатов моделирования и реальных физических свойств объектов.
В диссертации были разработаны новые подходы к исследованию структуры слоя воды вокруг белка: было показано, что гидратная оболочка может быть представлена как система гексациклов. Данный факт позволяет упростить получение таких статистических характеристик водного при-белкового слоя, как функции распределений «валентных» и торсионных углов.
Достоверность научных положений обусловлена получением статистически достоверных характеристик рассматриваемых структур и использованием апробированных научных методов.
Практическая значимость работы.
Для улучшения и упрощения качества обработки существующих экспериментальных данных, полученных для систем «белок + вода», необходимо использовать как можно более точную модель воды, учитывающую особенности взаимодействия с белком. Таким образом понимание особенностей структуры гидратного слоя воды представляет собой практически значимую задачу для определения белковой структуры с высокой точностью.
Апробация результатов.
Основные результаты работы докладывались автором на следующих российских и международных конференциях:
9th Annual Conference on the Physics, Chemistry, and Biology of Water (Bulgaria, 2014)
18-я Международная Пущинская школа-конференция молодых ученых «Биология — наука XXI века» (Пущино, Россия, 2014)
XXI международная научная конференция студентов, аспирантов и молодых ученых «Ломоносов-2014» (Москва, Россия, 2014)
XIII ежегодная международная молодежная конференция ИБХФ РАН-ВУЗы «Биохимическая физика» (Москва, Россия, 2013)
8th Annual Conference on the Physics, Chemistry, and Biology of Water (Bulgaria, 2013)
XX международная научная конференция студентов, аспирантов и молодых ученых «Ломоносов-2013» (Москва, Россия, 2013)
XIX международная научная конференция студентов, аспирантов и молодых ученых «Ломоносов-2012» (Москва, Россия, 2012)
7th Annual Conference on the Physics, Chemistry and Biology of Water (USA, 2012)
IV Съезд биофизиков России (Нижний Новгород, Россия, 2012)
Публикации.
Полученные в диссертации результаты опубликованы в 9 работах, список которых приведен в конце автореферата. В их число входит 2 статьи, опубликованных в журналах из списка ВАК РФ.
Структура и объем диссертации.
Метод Монте-Карло
Вода выполняет различные роли в живых системах. Белки проявляют свои нативные свойства лишь в присутствии достаточного количества жидкой воды [38], [39]. Молекулы воды и мостиковые водородные связи являются необходимым структурным компонентом во многих биологических макромолекулярных системах, таких как нуклеиновые кислоты, фибриллярные и глобулярные белки. Поверхностные молекулы воды могут играть решающую роль в межмолекулярных взаимодействиях и процессах агрегации белков [40], [41]. Очевидно, что для понимания процессов, происходящих в живой клетке, следует учитывать наличие гидратной оболочки макромолекул [42]
Экспериментальное изучение гидратации даёт неоднозначные результаты, зависящие от метода исследования и применяемой модели обработки результатов. Компьютерное моделирование приближает нас к лучшему пониманию гидратации белков. Так в работе [40] было показано, что молекулы гидратной оболочки воды играют значительную роль во взаимодействии макромолекул и процессах, приводящих к фолдингу белка, а взаимодействия между макромолекулами осуществляются через водную поверхность с помощью “связывающих мостиков” как, например, в случае взаимодействий белок - ДНК [41].
Литературные данные о гидратации белков свидетельствуют о существовании гидратной оболочки, средняя плотность которой на 10% больше, чем в объёмной воде при аналогичных условиях [84]. Таким образом, на поверхности макромолекул появляется слой связанной воды, физические свойства которой существенно отличаются от свойств объёмной воды. По изменившимся физическим свойствам сформировались те признаки, которые служат основаниями для разделения воды на гидратную сферу макромолекулы и объёмную воду. В качестве характеристик, отличающих свободную воду от связанной, используют калориметрические и диэлектрические характеристики, параметры ЯМР-релаксации, коэффициент самодиффузии, сжимаемость и некоторые другие. При измерениях в растворах биополимеров получают усредненную по объему характеристику, зависящую от количества и качества молекул связанной воды. По этой причине конечный результат зависит еще и от модели связанной воды. Чаще всего используется модель двух состояний – свободная и связанная вода с различными физическими свойствами. В заданных предположениях рассчитывают количество связанной воды. В то же время, даже для простых ионов при описании гидратации используется модель трех состояний, где учитывается второй переходный гидратный слой, отличный по своим характеристикам от первичного гидратного слоя и объемной воды [44]. Именно этот промежуточный слой играет принципиальную роль в объяснении характеристик связанной воды с ионами. В настоящее время для многих белков известна кристаллическая структура высокого разрешения, включающая локализованные молекулы воды, играющие роль структурных элементов биополимера. Молекулы воды в растворе белков можно разделить на 4 группы: cильно и специфически связанные молекулы воды внутри белка (молекулы воды составляют элемент структуры) в случае глобулярных белков молекулы воды первого гидратного слоя, взаимодействующие с поверхностью белка молекулы воды , находящиеся в промежуточном состоянии между первой гидратной оболочкой и объёмной водой объёмная вода
Сильно связанные молекулы воды занимают внутренние полости белка и могут быть определены методами кристаллографии. Поверхностные молекулы воды, образующие гид-ратную оболочку, подвижнее сильно связанных молекул, их водородные связи могут быть искажены, именно этот тип молекул исследуется в данной работе.
Свойства первого гидратного слоя воды определяются свойствами поверхности белка, а также дипольным моментом, поляризуемостью и способностью каждой молекулы воды образовывать водородые связи. Молекулы воды взаимодействуют с макромолекулами на малых расстояниях ( A). В ряде численных работ по моделированию установлено, что плотность слоя толщины (1 - 5)A на 15% превосходит плотность объёмной воды. Основная причина - это возмущение топологии сетки водородных связей воды [45]. Это возмущение состоит в изменении внутренних параметров сетки: уменьшении расстояния О..О и увеличении координационнго числа молекулы воды. Показано, что различия в плотности первой гидратной оболочки по сравнению с объёмной водой определяются топологическими и электростатическими свойствами поверхностей белков. В среднем, более плотная вода находится в сжатом состоянии, при котором водные диполи стремятся выровняться параллельно друг другу электростатическим полем, создаваемым атомами белка [46].
Наряду с изучением специфических свойств функции плотности растворителя в зависимости от расстояния до белка, нам также важны функции распределения. Существуют работы [5], в которых говорится о специфической структуре потенциала, имеющей периодическую структуру, что характеризует наличие чётко выраженных гидратных оболочек, не похожих по своей структуре на объёмную воду.
При экспериментальном исследовании гидратации белков топология связанной воды не подвергается подробному анализу, чаще всего доминирует представление о связанной воде как о структуре льда. В теоретических исследованиях, как правило, анализируются парные взаимодействия ближнего порядка, поэтому вопрос о топологии также не рассматривается. Определение топологии или характера связей молекул воды в гидратной оболочке - непростая задача для численного моделирования, а также для доказательства соответствия результатов моделирования и реальных физических свойств объектов.
Параметры моделирования должны, прежде всего, обладать понятным физическим смыслом, а результаты моделирования должны совпадать с экспериментальными данными, при этом требования к компьютерным мощностям должны оставаться в разумных пределах. Физические свойства первой гидратной оболочки макромолекул отличаются от свойств объёмной воды, некоторые из них известны, и могут быть измерены: температура фазового перехода, диэлектрическая постоянная, параметр релаксации ЯМР, калориметрические характеристики, кинетические характеристики, например, коэффициент самодиффузии. Основные факторы, которые определяют структуру белка, - это кулоновское и ван-дер-ваальсово взаимодействия, а также взаимодействия с ближайшими молекулами воды, при этом характер поверхности белка является ведущим фактором для определения топологии связанной воды.
Белки различаются по своей структуре на 2 больших класса: глобулярные и фибриллярные. Фибриллярные белки представляются собой периодически повторяющиеся спиральные структуры. Примером фибриллярного белка является коллаген.
Коллаген – один из самых распространённых и важных структурных белков, он характеризуется специфической последовательностью аминокислотных остатков [-Gly-X-Y-], в данных обозначениях Gly – глицин, X, Y – чаще всего пролин или гидроксипролин. Структура и функции коллагена достаточно хорошо изучены. Экспериментальные данные дают нам представление об основных мотивах (паттернах) третичной структуры коллагена. Было установлено [48], что вода играет важную роль в формировании структуры нативной кон-формации коллагена. С помощью различных экспериментальных техник (например, ЯМР и диэлектрическая релаксация) было показано, что молекулы воды в структурах волокон коллагена менее подвижны, чем в объёмной воде. Результаты экспериментов могут быть интерпретированы по-разному. С одной стороны, молекулы воды тесно связаны со специфическими областями цепочек коллагена, с другой стороны - можно предположить гипотезу о заполнении межмолекулярного пространства сеткой водородных связей. В исследованиях методом ЯМР [49] было подтверждено, что молекулы воды формируют цепочки водородных связей вокруг молекулы коллагена. Согласно экспериментальным данным, существует некоторый высокоупорядоченный гидратный слой, содержащий около 24% воды в отношении к сухому коллагену.
В работе [50] представлен подробный теоретический анализ структуры водного слоя небольшого фрагмента коллагена. Были исследованы кристаллическая структура [Gly — Ala], определённая с разрешением 1.85 A. Молекулы воды вокруг C-группы и группы гидроксипролин - гидроксил организованы в упорядоченные пространственные структуры. Присутствует повторяющийся мотив водных мостиков, которые связывают атомы кислорода между цепочками белка. Водные молекулы формируют кластер структур, окружающих и связывающих фибриллы в тройную спираль.
С помощью рентгеноструктурной кристаллографии [51] удалось представить упорядочивание воды вокруг полярных и заряженных боковых цепей белка. Были получены и исследованы фрагменты маннозо-связывающего белка А крысы с разрешением 1.8A. С помощью диэлектрической спектроскопии удалось представить характер взаимодействия белок - вода на больших временных масштабах (до микросекунд). С помощью метода рассеяния нейтронов и ЯМР были исследованы особенности «медленных» (с большим временным периодом) движений белка и «быстрых» движений растворителя, обнаружены корреляции в подвижности белковой цепи и связанной воды. Таким образом, множество проведённых численных и экспериментальных исследований говорят о сложном характере взаимодействия белка с молекулами растворителя.
Анализ стабильности получившейся структуры при увеличении температуры
что решётка льда, состоящая из 48 атомов, - наиболее стабильна из рассматриваемых структур, занимает положении ”более глубокого” локального минимума dU по ставнению с другими структурами, а T-кластер - наименее).
Удельная энергия водородной связи свзана с таким понятием, как "напряженность системы". Будем говорить о потенциальной энергии, имея в виду её абсолютное значение. Представим, что некоторая часть системы обладает большим запасом потенциальной энергии, которую можно извлечь при выведении этой части системы из равновесия. Такая система будет называться напряженной. Самым напряжённым оказался L-L-кластер, наименее напряжённым - T-кластер. Это можно объяснить так: T-кластер наиболее приближен к шаровой форме, которая является фигурой с наименьшей площадью поверхности при одинаковом объёме, следовательно, доля граничных атомов, на которые оказывается нескомпенсированное воздействие, в T-кластере минимально.
Мы исследовали устойчивые системы, находящиеся в локальном минимуме (нахождение глобального минимума является проблематичным): систему белок - вода и шарообразную структуру, состоящую из большого числа молекул воды - модель объёмной воды). Для моделирования атомной структуры растворителя мы применяли программный пакет SOLVATE [67].Минимизацию структуры с шагом 1фс осуществляли в вакууме (без периодических граничных условий) с помощью программного пакета NAMD [68] в потенциале CHARMM [69], с использованием модели воды TIP3P. Минимизация энергии структуры в этом пакете реализована методом сопряженных градиентов.
Для оценки достижения минимума полной энергии системы использовали следующий (за 1 шаг итерационного процесса минимизации). В ходе моделирования мы чередовали процесс минимизации с процессом молекулярной динамики (при небольших постоянных температурах (50 - 100)К в течение (0.5 - 1)пс для того, чтобы избежать ситуации, когда система скатывается в некоторый неглубокий локальный минимум и, соответственно, там остаётся. На рис. 40 изображена зависимость потенциальной энергии для гидратной оболочке коллагена 1CAG.pdb.
В работе проведено сравнение гидратных оболочек белков и th-циклов с точки зрения топологии связанных структур. Для этого необходимо установить наличие гексациклов в гидратных оболочках. Прежде всего, мы нашли простые циклы, то есть пути с неповторяющимися вершинами и рёбрами, кроме начальной и конечной вершины, начальная и конечная вершины совпадают.
В данной части работы проводилось моделирование гидратных оболочек белков следующих структур из быза Protein Data Bank (PDB): Для поиска циклов по очереди запускаем модифицированный алгоритм BFS из каждой вершины (на каждом таком запуске будем искать только циклы, содержащие стартовую вершину). Также заводим массив, в котором каждой вершине будем ставить номер вершины родителя (из которого мы попали в вершину). Меняем пункт 2 алгоритма BFS. Если приемник уже посещен, то пробуем составить цикл (пройдясь по массиву родителей до стартовой вершины, из которой запускали модифицированный BFS). Если длина цикла 2 и MAX_CYCLE_LENGTH (= 6 в нашем случае, так как в первую очередь нас интересуют гексациклы) и ни одна вершина не повторилась дважды (кроме стартовой), то мы нашли цикл - добавляем его в множество циклов. Иначе - идем дальше. Если же приемник не просмотрен, то добавляем его в очередь, запоминая родителя (текущую вершину). На рис. 44 показаны примеры циклов с различным числом вершин.
После того, как существование простых циклов в сетке водородных связей структуры гидратной оболочки белка было установлено, рассмотрим гексациклы в гидратных оболочках белка более подробно. Далее мы детально проанализировали распределение торсионных углов в гексациклах. Приведём распределение конформаций гексациклов для гидратных оболочек различной толщины T (табл. 5 - 7), количество гексациклов обозначим как H_0, количество твист-ванн -H_1, в исследуемых объектах гексациклы конформаций типа "кресло"и "ванна"отсутствуют.
Таким образом практически все молекулы ( 95%, табл. 8) в исследуемых гидратных оболочках принадлежат к хотя бы одному гексациклу. Это позволяет нам исследовать гид-58 ратные оболочки как систему гексациклов. Гексациклы могут соединяться друг с другом различными способами, 2 гексацикла могут иметь различное число общих вершин V: 2 (иллюстрация на рис. 47, a), 3 (рис. 47, b), 4 (рис. 47, c) общие вершины.
В данной части работы проведено изучение топологических характеристик гидратных оболочек коллагенов и убиквитина, используя силовое поле CHARMM и модель воды TIP3P. Было показано, что сеть водородных связей может быть рассмотрена как структура гексациклов, так как 95% молекул воды принадлежат по крайней мере к одному гексациклу. Эти гексацилы можно разделить на классы в зависимость от их торсионных углов. Среди этих гексациклов были выделены параметрические структуры - твист-ванны. 4 Распределения ”валентных” и торсионных углов в гидратных оболочках белков
Мы рассматривали структуры гидратных оболочек в рамках параметрической модели связанной воды Бульенкова, где сетка водородных связей может быть представлена как система гексациклов конформации твист-ванна. Твист-ванна не определяет жестко геометрические параметры: это могут быть как водные кластеры, так и кристаллические структуры, например, лёд. В структуре льда все гексациклы эквивалентны, внутренние параметры - межмолекулярные расстояния, валентные и торсионные углы - постоянны и могут изменяться только под действием температуры. При построении системы гексациклов с помощью только твист-ванн распределения геометрических параметров структуры должны искажаться. Это происходит вследствие неевклидовой природы этих структур [71].
Гидратная оболочка белка может состоять из твист-ванн согласно модели Бульенкова. Структура циклов построена из тетраэдрических частиц (водные молекулы, соединенные водородными связями). Эти тетраэдрические частицы объединяются в гексациклы определённой хиральности, а гексациклы уже объединяются в th-циклы.
Традиционный алгоритм поиска циклов в ширину (breadth-first search - BFS)
На распределении торсионных углов объемной воды и гидратных оболочек также есть различия. В воде наблюдается отчетливый глобальный минимум при 0 и два максимума при +60 и -60 (рис. 53), что нехарактерно для гидратной оболочки исследуемых белков. На распределении торсионных углов в гидратной оболочке убиквитина можно отметить максимумы +40 и -40 (рис. 59). Такие углы характеризуют гексацикл "твист-ванна". Эти максимумы не наблюдаются в объемной воде (рис. 58). Если распределение торсионных углов объясняется этим фактом, то объемная вода может быть представлена как система гексациклов "кресло"и "ванна”, то есть лёд-1c, а вода в гидратной оболочке может быть представлена как система гексациклов "кресло"и "твист-ванна".
Проведём детальный анализ полученных ранее функций распределения "валентных"углов: выясним вид этой функции распределения для частиц разных типов. Молекулы воды в графе, вершинами которого являются молекулы кислородов, а рёбрами - водородные связи, представляют собой топологически различные частицы, так как каждая молекула воды может образовать до четырёх водородных связей, если учитывать возможность образования бифуркатных связей- то до 5 - 6. Типичные представители классов молекул воды с различным числом водородных связей N показаны на рис. 64
В табл. 12- 14 показано распределение числа топологически различных молекул, то есть молекул с различным числом водородных связей N для белков 1ITT.pdb, 1A3I.pdb и 1UBQ.pdb соответственно. N в приведенных таблицах варьируется от 2 до 6. Молекул, образующих 1 водородную связь, практически не встречается.
Таблица 12: Распределения топологически различных часттиц, белок 1ITT.pdb, толщина гидратного слоя T, общее количество молекул воды M, число образованных частицей водородных связей N
Заметим, что в гидратной оболочке число молекул воды, которые образовали 3 связи (N = 3), больше числа молекул воды с 4-мя связями (N = 4), что говорит о том, что молекулы в гидратной оболочке отличаются от молекул в объёмной воде. Из статистики (табл. 12 - 14) видим, что отношение числа частиц с N = 3 к N = 4 уменьшается с увеличением ширины слоя растворителя. Этот факт показывает непротиворечивость модели, так как количество молекул в объёме растёт по сравнению с количеством поверхностных молекул (площадь поверхности пропорциональная 2-ой степени характерного радиуса, а объём тела -пропорционален 3-ей степени): где S - площадь поверхности, V - объем тела, R - характерный радиус (радиус описанной вокруг структуры сферы).
С увеличением числа молекул воды отношение поверхностных молекул к молекулам в объёме уменьшается. Чем больше молекул воды окружают белок и принимают участие в моделировании - тем больше частиц образуют водородные связи. Рис. 65: Распределения валентных углов O-O-O для топологически различных частиц, толщина водного слоя 12A, число образованных частицей водородных связей N, белок 1A3I.pdb
Полученные функции распределения для топологически различных частиц имеют качественные особенности, топологически различные частицы вносят неодинаковый вклад в суммарную функцию распределения. Так, вклад в суммарную функцию распределения Рис. 67: Распределения валентных углов O-O-O для топологически различных частиц, толщина водного слоя 12A, число образованных частицей водородных связей N, белок 1ITT.pdb ”валентных” углов от молекул с 3-мя водородными связями (N = 3) выражен в виде максимума (рис. 65 - 67), соответствующего валентному углу Н-О-Н, равному 104,50.
Особенности в распределениях "валентных"и торсионных углов в гидратных оболочках белков могут говорить о том, что в гидратной оболочке белка реализуется особая топология воды. Эта топология характеризуется большей устойчивостью - правильное распределение валентных углов соответствует потенциальному минимуму. Здесь же можно косвенно сказать о низкой подвижности связанных молекул воды по сравнению с объёмной водой - у молекул гидратной оболочки выше потенциальный барьер в среднем. Наблюдаемое в гидратной оболочке убиквитина наличие максимумов между -60 и 60 в распределении торсионных углов (рис. 59) говорит о присутствии дискретных структур.
Распределения валентных углов в области 60-75 свидетельствуют о том, что в сетке связей присутствуют или незамкнутые циклы или циклы, состоящие из более чем шести молекул. В обоих случаях подвижность молекул в этой сетке должна быть больше, чем если бы они были связаны в 4-, 5- или 6- циклы.
Мы полагаем, что распределение углов O - O - O связана с направлением водородной связи и донорно-акцепторным механизмом возникновения этой связи. Меньший равновесный угол является доминирующим в случае центральной акцепторной молекулы. В случаях нецентральной акцепторной молекулы пик распределения валентных углов должен быть меньше. В других случаях валентный угол должен стремиться к тетраэдрическому углу 104,5 (валентный угол молекулы воды в газовой фазе). Другим аргументом для этой гипотезы является тот факт, что мы используем TIP3P водный потенциал в моделировании. В этом типе модели воды угол жесткий и равен 104,5. Распределение углов O - O - O указывает неслучайности топологии структуры, ее негауссовом распределении. 5 Функции плотности и электростатического потенциала в гид-ратных оболочках белков
Характеристики гидратации белков существены для понимания их структуры и функций. Эти характеристики требуют выяснения взаимного влияния атомов белка и молекул воды. Для термодинамического описания гидратации белка необходимо получить модель, в которой растворитель описывается в терминах вероятностных распределений.
Традиционно гидратация белка обсуждается в терминах гидрофобности/гидрофильности поверхностных групп. Но в работe [78] указывается, что здесь имеет место изменения в топологии поверхности. Изменение топологии сетки водородных связей, а так же электростатическое поле, генерируемое атомами белка, определяют повышенную плотность гидратной оболочки, а также периодическую структуру функции электрического потенциала.
Одной из основных причин появления артефактов является достижение в процессе минимизации методом градиентного спуска (применяемого в нашей работе) точки локального минимума функции потенциальной энергии в зависимости от числа шагов минимизации, но не точки глобального минимума. Таким образом, в случае \MIN — MIN_global\ 3 Є (существенного различия локального и глобального минимумов) после минимизации система будет напряжена (обладать существенным запасом потенциальной энегрии), и последующий процесс молекулярной динамики при различных начальных условиях будет приводить к различным статистическим характеристикам системы. В то же время, нагрев не должен проводиться при больших температурах, так как это приведет к сильно неравновесным структурам, имеющим совсем другие характеристики, возможно, без ярко выраженних особенностей. Таким образом для уменьшения влияния начальных условий необходимо чередовать минимизацию со слабым нагревом.
Топологически различные частицы в гидратных оболочках
Мы рассматривали структуры гидратных оболочек в рамках параметрической модели связанной воды Бульенкова, где сетка водородных связей может быть представлена как система гексациклов конформации твист-ванна. Твист-ванна не определяет жестко геометрические параметры: это могут быть как водные кластеры, так и кристаллические структуры, например, лёд. В структуре льда все гексациклы эквивалентны, внутренние параметры - межмолекулярные расстояния, валентные и торсионные углы - постоянны и могут изменяться только под действием температуры. При построении системы гексациклов с помощью только твист-ванн распределения геометрических параметров структуры должны искажаться. Это происходит вследствие неевклидовой природы этих структур [71].
Гидратная оболочка белка может состоять из твист-ванн согласно модели Бульенкова. Структура циклов построена из тетраэдрических частиц (водные молекулы, соединенные водородными связями). Эти тетраэдрические частицы объединяются в гексациклы определённой хиральности, а гексациклы уже объединяются в th-циклы.
Перечислим основные характеристики твист-ванны: Евклидово пространство не может быть заполнено этими структурами иерархичность: все структуры строятся по одним топологическим правилам (из одинаковых предпосылок) из тетраэдрических частиц ограничение на связь твист-ванн в гексациклы, твист-ванна - это инвариант модели
Th-циклы имеют простые геометрические и топологические свойства, которые также являются характерными для биосистем - макромолекул и макромолекулярных комплексов. Биосистемы, как и th-циклы, дисконтинуальны, иерархичны и обладают инвариантами (например, ограниченное число аминокислотных остатков и нуклеотидов, опредёленный способ соединения аминокислотных остатков друг с другом в аминокислотную цепь). Предполагается, что поверхность белка и вода в прилегающей к белку области должна обладать схожими геометрическими и топологическими характеристиками. В общем смысле - твист-ванна -это только один пример нескольких возможных иерархических тетраэдрических систем, построенных на "биологических принципах".
Равновесные гидратные оболочки, полученные путём минимизации системы в заданном потенциале, могут быть рассмотрены с точки зрения соответствия их топологической модели са моделью th-циклов.
В связанной воде гексациклы являются важной структурной единицей. Они существуют не только в конформациях типа кресло и ванна, но и в конформации типа твист-ванна [73]. В рамках модели Бульенкова связанная вода моделируется сеткой твист-ванн, атомы кислородов представлены вершинами графа, а водородные связи между молекулами воды – рёбрами этого графа.
Гексацикл "твист-ванна"в двух проекциях. В гидратных оболочках всех исследуемых белков действительно были обнаружены гекса-циклы типа твист-ванна. Ранее было показано (табл. 8), что 95% молекул воды гидратных оболочек принадлежат хотя бы одному гексациклу, что даёт возможность исключить из рассмотрения оставшиеся 5% молекул (рис. 52). На рис. 49 приведены примеры твист-ванн, найденных в исследуемых гидратных оболочках. Это не теоретически построенная структура, построенная из геометрических соображений, а полученная при моделировании.
Рассмотрим распределение углов O - O - O (атомов кислорода) для всех троек молекул воды (1 - 2 - 3), соединённых водородными связями. В этой тройке присутствуют 2 водородные связи, образующие угол ABC (рис. 50). В данном случае не имеет значения - является ли центральная молекула донором или акцептором. Мы можем характеризовать геометрическую картину гидратной оболочки с помощью распределения углов O - O - O. В дальнейшем будем называть угол O - O - O "валентным”. Мы подразумеваем, что это не угол между валентными связями в молекуле воды, но угол между направлениями на O-H.
Рассмотрим распределение внутренних параметров в гексациклах: распределение "ва-лентных"(рис. 50) и торсионных (рис. 51) углов.
Из распределения ”валентных” углов в объёмной воде (рис. 53) видно, что максимум распределения соответствует валентному углу Н-О-Н, равному 104,50. В распределениях валентных углов для гидратных оболочек (рис. 54 - 57) наблюдается минимум в области 60-75. Для количественной оценки глубины этого минимума посмотрим на следующую величину: отношение числа молекул с валентным углом 60-75 к общему числу молекул. Оказалось, что для гидратных оболочек рассматриваемых белков эта величина составляет 7%, а для объёмной воды – 12%. Данные оценки сохраняют значения для нескольких структур каждого белка, что свидетельствует о значимом характере данного минимума в гидратных оболочках белков (табл. 11).
Сетки водородных связей объемной воды и гидратных оболочек отличаются по распределениям внутренних параметров (валентных и торсионных углов), следовательно, можно предположить, что они отличаются топологически, то есть отличие существует в алгоритме связывания молекул посредством водородной связи.
Отметим область валентных углов вблизи 60. В объемной воде мы можем наблюдать лишь небольшое плечо в этой области (рис. 53). Угол 60 является принципиальным для топологии дисконтинуальных водных структур, поскольку он соответствует промежуточнуму минимуму 3.5A на радиальной функции [74]. Рис. 59: Распределение торсионных углов О-О-О-O в гидратной оболочке белка 1UBQ.pdb
Отчётливо наблюдаемый в распределениях ”валентных” углов локальный максимум 60 в гидратных оболочках белков (рис. 54 - 57) может быть объяснён наличием устойчивого четырехмолекулярного фрагмента (рис. 63). Этот четырёхмолекулярный фрагмент может быть, в том числе, фрагментом гексамера в конформации "клетка"(cage-hexamer), так как угол 60 является характерным углом в гексамере "клетка"(рис. 7). Такой гексамер характеризуется низким локальным минимумом потенциальной энергии [61] по сравнению с другими гексациклами. В распределении ”валентных” углов для объемной воды этот максимум на 60 выражен слабо.