Содержание к диссертации
Введение
1. Обзор литературы.
1.1. Биологические макромолекулы и биомиметика 8
1.2. Сворачивание биологических макромолекул в уникальную пространственную структуру 11
1.3. Гетерополимер со случайной последовательностью как модель глобулярного белка 13
1.4. Белковоподобные АВ-сополимеры: пример конформационно-зависимого синтеза 17
1.5. Эволюционные алгоритмы синтеза первичных последовательностей 22
1.6. Сополимер с насыщающимися связями как пример РНК-подобных полимеров 24
1.7. Строение и вторичная структура макромолекул РНК 26
1.8. Компьютерная модель полимерной цепи с флуктуирующей длиной связи 29
2. Зависимость статистических свойств белковоподобной последовательности от условий проведения эксперимента .
2.1. Описание модели 32
2.2. Статистические свойства первичных последовательностей белковоподобных сополимеров 34
2.3. Итерационный механизм конформационно-зависимого синтеза 37
2.3. Влияние относительного состава сополимера на статистику первичной последовательности 43
2.5. Влияние компактности материнской конформации 45
3. Моделирование глобул с активным центром .
3.1. Простейшая модель ABC-глобулы с активным центром 47
3.2. Восстановление активного центра
3.2.1. Сборка ядра активного центра при коллапсе из клубка 48
3.2.2. Восстановление ранее разрушенного активного центра внутри глобулы 49
3.3. Влияние первичной последовательности на структуру глобулы 51
4. АВ-сополимеры с насыщающимися связями .
4.1. Метод мультиканонического моделирования 54
4.2. Модель сополимера с насыщающейся А-В связью и кооперативными свойствами 55
4.3. Свойства сополимера со случайной последовательностью 59
4.4. Свойства сополимера со специально приготовленными последовательностями: переходы клубок-глобула-шпилька 61
4.5. Влияние жесткости на переходы клубок-глобула-шпилька 69
4.6. Вырожденность вторичной структуры в основном состоянии 73
4.7. Влияние флуктуации на свойства сополимеров с насыщающимися связями 77
5. Эволюционные процедуры для оптимизации и синтеза сополимерных последовательностей .
5.1. Биоэволюционный подход к конформационно-зависимому синтезу 82
5.2. Эволюционный синтез белковоподобных последовательностей 83
5.3. Эволюция РНК-подобных сополимеров 93
Заключение 101
Литература 105
- Белковоподобные АВ-сополимеры: пример конформационно-зависимого синтеза
- Компьютерная модель полимерной цепи с флуктуирующей длиной связи
- Влияние относительного состава сополимера на статистику первичной последовательности
- Восстановление ранее разрушенного активного центра внутри глобулы
Белковоподобные АВ-сополимеры: пример конформационно-зависимого синтеза
На стыке проблемы создания функциональных полимеров и понимания механизмов сворачивания белков лежит подход конформационно-зависимого синтеза, предложенный несколько лет назад Хохловым и Халатуром в работе [1,54]. В отличии от методов «отпечатка» и «размораживания последовательностей», упоминавшихся выше, этот метод направлен не на изучение процессов сворачивания белков, а на создание гетерополимеров, обладающих некоторыми простейшими свойствами белков, в частности - растворимости белковых глобул. Принцип этой методики проиллюстрирован на рисунке 1.3. Процедуру "приготовления" белковоподобных сополимеров можно описать следующим алгоритмом: 1. Из случайного гомополимерного клубка формируется плотная глобула. 2. Осуществляется процедура «окраски»: все звенья данной конформации делятся на 2 сорта: сорт Н - гидрофобные, звенья, лежащие в ядре глобулы и имеющие меньше всего контактов с растворителем, и сорт Р - полярные, лежащие на поверхности глобулы и имеющие наибольшее количество контактов с растворителем. 3. После этого фиксируется получившаяся последовательность и можно проводить исследования над синтезированным таким образом АВ-сополимером. Такие АВ-сополимеры были названы белковоподобными, поскольку они моделируют одно из основных свойств глобулярных белков - растворимость в основном состоянии. В рамках Модели с Флуктуирующими
Связями рассматривались три модели АВ-сополимеров: Сополимер с белковоподобной первичной последовательностью, приготовленный по вышеописанным правилам. Случайный сополимер, имеющий статистическую случайную последовательность с бернулиевской статистикой. Блочно-случайный сополимер, имеющий первичную структуру, определяемую распределением Пуассона со средним значением длины блока эквивалентным аналогичному значению у белковоподобных сополимеров. Было показано [1, 10-14, 54-56], что переход клубок-глобула в белковоподобных сополимерах происходит при больших температурах, более резкий и приводит к формированию более плотных глобул, чем в случайных и блочно-случайных сополимерах. На рисунке 1.4 показаны типичные конформации глобул исследовавшихся сополимеров. Глядя на эти конформации, нетрудно согласиться, что белковоподобная глобула наименее всего подвержена выпадению в осадок: гидрофобное ядро плотное и хорошо сформировавшееся, в то время как гидрофильные звенья формируют равномерную и рыхлую опушку. Эксперименты по реализации схемы конформационно-зависимого синтеза в лаборатории подтверждают предположения компьютерного моделирования [3-5, 57-58]. Таким образом, свойства белковоподобных сополимеров заметно отличаются от случайных и, поскольку ничем кроме последовательностей они не отличаются, отличия заключены именно в структуре последовательности. Обнаружить такие отличия позволяет корреляционный анализ, аналогичный тому, который использовался при анализе последовательностей ДНК [60]. В простейшем случае такой анализ может быть описан как нахождение дисперсии среднего числа частиц определенного сорта в окне Для абсолютно случайной последовательности значение Д должно изменятся с длиной окна L как /Л Зависимость D(L) L" с а 1Л можно интерпретировать как существование дал ьно действующих корреляций.
И такие дальнодействующие корреляции действительно были обнаружены в белковоподобных последовательностях. На рисунке 1.5 показаны зависимости D(L) для исследовавшихся типов сополимеров. Видно, что D(L) для случайной и блочно-случайной последовательностей имеют асимптотику L A, в то время как D(L) для белковоподобных последовательностей не следует этой зависимости даже при значительных длинах L. К настоящему моменту метод конформационно-зависимого синтеза реализован также для "настроенных на адсорбцию" сополимеров, ведутся работы по исследованию "мембрано-подобных" и "ферменто-подобных" сополимеров [10-14, 55]. Не так давно был предложен аналитический подход для описания конформационно-зависимого синтеза и возникающих при этом корреляций в последовательностях [2, 61]. Суть подхода заключается в рассмотрении самой природы получающихся белковоподобных последовательностей, т.е. рассмотрении конформации материнской глобулы. Именно эта конформация определяет первичную структуру сополимера. Как известно [62], статистика полимерной цепи в плотной глобуле, а именно такая конформация берется за материнскую, - гауссова. Следовательно, все статистические свойства, включая корреляции в первичной структуре, вызванные процедурой конформационно-зависимого синтеза, могут быть получены при решении уравнения диффузии с определенными граничными условиями. Другими словами, мы можем мысленно разделить материнскую глобулу на две области: внутренняя (сфера с радиусом R , R R) и внешняя (остальная часть глобулы) и представить процедуру синтеза как случайное блуждание в глобуле, отображающееся как звенья разного сорта при нахождении во внешней и внутренней областях. Таким образом, статистические свойства белковоподобных последовательностей находятся при решении уравнения: Не вдаваясь в подробности вычислений, отметим лишь общие асимптотики для распределения длины блока, состоящего из мономеров одного сорта где d = R-R - расстояние, ограничивающее внутреннюю и наружнюю области глобулы, а - характерный размер звена, и для величины D(L), определяемой формулой (1.3) Для получения выражения для дисперсии D(L) в явном виде заметим, что щщ в формуле (1.3) - просто вероятность того, что / и у звенья гидрофобны или, что тоже самое, находятся внутри области материнской конформации с радиусом R . Усреднение приводит к: где G(r,k\r0) - функция Грина, удовлетворяющая уравнению (1.4) с граничными условиями (1.5), щ и Я„ - соответствующие собственные вектора и функции. При переходе к интегрированию в формуле (1.3) получается:
Компьютерная модель полимерной цепи с флуктуирующей длиной связи
Другой подход, активно использующийся как при компьютерном моделировании, так и при попытках теоретического описания белков, - модель гетерополимера со случайной последовательностью [27]. Как правило, рассматривается решеточная модель компактных конформаций гетерополимера на простой кубической решетке. Это предполагает, что плотность системы близка к плотности упаковки и верно объемное приближение. Гамильтониан такой системы в наиболее общем виде можно записать в следующем виде: где заглавные латинские буквы в индексах означают номера звеньев вдоль по цепи, S/є {1,..., q) - изображает "химическую породу" мономера номер / (так что {Si} представляет первичную структуру), q - число химически различных типов мономеров, вектор г/ указывает положение мономера /в пространстве (и, тем самым, {г/} описывает конформацию цепи). Функция А(г) сконцентрирована там, где могут находиться ближайшие пространственные соседи мономера, на решетке, например, Д(д)=1 и А(г а)=0, где а - размер ячейки решетки. Таким образом, в этой модели заключен простой смысл: мономеры взаимодействуют, если в данной конформации они соседи в пространстве, и энергия их взаимодействия определяется тем, какие это мономеры (в соответствии с "матрицей взаимодействий" /,). Предполагается, хотя и не пишется этого явно в формуле (1.1), что положения мономеров такие, что сохраняются все условия связности цепи или линейной памяти (точки г/ и г/ +; всегда соседи в пространстве для всех Г), исключенного объема (17=17 для всех I=J) и плотной упаковки. Как ни обща модель, представленная формулой (1.1), это, конечно, только приближение. Например, неучтены гетерогенные трех- и более частичные взаимодействия, а матрица взаимодействий, на самом деле, представляет уже соответствующие свободные энергии, неявно учитывающие роль растворителя. Также предполагается, что "мономеры" в формуле (1.1) - это уже перенормированные "квазимономеры".
Тем не менее, формула (1.1) включает все основные факторы, определяющие крупномасштабное поведение глобулы гетерополимера типа белка, в том числе само явление сворачивания белков. Для теоретического описания свойств гетерополимерных глобул, как правило, используется Модель Случайных Энергий (МСЭ) [22]. Не вдаваясь в подробное описание этой модели, ниже перечислены основные свойства МСЭ: 1. Определяющее свойство МСЭ - это статистическая независимость микросостояний. 2. Энергетический спектр МСЭ состоит из квазинепрерывной части, которая практически не зависит от реализации беспорядка, и нескольких дискретных уровней, конкретное расположение которых индивидуально для каждой реализации (см. рис. 1.3). 3. Для типичных реализаций основное состояние МСЭ находится на величину порядка JN ниже границы непрерывного спектра, которая, в свою очередь, на величину порядка V7V ниже середины спектра. Энергетическая разница между дискретными состояниями порядка N/. 4. Для МСЭ имеется особая температура Tgiass такая, что при Т Tgtass система имеет малую энтропию и перебирает в ходе теплового движения состояния квазинепрерывного спектра, тогда как при Т Tgiass система имеет на выбор всего несколько индивидуальных дискретных состояний. 5. Свободная энергия МСЭ определяется формулой [29]: Как правило, делается еще предположение о гауссовом характере распределения энергии какой-то одной конформации. Заметим, что все 5 вышеописанных свойств не зависят от предположения о гауссовом распределении энергии одной конформации. Особое место в анализе свойств гетерополимеров занимает матрица взаимодействия By, более подробно о ней говорится в Приложении 1, здесь лишь приведены несколько общих свойств: Гетерополимерные эффекты не зависят от среднего значения Bv. Изменение разброса энергии By эквивалентно изменению температуры, именно 8В является характерным энергетическим масштабом в гетерополимерной задаче. Анализ МСЭ наводит на мысль, что что-то важное происходит, когда при уменьшении температуры средняя энергия опускается ниже границы квазинепрерывного спектра.
Выше соответствующей температуры Tgiass система перебирает много (порядка O(expN)) состояний и ведет себя практически независимо от реализации беспорядка: побеждает энтропия. Ниже этой температуры главный вклад дают несколько индивидуальных дискретных состояний: побеждает энергия. Температура Tgiass называется температурой стеклования, соответствующий переход называется стеклованием. Когда был открыт переход стеклования для случайных гетерополимеров [30], многие подумали, что это уже хорошая модель для белков, так как получалось, что даже случайная последовательность дает уникальное пространственное состояние с заметной (главное, не зависящей от N) вероятностью. Довольно скоро, однако, стало понятно, что это состояние, хотя формально и уникальное, но совершенно недостаточно "грубое" и устойчивое. Действительно, поскольку различие энергий низко лежащих состояний в МСЭ пропорционально только N , и это несмотря на то, что эти состояния структурно абсолютно различны (с нулевым или малым перекрытием), то достаточно ничтожного ( N ) изменения параметров взаимодействий (например, за счет небольшого изменения растворителя), чтобы конформация основного состояния перестроилась полностью, до неузнаваемости [31]. Это, конечно, совершенно не похоже на природные белки, у которых нативные состояния, наоборот, замечательны своей устойчивостью. Таким образом, мы приходим к отбору последовательностей - изучению гетерополимеров с последовательностями, глобулярные состояния которых наиболее стабильны. Другая сторона проблемы состоит в том, что выбор основного состояния для случайной последовательности, естественно, никак нельзя контролировать. Было бы проблематично найти последовательности, основные состояния которых обладают какими-либо желаемыми свойствами. Отсюда следует вывод о необходимости не просто отбора, а сознательного конструирования последовательностей, используя которые можно получить гетеро полимеры с требуемыми свойствами.
Влияние относительного состава сополимера на статистику первичной последовательности
Представлялось интересным, кроме того, рассмотреть влияние относительного состава сополимера на статистическую структуру его последовательности. Теоретическое описание белковоподобных сополимеров позволяет варьировать относительное содержание внешних и внутренних звеньев. Это делается путем изменения R - границы, разделяющей области внешних и внутренних звеньев. На рисунке 2.11 показаны графики D(L) при варьировании процентного состава, полученные путем моделирования на компьютере и из аналитической формулы (1.9). Полученный результат свидетельствует об интересной особенности синтезированных последовательностей: сохранении статистики при варьировании процентного состава сополимера. Различия проявляются только в вертикальном сдвиге зависимостей D(L). Прослеживается аналогия с бернуллиевской статистикой: D(L)= p/(p-l)-L, где р -относительное содержание звеньев разных сортов в последовательности. Это означает, что зависимость D L остается верной для любых р и от последнего параметра зависит лишь положение этой прямой вдоль оси ординат. Как видно из графиков, прослеживается хорошее соответствие теории с экспериментом на качественном уровне. Говорить, однако, о полном соответствии не приходится: как видно из графиков, положение аналитической зависимости D(L) далеко не симметрично относительно замены процентных составов внутренних и внешних звеньев, Как это получается из компьютерного эксперимента. Далее приведены данные о зависимости статистической структуры получаемых первичных последовательностей при варьировании относительного состава звеньев разного типа для итерационного механизма конформационно-зависимого синтеза.
На рисунке 2.12 приведены соответствующие графики. Из них также следует сохранение статистики при варьировании процентного состава сополимера. Как и для мгновенной процедуры синтеза, различия проявляются только в вертикальном сдвиге зависимостей D(L). исследовано влияние компактности материнской конформации на получающиеся после синтеза последовательности. Плотность исходной конформации задавалась температурой эксперимента, а получающиеся последовательности мы характеризуем, как и раньше, углом наклона функции D(L). Отметим, что для набухшего клубка получаемые последовательности должны быть случайными, а значит, тангенс угла наклона должен быть равным /г, так как D2 L для статистики Бернулли. Данные компьютерных экспериментов при использовании итерационного механизма синтеза приведены на рисунке 2.13. Нижняя асимптотика указывает на наклон У2. Видно, что по мере увеличения температуры, а значит - набухания клубка, угол наклона стремится к У2, как и должно быть исходя из общих соображений. Диапазон изменения igD(L): 0.6 + 0.85. Верхняя прямая, с наклоном 1 -асимптотика D(L) для максимально "неслучайной" последовательности, например -диблока. Для дальнейших исследований свойств конформационно-зависимых полимеров были выбраны ABC-сополимеры, состоящие из мономерных звеньев трех типов. При конструировании первичных последовательностей за основу был взят алгоритм, предложенный в пионерской работе [1] и описанный во введении. Был добавлен лишь шаг выделения ("покраски") звеньев третьего сорта (см. рис. 3.1). Таким образом, этапы приготовления ABC-сополимера могут быть описаны следующим образом: 1. За начальную конформацию берем случайную конформацию гомополимерного клубка. Далее осуществляем коллапс в плотную глобулу, по форме близкую к сферической. 2. Делим все звенья цепи на две части - тип А ("гидрофильные") и тип В ("гидрофобные"), помечаем типом
В звенья полимера, имеющие меньше всего контактов с растворителем. 3. Среди всех звеньев выделяем тип С ("активный центр"), помечаем этим типом звенья, попавшие в сферу с центром, находящимся на определенном расстоянии от центра масс молекулы и с требуемым для процентной концентрации радиусом. Как правило, концентрация звеньев активного центра и их смещение брались достаточно малыми и получившееся С-ядро не выходило на границу гидрофильной оболочки глобулы. 4. Запоминаем получившуюся последовательность. Таким образом, мы осуществляем конформационно-зависимый синтез. Для дальнейшей работы мы можем использовать как свежеприготовленную глобулу, уравновешивая её при различных потенциалах взаимодействия между звеньями, так и саму первичную последовательность, перенося её на другие конформации полимеров. Такой ABC-сополимер может рассматриваться как простейшая модель белковой макромолекулы, состоящей из гидрофобных и гидрофильных звеньев и имеющей, кроме того, звенья особого типа, выполняющие некие функции при кооперативном участии. В организме такой белок находится в глобулярном состоянии, с гидрофильной опушкой, не позволяющей ему выпадать в осадок, и с биологически-активным ферментативным центром внутри гидрофобной глобулы. В биологии известно огромное множество подобных белков: это и всевозможные ферменты - биокатализаторы химических реакций в
Восстановление ранее разрушенного активного центра внутри глобулы
Вдополнение к вышеуказанным экспериментам был проведен эксперимент по разрушению и последующему восстановлению активного центра внутри целой гидрофобной глобулы (см. рис. 3.3). В начале бралась первичная конформация свежеприготовленной глобулы, уравновешенная при потенциалах с вес = -2, св = вв = -1. Если после этого выключить притяжение между активными звеньями, полагая єсс 0, то тем самым разрушается С-ядро и С-звенья выталкиваются на периферию гидрофобной глобулы. Когда равновесие устанавливалось, снова включалось притяжение между звеньями активного центра. В результате происходило восстановление разрушенного активного центра. Этот эффект может получить интересное применение: например, будут созданы постоянно присутствующие в среде вещества (молекулы), которые при изменении внешних условий будут собирать активный центр, выполняющий определенную функцию, а затем, при отсутствии необходимости в нем, снова разрушать его. Другими словами, показана возможность перестройки внутренней структуры глобулы без перехода к клубковой конформации, то есть без кардинальных изменений внешних условий. Правда, в наших экспериментах восстановление было неполным: после восстановления некоторые С-звенья не входили в кластер активного центра. Для анализа влияния такого типа последовательностей на конформацию глобулы было проведено сравнение сополимеров с последовательностями этого типа и АВС-сополимеров со статистическим распределением звеньев различных типов вдоль по цепи, при этом сохранялось процентное соотношение между типами звеньев. Температура коллапса таких статистических сополимеров оказалась ощутимо ниже и переход клубок-глобула более резкий. Результат, однако, таков: и при белковоподобной первичной последовательности, и при случайном распределении типов звеньев по цепи в результате коллапса из клубковой конформации происходит восстановление С-ядра. Напомним, что эксперимент проводился при потенциале с єсс= -2. Это означает, что взаимодействие С-звеньев настолько велико, что практически при любом их расположении вдоль по цепи после коллапса они образуют кластер.
Конечно, говорить так можно с некоторыми оговорками: для случайного сополимера С-ядро довольно рыхлое и несферичное. Если сравнить распределения размера максимального кластера из С-звеньев в обоих случаях, то для случайного оно оказывается более широким и его максимум немного смещен к более мелким кластерам. Естественным продолжением этой серии экспериментов было исследование потенциалов с более слабым притяжением между С-звеньями. Таким образом, следующим шагом было изменение сс = -1 (оставляя євс= -1 и євв -1)- Этим фактически снимаются различия между В- и С-звеньями, что позволяет исследовать влияние именно первичной последовательности, абстрагируясь от различий в объемных взаимодействиях. Кроме того, для окончательного прояснения влияния нашего типа первичной последовательности на конформацию глобулы вместо вышеописанной случайной первичной последовательности рассматривалась "псевдослучайная" последовательность, где случайно лишь распределение В- и С-звеньев внутри первоначального гидрофобного ВС-ядра. Это обеспечивает при коллапсе самосборку гидрофобного ядра и одинаковую концентрацию С-звеньев внутри него. Также были внесены небольшие изменения в потенциал взаимодействия между звеньями и в алгоритм идентификации кластеров. Все подробности изложены в Приложении 2. На графиках (см. рис. 3.4 и 3.5) показан сравнительный анализ результатов для размеров кластера из активных звеньев и их радиуса инерции для последовательности нашего типа и псевдослучайной. Налицо различие между этими двумя первичными последовательностями: способность воспроизводить активный центр у сополимера со сконструированной нами последовательностью явно выше, чем у сополимера со статистической последовательностью, при прочих равных условиях. Отметим, что используемый алгоритм идентификации кластеров не учитывает соседей вдоль по цепи. По всей видимости, различие между сополимерами с такими последовательностями ещё больше увеличится, если внести изменения в алгоритм для учёта соседей вдоль по цепи, вследствие существования значительных корреляций по составу у белковоподобных последовательностей. Однако, при сравнении расположения центра масс звеньев активного центра различия между этими двумя последовательностями практически отсутствуют, что говорит о том, что в рамках предложенной модели невозможно полностью смоделировать сборку внутренней структуры глобулы: пространственное расположение этого центра недетерминировано внутри гидрофобного ядра.
Объяснение последнего факта видится в маленьком радиусе взаимодействия между мономерными звеньями. В нашей модели радиус объемного взаимодействия (1.13) одного порядка с длиной связи, но чтобы создать и зафиксировать в пространстве структуру какого-либо масштаба из небольших частиц, необходимо наличие потенциала, сопоставимого по радиусу с масштабом этой структуры. каноническом ансамбле конформации при обратной температуре /3 s 1/квТ имеют веса согласно распределению Больцмана ыв exp{-j3Uj [82-84]. Конечное распределение плотности вероятности встретить данную конформацию выражается формулой PB(U) n(U)-Q)B(U), где n(U) - спектральная плотность. В случае использования мультиканонического ансамбля [85-88] распределение вероятности определяется условием: Pmu(U) n(U) -0)ти(и) = const. (4.1) Таким образом, все энергетическое пространство системы становится одинаково доступным. В дальнейшем, осуществляя одномерное случайное блуждание по этому пространству, система уже не чувствует никаких энергетических барьеров и локальных ям. Однако, основная сложность заключается в том, что мультиканонический фактор (вес) O)mu(U) неизвестен заранее, в отличие от больцмановского фактора в каноническом ансамбле. В общем случае, мультиканоническая процедура состоит из трех этапов: 1) найти оценку для мультиканонического веса wmu(U); 2) с помощью этой оценки провести длинное моделирование и набрать хорошую статистику: 3) провести процедуру обратного «перевешивания» для определения характеристик системы при требуемой температуре. Чрезвычайно важен и трудоёмок первый этап: для наших задач он занимал до 80% вычислительного времени. Использовался следующий алгоритм построения весов Ыти(Ц): (і) запускается каноническое МС моделирование по алгоритму Метрополиса при очень высокой температуре То, т.е. со = Ws = exp{-U/To} (в нашем случае: То = 1000). Запоминается гистограмма распределения энергий H(Uj), где /, -дискретные значения энергии, ширина бина равна 8U. В наших задачах, зачастую, не приходилось искусственно дискретизировать энергию U, так как в решеточных моделях энергия, как правило, дискретная величина. (ii) Рассчитывается первое приближение для веса „„/UJ l/HfUJ. Повторяется шаг (і) но уже с новыми весами omu(Uj).