Электронная библиотека диссертаций и авторефератов России
dslib.net
Библиотека диссертаций
Навигация
Каталог диссертаций России
Англоязычные диссертации
Диссертации бесплатно
Предстоящие защиты
Рецензии на автореферат
Отчисления авторам
Мой кабинет
Заказы: забрать, оплатить
Мой личный счет
Мой профиль
Мой авторский профиль
Подписки на рассылки



расширенный поиск

Теоретическое исследование сворачивания белков и пептидов Галзитская Оксана Валериановна

Теоретическое исследование сворачивания белков и пептидов
<
Теоретическое исследование сворачивания белков и пептидов Теоретическое исследование сворачивания белков и пептидов Теоретическое исследование сворачивания белков и пептидов Теоретическое исследование сворачивания белков и пептидов Теоретическое исследование сворачивания белков и пептидов Теоретическое исследование сворачивания белков и пептидов Теоретическое исследование сворачивания белков и пептидов Теоретическое исследование сворачивания белков и пептидов Теоретическое исследование сворачивания белков и пептидов
>

Диссертация - 480 руб., доставка 10 минут, круглосуточно, без выходных и праздников

Автореферат - бесплатно, доставка 10 минут, круглосуточно, без выходных и праздников

Галзитская Оксана Валериановна. Теоретическое исследование сворачивания белков и пептидов : диссертация ... доктора физико-математических наук : 03.00.02.- Пущино, 2006.- 259 с.: ил. РГБ ОД, 71 07-1/58

Содержание к диссертации

Введение

ГЛАВА 1. Литературный обзор 11

1.1. Проблема сворачивания белка 11

1.2. Открытие одностадийного перехода («все-или-ничего») в кинетике 14

1.3. Ядра сворачивания и скорости сворачивания: экспериментальные работы 16

1.4. Ядра сворачивания и скорости сворачивания: теоретические работы 27

1.5. Сворачивание Р-шпилек 39

1.6. Экспериментальные работы по сворачиванию Р-шпилек 40

1.7. Скорость сворачивания Р-структуры 42

1.8. Теоретические работы по сворачиванию Р-шпилек 46

1.9. Предсказание границ доменов 48

1.10. Предсказание нативно-развернутых участков белковой цепи 55

1.11. Предсказание амилоидогенных участков белковой цепи 57

ГЛАВА 2. Развитие метода для предсказания ядер сворачивания в глобулярных белках 64

2.1. Условия моделирования: точка термодинамического равновесия 64

2.2. Сеть путей разворачивания белка 65

2.3. Оценка свободной энергии 67

2.4. Переходные состояния на путях разворачивания белка 69

2.5. Анализ сети путей разворачивания белка при помощи метода динамического программирования: поиск оптимального переходного состояния. 71

2.6. Полный набор возможных переходных состояний, найденных методом динамического программирования 73

2.7. Ограничения, присущие поиску переходных состояний методом динамического программирования 74

2.8. Поиск переходных состояний методом Монте-Карло 75

2.9. Вычисление величин Ф для аминокислотных остатков 76

2.10. Исследованные белки 78

2.11. Сравнение экспериментально полученных величин Ф с вычисленными при помощи метода динамического программирования 83

2.12. Предсказание ядер сворачивания для белков, величины Ф для которых еще не исследованы экспериментально 95

2.13. Сравнение качества предсказаний ядер сворачивания при использовании метода динамического программирования и метода Монте-Карло 97

ГЛАВА 3. Различия между структурами белка, определяемыми с помощью рентгеноструктурного анализа и ядерного магнитного резонанса 100

3.1. Введение 100

3.2. Создание базы белков, структура которых разрешена с помощью методов рентгеноструктурного анализа и ядерного магнитного резонанса 101

3.3. Контакты аминокислотных остатков в структурах белков, расшифрованных методами рентгеноструктурного анализа и ядерного магнитного резонанса 105

3.4. Анализ водородных связей в главной цепи для РСА- и ЯМР-структур 108

3.5. Сравнение ЯМР-структур до и после их уточнения 112

ГЛАВА 4. Расчет скоросети сворачивания и сравнение с экспериментом 114

4.1. Оценка скорости сворачивания белка по вычисленной свободной энергии переходного состояния 114

4.2. Вычисление скоростей сворачивания методом Монте-Карло 116

4.3. Длина цепи - один из определяющих факторов для сворачивания белков, имеющих интермедиаты сворачивания 119

ГЛАВА 5. Влияние средней конформационнои энтропии и средней энергии остатка на скорость сворачивания белка 126

5.1.Ввеедние 126

5.2. Энтропийная емкость для белков с заданной топологией. 127

5.3. Измеение величины барьера свободной энергии от изменения величины энтропийной емкости 128

5.4. Статистический анализ средней конформационной энтропии и

среднего числа контактов на остаток для различных классов белков 131

5.5. Корреляция между скоростью сворачивания и энтропийной

емкостью для различных структурных классов 13 6

5.6. Обсуждение 140

ГЛАВА 6. Моделирование сворачивания пептидов методом молекулярной динамики и мультиканонического моделирования 142

6.1 Введение 142

6.2 Моделирование сворачивания дистальной Р-шпильки из src SH3

домена методом молекулярной динамики 143

6.3 Моделирование сворачивания дистальной Р-шпильки из src SH3

домена методом мульти-канонического моделирования 150

6.4. Заключение 163

ГЛАВА 7. Предсказание границ доменов по аминокислотной последовательности 165

7.1. Введение 165

7.2. Создание базы двухдоменных белков 168

7.3. Статистика аминокислотных остатков на границе доменов 169

7.4. Построение вероятностного профиля 170

7.5. Определение качества предсказания границ доменов нашим методом 171

7.6. Результаты и обсуждения 172

ГЛАВА 8. Предсказание нативно-развернутых участков белковой цепи 185

8.1. Создание баз данных белков 185

8.2. Наблюдаемое среднее число сближенных остатков в глобулярном состоянии на заданном расстоянии:

средняя плотность окружения 187

8.3. Предсказания формы (свернутой или развернутой) нативного состояния белка 189

8.4. Предсказание разупорядоченных участков белковой цепи 190

8.5. Сравнение различных методов для предсказания разупорядоченных участков белковой цепи 193

8.6. Заключение 195

ГЛАВА 9. Предсказание амилоидогенных участков белковой цепи 196

9.1. Поиск амилоидогенных участков в белках и пептидах, связанных с амилоидными болезнями 196

9.2. Изменения скорости агрегации при мутациях в белках и пептидах 205

Заключение 207

Результаты и выводы 212

Цитируемая литература

Введение к работе

Проблема сворачивания белка была и остается центральным вопросом современной биофизики. Цель заключается в том, чтобы объяснить, каким образом белок из развернутой полипептидной цепи очень быстро и точно приобретает уникальную пространственную структуру, обеспечивающую выполнение им специфической функции.

Данная работа посвящена поиску и изучению основных принципов, которые лежат в основе кинетики и термодинамики сворачивания белков, котороые в свою очередь генерируют новый взгляд на факторы, контролирующие этот процесс. Понимание механизмов сворачивания белка имеет большое значение для фундаментальной науки, являясь ключом к пониманию принципов фунционирования живой материи.

Сворачивание белка - сложный процесс, в результате которого такая сложная система, как белковая молекула, состоящая из многих сотен или тысяч атомов, приобретает свою уникальную пространственную структуру. Помимо своей фундаментальной значимости, понимание механизма сворачивания белка имеет огромное значение для решения многих прикладных направлений, таких, как разработка лекарств и создание искусственных белков с заданными свойствами, предсказание пространственной структуры белка по его аминокислотной последовательности. Нарушение правильного сворачивания белков in vivo, а также часто сопутствующий этому процесс агрегации во многих случаях приводят к заболеваниям. Несмотря на многолетние усилия, решить этот вопрос полностью пока не удалось.

Белковая цепь в ходе самоорганизации проходит через множество промежуточных состояний. Ключевую роль в сворачивании белков играет «зародыш» его нативной структуры. Этот зародыш соответствует переходному, т.е. самому нестабильному состоянию на пути сворачивания. После образования структур, соответствующих переходным состояниям ("ядер сворачивания"), белковая цепь быстро приходит к своей нативной

структуре. Знание структуры ядер сворачивания позволяет выяснить, образование каких структурных элементов лимитирует скорость сворачивания белковой молекулы.

В настоящее время существует единственный экспериментальный подход к поиску ядер сворачивания - Ф-анализ предложенный Фёрштом (Matouschek et ah, 1990) и производные от него методы, суть которых сводится к введению в изучаемый белок множества точечных мутаций и выявлению тех аминокислотных остатков, замена которых меняет стабильность переходного состояния белка столь же сильно, как и стабильность нативного состояния. Экспериментально это проявляется в сильном изменении скорости сворачивания мутантного белка по сравнению с белком дикого типа, при малом изменении скорости разворачивания. Необходимо сделать очень большое количество одинарных и двойных мутаций в белке, чтобы получить достаточный набор данных для выделения входящих в «зародыш» остатков белковой цепи. Поэтому так важно изучение структуры зародыша сворачивания белка теоретическими методами.

Умение теоретически определять остатки белковой цепи, важные для формирования ядра сворачивания, позволило бы предварительно определять наиболее вероятный кинетический путь сворачивания, и, главное, выявить, образование каких структурных элементов является лимитирующей стадией в процессе сворачивания данной молекулы. Это, в свою очередь, позволит рационально планировать белково-инженерные работы по экспериментальному определению зародыша сворачивания белковой структуры. Поэтому главное направление диссертации состояло в развитие теории и методов для расчета ядер сворачивания и оценки времени сворачивания глобулярного белка по его пространственной структуре. При этом сравнительный анализ теоретических и экспериментальных данных позволяет судить о потенциальных возможностях развитых в данной работе подходов.

Изучение кинетических аспектов самоорганизации белков, поиск факторов, определяющих скорость сворачивания белковых молекул, как с простой, так и сложной кинетикой, остается актуальной проблемой физики белка. Скорость сворачивания белковой молекулы определяется барьером свободной энергии между нативным и развернутым состояниями. Величина этого барьера определяется сложной картиной различных взаимодействий в белке, величина которых напрямую связана со структурой белка. Поэтому другое направление диссертации было посвящено поиску факторов важных для сворачивания белков с простой и сложной кинетикой.

Предсказание структуры и функции белков является одним из главных направлений в структурной геномике. Особую роль в этом направлении играют развернутые участки белковой цепи, предсказание которых представляет особый интерес. На сегодняшний день известно более 100 белков с неупорядоченной структурой (Тотра, 2002; Uversky, 2002). Эти белки и домены развернуты в нативном состоянии (так называемые нативно-развернутые белки) или содержат большие неструктурированные участки белковой цепи. При этом оказывается, что функционально важные белковые участки часто находятся вне глобулярных доменов (Wright & Dyson, 1999; Dunker et al, 2002). Это противоречит классическому понятию, что белок обязательно должен быть глобулярным, чтобы быть функциональным.

Умение предсказывать неупорядоченные участки белковой структуры важно как для понимания функции белка, так и путей его сворачивания (Bracken et al, 2004; Fink, 2005; Dyson & Wright, 2005). Эти же данные необходимы и для дизайна белков de novo, где необходимо знать, какие особенности первичной структуры определяют, будет ли белок свернут или нативно-развернут. Поэтому одна из глав посвящена этому вопросу: предсказанию неструктурированных участкой белковой цепи.

В настоящее время структуры белков, определяемые с помощью рентгеноструктурного анализа (РСА), чаще используются как для теоретических расчетов так и для моделирования взаимодействий белковых структур, чем структуры, определяемые с помощью ядерного магнитного резонанса (ЯМР). Это связано с тем, что пока нет критерия оценки качества ЯМР структур, а «РСА-структура» считается более надежной и качественной для теоретических расчетов (Doreleijers et ah, \999a,b; Bastolla et al., 2001; Spronk et ah, 2002). Кроме того, необходимо понимать, чем отличаются белковые структуры в кристалле от тех, что расшифрованы методом ЯМР, поскольку, как выяснилось, все вычислительные методы оценки стабильности белковых структур чувствительны к методу определения структуры белка. Одна из глав посвящена структурному сравнительному анализу белков, структура которых расшифрована методом рентгеноструктурного анализа и методом ядерного магнитного резонанса.

Одним из наиболее многообещающих теоретических подходов к исследованию самоорганизации белков является метод молекулярной динамики, который, в принципе, может позволить проследить динамику конформационных изменений пептида в водном окружении на атомном уровне. Однако на это требуется очень много компьютерного времени; к тому же любое явление, найденное при молекулярно-динамическом моделировании, требует проверки статистической достоверности, - а это, в свою очередь, требует гигантского компьютерного времени. Одна из глав диссертации (глава 6) посвящена моделированию сворачивания пептидов с помощью метода молекулярной динамики и мульти-канонического моделирования, который хорошо дополняет метод молекулярной динамики: не воспроизводя кинетику процесса, он позволяет исследовать большую выборку точек конформационного пространства без затрат времени на преодоление энергетических ловушек.

Наряду с проблемой предсказания пространственной структуры белка, остро стоит проблема предсказания границ доменов по аминокислотной последовательности, в связи с тем, что число аннотированных последовательностей белков растет значительно быстрее, чем число расшифрованных пространственных структур. В главе 7 рассматривается эта проблема.

Процесс образования амилоидных фибрилл тесно связан с механизмом сворачивания белковой цепи в нативную структуру. Так как нативная структура есть результат баланса между конформационной энтропией и энергией взаимодействий аминокислотных остатков, то сбой в одной из этих составляющих будет приводить к неправильному сворачиванию белков, а в худшем варианте, к образованию амилоидных фибрилл. Выявление факторов, которые влияли бы на конформационные изменения белка и приводящих к неправильному сворачиванию белковых структур, является одной из важных фундаментальных задач в настоящее время. Заключительная часть диссертации посвящена развитию теории и метода для предсказания и поиска участков белковой цепи, способных к образованию амилоидных фибрилл. Предсказание таких участков является одной из важных задач для понимания основных физических принципов агрегации. Поиск таких участков особенно важен в связи с тем, что многие глобулярные белки могут образовывать амилоидные фибриллы, которые в свою очередь могут вызывать ряд сложных болезней в организме человека.

Диссертация написана на основе статей и обзоров, публиковавшихся в течении десяти лет.

Открытие одностадийного перехода («все-или-ничего») в кинетике

Большинство экспериментов по исследованию кинетики сворачивания белков обычно проводится при «биологических» условиях (25-37С, нейтральный рН, отсутствие денатуранта) или экстраполируется к ним (Baldwin & Creighton, 1980). В этих условиях не только нативное, но и промежуточные состояния намного стабильнее, чем развернутое, вследствие чего и происходит накопление промежуточных конформаций молекул белка. Однако, ренатурация белка происходит и в области термодинамического равновесия, когда развернутое состояние почти так же стабильно, как и нативное (Kuwajima & Sugai, 1978; Segawa & Sugihara, 1984), в то время как все промежуточные состояния нестабильны и не могут накапливаться по определению перехода «все-или-ничего», наблюдаемого в термодинамике (Privalov, 1979; 1982). Кроме того, существует много белков, состоящих из -100 остатков, которые быстро сворачиваются без каких-либо интермедиатов в широком диапазоне внешних условий (Jackson, 1998). Открытие одностадийного сворачивания, происходящего без накопления промежуточных конформаций молекул белка, было на самом деле пере-открытием термодинамического перехода «все-или-ничего» в кинетике, который до этого был установлен лишь для термодинамически-равновесных условий.

В последнее время основные успехи в понимании сворачивания белка (Fersht, 1995; Dobson & Karplus, 1999) были достигнуты именно исследованием белков, которые, стартуя из полностью развернутого («клубкового») состояния, сворачиваются без «дополнительных усложнений» (ранее широко употреблявшихся для трассировки пути сворачивания): без накопления промежуточных состояний, без цис-транс пролиновой изомеризации, без формирования S-S связей. Кинетика сворачивания (или разворачивания) в этом случае выглядит очень просто: все свойства нативного (или денатурированного) белка восстанавливаются синхронно, а сам процесс описывается одной экспонентой (Kragelund et al., 1995). Для некоторых белков такие простые кинетические процессы наблюдаются в широком диапазоне условий (как в области перехода, т.е. области термодинамического равновесия между нативным и денатурированным состояниями, так и вдали от нее, при «биологических условиях», т.е. в отсутствие или при малых концентрациях денатурирующего агента); для других — только в области перехода (рис.1, рис.2а,б). Таким образом, универсальные характеристики сворачивания и разворачивания могут наблюдаться именно в области перехода, в то время как индивидуальные характеристики процесса сворачивания начинают проявляться по мере удаления от этой области к области «биологических» условий.

Зависимости наблюдаемой скорости ктбл. процессов сворачивания/ разворачивания от концентрации денатуранта (или от температуры), (а) Типичный график: белок сворачивается по переходу «все-или-ничего» только в области термодинамического равновесия между нативным и денатурированным состояниями (или вблизи от этой области), но не при «биологических» условиях, (б) Сворачивание белка происходит по механизму «все-или-ничего» во всем диапазоне экспериментальных условий. Для такого перехода справедливо равенство кнаб„.= к/+ ки, где к/— скорость сворачивания, а ки — скорость разворачивания: таким образом, киабя к/ в области сворачивания (где к/ » к»), и кШбЛ »кив области разворачивания (где к/« ки) (Zana, 1975). (в) Мутация остатка, входящего в ядро сворачивания, изменяет только скорость сворачивания мутантного белка по отношению к его «дикому типу» (w.t.). (г) Мутация остатка, не входящего в ядро сворачивания, наоборот, изменяет только скорость разворачивания.

Что же мы можем получить, исследуя процесс сворачивания или разворачивания в области перехода, где не происходит накопления никаких интермедиатов? Оказывается, только здесь, в самом простом одностадийном переходе между двумя состояниями, мы можем косвенно зарегистрировать нестабильное переходное состояние (ПС), стабильность (или, строго говоря, нестабильность) которого определяет скорость сворачивания и разворачивания белка (Jackson, 1998; Fersht, 1995, 1997; Dobson & Karplus, 1999). В результате мы можем выделить структурированную часть ПС, т.е. «ядро сворачивания» белковой структуры: оно нестабильно и соответствует максимуму свободной энергии на пути сворачивания/ разворачивания белка (рис.1) или, точнее, седловой точке ландшафта свободной энергии на сетке всех возможных путей.

В настоящее время существуют два сходных экспериментальных подхода к определению ядра сворачивания в белке: Ф-анализ (Matouscheck et ah, 1990) и Ч -анализ (Krantz & Sosnick, 2001). Оба метода основаны на определении в белке тех аминокислотных остатков, изменения в которых существенно влияют на скорость сворачивания белка, изменяя стабильность переходного состояния так же сильно, как стабильность нативного белка. Главное различие между этими двумя методами состоит в том, что с помощью Ф-анализа изучают вовлеченность в ядро сворачивания аминокислотных остатков, а с помощью -анализа -вовлеченность в ядро отдельных контактов между ними.

Суть Ф анализа заключается в следующем. В изучаемый белок вводят точечные мутации и выявляют аминокислотные остатки, замена которых изменяет стабильность переходного состояния так же сильно, как и стабильность нативного состояния белка (Matouschek et ah, 1989; Dobson & Karplus, 1999) (изменение стабильности приводит к изменению скоростей сворачивания и разворачивания).

Анализ сети путей разворачивания белка при помощи метода динамического программирования: поиск оптимального переходного состояния.

В таблице 4 представлены коэффициенты корреляции (для каждого из исследованных 17 белков) между экспериментальными и теоретическими величинами Ф, полученными с помощью метода динамического программирования. Коэффициент корреляции, усреднённый по всем 17 исследованным белкам, получается невысоким (0.38±0.07), если при расчёте величин Ф учитывать только ядра сворачивания, имеющие минимальную свободную энергию (иными словами, это «оптимальные» ядра сворачивания). Если разделить белки согласно методу получения их пространственной структуры (РСА либо ЯМР), то оказывается, что корреляция между теоретически вычисленными и экспериментально измеренными величинами Ф для белков, структуры которых получены методом РСА, выше (коэффициент корреляции составляет 0.45), чем для белков, структуры которых получены с помощью метода ЯМР (коэффициент корреляции равен 0.28).

Мы попытались улучшить качество предсказаний. Если при расчёте принимать во внимание весь ансамбль ядер сворачивания (см. правый столбец таблицы 4), а не только ядра сворачивания с минимальной свободной энергией, то средний коэффициент корреляции возрастает для белков, структура которых решена методом РСА (коэффициент корреляции составляет 0.57 вместо 0.45).

Как уже отмечалось, во многих пространственных структурах белков, представленных в банке данных PDB, координаты атомов водорода не указаны (особенно это касается структур, решённых методом рентгеноструктурного анализа). Влияет ли наличие атомов водорода в пространственной структуре, используемой для расчёта, на качество предсказания ядер сворачивания? В таблице 5 представлены коэффициенты корреляции экспериментально исследованных величин Ф с теоретически вычисленными при расчёте ядер сворачивания на основе трёхмерной структуры, содержащей и атомы водорода (в случаях где атомы водорода не были указаны в структуре, недостающие атомы были добавлены с помощью программы INSIGHT II (Accelrys Inc.) при рН 7.0). Как и в предыдущем случае, во внимание принимался весь ансамбль переходных состояний; расчёт вёлся методом динамического программирования.

Из таблицы видно, что коэффициент корреляции, усреднённый по всем 17 белкам, остаётся практически неизменным, однако для белков, решённых методом РСА, коэффициент корреляции при добавлении атомов водорода возрастает (с 0.57 до 0.64).

Одно из ограничений, необходимых при расчете ядер сворачивания методом динамического программирования, - ограничение на размер звена. Предыдущие результаты были получены с минимально возможным для компьютерных расчётов размером звена (для маленьких белков размер звена составлял 2 аминокислотных остатка, для более крупных - 4 остатка). Однако является ли минимальный размер звена оптимальным для предсказания ядер сворачивания? Чтобы получить ответ на этот вопрос, мы предсказали ядра сворачивания при различном размере звена (на этот раз положив размер звена одинаковым для всех белков), и сравнили результаты предсказаний с экспериментальными данными. Ожидалось, что предсказание будет тем точнее, чем меньше звено: ведь чем меньше звено, тем более детально представлена цепь белка в нашей модели. Однако оказалось, что наилучшие результаты предсказаний получаются в том случае, когда размер звена для любого белка равен пяти аминокислотным остаткам (рис. 9). Любопытно, что найденный «оптимальный» размер звена (5 аминокислотных остатков) практически совпадает со средним размером персистентного участка в полипептидах (Flory, 1969). Однако следует отметить, что погрешности усреднения довольно велики (рис. 9); поэтому мы не можем утверждать с уверенностью, что размер звена в 5 аминокислотных остатков действительно является оптимальным для расчёта величин Ф.

Создание базы белков, структура которых разрешена с помощью методов рентгеноструктурного анализа и ядерного магнитного резонанса

В настоящее время разработан специальный комплекс программ для оптимизации данных ЯМР и получения более качественных ЯМР-структур (Nabuurs et al, 2004). Мы сравнили улучшенные ЯМР-структуры (http://vvww.ebi.ac.uk/msd-srv/docs/NMR/recoora7main.html) со старыми, оригинальными структурами, для этого же набора белков, рассматривая плотность контактов и водородные связи. На рисунке 24 показана разница (ЯМР-РСА) в плотности контактов и числа водородных связей между 13 структурами до и после их уточнения.

Из рисунка видно, что разница между ЯМР и РСА структурами становится меньше после уточнения ЯМР структур, хотя и не исчезает совсем.

Таким образом, для белков, РСА и ЯМР структуры которых не имеют явных отличий друг от друга (параметр MaxSub 0.7), существуют тонкие, но статистически достоверные различия между РСА и ЯМР структурами.

Нами выявлены следующие достоверные различия между структурами одного и того же белка, полученными при помощи РСА и ЯМР: 1) ЯМР и РСА структуры одного белка различаются сильнее, чем различные РСА структуры одного белка, и сильнее, чем различные ЯМР структуры одного белка. 2) Между РСА и ЯМР структурами существуют достоверные различия в числе атом-атомных и остаток-остаточных контактах на некоторых контактных расстояниях; наблюдаемые различия в плотности контактов больше для внутренних аминокислотных остатков по сравнению с поверхностными остатками. 3) Распределения водородных связей главной цепи по энергиям и расстояниям между донором и акцептором у РСА и ЯМР структур достоверно различаются; кроме того, доля водородных связей, совпадающих между РСА и ЯМР структурами, не превышает 70%. Найденные различия в распределении контактов и водородных связей достаточны, чтобы привести к различным оценкам стабильности РСА и ЯМР структур.

В случае, когда анализ сети путей сворачивания/разворачивания проводился с помощью метода динамического программирования, мы вычисляли эффективную величину свободной энергии барьера: F{nC) = -RTIn X expt- " ], (is) ІєПС Лі где IL - полностью развернутое состояние белковой цепи. Эта теоретически вычисленная величина свободной энергии барьера должна коррелировать с логарифмом экспериментально измеренного времени сворачивания в точке термодинамического равновесия (таблица 8).

Метод Монте-Карло позволяет получать время сворачивания отдельной молекулы, измеренное в числе Монте-Карловских шагов (см. рис. 25). В качестве теоретически рассчитанного времени сворачивания белка мы использовали характерное время tj/2, за которое свернулась половина молекул (то есть, 25 из 50 проведенных запусков привели к образованию нативной структуры (Galzitskaya & Finkelstein, 1995)).

Вычисленные эффективные величины свободной энергии барьера хорошо коррелируют с логарифмом экспериментально измеренного времени сворачивания в точке термодинамического равновесия: коэффициент корреляции составляет 0.73±0.11 (рис. 25, таблица 8). С другой стороны, величины барьера свободной энергии практически не коррелируют с логарифмом экспериментально измеренного времени сворачивания в воде, далеко от точки термодинамического равновесия: для этого случая коэффициент корреляции теории с экспериментом составляет

Вычисление скоростей сворачивания методом Монте-Карло

Чтобы доказать, что наш результат не есть следствие зависимости от длины белка, так как в с-классе самые большие белки, мы проанализировали число контактов в заданном диапазоне длин, где средняя длина белков приблизительно одинакова в каждом структурном классе (см. рис. 31 в,г). Из рисунка 31 действительно видно, что с-класс белков (сс/р) самый плотно упакованный по сравнению с другими классами (а, Р, а+Р), и этот результат сохраняется во всем диапазоне длин за исключением точки 200-250 остатков в белковой цепи, где все четыре класса имеют практически одинаковое среднее число контактов на остаток. Нами было проверено, что данный результат обусловлен тем, что мы рассмотрели базу, в которую вошли белки с долей идентичных остатков менее 80% (Галзитская и Гарбузинский, 2006).

Величина средней конформационной энтропии, v, вычисляется как сумма числа углов вращения для каждого остатка, нормированная на длину цепи. Под числом углов вращения мы будем понимать число двугранных углов (ф, у и %) аминокислотного остатка, по которым возможно вращение. При этом мы принимаем во внимание лишь те двугранные углы, которые образованы четырьмя тяжелыми атомами. Число углов вращения для каждого из 20 типов аминокислотных остатков приведено в таблице 12.

Следует отметить, что крупные аминокислотные остатки необязательно имеют в среднем больше контактов, чем маленькие. Иными словами, число углов вращения не коррелирует со средним числом контактов: для 20 типов аминокислотных остатков коэффициент корреляции составляет 0.10, если контактное расстояние составляет менее 8 А, и 0.15 при контактном расстоянии менее 6 А.

Из рисунка 30 видно, что топологически разные белки попадают в одну и ту же область конформационной энтропии: 3.4-4.2 (Galzitskayaet et ah, 2000b). Следует отметить, что белки с наименьшей конформационной энтропией, то есть, наименьшим средним числом углов вращения на остаток), принадлежат классу Ь (см. табл. 11 и рис. 30), а белки с наибольшей конформационной энтропией принадлежат классу а.

Мы также проанализировали среднее число углов вращения на остаток в каждом структурном классе при одинаковом диапазоне длин белков (см. рис. 316). Полученный результат только подтверждает результат, полученный по полной базе белков, что «-класс белков имеет наибольшее среднее число углов вращения, а 6-класс - минимальное. Данный результат также подтверждает гипотезу, выдвинутую Крамером и Розом (Creamer & Rose, 1992), что потеря конформационной энтропии боковых групп является одним из определяющих спираль-образующих свойств аминокислотных остатков.

Рассмотрение конформационной энтропии особенно важно, так как лимитирующим шагом белкового сворачивания является поиск правильных ротамеров боковых групп. Поэтому различие между скоростью сворачивания для белков с одинаковой топологией (SH3-домены, белки холодового шока, домены фибронектина, белки, принадлежащие к ферредоксиновому фолду (Guijarro et ah, 1998а; Plaxco et al., 1998b; Perl et al, 1998; van Nuland et al, 1998; Zerovnik et al, 1998)) может быть объяснено различием в конформационной энтропии. Так в нашем случае среднее различие между числом углов вращения меняется в единицах энергии от 0.03 до 0.06 ккал/моль на остаток, что может объяснить различие во временной шкале сворачивания от 100 до 10000 для белков среднего размера 100 остатков.

Для 60 белков с известными экспериментальными данными по скорости сворачивания (Galzitskaya etal, 2003; Ivankov & Finkelstein, 2004) нами были вычислены те же самые параметры: среднее число контактов на остаток и среднее число углов вращения на остаток (см. табл. 11). В этой базе исключены белки, имеющие дисульфидные связи и лиганды, а также те, размер которых меньше 40 остатков (Galzitskaya & Garbuzynskiy, 2006).

Из таблицы 11 видно, что средние величины энтропийной емкости, вычисленные для двух наборов белков (60 и 5829), совпадают для классов а и с, и не совпадают для классов Ъ и d. Статистические параметры для средней длины белковой цепи, среднего числа контактов на остаток и среднего числа углов вращения на остаток показывают, что данное отличие между двумя наборами белков может быть объяснено недостаточной статистикой по 60 белкам. Хотя для обеих баз получается, что нет большой разницы в структурных параметрах между 0- и а+Р-классами белков.

На рисунке 32 показана зависимость величины барьера свободной энергии, вычисленной из экспериментальной скорости сворачивания белков в водном растворе, от вычисленной модельной энтропийной емкости (отношения между средним числом углов вращения к среднему числу контактов на остаток) для 60 белков. Вертикальные линии соответствуют средней модельной энтропийной емкости, вычисленной по структурной базе 5829 белков для каждого структурного класса в заданном диапазоне длин. Из рисунка видно, что спиральные белки - это самые быстро сворачивающиеся белки, а белки класса с - самые медленно сворачивающиеся белки, для которых плотная упаковка боковых групп требует большего времени сворачивания.

Мы не пытались улучшить корреляцию между скоростью сворачивания и модельной энтропийной емкостью (по 60 белкам она равна 0.64), но корреляция для отдельных классов белков получилась высокой: -0.79 для класса а, 0.85 для класса с, 0.55 для класса d и -0.03 для класса Ь. При этом интересно сравнить корреляции между величиной барьера свободной энергии и различными структурными параметрами: порядок контактов (Plaxco et al, 1998а), длиной и эффективной длиной (Ivankov & Finkelstein, 2004) (см. табл. 13).

Похожие диссертации на Теоретическое исследование сворачивания белков и пептидов