Электронная библиотека диссертаций и авторефератов России
dslib.net
Библиотека диссертаций
Навигация
Каталог диссертаций России
Англоязычные диссертации
Диссертации бесплатно
Предстоящие защиты
Рецензии на автореферат
Отчисления авторам
Мой кабинет
Заказы: забрать, оплатить
Мой личный счет
Мой профиль
Мой авторский профиль
Подписки на рассылки



расширенный поиск

Моделирование и предсказание укладок белковых цепей при помощи регулярных и нерегулярных пространственных решеток Рыкунов Дмитрий Станиславович

Моделирование и предсказание укладок белковых цепей при помощи регулярных и нерегулярных пространственных решеток
<
Моделирование и предсказание укладок белковых цепей при помощи регулярных и нерегулярных пространственных решеток Моделирование и предсказание укладок белковых цепей при помощи регулярных и нерегулярных пространственных решеток Моделирование и предсказание укладок белковых цепей при помощи регулярных и нерегулярных пространственных решеток Моделирование и предсказание укладок белковых цепей при помощи регулярных и нерегулярных пространственных решеток Моделирование и предсказание укладок белковых цепей при помощи регулярных и нерегулярных пространственных решеток
>

Данный автореферат диссертации должен поступить в библиотеки в ближайшее время
Уведомить о поступлении

Диссертация - 480 руб., доставка 10 минут, круглосуточно, без выходных и праздников

Автореферат - 240 руб., доставка 1-3 часа, с 10-19 (Московское время), кроме воскресенья

Рыкунов Дмитрий Станиславович. Моделирование и предсказание укладок белковых цепей при помощи регулярных и нерегулярных пространственных решеток : диссертация ... кандидата физико-математических наук : 03.00.02.- Пущино, 2001.- 88 с.: ил. РГБ ОД, 61 02-1/4-9

Содержание к диссертации

Введение

Глава 1. Обзор литературы 5

1.1. Решеточные модели белков как инструмент их исследования 5

1.2. Предсказание пространственной структуры белков: обзор современного состояния проблемы 12

Глава 2. Поиск (построение) конформации цепи на кубической решетке, наилучшим образом приближающей пространственную структуру белка 24

2.1. Моделирование хода главной цепи белка на решетке. Метод глобальной минимизации 24

2.2. Решеточные модели белковых цепей с боковыми группами 38

2.3. Построение решеточных моделей больших белков с применением теории самосогласованного поля 42

2.4. Построение решеточных моделей, оптимизированных по энергии парных взаимодействий 50

Глава 3. Предсказание пространственной структуры белка по его аминокислотной последовательности 54

3.1. Поиск структуры с наименьшей энергией в молекулярном поле. Метод «протягивания»: модель и теория 54

3.2. Метод «протягивания»: результаты и обсуждение 64

3.3. Возможность предсказания новых мотивов укладки цепи 68

3.4. Использование гомологичных последовательностей и структурно похожих белков для улучшения качества предсказания 70

Заключение 77

Выводы 78

Литература 79

Предсказание пространственной структуры белков: обзор современного состояния проблемы

В первом параграфе этой Главы дан краткий обзор развития теоретических исследований белков с применением различных моделей. Начавшись с попыток предсказания белковых структур при помощи упрощенных моделей в непрерывном пространстве, эти исследования вскоре в значительной степени стали проводиться на регулярных решетках. Введение решеточных моделей, в свою очередь, довольно быстро сместило акцент этих работ с предсказания структуры реальных белков на изучение общих физических закономерностей, определяющих механизмы их сворачивания и стабильности. Тем не менее, задача предсказания пространственной структуры реальных белков осталась по-прежнему актуальной, что привело к возникновению новых подходов и методов ее решения.

Более того, развитие методов предсказаний белковых структур, с одной стороны, и все возрастающая потребность в создании таких методов (в частности, как уже упоминалось, вследствие выполнения проектов по секвенированию геномов различных организмов, включая человека), привели к возникновению всемирного эксперимента по «слепым» предсказаниям, который проводится раз в два года {Moult et al, 1995; Moult et al, 1997; Moult et al, 1999). Смысл организации такого соревнования состоит в том, чтобы, предлагая различным исследователям предсказать структуру одних и тех же белков, неизвестных на момент предсказания, но уже решенных на момент проведения анализа результатов, получить независимый анализ сильных и слабых сторон различных методов предсказания.

Помимо уже обсуждавшихся в первом параграфе методов аЪ initio предсказаний, в последние годы было развито еще несколько интересных подходов. Группой Маршалла {Galactionov, Marshall, 1994), основываясь на цикле работ группы Галактионова {Галактионов, Родионов, 1980; Родионов, Галактионов, 1992), предложен метод предсказания, в котором по заранее предсказанной вторичной структуре и предсказанным векторам координационных чисел остатков предсказывается контактная матрица, с последующей реконструкцией пространственной структуры. Лунд и соавт. {Lund et al, 1997) также предсказывали контактные матрицы, используя для этого нейронную сеть. Шерага и соавт. {Lee et al, 1999) использовали поиск наилучшей для целевой последовательности конформации в ансамбле искусственно сгенерированных структур методом «конформационного отжига» {Lee et al, 1997), близким к генетическим алгоритмам.

Как уже было отмечено, успешному практическому применению этих методов препятствует прежде всего приближенное, неточное знание энергетики белковой цепи (использование дополнительных упрощений, таких, как решеточное моделирование, еще сильнее деформирует все потенциалы).

Одним из наиболее успешных (хотя и не поддающихся простому объяснению с физической точки зрения) методов предсказания укладки белковой цепи на сегодняшний день является метод «Розетта», разрабатываемый группой Бэйкера {Simons et al, 1997, Simons et al, 1999). Его суть состоит в том, что фрагменты известных пространственных структур длиной от 3 до 9 остатков, имеющие гомологию с участками предсказываемой последовательности, собираются в компактную пространственную структуру с помощью Монте-Карло процедуры с искусственным отжигом. Целевая функция, используемая в этой процедуре, включает в себя зависящие от типов аминокислотных остатков члены, которые учитывают их гидрофобность, погруженность, электростатические взаимодействия, образование дисульфидных связей, а также независящие от аминокислотного состава члены, принимающие во внимание упаковку твердых сфер и упаковку оспиралей и Р-тяжей. По результатам двух последних международных экспериментов по «слепым» предсказаниям, CASP3 и CASP4, метод Бэйкера существенно превосходит все остальные ab initio методы и успешно конкурирует с методами «протягивания», детально рассмотренными ниже: правильно предсказываются % - Уз целей, при этом RMS правильно предсказанных структур лежит в пределах 3.5 - 6.5 А.

В основе этого метода лежат две идеи: 1)число мотивов укладок белков конечно (Finkelstein, Ptitsyn, 1987), и 2) достаточно многие из этих мотивов уже известны и представлены в библиотеке укладок-шаблонов (Chothia, 1992). В качестве таких шаблонов (каркасов белковых глобул) могут быть использованы модели, построенные на основе структур уже известных белков, - либо путем их идеализации, либо путем использования непосредственно координат атомов главной цепи, либо путем построения эффективных силовых центров на основе этих координат. Исследуемую цепь «протягивают» через каждый из этих шаблонов (т.е. оценивают энергию различных расположений цепи на каждом из них), ожидая, что минимум энергии укажет на правильную структуру цепи.

По сути, все «шаблоны», используемые в методе протягивания, являются нерегулярными решеточными, так как каждому остатку моделируемой структуры доступен только ограниченный, относительно небольшой, набор узлов такой нерегулярной решетки.

Метод «протягивания» был предложен в 1990-1991 гг. Ревой и Финкелынтейном (Финкельштейн, Рева, 1990; Finkelstein, Reva, 1991) и, независимо, группой Айзенберга (Bowie etai, 1991).

Данная диссертационная работа в части предсказания пространственной структуры белка по его аминокислотной последовательности (Глава 3) является развитием подхода Финкелынтейна и Ревы [более подробно изложенного позднее в (Finkelstein, Reva, 1996; Reva, Finkelstein, 1996)], поэтому рассмотрим его детально. Задача поиска наилучшей укладки (наилучшего «шаблона») для данной аминокислотной последовательности в обсуждаемом методе сводится к поиску состояния с наименьшей свободной энергией в каждой из укладок и последующему сравнению свободных энергий таких состояний.

Моделирование хода главной цепи белка на решетке. Метод глобальной минимизации

Группой Бартона (Russell et al, 1996) развит вариант метода протягивания, также основанный на использовании информации о предсказанной вторичной структуре: на первом шаге из набора потенциальных структур-кандидатов удаляются все укладки, со вторичной структурой которых предсказанная вторичная структура целевой последовательности оказывается несовместимой. Далее, полученный на первом шаге набор структур-кандидатов обрабатывается рядом фильтров (проверка на компактность структуры, на целостность р-листов и т.п.). Оставшиеся структуры ранжируются целевой функцией, учитывающей сходство доступности растворителю и длин предсказываемой и референтной последовательностей. Тестирование на ряде уже известных белков, по утверждению авторов, показало значительное превосходство описываемого метода над методом группы Джонса (Jones et al, 1992), однако реальные предсказания в ходе экспериментов CASP3 и CASP4 продемонстрировали обратные результаты.

Группы Хаббарда и Карплюса использовали скрытые Марковские цепи в качестве инструмента распознавания укладки предсказываемого белка (Hubbard, 1994; Hubbard, Park, 1995; Karplus et al, 1998; Park et al, 1998; Karplus et al, 1999). Этот подход, в отличие от большинства методов протягивания, не использует информацию о пространственном расположении аминокислотных остатков библиотечного белка. Вместо этого информация о белках библиотеки учитывается в виде композиции плотностей Дирихле (Sjolander et al., 1996) в позиционно-зависимой весовой матрице. Компоненты такой композиции отражают различные паттерны консервации аминокислотных последовательностей в наборе гомологов. Полученная позиционно-зависимая матрица весов может быть использована для распознавания гомологии целевой последовательности с одной (или несколькими) из библиотечных. Несмотря на то, что этот метод вообще не использует никакую информацию о пространственной структуре белков из библиотечного набора, его эффективность оказывается сравнимой с лучшими вариантами методов протягивания, такую информацию использующих (Karplus et al, 1999).

Подход к распознаванию укладки белка, разработанный группой Дубчак (Dubchack et al., 1993; Dubchack et al, 1995; Dubchack et al, 1999), основан на определении формальных описаний (дескрипторов) свойств аминокислотных последовательностей глобулярных белков, описании структур известных белков в терминах таких дескрипторов и тренировке нейронной сети на распознавание предсказываемой аминокислотной последовательности с их помощью. В качестве таких глобальных дескрипторов были определены С - дескриптор композиции (процентный состав остатков данного типа), Т - дескриптор переходов, принимающий во внимание частоту, с которой остаток типа В следует за остатком типа А (например, неполярный за полярным, и т.п.) и D - дескриптор распределения остатков различных типов по цепи. Используя такие дескрипторы для описания гидрофобности аминокислотных остатков, их доступности растворителю и предсказанной вторичной структуры, авторы показали, что их метод хорошо справляется с распознаванием укладок белков и достаточно устойчив к ложным распознаваниям (Dubchack et al., 1999).

Описанные до сих пор методы предсказания пространственных укладок белковых цепей по их аминокислотным последовательностям составляют лишь малую часть от их общего количества. Достаточно лишь упомянуть, что в последнем эксперименте по «слепым» предсказаниям CASP4 приняло участие 160 различных групп. Тем не менее, несмотря на огромное количество работающих в этой области исследователей и на разнообразие используемых ими методов, несмотря на заметный прогресс, наблюдаемый в этой области исследований в последние годы, проблема предсказания пространственной структуры белка до сих пор остается не разрешенной - ни один метод не в состоянии гарантировать точное решение проблемы (как уже было сказано, лучшие из них правильно опознают только -30% укладок цепи, и даже при правильном опознавании почти всегда заметно сдвигают цепь относительно ее правильного положения на шаблоне). Различные исследователи предпринимали множество разнообразных, порой весьма нетривиальных, или экзотических, попыток ее преодоления - достаточно вспомнить применение коррелированных мутаций Ростом или «перетасовку» предсказываемой последовательности Джонсом. Очевидно, все эти усилия вызваны грубостью применяемых энергетических (или других дискриминирующих) параметров и сводятся к поиску источников дополнительной информации, которая позволит сгладить эти погрешности. Все большее число авторов все более продуктивно используют в качестве такого источника гомологичные белки, сначала для предсказания вторичной структуры белка (Rost, Sander, 1995), а затем и для предсказания его пространственной структуры (Defay, Cohen, 1996; Taylor, 1997; Mehta et al, 1999). Это связано с тем, что число примеров дивергентной эволюции в природе велико. Давно известно, что структуры родственных белков с заметной гомологией очень похожи -при 50% совпадении аминокислот в двух последовательностях 95% их аминокислотных остатков, как правило, могут быть наложены друг на друга с RMS менее 1 A (Chothia, Lesk, 1986). Однако, теоретическое обоснование ожидаемому улучшению качества предсказания в результате использовании гомологов было дано совсем недавно (Finkelstein, 1998). На основе теории случайных энергий в этой работе продемонстрировано, что случайные погрешности, которые неизбежно возникают при определении величин энергетических параметров, приводят к «размыванию» спектра энергий ненативных конформаций. Это размывание пропорционально длине цепи L, умноженной на (\-corr), где согг - коэффициент корреляции «истинных» и «оцененных» энергий. Так как энергия нативной конформаций белка отделена от прочих сравнительно небольшой щелью, то она (энергия нативной конформаций) очень быстро оказывается «погребенной» внутри непрерывного спектра энергий ненативных конформаций. Тем не менее, из того, что гомологичные белки имеют почти одинаковую пространственную структуру (а значит, минимум их истинной энергии падает на эту структуру), и из того, что ошибки в энергетических оценках носят случайный характер (там, где последовательности гомологов различаются), следует, что усреднение энергий элементарных взаимодействий по гомологичным белкам позволяет хотя бы отчасти (при использовании достаточно большого числа гомологов) компенсировать энергетические ошибки, что может привести к восстановлению возможности того, что структура целевой последовательности будет предсказана правильно. После проверки работоспособности этой теории моделированием на «игрушечных» белках (Badretdinov, Finkelstein, 1998) улучшение работы простейшего (безделеционного) метода протягивания при использовании набора гомологичных структур было продемонстрировано в работе (Reva et al, 1999).

Построение решеточных моделей больших белков с применением теории самосогласованного поля

Моделирование белковых структур на регулярных решетках является важным инструментом изучения самоорганизации белков in silico, как было отмечено в Главе 1. Однако, основное преимущество моделей, построенных на грубых регулярных решетках (и являющееся следствием именно грубости решетки), а именно - относительно малый объем конформационного пространства (необходимый для того, чтобы численные эксперименты были осуществимы за приемлемое время), существенно снижается значительным искажением геометрии (и, как следствие - энергии) в модели, вызванным грубостью решетки. Этот недостаток, однако, оказывается легко устранимым, когда целью моделирования является расчет энергии модели в заранее заданной конформации. Примером такой задачи является задача распознавания укладки белковой цепи методом протягивания {Финкельштейн, Рева, 1990; Finkelstein, Reva, 1991; Bovie et al, 1991). Как было отмечено в Главе 1, в основе этого метода лежат две идеи: 1) число мотивов укладок белков конечно, и 2) большинство из них уже представлено в библиотеке укладок-шаблонов. В качестве таких шаблонов (каркасов) могут быть использованы модели, построенные из структур уже известных белков, - либо путем использования непосредственно координат атомов главной цепи, либо путем построения эффективных силовых центров на основе этих координат. По сути, такие модели являются нерегулярными решеточными, так как каждому остатку моделируемой структуры доступен только ограниченный, относительно небольшой, набор состояний.

Как уже отмечалось в Главе 1, теория использованного варианта метода протягивания и приложение этого метода к расчету оптимальных укладок цепей двухслойных р -белков на искусственных идеальных структурных каркасах были разработаны в работах Ревы и Финкельштейна в конце 80-х - начале 90-х годов {Finkelstein, Reva, 1996; Reva, Finkelstein, 1996). В данной работе метод развит с целью применения его к белкам, содержащим не только 3-листы, но и а-спирали; при этом использованы структурные каркасы, взятые из трехмерных белковых структур, а не сконструированные на основе теоретических соображений (надо отметить, что теоретическое определение возможных структурных каркасов, довольно просто дающее удовлетворительные результаты для Р-белков (Reva, Finkelstein, 1996), оказалось весьма сложным для белков, содержащих а-спирали, т.к. спирали могут, даже в рамках набора сходных укладок, сильно поворачиваться вокруг своих осей).

Построение структурных каркасов белков. Структурный каркас белка строится на основе пространственной укладки его вторичной структуры (Finkelstein, Ptitsyn, 1987). Вторичная структура обладает гораздо большей консервативностью пространственного расположения элементов, чем нерегулярные петли, что делает такой структурный каркас пригодным для распознавания укладок многих гомологичных цепей одновременно (Madej et al., 1995).

Используемые в данной работе трехмерные структурные каркасы составлены из структурных сегментов, каждый из которых включает как сам участок вторичной структуры моделируемого белка, так и его возможные регулярные продолжения (см. ниже). Каждый структурный сегмент состоит из узлов, моделирующих аминокислотные остатки. Каждый узел, в свою очередь, состоит из Са атома рассматриваемого остатка, из виртуального Z атома, задающего позицию его боковой группы, а также из виртуальных X и Y атомов, необходимых для учета водородных связей в (3-структуре (см. ниже, рис. 3.1, 3.2). Кроме того, определяется направление D данного остатка как вектор, идущий из предшествующего данному остатку Са атома в следующий за ним Са атом. Таким образом, структурный каркас представляет собой апериодическую трехмерную решетку, через которую протягивается рассматриваемая белковая цепь. Зная трехмерные координаты узлов решетки, мы можем рассчитать энергию цепи при каждом распределении ее звеньев по этим узлам. Для построения таких решеток мы использовали координаты атомов белков, взятые из Банка белковых структур (Bernstein et ai, 1977). Из набора координат атомов белка выделяли поднаборы, соответствующие участкам вторичной структуры (рис. 3.1,а). Вторичную структуру белка определяли с помощью программы DSSP (Kabsch, Sander, 1983), принимая в рассмотрение только ос-спирали и Р-тяжи из двух и более остатков. Таким образом, мы выделяли структурный каркас данного конкретного белка. Для обобщения этого каркаса на случай небольших смещений концов структурных сегментов, которые часто наблюдаются даже в гомологичных белках (Creighton, 1993), нативные фрагменты вторичной структуры удлиняли, продляя их концы идеальными моделями этой структуры (рис. 3.1,6), наложенными на три крайних остатка на каждом конце фрагмента. В данной работе продления концов р-участков состояли из трех остатков, а ос-спиралей - из восьми. В случае пересечения какого-либо узла такого продления с узлом другого структурного сегмента белка (под "пересечением" двух узлов мы понимаем сближение их Са атомов на расстояние менее 3.2 А), продление ограничивали лишь лежащей до пересечения частью. В случае пересечения двух продлений оба они были ограничены своей непересеченной частью.

Для определения р-структурных водородных связей в таком обобщенном структурном каркасе мы не пользовались стандартной программой DSSP, а определяли их с помощью взаимодействий виртуальных X и Y атомов аминокислотных остатков. Это связано с тем, что, во-первых, мы должны были рассматривать образование водородных связей не только у исходных р-участков, но и у их идеальных продолжений; во-вторых - и главное - с тем, что наш алгоритм расчета взаимодействий (см. ниже) работает только с парными взаимодействиями аминокислотных остатков, в то время как две водородные связи, фиксирующие пару остатков в Р-структуре, определяются атомами, принадлежащими к двум, четырем и даже шести остаткам (см. рис. 3.2).

Использование гомологичных последовательностей и структурно похожих белков для улучшения качества предсказания

Изложенные в трех первых параграфах данной главы результаты позволяют утверждать, что метод протягивания, основанный на априорных потенциалах взаимодействия и теории самосогласованного поля, позволяет распознавать нативные укладки однодоменных белков с довольно высокой уверенностью. Однако такое распознавание всегда носит вероятностный характер: фактически, мы всегда можем утверждать, что нативная укладка находится среди нескольких самых стабильных (с точки зрения наших энергетических оценок) укладок, но не можем гарантировать, что самая стабильная (с точки зрения этих оценок) укладка и есть нативная. Причина, по которой мы можем делать только вероятностные оценки (в то время как сама белковая цепь находит свою стабильную структуру безошибочно) заключается в том, что, во-первых, все экспериментальные оценки потенциалов взаимодействий имеют конечную точность, и, во-вторых (что еще важнее), - мы не принимаем в расчет петли, конформации ротамеров боковых групп и т.д., так что любое наше заключение о стабильности или нестабильности любой структуры неизбежно базируется только на части истинных взаимодействий в ней (Finkelstein et al, 1995а). В такой ситуации для улучшения качества распознавания (т.е. повышения вероятности нативной укладки) становится необходимым по возможности привлечь дополнительную доступную информацию, которую сам белок не «использует» при сворачивании ни in vivo, ни in vitro. Такой информацией могут быть, например, результаты протягивания гомологичных последовательностей по одним и тем же каркасам, а также результаты протягивания, полученные на каркасах белков, структурно похожих на испытываемый каркас. Исследование использования этих данных на качество распознавания укладок является целью данного параграфа.

Библиотека структурно похожих гомологов. Белки (точнее, домены), использованные в этой работе, были выбраны следующим образом: мы выбрали по одному представителю каждого белкового структурного домена из категории "Species" базы данных SCOP (Murzin et al., 1995). С помощью пакета программ STAMP (Russell, Barton, 1991) в каждой группе белков этого начального набора, принадлежащих, согласно SCOP, к одному суперсемейству, была проведена оценка похожести пространственных структур белков, входящих в группу, в результате чего были отобраны поднаборы белков с высокой степенью схожести пространственных структур: в каждом таком поднаборе (кластере) RMS входящих в него структур не превышает 2 А для, по крайней мере, половины остатков. Домены, не отвечающие этому условию, были удалены из библиотеки укладок. Полученная в результате библиотека укладок состоит из 125 кластеров, содержащих в сумме 401 домен. Надо заметить, что в отличие от критериев отбора белков, использованных ранее, требование однодоменности белка было снято, т.е. в библиотеку укладок вошли как целые однодоменные белки, так и отдельные домены многодоменных белков.

Само-распознавание белковой укладки. Как и ранее, мы протянули каждую из 401 последовательностей доменов, вошедших в библиотеку укладок, по каждому из 401 структурных каркасов, составляющих эту библиотеку, и рассчитали геометрические факторы для каждого каркаса библиотеки. Оказалось, что 113 из 401 последовательности распознали свою нативную укладку как наилучшую (наиболее вероятную), и еще 114 белков распознали в качестве наилучшей укладку похожего (т.е. входящего в тот же кластер) белка. Таким образом, в среднем 57% последовательностей распознали свою или родственную укладку правильно.

Для количественной оценки ожидаемого улучшения качества распознавания в результате усреднения по гомологичным последовательностям и родственным (входящим в один кластер) укладкам мы провели сравнение результатов такого усреднения по кластерам с результатами, получаемыми для индивидуальных представителей каждого кластера. Для этого мы составили два «Набора Отдельных Образцов» случайно отобрав в каждый из них по одному представителю каждого из 125 кластеров. Второй набор при этом был использован для ответа на вопрос, насколько хорошо белковые последовательности распознают укладки родственных белков. Используя ранее вычисленные геометрические факторы, мы сравнили результаты самораспознавания укладок каждого набора последовательностями этого набора с результатами кросс-распознавания укладок первого набора последовательностями второго и наоборот. В Таблице 3.5 приведены число правильно распознанных укладок (нативных или родственных, в зависимости от того, одному или разным наборам принадлежат последовательности и каркасы) и средняя (среднегеометрическая) больцмановская вероятность нахождения нативной (родственной) укладки (рассчитанная, как и все расчеты по протягиванию, при температуре 300К).

Видно, что результаты в кросс-тесте лишь незначительно хуже результатов, получаемых при самораспознавании. Это означает, что белковые последовательности распознают родственные укладки лишь незначительно хуже, чем свои собственные. Усреднение по гомологичным последовательностям и родственным укладкам.

Арифметическое усреднение свободных энергий по гомологичным последовательностям и родственным укладкам проводили, как обычно: пусть кластер последовательностей і содержит Kj последовательностей и кластер укладок j содержит Lj укладок. Тогда средняя свободная энергия данных последовательностей в данных укладках равна Результаты арифметического усреднения свободных энергий по членам кластеров в «Наборе Кластеров», вместе с результатами, полученными на «Наборе Отдельных Образцов», приведены в Таблице 3.6. Она показывает, что усреднение свободных энергий, как по родственным укладкам, так и по гомологичным последовательностям, а особенно - и по тому, и по другому, - улучшает распознавание укладок по сравнению со случаем, когда само-распознавание проводили на «Наборе Отдельных Образцов». Особенно улучшение заметно на средних величинах больцмановских вероятностей «нативных» укладок (кавычки подразумевают, что в их число входят и родственные укладки).

Похожие диссертации на Моделирование и предсказание укладок белковых цепей при помощи регулярных и нерегулярных пространственных решеток