Электронная библиотека диссертаций и авторефератов России
dslib.net
Библиотека диссертаций
Навигация
Каталог диссертаций России
Англоязычные диссертации
Диссертации бесплатно
Предстоящие защиты
Рецензии на автореферат
Отчисления авторам
Мой кабинет
Заказы: забрать, оплатить
Мой личный счет
Мой профиль
Мой авторский профиль
Подписки на рассылки



расширенный поиск

Топологические особенности РНК-подобных молекул со случайной первичной структурой Вальба Ольга Владимировна

Топологические особенности РНК-подобных молекул со случайной первичной структурой
<
Топологические особенности РНК-подобных молекул со случайной первичной структурой Топологические особенности РНК-подобных молекул со случайной первичной структурой Топологические особенности РНК-подобных молекул со случайной первичной структурой Топологические особенности РНК-подобных молекул со случайной первичной структурой Топологические особенности РНК-подобных молекул со случайной первичной структурой Топологические особенности РНК-подобных молекул со случайной первичной структурой Топологические особенности РНК-подобных молекул со случайной первичной структурой Топологические особенности РНК-подобных молекул со случайной первичной структурой Топологические особенности РНК-подобных молекул со случайной первичной структурой Топологические особенности РНК-подобных молекул со случайной первичной структурой Топологические особенности РНК-подобных молекул со случайной первичной структурой Топологические особенности РНК-подобных молекул со случайной первичной структурой
>

Диссертация - 480 руб., доставка 10 минут, круглосуточно, без выходных и праздников

Автореферат - бесплатно, доставка 10 минут, круглосуточно, без выходных и праздников

Вальба Ольга Владимировна. Топологические особенности РНК-подобных молекул со случайной первичной структурой: диссертация ... кандидата физико-математических наук: 01.04.17 / Вальба Ольга Владимировна;[Место защиты: Институт химической физики им.Н.Н.Семенова РАН].- Москва, 2014.- 96 с.

Содержание к диссертации

Введение

1 Обзор литературы 8

1.1 Особенности пространственной структуры молекул РНК 8

1.2 Методы предсказания структуры РНК 11

1.3 Случайная первичная структура РНК 13

1.4 Термодинамические свойства 14

1.5 Описание РНК структур случайными матрицами 18

2 Алгоритмы вычисления свободной энергии РНК-подобных структур 22

2.1 Выравнивание последовательностей 22

2.2 Комплементарное связывание биополимеров 24

2.3 Связывание РНК с внутрипетлевым взаимодействием 28

2.4 Алгоритмы восстановления структуры 31

3 Свойства РНК структур со случайной последовательностью звеньев 38

3.1 Свободная энергия основного состояния 38

3.2 Распределение длин петель в РНК-подобных структурах 43

4 Топология РНК-подобных молекул в зависимости от алфавита случайной первичной структуры 48

4.1 Зависимость свободной энергии РНК-подобных структур от алфавита 48

4.2 Топологический переход в модели Бернулли 53

4.3 Аналитическая оценка критической точки топологического перехода в модели Бернулли 57 4.3.1 Метод среднего поля 57

4.3.2 Комбинаторная оценка 59

4.3.3 Матричный подход 61

4.4 Переход случайной РНК в замороженное состояние, ограниченный топологическим переходом 63

4.5 Другие модели нецелого алфавита 65

4.5.1 Метод концентраций 66

4.5.2 Коррелированная случайная последовательность 67

4.5.3 Рациональный алфавит 69

5 Описание РНК-подобной структуры в терминах оптимизационной транспортной задачи 71

5.1 Оптимизационная транспортная задача 71

5.2 Модель случайных интервалов первичной структуры РНК-подобной молекулы 73

5.3 Топологические свойства РНК-подобных структур в модели случайных интервалов 75

5.3.1 Численное моделирование 76

5.3.2 Аналитическое описание 79

Заключение 84

Список сокращенийиусловных обозначений 84

Литература 86

Введение к работе

Актуальность работы. Структура важнейших биологических макромолекул, таких как дезоксирибонуклеиновые кислоты (ДНК), рибонуклеиновые кислоты (РНК) и белки, играет ключевую роль в их правильном функционировании в клетке. Различают несколько уровней структурной упорядоченности биомакромолекул. Последовательность звеньев в ДНК, РНК и белках индивидуального организма, которая называется первичной структурой, строго зафиксирована. Биополимерные цепи могут формировать спиралеобразные и складчатые участки небольшого масштаба, как в белках, или комплементарно спаренные и петлевые участки, как в РНК. Такие фрагменты называются элементами вторичной структуры. Различают также третичную и четвертичную пространственные структуры биополимеров.

Данная работа посвящена исследованию топологических свойств вторичной структуры молекул РНК-типа. Известно, что биомакромолекулы являются «слабо отредактированными случайными гетерополимерами» [1,2]. Более того, для ряда свойств распределение мономерных звеньев в первичной структуре биополимера ( например, функциональных РНК) можно считать случайным [3, 4]. В этом случае, модель случайной первичной структуры является базовой моделью, описывающей основной (нулевой) вклад в наблюдаемые физические явления. Основное внимание при этом сфокусировано на нетривиальной вторичной структуре РНК-подобных полимеров, для описания которой привлекаются разнообразные техники, в том числе, техники квантовой теории поля и моделей Изинга [5].

Цель работы заключается в описании топологических особенностей РНК-подобных последовательностей методами статистической физики и теории случайных процессов. Для достижения поставленной цели необходимо было решить следующие задачи:

  1. Разработать алгоритм вычисления свободной энергии РНК-подобной молекулы;

  2. Установить зависимость статистических свойств распределения свободной энергии в ансамбле РНК-подобных структур со случайной последовательностью звеньев от длины цепи;

  3. Рассмотреть зависимость топологических свойств РНК-подобных структур от количества типов мономерных звеньев (далее, алфавита), используемого в случайных первичных структурах;

  4. Разработать алгоритм вычисления свободной энергии в модели первичной структуры со случайными расстояниями между мономерными звеньями вдоль по цепи и потенциалом взаимодействия между мономерами, заданного выпуклой функцией от расстояния.

Научная новизна работы заключается в следующем.

  1. Впервые методами статистической физики и теории случайных процессов установлена зависимость топологических свойств РНК-подобных гетерополимеров со случайной первичной структурой от их длины и используемого в первичной структуре алфавита;

  2. Теоретически обнаружено критическое изменение топологии РНК-подобных структур при переходе от двухбуквенного алфавита к трехбуквенному и проведена аналитическая оценка точки перехода в рамках комбинаторного и матричного описания;

  3. Установлена взаимосвязь между наблюдаемым критическим изменением топологии РНК-подобных структур и переходом в замороженное состояние, который обсуждался ранее в работах Т. Хва и Р. Бундшу [6];

  4. Впервые показано, что описание топологии РНК-подобной структуры может быть сведено к оптимизационной транспортной задаче.

Теоретическая и практическая значимость диссертационной работы обусловлена тем что, полученные результаты носят фундаментальный характер и дают более глубокое понимание физических закономерностей, лежащих в основе формирования вторичной структуры молекул РНК.

Методы исследования. В работе использовалось компьютерное моделирование, включающее вычисление свободной энергии основного состояния РНК-подобных молекул и предсказание соответствующих вторичных структур. В аналитическом рассмотрении широко использовалась теория случайных процессов, а также описание вторичной структуры РНК случайными матрицами.

Основные положения, выносимые на защиту:

  1. Алгоритмы описания вторичной структуры РНК-подобной молекулы и вычисления свободной энергии основного состояния, учитывающие внутрипетлевое взаимодействие;

  2. Свойства распределения свободной энергии в ансамбле РНК-подобных структур со случайной последовательностью мономерных звеньев;

  3. Зависимость топологических свойств РНК-подобных структур от используемого в первичной структуре числа различных мономерных звеньев (алфавита). Критическое изменение топологии РНК-подобных структур при переходе от двухбуквенного алфавита к трехбуквенному;

  4. Топологические свойства РНК-подобных структур с выбранным распределением расстояний между мономерными звеньями и потенциалом взаимодействия между мономерами, заданным выпуклой вниз функцией от расстояния.

Достоверность изложенных в работе результатов обеспечивается использованием широко апробированных методов. Результаты находятся в соответствии с данными, полученными ранее другими авторами.

Апробация работы. Основные результаты по теме диссертации изложены в 6 статьях ведущих российских и зарубежных журналах, рекомендованных ВАК и 8 тезисах к докладам конференций. Работа докладывалась и обсуждалась на конференциях:

  1. International conference "Engineering of Chemical Complexity Berlin, Germany, 2011;

  2. Conference on physics and biological systems, Orsay, France, 2011;

  3. International conference on Statistical Physics, Larnaka, Cyprus, 2011;

  4. Юбилейная конференция «Химическая физика вчера, сегодня, завтра», Москва, 2011;

  5. Journees de Physique Statistique, Paris, France, 2012;

  6. Конференция молодых ученых Института химической физики им. Н.Н. Семенова РАН, Звенигород, 2012;

  7. Journee de LPTMS, Paris, France, 2012;

  8. Spring School in Probability, Dubrovnik, Croatia, 2012;

  9. 38th Conference of the Middle European Cooperation in Statistical Physics, Triest, Italie, 2013;

  1. Conference on Biological Complexity, Krakow, Poland, 2013;

  2. Всероссийская научная конференция «Химическая физика и строение вещества», Москва, 2013;

  3. 9-ая Санкт-Петербургская конференция молодых ученых «Современные проблемы науки о полимерах», Санкт-Петербург, 2013;

и семинарах:

1. Seminars on physical biology and complex systems, Paris, France, 2010;

  1. Молодежный семинар лаборатории Ж.-В. Понселе по проблемам статистической физики неупорядоченных систем с приложением к биофизическим системам, Москва, 2010;

  2. Seminars of LPTMS, Paris, France, 2011;

  3. Добрушинский математический семинар Института Проблем Передачи Информации, Москва, 2012;

  4. Семинар Физического Факультета МГУ, Москва, 2012;

  5. Seminars of LPTMC, University Paris IV, Paris, France, 2012;

  6. Seminar in Politecnico di Torino, Turin, Italy, 2012;

  7. Seminar in University of Potsdam, Potsdam, Germany, 2012;

  8. Seminar in University of Cologne, Cologne, Germany, 2013;

  1. «Московский биоинформатический семинар», МГУ, Москва, 2013;

  2. Семинар в Институте Высокомолекулярных Соединений, Санкт-Петербург, 2013;

  3. Seminar in Princeton University, Princeton, 2014.

Личный вклад автора заключается в развитии методов описания РНК-подобных молекул со случайной первичной структурой. Им были разработаны соответствующие алгоритмы вычисления свободной энергии РНК-подобных молекул. Все приведенные в работе расчеты и обобщение полученных результатов были выполнены автором лично.

Случайная первичная структура РНК

Наибольшую популярность приобрели методы предсказания вторичной структуры РНК, основанные на минимизации свободной энергии [11–13,17,18]. Основоположниками данного метода можно назвать М. Зукера и П. Стиглера [11]. В основе подхода лежит идея о том, что «правильная» вторичная структура РНК должна быть термодинамически наиболее стабильной и, следовательно, обладать наименьшей свободной энергией. При решении задачи минимизации энергии необходимы правила подсчета энергии для любой структуры и эффективный алгоритм минимизации энергии. На основе разнообразных экспериментальных данных [13] сделано много попыток построения правил подсчета свободной энергии и созданы достаточно эффективные алгоритмы, основанные на динамическом программировании [19]. Основное уравнение на статистическую сумму вторичной структуры РНК (Рис. 1.2 (а)) записывается как: описывает статистический вес участка цепи с по мономер, а , определяется больцмановским весом контакта между и мономерами. Основное состояние определяется как: при комнатной температуре (Табл. 1.1), очень часто используют так называемое приближение нулевой температуры. В таком приближении, основное состояние определяется энергией взаимодействующих мономеров, тогда как, энтропией цепи можно пренебречь. Отметим, что выражение (1.1) может быть дополнено различными факторами, такими как минимальная длина петли, энергия стэкинга, различная энтропия структурных элементов РНК (Рис. 1.3 (б)). Особым случаем является предсказание пседвоузлов [20, 21], для которых разрабатываются отдельные алгоритмы с использованием динамического программирования. Методы, основанные на минимизации энергии, на сегодняшний день — наиболее часто используемые. Но, к сожалению, эти алгоритмы не являются надежными, и их точность сильно падает при увеличении длины последовательности. Также следует отметить, что в настоящее время еще не разработан подход, количественно оценивающий вероятность ошибочного предсказания РНК структуры. Один из недавно предложенных подходов основан на анализе кинетики сворачивания РНК в процессе ее синтеза [22]. При этом, в отличие от методов минимизации свободной энергии, ищутся не наиболее стабильные структуры, а структуры, кинетически доступные для сворачивания. Для этих подходов пока не проводилось массового анализа, однако, несмотря на физическую ясность подхода, этот метод содержит в себе довольно много неучтенных факторов.

Наконец, есть так называемый «биологический» подход, основанный на идее, что биологически важные вторичные структуры должны сохраняться в процессе эволюции [23]. При таком подходе анализируется не одна последовательность, а множество последовательностей, выполняющих одну биологическую функцию. Однако при анализе множества полимеров часто используют алгоритмы минимизации энергии, что влечет за собой ошибки.

Есть ряд других алгоритмов поиска оптимальной структуры, использующих методы стохастической оптимизации, в частности, генетические алгоритмы.

Таким образом, предсказание вторичной структуры молекулы РНК по ее первичной — все еще открытый вопрос и исследования в этой области продолжаются [24–27]. Особое место среди таких задач занимают задачи о связывании РНК с биополимерами (белки, ДНК, РНК). Роль таких биополимеров как ДНК и РНК в механизмах клеточной регуляции общеизвестна. Их взаимодействие является одним из необходимых этапов клеточного цикла, связанного с хранением и передачей генетической информации. Помимо общеизвестных механизмов трансляции и транскрипции информации, основанных на ДНК–РНК связывании, исключительно важную роль играют РНК–РНК взаимодействия. Эти взаимодействия имеют ключевое значение для регуляции экспрессии генов [28,29]. Молекулы РНК, посредством образования комплементарных пар, связываются с матричной РНК или ее участком и, тем самым, останавливают трансляцию генов с данной мРНК [28]. Молекулы РНК, участвующие в процессах данного типа, называются некодирующими РНК (нкРНК). Это название обусловлено тем, что они сами не транслируются в белки [29] и, следовательно, исключены из непосредственного процесса транскрипции.

Важная биологическая роль РНК–РНК взаимодействий обуславливает необходимость построения эффективного алгоритма, который бы позволил по первичным струк турам молекул РНК, теоретически вычислять энергию связывания, а также предсказывать вторичную структуру такого комплекса. Эта задача тесно связана с проблемой выравнивания (alignment) двух произвольных линейных последовательностей типа ДНК. Существенным отличием задачи выравнивания молекул РНК от аналогичной задачи для ДНК является наличие нетривиальной вторичной структуры у молекул РНК (Рис. 1.3). Существует ряд подходов к определению энергии РНК-РНК взаимодействия [30–34]. Однако все они применимы в своем, достаточно узком семействе РНК последовательностей и «хорошо» работают только на конкретных примерах. Проблемы определения энергии РНК-РНК связывания аналогичны проблемам, возникающим в задачах предсказания вторичной структуры РНК, и эффективность того или иного алгоритма зависит от выбора факторов, которыми можно и нельзя пренебречь.

Конечно, ограничения того или иного метода могут оказаться существенными для предсказания структуры конкретной молекулы РНК, что, в свою очередь, может привести к неверным выводам о ее функции. Однако, для исследования статистических свойств случайных последовательностей РНК, т.е. цепочек со случайной первичной структурой, достаточно учесть основополагающие свойства полимера, — для РНК, это, в первую очередь, иерархическая вторичная структура типа клеверного листа, образующаяся согласно комплементарности азотистых оснований, и пренебречь теми, которые влияют, в большей степени, на структуру (и функцию) конкретной молекулы — псевдоузлами, минимальной длиной петли, стэкинг-взаимодействием.

Связывание РНК с внутрипетлевым взаимодействием

Результаты численного моделирования распределения свободной энергии основного состояния для ансамбля случайных первичных структур РНК представлены на Рис. 3.1. Угловой коэффициент прямой к 0.65 (Рис. 3.1(a)), что хорошо согласуется с величиной к = lim " — 23, вычисленной по формуле (3.2). Для флуктуации энергии ra-s-oo п полученный наклон 0.34 (Рис.3.1(б)) также близок к значению 13. Таким образом, уравнение (3.2), полученное в приближении бернуллиевского сравнения, удовлетворительно описывает численно наблюдаемую зависимость энергии основного состояния при связывании сополимеров с петлевыми участками от длины случайных цепей.

Связывание двух РНК с внутрипетлевым взаимодействием Аналогичный анализ был проведен и для двух последовательностей, образующих структуру с внутрипетлевым взаимодействием и минимальной длиной петли = 0. Соответствующие графики зависимости свободной энергии и флуктуации энергии представлены на Рис. 3.2. Как и для взаимодействия с петлевыми участками, (Fn n) (п) = кп при п $ 1 (Рис. 3.2), но угловой коэффициент прямой к 0.92 гораздо выше, что обусловлено взаимодействием нуклеотидов внутри петель. Зависимость флуктуации энергии основного состояния остается такой же (см. Рис. 3.2(б)).

Взаимодействие РНК с петлевыми участками: зависимость среднего значения свободной энергии основного состояния , (а) и флуктуации энергии (б) от длины случайной последовательности . Усреднение проводилось по ансамблю из 105 случайных пар последовательностей для каждого значения длины. (а) (б) Рис. 3.2 Связывание РНК с внутрипетлевым взаимодействием: зависимость энергии основного состояния , (а) и флуктуации свободной энергии (б) от длины случайной последовательности . Усреднение проводилось по ансамблю из 105 случайных пар последовательностей для каждого значения длины. Рис. 3.3 Иерархическая модель связывания двух полимеров с внутрипетлевым взаимодействием. Петли первого ( = 1), второго ( = 2) и третьего ( = 3) иерархических уровней.

Оценим аналитически величину коэффициента в зависимости свободной энергии от длины цепи для внутрипетлевого взаимодействия (Рис. 3.2). Будем рассматривать комплекс, который образуют две случайные последовательности РНК, как структуру, состоящую из петель различных иерархических уровней, занумерованных индексом (см. Рис. 3.3).

Каждую петлю -ого иерархического уровня можно рассматривать как комплекс двух взаимодействующих подпоследовательностей из которых она состоит. Из выражения (3.1) следует, что наибольший вклад в свободную энергию наблюдается для комплекса, состоящего из двух последовательностей равной длины, = . Это позволяет оценить сверху свободную энергию петли как свободную энергию двух взаимодействующих половинок этой петли. Представление комплекса двух молекул РНК в виде иерархической структуры позволяет использовать идеи ренормализационной группы [85]. А именно, комплексы -ого иерархического уровня содержат петли, которые будем считать комплексами ( + 1)-ого уровня (Рис.3.3) ( = 1, 2,...).

Формализуя эту идею, будем полагать, что комплекс двух молекул РНК иерархического уровня - это комплекс двух последовательностей с петлевыми участками, в которых энергия взаимодействующих мономеров перенормирована энергией петель иерархического уровня (+1). Пользуясь тем, что энергия петель в первом приближении пропорциональна длине (3.2), представим ее в виде: J РИ г , где — длина петли, а kr — соответствующий г-ому уровню коэффициент связывания. Подставляя в формулу (2.15) статистические веса петель giti+s = e krS T, получим выражение для определения свободной энергии комплекса двух случайных РНК-последовательностей 1:

Выражение (3.4) нужно понимать следующим образом. Прежде всего, определим свободную энергию комплекса Fm,n, в котором могут образовываться петли только первого иерархического уровня. Далее определим энергию связывания на один мономер в петлях второго уровня как

Подставляя полученный коэффициент связывания снова в формулу (3.4), получим значения энергии для петель третьего иерархического уровня, кг , и т.д. Величина V(m,n) учитывает ограничение на минимальное количество мономеров, которые могут образовать петлю г-ого иерархического уровня:

В таблице 3.1 приведены значения для коэффициента связывания и минимальное количество нуклеотидов в петлях г-ого уровня; вычисления проводились для случайных последовательностей равной длины га = п = 104. Длины последовательностей слабо

1 Здесь, как и ранее, F имеет смысл свободной энергии с обратным знаком влияют на средний коэффициент связывания, однако рассмотрение больших длин позволяет провести оценку для большего количества иерархических уровней. Отметим, что коэффициент связывания, определяемый по данной иерархической процедуре, медленно (логарифмически) стремится к 1 с ростом количества иерархических уровней (т.е. при — об). Логарифмическая зависимость обусловлена экспоненциальным ростом минимального числа мономеров, которые могут образовать петлю, гтіп = "И ы + 6 ( 2) с увеличением номера иерархического уровня ( см. Табл. 3.1).

Таким образом, численно наблюдаемый коэффициент связывания (Рис. 3.2(а)) в действительности зависит от длин рассматриваемых последовательностей и полученное нами значение 0.92 лишь указывает на то, что последовательности длиной 400 -т- 1000 мономеров образуют структуру всего с двумя-тремя иерархическими уровнями.

Распределение длин петель в РНК-подобных структурах Связывание двух РНК с петлевыми участками Было проанализировано распределение длин петель в структуре комплекса с петлевыми участками и внутрипетлевым взаимодействием. На Рис. 3.4 представлена зависимость () числа петель различной длины для структуры с петлевыми участками. Видно, что зависимость с хорошей точностью является экспоненциальной. Такое распределение характерно для системы, в которой связывание различных мономеров в цепи происходит независимо (т.е. вероятность того, что следующий по цепи мономер образует связь, никак не зависит от того, образует ли связь предыдущий мономер).

Действительно, величину к = при п $ 1 можно рассматривать, как вероятность связывания мономера в структуре. Считая, что взаимодействие мономеров независимым, число петель длиной s в структуре двух взаимодействующих сополимеров длиной п можно оценить, как: W(s) = пк (1 — k)s. (3.7) Такое распределение длин петель при п $ 1 удовлетворяет очевидному соотношению Е й- лит( і \ s=1 sW (s) = (1 — к)п. Из Рис. 3.4 видно, что численные результаты хорошо аппроксимируются в логарифмическом масштабе прямой y(s) = a — bs, где c хорошей точностью а \п(пк2) и Ъ 1п(1 — к) (см. (3.7)). Таким образом, в связывании сополимеров с петлевыми участками статистика петель выглядит в точности так, как происходит при независимом связывании мономеров. Однако стоит отметить, что модель независимого связывания дает хорошие результаты для последовательностей, в которых количество различных сортов мономеров с 4. Для двухбуквенных и трехбуквенных алфавитов, взаимодействие сополимеров оказывается коррелированным, и формула (3.1) плохо описывает энергию оптимальной конфигурации.

Распределение длин петель в РНК-подобных структурах

Рассмотрим как данный топологический переход ограничивает фазовый переход в замороженное состояние 1.4. Отметим, что аналогичный вопрос исследуется и в теории перколяции, где тоже предполагается взаимосвязь перколяционного перехода и температурного фазового перехода, наблюдаемого, например, в модели Изинга [92].

Были проанализированы температурные зависимости свободной энергии пинча (2.2) случайной последовательности в модели Бернулли разной вероятности р. Как уже обсуждалось, температура перехода в замороженное состояние Тд непосредственно связано со средним числом пропусков в структуре основного состояния. В [38] было показано, что температура перехода не превосходит Т Т = А_1 7, (4.36) где а — среднее число пропусков на пару мономеров, а Л определяется из зависимости наибольшего общего непрерывного сегмента двух половинок последовательности РНК: = A-1 InL (см. Рис. ?). Известно, что для цепочек РНК Л = In 2. Для случайного бернуллиевского процесса Л определяется как Л = 1п(1/р) [79]. Таким образом, выражение (4.36) можно переписать в виде Доля несвязанных мономеров о растет с ростом алфавита 1/р сильнее, чем логарифм (см. Рис. 4.1(б)) и из (4.37) непосредственно следует, что в допереходной области (р рс) фазовый переход в замороженное состояние наблюдаться не будет. Температура перехода Тд эффективно равна нулю, т.е., случайный полимер во всем температурном диапазоне находится в расплавленной фазе. Данное предположение дополнительно подтверждается наблюдением того, что для случайных последовательностей с алфавитом с = 2 переход имеет место только при накладывании ограничений на структуру, а именно, введением минимального размера петли [39].

Результаты численного моделирования представлены на Рис. 4.5. Был проанализирован температурный коэффициент а{Т) (2.4) для последовательностей с разной вероятностью р. Температура перехода определяется точкой, в которой нарушается линейная зависимость а{Т) = Т, характерная для расплавленной фазы. Из полученных данных видно, что температура перехода уменьшается с ростом вероятности рив допереходной области становится равной нулю (р = 0.5 на Рис. 4.5). Вблизи критического значения рс численный эксперимент усложняется тем, что корректный анализ требует рассмотрения достаточно длинных случайных цепочек (с длиной, превышающей соответствующую релаксационную длину (р), см. (4.11)), что приводит к существенному увеличению времени численного моделирования. Также стоит отметить, что в связи с наблюдаемой степенной зависимостью свободной энергии основного состояния от длины последовательности ((4.11)), аппроксимация уравнением (2.2) вблизи точки Т = 0, вообще говоря, неверна.

Предполагается, что критическая точка топологического перехода между полностью связанной РНК-подобной структурой и структурой с пропусками является пороговым значением для термодинамического перехода. В области последовательностей р рс возможна только расплавленная фаза вне зависимости от температуры. Рис. 4.6 пока со

Зависимость коэффициента a(T) (1.4) для случайной последовательности разной вероятности р в модели Бернулли. зывает фазовую диаграмму на (Т,р) плоскости. Это предположение подтверждается исследованием энергии пинча от длины случайной последовательности в точке Т = 0. Точка пересечения зависимостей для разных длин (см. дополнительный график на Рис. 4.6) разделяет два топологических режима и близка к наблюдаемому критическому алфавиту.

Основной недостаток бернуллиевской модели полимера заключается в отсутствии ясного соответствия матрицы контактов V для произвольного р и первичной структуры полимера. Как уже указывалось, в модели Бернулли нет разделения на сорта мономеров, все мономеры, рассматриваются однотипными. В этом разделе, речь пойдет о некоторых подходах генерации полимера с нецелым алфавитом и разными сортами мономеров. 1.5

Одна из самых простых моделей нецелого алфавита, сохраняющего свойство транзитивности — модель концентраций. В такой модели предполагается, что случайный полимер состоит из трех типов мономеров, A, B и C, но мономеры распределены в цепочке не случайно, а коррелировано. В модели так называемых «локальных концентраций» предполагается, что концентрация, количество мономеров третьего типа [] не равна концентрации мономеров [] = [], а зависит от алфавита . В частности, концентрацию [] можно определить по заполненности матрицы контактов . Изменение концентрации [] от 0 до 13 описывает последовательности с нецелым алфавитом от = 2 до = 3. Однако, для алфавитов, немного превышающих = 2 ( = 2+), данная модель приводит к случайной двухбуквенной последовательности, слабо разбавленной третьим типом мономеров . Из-за малого количества [], эти мономеры появляются редко в цепочке, и из-за специфического комплементарного взаимодействия С–С, это приводит к сильным ограничениям на конфигурации основного состояния. Как уже упоминалось, основное состояние характеризуется большим количеством коротких арок, т.е., взаимодействием ближайших соседей в цепочке. Таким образом, важнее оказывается не количество различных типов мономеров в первичной структуре, а их распределение. Модель концентраций может быть улучшена, если распределять [] мономеров третьего типа не случайно, а согласно некому распределению, характерному для случайных трехбуквенных (двухбуквенных) последовательностей. Грубо говоря, это приведет к тому, что мономеры третьего типа C будут появляться в первичной структуре блоками. Но даже такая модель обладает существенным недостатком — выделенной ролью мономеров типа C, по сравнению с мономерами типа А и B.

Переход случайной РНК в замороженное состояние, ограниченный топологическим переходом

Другая модель, частично сохраняющая свойство транзитивности, — модель рационального алфавита — заключается в следующем. Последовательность с алфавитом можно представить, как полимер, состоящий из P сортов мономеров, правила комплементарности для которых разрешают Q связей для каждого мономера. Например, алфавит с = I означает пятибуквенный алфавит в первичной структуре и с правилами комплементарности, организованными, к примеру, по пятиугольнику (Рис. 4.8). Такие правила можно построить для рационального алфавита любой величины. Численные результаты для данной модели приведены на Рис. 4.8 и показывают критическое изменение топологии вторичной структуры РНК.

Отметим, что модель чувствительна к выбору Р и Q, так например, один и тот же алфавит с = 2.8, представленный как и ft дает разные результаты для удельной энергии основного состояния. В пределе Р — L рассматриваемая модель сводится к модели Бернулли. Модель рационального алфавита, интуитивно, кажется ближе к алфавиту, используемого природой в молекулах РНК. Как указывалось, в молекулах РНК, помимо комплементарных пар, образуются неканонические пары (1.1), т.е. правила образования связей, во-первых, не транзитивны, а во-вторых, система правил похожа на систему связей в модели рационального алфавита (Рис. 4.8).

Каков алфавит в реальных молекулах РНК? Понятно, что учет неканонических пар эффективно приводит к уменьшению алфавита. С другой стороны, учет, к примеру, минимальной длины петли увеличивает алфавит в последовательностях РНК. Образование псевдоузлов и стэкинг взаимодействия приводит к сдвигу алфавита к меньшим значениям. Таким образом, фактический алфавит в молекулах РНК определяется многими факторами. Однако, логично предполагать, что алфавит в РНК находится вблизи критического. Почему выгодно реальным молекулам РНК иметь алфавит вблизи критического? Для того чтобы РНК выполняла свою биологическую функцию, она должна удовлетворять следующим критериям: i) ее фолдинг должен быть достаточно уникален и ii) структура должна быть устойчива к тепловому шуму. Короткие алфавиты с сс не обеспечивают первый критерий, так как для допереходной фазы характерна сильная вырожденность основного состояния. С другой стороны, длинным алфавитам с» сс свойственны структуры с длинными петлями — несвязанными мономерами, которые 1.000f в A _

Описание РНК-подобной структуры в терминах оптимизационной транспортной задачи

В данной главе показывается, что задача о вторичной структуре РНК-подобного полимера может быть сформулирована в терминах оптимизационной транспортной задачи (ОТЗ). Заимствованная из ОТЗ процедура оптимизации позволяет описать топологические свойства РНК-подобных структур, если задано распределение расстояний между мономерными звеньями, и потенциал взаимодействия между мономерами имеет вид возрастающей и выпуклой вверх функции от расстояния.

Оптимизационная транспортная задача Классическая транспортная задача заключается в поиске оптимального распределения однородных объектов из пунктов наличия (например, железные рудники) к приемникам (например, заводы) с минимизацией затрат на перемещение. Затраты на перевозку одной единицы руды с рудника до завода задаются ценовой функцией (, ), поэтому ОТЗ может быть сформулирована как задача линейного программирования. Транспортная задача ещё называется задачей Монжа-Канторовича. Она впервые была формализована французским математиком Гаспаром Монжем в 1781 году. Основные продвижения в этой задаче сделал выдающийся советский математик и экономист Леонид Канторович в середине 20-го века [94]. В теории сложности вычислений транспортная задача принадлежит классу сложности NP ( non-deterministic polynomial) [95], т.е. решение задачи не определяется за время, не превосходящее полинома от размера данных. Существует множество методов и алгоритмов решения этой задачи в разных предельных случаях, например, симплекс-метод, метод северо-западного угла, метод наименьшего элемента, метод падающего камня, метод потенциалов [96]. Для математического удобства используют и другие эквивалентные формулировки транспортной задачи [96,97].

В частности, ОТЗ может быть сформулирована как задача поиска оптимального полного паросочетания на полном графе [98]. Паросочетанием на графе называется множество попарно несмежных рёбер, то есть рёбер, не имеющих общих вершин. Паросочетание, включающее в себя все вершины графа называется полным. Ясно, что поиск полного паросочетания на двудольном графе, одни вершины которого описывают пункты наличия продукта /і, а другие пункты доставки и (и /і = и), соответствует построению оптимального плана в ОТЗ. Вес ребра графа, соединяющего вершину /ІІ c вершиной Vj определяется соответствующей ценовой функцией w(/Ii, Uj).

Рассмотрим ОТЗ на прямой, когда все пункты наличия продукта и пункты доставки распределены вдоль одного пути. Следуя [99], будем считать w ценовой функцией выпуклого типа, если для любых Хі,Х2,уі,У2 из R неравенство w(x\,у\) + w(x2,У2) w(x\,У2) + w(x2,у\) (5.1) означает, что интервалы [жі,г/і] и [х2,у2] либо не пересекаются, либо один полностью лежит в другом. Примерами такой ценовой функции служат: w(x,y) = \х — у\а с 0 а 1, или w(x,y) = ln \х — у\ с доопределением w — —00 на диагонали х = у. Если ценовая функция w симметрична и пространственно однородна, т.е., w(x,y) = д(\х — у),функция д должна быть строго возрастающая и строго выпуклой вверх [99]. Хотя такое рассмотрение является некоторой идеализацией ОТЗ, оно кажется вполне разумным, если считать, что доставка руды производится по одному маршруту (одна железнодорожная линия), а выпуклость ценовой функции отражает увеличение суммарных затрат с увеличением расстояния доставки, несмотря на уменьшение удельных затрат на один километр. Задаче с выпуклой вверх ценовой функцией уделено гораздо меньше внимания чем аналогичной задаче с выпуклой вниз функцией затрат. Было показано, что для выпуклой вверх ценовой функции оптимальный транспортный план обладает некоторыми топологическими особенностями [98-100]. Рассмотрим эти особенности, сформулировав ОТЗ следующим образом.

Определим набор точек х на действительной прямой К и рассмотрим полный граф К2п на этих точках, при этом каждому ребру графа (ХІ, XJ) припишем вес w(xi,Xj). ОТЗ заключается в поиске полного паросочетания с минимальным суммарным весом на графе К2П.

Похожие диссертации на Топологические особенности РНК-подобных молекул со случайной первичной структурой