Электронная библиотека диссертаций и авторефератов России
dslib.net
Библиотека диссертаций
Навигация
Каталог диссертаций России
Англоязычные диссертации
Диссертации бесплатно
Предстоящие защиты
Рецензии на автореферат
Отчисления авторам
Мой кабинет
Заказы: забрать, оплатить
Мой личный счет
Мой профиль
Мой авторский профиль
Подписки на рассылки



расширенный поиск

Математическое моделирование генных сетей в раннем развитии дрозофилы Гурский Виталий Валериевич

Математическое моделирование генных сетей в раннем развитии дрозофилы
<
Математическое моделирование генных сетей в раннем развитии дрозофилы Математическое моделирование генных сетей в раннем развитии дрозофилы Математическое моделирование генных сетей в раннем развитии дрозофилы Математическое моделирование генных сетей в раннем развитии дрозофилы Математическое моделирование генных сетей в раннем развитии дрозофилы Математическое моделирование генных сетей в раннем развитии дрозофилы Математическое моделирование генных сетей в раннем развитии дрозофилы Математическое моделирование генных сетей в раннем развитии дрозофилы Математическое моделирование генных сетей в раннем развитии дрозофилы Математическое моделирование генных сетей в раннем развитии дрозофилы Математическое моделирование генных сетей в раннем развитии дрозофилы Математическое моделирование генных сетей в раннем развитии дрозофилы
>

Диссертация - 480 руб., доставка 10 минут, круглосуточно, без выходных и праздников

Автореферат - бесплатно, доставка 10 минут, круглосуточно, без выходных и праздников

Гурский Виталий Валериевич. Математическое моделирование генных сетей в раннем развитии дрозофилы : диссертация ... кандидата физико-математических наук : 05.13.18 / Гурский Виталий Валериевич; [Место защиты: С.-Петерб. политехн. ун-т].- Санкт-Петербург, 2009.- 168 с.: ил. РГБ ОД, 61 09-1/570

Содержание к диссертации

Введение ' 5

1 Биологические определения и модели генной экспрессии 15

  1. Генная экспрессия в многоклеточных организмах 15

  2. Описание системы сегментационных генов в растущем эмбрионе дрозофилы 18

  3. Вывод континуальных уравнений 23

  4. Генная сеть 25

  5. Учет деления ядер в математической модели 29

  6. Уравнения дискретной модели 31

2 Континуальная модель сети сегментационных генов hb, Кг, gt, kni и
eve. Роль клеточной структуры и деления ядер 34

2.1 Континуальная модель экспрессии сегментатщонных генов Кг, hb, gt, kni

и eve в дрозофиле 35

  1. Уравнения модели 35

  2. Получение значений параметров путем решения обратной задачи математического моделирования 41

  3. Описание экспериментальных данных 43

  4. Описание метода минимизации функционала качества 45

  5. Результаты оптимизации 47

  6. Решение в модели с оптимальными значениями параметров .... 50

2.2 Динамическая роль деления ядер 54

  1. Эффект сокращения числа аттракторов 55

  2. Ограничение от правила деления 60

  3. Ограничение от динамики в ранних циклах 62

3 Дискретная модель сети генов gap. Исследование механизмов парамет
рической устойчивости
66

3.1 Модель с асимптотически устойчивой динамикой для сети генов gap ... 67

  1. Описание модели 69

  2. Оптимизация параметров с дополнительным требованием квази-стациопарности решений на больших временах 70

  3. Обоснование использования предположения о квазистационарности на основе анализа экспериментальных данных 71

3.1.4 , Результаты моделирования 74

  1. Устойчивость к возмущению начальных условий 80

  2. Устойчивость к возмущению решений в отдельные моменты времени 84

  3. Устойчивость к возмущению значений параметров 88

3.2 Устойчивость границ областей экспрессии при вариации функции uBcd(x) 90

  1. Позиционная вариабельность в эксперименте и в модели 92

  2. Упрощающие предположения и аналитические стационарные решения 98

  3. Уравнения для вариаций границ кинков при вариации uBcd(x) . . 103

  4. Вычисление коэффициентов позиционной вариабельности 104

4 Комбинированный метод решения обратной задачи моделирования 111

  1. Анализ упрощенных уравнений 114

  2. Контроль начальной стадии эволюции решения типа слоистого паттерна 116

  3. Применение к сети gap-генов в дрозофиле 121

  1. Получение приближенных значений параметров 122

  2. Уточнение значений параметров путем оптимизации методом оптимального наискорейшего спуска 129

Заключение 134

Список цитируемой литературы 141

Приложение 149

5.1 Априорные оценки для решений систем уравнений реакции-диффузии . 149

  1. Основные теоремы 149

  2. Точные стационарные верхние и нижние решения в частном случае 154

5.2 Аттракторы и их области притяжения в 2-генной модели 157

\

Введение к работе

Диссертация посвящена построению л исследованию математических моделей биологического процесса регуляции генов сегментации в период раннего развития эмбриона плодовой мушки дрозофилы (Drosophila nielanogaster). С использованием численных и аналитических методов исследуются степень избыточности моделей типа реакции-диффузии, механизмы параметрической устойчивости решений, а также совершенствуются методы определения значений феноменологических параметров по экспериментальным данным в ходе решения обратной задачи математического моделирования.

Физико-математическое моделирование биологических процессов переживает период бурного развития, тесно связанный с возникновением новых междисциплинарных научных областей, таких как биоинформатика и системная биология [72, 13]. Суть данных научных областей состоит в применении методов математического моделирования и вычислительных алгоритмов к экспериментальным биологическим данным для описания процессов, происходящих в живых системах (в клетках, тканях или организмах).

Прогресс системной биологии, основанной на математическом моделировании биологических процессов, определяется, как минимум, двумя факторами. Первый фактор связан с понятием биологической системы как объекта для моделирования. Несмотря на иерархическую сложность живых объектов и тот факт, что большинство процессов, происходящих в этих объектах, являются взаимно зависимыми, оказывается возможным приближенно представить живой объект как систему, состоящую из "отдельных" подсистем. При таком подходе можно корректно построить описание поведения всего объекта, основываясь на математических моделях его подсистем, которые, в этом

смысле, являются локальными моделями. Это значительно упрощает процедуру моделирования и делает ее более реалистичной, поскольку относительно детальные модели даже отдельных подсистем простых биологических объектов трудны для анализа.

Второй фактор связан с мезоскопическим подходом при формулировке уравнений моделей биологических систем. Современные вычислительные возможности не позволяют работать с реалистичными моделями, основанными на детальном описании всех микроскопических взаимодействий в биологических процессах. С другой стороны, макроскопического описания биологических структур и процессов, как правило, недостаточно для того, чтобы доверять выводам, полученным из анализа соответствующих моделей. В качестве компромисса выбирается мезоскопический уровень описания. Современное развитие математических методов и алгоритмов в биологии необходимо для интерпретации и обработки огромного массива экспериментальных данных, накопленных в биологии. Именно математические модели и методы обработки информации могут позволить собрать эти экспериментальные данные в согласованную картину развития и функционирования организмов и их подсистем.

Одним из следствий использования мезоскопического подхода в моделировании биологических систем является феноменологический характер уравнений модели. Во-первых, данный факт обуславливает необходимость исследований, проясняющих, какую именно степень детализации необходимо и/или достаточно использовать при формулировке уравнений модели, чтобы модель была адекватной с одной стороны и не была излишне сложной с другой. Этот вопрос не имеет однозначного ответа в общем случае и требует отдельного рассмотрения для каждой моделируемой системы. С прикладной точки зрения задача определения степени детализации модели важна для выделения более и менее существенных процессов в системе, являющейся объектом моделирования. Эта задача также важна с точки зрения методологии математического моделирования. Во-вторых, феноменологические модели многих биологических процессов содержат параметры, значения которых трудно определить экспериментально. Как следствие, возникает необходимость в разработке эффективных алгоритмов определения значений

таких параметров в ходе решения обратной задачи математического моделирования, то есть путем "подгонки" решений в модели к имеющимся экспериментальным данным. Эта задача является особенно актуальной для больших моделей, в которых традиционные алгоритмы оптимизации в пространстве параметров недостаточно эффективны.

Другой важной задачей математического моделирования в системной биологии является математическое описание механизмов, ответственных за устойчивое развитие организмов (робастность) [41]. Большинство процессов в клетках происходят на фоне "шумов" различной природы. Данные шумы могут определяться как внутренними причинами, связанными со стохастической природой фундаментальных молекулярных процессов, так и внешними, связанными с флуктуациями внешней среды. Адекватное математическое описание механизмов биологической робастности является актуальным для увеличения предсказательной силы моделей.

Одним из наиболее изученных многоклеточных организмов является плодовая мушка дрозофила [42]. Получено большое количество новых экспериментальных данных по концентрациям белков в эмбрионе дрозофилы, которые требуют интерпретации и количественного объяснения в рамках математических моделей [65, 20]. Актуальной в последние годы также стала дискуссия о степени точности позиционирования сегментов эмбриона в ходе раннего развития дрозофилы в условиях изменчивых внешних факторов [33, 26]. За формирование этих сегментов отвечают специальные гены, называемые генами сегментации, или сегментационпыми генами. Понимание робастности, наблюдающейся в эксперименте, требует математической интерпретации.

Объектом исследования в диссертации является модель активности системы сегмен-тацпонных генов в раннем развитии эмбриона дрозофилы. Активность генов проявляется в концентрациях белков, которые "кодируются" этими генами, поэтому решением уравнений модели являются концентрации белков в эмбрионе как функции пространства и времени. Гены взаимно регулируют друг друга, поэтому объект моделирования является сложной нелинейной системой.

Научная новизна результатов диссертации складывается из следующих фактов:

  1. Впервые исследована континуальная модель типа реакции-диффузии, описывающая активность генов сегментации в эмбрионе дрозофилы с высокой точностью.

  2. Впервые описан математический механизм сокращения числа аттракторов в динамических системах, в которых размерность фазового пространства изменяется во времени.

  3. Предложена новая модификация модели активности генов сегментации, с помощью которой решения в модели демонстрируют улучшенную параметрическую устойчивость.

  4. Предложен новый способ подбора начальной точки в пространстве параметров для задачи оптимизации значений параметров в модели активности генов сегментации.

Теоретическая значимость результатов диссертационного исследования заключается в том, что исследуемые модели регуляции сегментацнонпых генов и полученные результаты могут способствовать созданию более реалистичных моделей таких сложных биологических процессов, как экспрессия генов в многоклеточных организмах. Работа имеет научную и практическую ценность в силу того, что полученные результаты могут быть использованы или обобщены в моделях регуляции генов в других организмах, включая человека. Такие модели важны для решения многих практических проблем медицины, таких как создание лекарств нового поколения, осуществляющих контроль над специфической генной активностью.

В первой главе приводятся основные биологические определения и уравнения математических моделей, исследуемых в диссертации. Модель описывает динамику концентраций белков в клетках эмбриона дрозофилы. Данные белки синтезируются в результате биологического процесса, называемого "экспрессией генов". Каждый ген в каждой клетке "кодирует" определенный белок. В ходе своей экспрессии гены регулируют активность друг друга, поэтому пространственно-временное распределение концентрации белков в эмбрионе возникает как результат нелинейных взаимодействий между генами.

Поэтому модель, описывающую динамику пространственных функций концентраций белков, можно назвать моделью регуляции генов или моделью экспрессии генов.

Уравнения модели основаны на балансе между тремя процессами: синтезом белка, его диффузией в эмбрионе и химическом распадом молекул белка. Существуют различные методы формализации этих процессов и, следовательно, различные виды уравнений [63, 17]. Соответствующие модели можно условно разделить на три основных класса, связанных с тремя различными математическими подходами к формулировке уравнений. Первый класс ("логические" модели) включает модели генной регуляции, уравнения которых основаны на булевой логике и ее различных модификациях [67, 23, 39, 11, 66]. В логических моделях состояние гена описывается булевой переменной, значение 1 которой соответствует состоянию гена, в котором он активен (кодирует белок), а значение 0 — состоянию, в котором ген неактивен (белок не синтезируется). Существуют также обобщения логических моделей, в которых логическая переменная может иметь более, чем два дискретных значения. Динамика такой переменной ошгсывпется с помощью булевых функций. Логические модели позволяют лишь качественно описывать экспрессию генов, то есть решения для функций концентрации белков, кодируемых генами, представляют собой дискретные уровни в пространстве и времени.

Во втором классе моделей концентрации белков (продуктов экспрессии генов) являются непрерывными функциями времени и дискретными функциями пространственной переменной; динамика таких функций описывается с помощью обыкновенных дифференциальных уравнений (см., например, [6, 13, 62]). К этому же классу можно отнести модели, в которых концентрации белков также непрерывны по пространству и являются решением уравнений в частных производных (см., например, [46, 6, 62, 43]). Функции синтеза и распада белка в уравнениях строятся на основе имеющихся знаний об общих механизмах процесса экспрессии генов и химической кинетики. Диффузия моделируется как правило на основе закона Фика или дополнительно с учетом возможных нелокальных эффектов.

В третий класс входят стохастические модели экспрессии генов [52, 38, 40]. Данные модели являются наиболее детальными, поскольку сам процесс экспрессии гена осуществляется на основе стохастических молекулярных механизмов. Стохастический подход наиболее важен в ситуациях, когда биологические функции белков, кодируемых генами, осуществляются при очень маленьких концентрациях этих белков, поскольку именно при малых концентрациях стохастические эффекты значительны. В практике построения стохастических моделей генных сетей молено выделить два подхода. В первом подходе стохастические уравнения получаются просто добавлением в детерминированные уравнения случайной функции, определяющей стохастический характер процессов синтеза, распада и диффузии молекул белка. Экспрессия гена во втором подходе моделируется как набор элементарных реакций (присоединение к ДНК, диссоциация и так далее) с заданными вероятностями случиться [22].

В диссертации строятся и исследуются детерминированные модели генной экспрессии на основе систем обыкновенных дифференциальных уравнений и уравнений в частных производных. Значения параметров в этих моделях находятся в ходе решения обратной задачи моделирования, то есть путем подгонки решения модельных уравнений к экспериментальным данным. Обратная задача моделирования решается численной минимизацией функционала качества, определяющего квадратичное отклонение решения от экспериментальных данных.

В первой главе описываются два подхода к формулировке уравнений модели экспрессии генов — континуальный и дискретный. В континуальном подходе эмбрион рассматривается как непрерывная среда (континуум), в которой формируются непрерывные по пространству функции концентрации белков. Уравнения континуальной модели имеют вид уравнений в частных производных. В дискретном подходе учитывается клеточная структура эмбриона, точнее тот факт, что в ходе раннего развития эмбрион дрозофилы состоит из множества ядер будущих клеток. Все гены находятся в ядрах, поэтому экспрессия генов начинается там же. Кроме того, ядра делятся со временем, то есть происходит перестроение клеточной структуры эмбриона. Уравнения дискрет-

ной модели описывают динамику концентраций белков внутри ядер и формулируются в терминах обыкновенных дифференциальных уравнении.

Во второй главе формулируется и исследуется континуальная модель, описывающая экспрессию пяти генов сегментации в ходе раннего развития эмбриона дрозофилы. Значения параметров в уравнениях находятся в результате решения обратной задачи математического моделирования. Функционал, определяющий разницу между решением и экспериментальными данными, численно минимизируется с помощью оптимизированного метода наискорейшего спуска.

В главе исследуется роль, которую клеточная структура эмбриона и ее перестроение могут иметь с точки зрения моделирования. Для этого в континуальной модели вводится дополнительная функция, моделирующая деление ядер клеток в эмбрионе. Также исследуется возможность учета деления ядер с помощью уравнений дискретной модели, в которой каждое уравнение связано с одним ядром. Учет деления ядер в такой модели приводит к динамической системе с изменяющимся со временем числом уравнений, то есть размерность фазового пространства удваивается после каждого акта деления. В главе исследуются аттракторы в такой динамической системе.

В третьей главе исследуются механизмы в математических моделях экспрессии генов сегментации, ответственные за параметрическую устойчивость решений.

Предлагается метод улучшения параметрической устойчивости решений дискретной модели с помощью модификации функционала в обратной задаче математического моделирования. Модификация эквивалентна тому, что при подгонке решения к экспериментальным данным на ограниченном временном интервале требуется квазпстаци-онарность решения на более поздних временах. Решая модифицированную обратную задачу моделирования, находятся значения параметров, дающие решения модельных уравнений, являющиеся параметрически более устойчивыми, чем решения тех же уравнений, но с параметрами, полученными при решении обратной задачи без модификации. Параметрическая устойчивость решений оценивается вычислением отклонения возмущенных решений от экспериментальных данных в норме L

При оценке параметрической устойчивости решений рассматриваются случайные возмущения значений параметров в модельных уравнениях, а также случайные возмущения самих решений в различные моменты времени. Таки возмущения моделируют стохастические эффекты, имеющие место в процессе экспрессии генов в многоклеточных организмах.

Во второй части главы исследуется другой вид параметрической устойчивости решений. Уравнения дискретной и континуальной моделей экспрессии генов сегментации зависят от заданного внешнего фактора uBcd(x), определяющего известную пространственную функцию, которая аппроксимирует распределение концентрации материнского белка Bed ("бикоид") вдоль центральной оси эмбриона. Изучается вариация решений модельных уравнений при вариации функции ивы(х). Выводится система алгебраических уравнений для вариаций 8ql пространственных положений () точек перегиба решений. Решения 5qi этой системы определяют позиционную вариабельность решений модельных уравнений. Показывается, что ( << 5xBcd, где SxBcd есть вариация пространственного положения некоторого фиксированного значения функции uBcd(x). Этот результат совпадает с экспериментальными оценками.

В четвертой главе предлагается комбинированный метод решения обратной задачи моделирования экспрессии генов сегментации. Метод состоит из двух шагов. На нервом шаге находятся приближенные значения параметров в модели. Решения модельных уравнений при приближенных значениях параметров аппроксимируют экспериментальные данные лишь качественно. На втором шаге приближенные значения параметров используются в качестве стартовой точки в ходе минимизации функционала, определяющего отклонение решения от экспериментальных данных, методом наискорейшего спуска. Метод применяется как в дискретной, так и в континуальной моделях экспрессии генов сегментации.

Приближенные значения параметров находятся в результате анализа динамики в упрощенной модели, в которой пренебрегается диффузионным слагаемым и нелинейность заменяется на ступенчатую функцию Хевисайда. Чтобы обеспечить в такой мо-

дели существование аттрактора, качественно схожего с экспериментальными данными, формулируется система неравенств на параметры в модельных уравнениях. Значения параметров, удовлетворяющие этим неравенствам, принимаются в качестве приближенных значений. На втором шаге метода построенные таким образом приближенные значения параметров используются в качестве стартовой точки в методе наискорейшего спуска для минимизации функционала.

Основные результаты диссертации докладывались на Международных семинарах "Day on Diffraction" (С.-Петербург, 2000, 2001; 2003; 2004), на Европейских школах по нелинейной динамике для систем и анализу сигналов "Euroattractor" (Варшава, Польша, 2000; 2002), на Международной школе по моделированию транскрипционных регуляторных сетей (Амблетез, Франция, 2002), па Московской международной конференции по вычислительной молекулярной биологии "МССМВ-2003" (Москва, 2003), на Международной ежегодной конференции BMES (США, 2003), на Политехнических симпозиумах "Молодые ученые — промышленности Северо-Западного региона" (С.Петербург, 2004; 2007), на Международной конференции по системной биологии "From Molecules h Modeling to Cells (SysBio 2005)" (Гозау, Австрия, 2005), па Международной конференции по вычислительной системной биологии "WCSB 2005" (Тампере, Финляндия, 2005), на Международных симпозиумах по сетям в биоинформатике "ISNB" (Амстердам, Голландия, 2006; 2007), на Международной конференции по биоинформатике регуляции и структуры генома "BGRS 2006" (Новосибирск, 2006), на Международной конференции по нанобиотехнологиям (С.-Петербург, 2006), на Международных симпозиумах "Atomic Cluster Collisions: Structure and Dynamics from the Nuclear to the MesoBioNano scales" (TSACC 2007, Дармштадт, Германия, 2007; ISACC 2008, С.-Петербург, 2008), на Российско-Немецкой конференции по системной биологии (Москва, 2008), на Международной конференции по системной биологии "ICSB-2008" (Ґетеборг, Швеция, 2008), на семинаре кафедры зоологии Кембриджского университета (Кембридж, Великобритания, 2008), на семинаре кафедры прикладной математики и статистики Университета Стони Брук (Стони Брук, США, 2003), на семинарах ФТІІ им.

А.Ф. Иоффе РАН (С.-Петербург, 2005-2006), на семинарах отдела компьютерной биологии СПбГПУ (С.-Петербург, 2002-2008).

Основные результаты диссертации опубликованы в работах [60, 29, 30, 27, 62, 28, 9, 31, 2, 61].

Похожие диссертации на Математическое моделирование генных сетей в раннем развитии дрозофилы