Содержание к диссертации
Введение
1. Краткая характеристика генных сетей как объектов теоретического анализа 21
2. Методы моделирования молекулярно-генетических систем 26
3. Подходы к моделированию элементарных подсистем
3.1. Химико-кинетический подход. 42
3.2. Стационарный химико-кинетический подход 45
3.3. Метод Обобщенных функций Хилла 50
4. MGSmodeller- компьютерная система для разработки генетического конструктора, моделирования и анализа природных и искусственных генных сетей
4.1. Требования к MGSmodeller 52
4.2. Краткое описание компьютерной системы MGSmodeller
4.2.1. Моделирование элементарных подсистем в MGSmodeller 55
4.2.2. Формализация моделей генных сетей в MGSmodeller 58
4.2.3. Конструирование моделей генных сетей в MGSmodeller
4.3. Расчет динамики моделей генных сетей 61
4.4. Связь с другими компьютерными средствами 62
5. Моделирование и компьютерный анализ генных сетей 63
5.1. Виртуальный генетический конструктор: компьютерный ресурс для моделирования сложных биологических систем и процессов 66
5.1.1. База моделей элементарных подсистем прокариот 67
5.1.1.1. Модели генетических элементов 68
Подсистема элонгации и терминации репликации 70
Подсистема элонгации и встречной терминации транскрипции 72
Подсистема суперспирализации ДНК 73
Подсистема деградации ДНК 74
Подсистема элонгации трансляции мРНК 74
Подсистема инициации трансляции и деградации мРНК 75
Подсистема терминации трансляции 76
Универсальный промотор 76
Подсистема инициации транскрипции с промоторов Рт и Рг
фага X 77
Регуляция экспрессии гена ругС в клетке E.coli 84
Регуляция экспрессии оперона cyoABCDE 87
Регуляция экспрессии оперона cydAB 92
5.1.1.2. База моделей негенетических элементов прокариот 95
Подсистемы мультимеризации и деградации белков 95
Подсистемы ферментативных реакций прокариот 96
Модель функционирования фермента
аденилосукцинатсинтетазы 97
Модель реакции, катализируемой триптофан-чувствительной 3 деокси -арбино-гептулосонат-7-фосфатсинтетазой 107
Модель регуляции активности
аденинфосфорибозилтрансферазы 109
5.1.2. Заключение к разделу 5.1 111
5.2. Моделирование онтогенеза бактериофага X 114
5.2.1.Краткая характеристика внутриклеточного цикла развития фага X в 114
5.2.2. Модель онтогенеза фага X 117
5.2.3. Численное моделирование онтогенеза фага X и его мутантов 118
5.2.3.1. Анализ численного моделирования репликации ДНК фага?. 119
5.2.3.2. Анализ результатов численного моделирования функционирования мутантов по генам N и Сго. 124 Анализ N-мутантов 125 Сго-мутанты 129
5.2.3.3. Анализ результатов расчета лизогенного и литического режимов развития фага X в клетке Е. coli 134
5.2.3.4. Анализ результатов численного моделирования размножения гибридов фага X 159
5.2.4. Заключение к разделу 5.2 166
5.3. Генетический конструктор как основа для моделирования искусственных генетических систем 168
5.3.1. Моделирование репрессилятора Еловица-Лейблера 168
5.3.1.1. Описание модели репрессилятора 168
5.3.1.2. Параметры модели репрессилятора 169
5.3.1.3. Компьютерный анализ модели репрессилятора 172
5.3.2. Заключение к разделу 5.3 177
5.4. Моделирование и компьютерный анализ генной сети, контролирующей 179
5.4.1. База моделей элементарных подсистем генной сети, контролирующей гомеостаз внутриклеточного холестерина 180
5.4.1.1. Модели протока низкомолекулярных веществ через систему внутриклеточного синтеза холестерина 181
5.4.1.2. Модели ферментативных реакций метаболического пути синтеза холестерина в клетке 181
5.4.1.2.1. Математическая модель регуляции активности пренилтрансферазы 184
5.4.1.3. Регуляция транспорта SREBP из эндоплазматического ретикуллума в аппарат Гольджи и дальнейшая транспортировка активных транскрипционных факторов в ядро 186
5.4.1.4. Регуляция факторами SREBP транскрипции генов, продукты которых участвуют в поддержании гомеостаза холестерина в клетке 187
5.4.1.5. Созревание и трансляция мРНК 188
5.4.1.6. Поступление и утилизация липопротеинов низкой плотности (ЛНП) в плазме крови 188
5.4.1.7. Рецептор-опосредованный эндоцитоз частиц ЛНП и дальнейшая их деградация в лизосомах клетки 189
5.4.1.8. Депонирование холестерина в клетке 195
5.4.1.9. Модуляция активности HMG-CoA редуктазы 197
5.4.1.10. Холестерин-чуствительная регуляция деградации HMG-CoA редуктазы 198
5.4.1.11. Утилизация и деградация высокомолекулярных веществ 198
5.4.2. Адаптация параметров модели генной сети, контролирующей гомеостаз холестерина 199
5.4.3. Моделирование влияния мутаций в гене рецептора ЛНП на равновесные и динамические характеристики генной сети гомеостаза внутриклеточного холестерина 202
5.4.4. Анализ «мутационного портрета» генной сети, контролирующей гомеостаз холестерина в клетке 207
5.4.5.Моделирование эволюции генной сети, контролирующей гомеостаз 2 5.4.5.1. Процедура имитации эволюции 210
5.4.5.2. Моделирование эволюции генной сети при переходе из нормальной среды в среду с низким уровнем поступления экзогенного холестерина 211
5.4.5.3. Моделирование скрещиваний особей, имеющих диплоидные генные сети, адаптированные к различным средам 213
5.4.6. Заключение к разделу 5.4 215
5.5. Математическая модель и компьютерный анализ распределения ауксина вдоль центральной оси корня 216
5.5.1. Описание ID-модели 218
5.5.3. Качественное соответствие стационарного решения экспериментальным данным 220
5.6.3. Множественность стационарных распределений
5.4.1. Анализ чувствительности позиции максимума концентрации ауксина в кончике корня от длины корня N 223
5.5.4.2. Чувствительность стационарных распределений к флуктуациям концентраций ауксина в клетках 225
5.5.4.3. Формирование внутренних пиков в (0, j, 1) распределении 227
5.5.4.4. Влияние флуктуации на распределение ауксина, изученное при других наборах параметров 228
5.5.4.5.Чувствительность модели к варьированию параметров 228
5.5.4.6. Влияние интенсивности потока ауксина из побега в корень на распределение ауксина 229
5.5.4.7. Влияние коэффициентов скорости активного транспорта на распределение ауксина в корне 230
5.5.4.8. Влияние степени нелинейности механизма активного транспорта на поведение Ш-модели 233
5.5.5. Заключение к разделу 5.5 235
5.6. Модель простейшей самовоспроизводящейся молекулярно-генетической системы 241
5.6.1. Описание модели простейшей самовоспроизводящейся системы 243
5.6.1.1. Одиночный цикл развития 243
5.7.1.1. Мутационный процесс 245
5.7.1.2. Эволюционный процесс 248
5.6.1.4. Флуктуации 250
5.6.2. Эволюционный дрейф простейшей самовоспроизводящейся системы 250
5.6.3. Влияние флуктуации 252
5.6.4. Биологическая интерпретация результатов 255
6. Вопросы теории генных сетей 262
6.1. Описание гипотетических генетических элементов 263
6.2. Три иерархических уровня строения гипотетических генных сетей 268
6.3. Пять классов ГГС 269
6.4. Предельные теоремы в теории моделирования генных сетей 276
6.4.1. Первая предельная теорема (случай необратимых микростадий)
276
6.2.2. Вторая и третья предельные теоремы (случай обратимости микростадий и спонтанная терминация) 277
6.2.3. Четвертая предельная теорема 280
6.5. Модели циклических генных сетей
6.5.1. Модель авторепрессирующегося генетического элемента 284
6.5.2. Модели циклических генных сетей при п
6.5.2.1. Случай бесконечного значения параметра у 287
6.5.2.2. Случай конечного значения параметра у 294
6.5.2.3. О существовании в циклических ГГС частично симметричных циклов 297
6.6. Гипотетические генные сети с произвольными структурными графами
299
6.6.1. Критерии числа стационаров и циклов для ГГС 1-5 класса 299
6.6.2. Критерий числа устойчивых стационаров для кГГС 1-4 классов 303
6.6.3. Критерий числа устойчивых стационаров для кГГС смешанного типа 303
6.6.4. (п,к)-критерий количества стационаров. 305
6.6.5. (п,к)-критерий количества циклов. 305
6.6.6.Гипотезы, описывающие циклы и точки покоя модели Ml(n,k) 306
6.7. Дискретные модели генных сетей 307
6.7.1.Определение генетического автомата на двудольном орграфе 307
6.7.2. Сведение задачи поиска неподвижных точек генетических автоматов к проблеме поиска g-баз ориентированных графов 308
6.7.3. Исследование неподвижных точек и циклов ат-автоматов 312
6.7.4. Неподвижные точки аддитивного и мультипликативного автоматов на Gnk 314
6.7.5. Циклы аддитивного автомата на G„/c 314
6.7.6. Неподвижные точки ат-автоматов 316
6.7.7. Алгоритм поиска неподвижной точки ат-автомата 319
6.8. Заключение к главе 6 321
Заключение 325
Выводы 329
Список литературы
- Методы моделирования молекулярно-генетических систем
- Стационарный химико-кинетический подход
- Подсистема элонгации и терминации репликации
- Модели ферментативных реакций метаболического пути синтеза холестерина в клетке
Введение к работе
Актуальность проблемы Конец ХХ-го столетия ознаменован значительным научным достижением в области молекулярной биологии - расшифровкой генома человека. Это событие считается началом нового периода в развитии наук о жизни, часто называемым постгеномной эрой. Постгеномная эра характеризуется, с одной стороны, разработкой скоростных методов секвенирования геномов, в результате чего быстро растет количество организмов, у которых нуклеотидная последовательность генома установлена, а с другой - развитием высокоэффективных экспериментальных методик изучения динамических профилей организмов, построения карт белок-белковых, ДНК-белковых и иных классов взаимодействий. Разработанные ДНК-чиповые технологии позволяют изучать динамику экспрессии тысяч генов одновременно. Новое поколение методов высокоразрешающей масс-спектрометрии позволяет наблюдать за динамикой изменения РНК, белков, изучать потоки низкомолекулярных соединений и т.п.
Разработка новых методик привела к стремительному росту объемов экспериментальных данных, получаемых в молекулярной биологии и генетике, которые нельзя характеризовать иначе как информационный «взрыв». Систематизация и анализ беспрецедентно огромных объемов экспериментальных биологических данных является сложнейшей проблемой наук о жизни на современном этапе развития. Данные вызовы привели к формированию в XXI веке новой комплексной науки - системной биологии. Системная биология ставит перед собой цель изучения закономерностей функционирования живых систем на всех уровнях их организации с использованием комплексного подхода, комбинирующего теоретические и экспериментальные методы. Составной частью системной биологии является информационная биология, которая, в качестве основного, применяет теоретический подход для анализа живых систем. В частности, информационная биология занимается разработкой компьютерных технологий анализа живых систем на генетическом, молекулярном, клеточном и других уровнях организации, а также структуры и функции биологических систем.
Область математического и компьютерного моделирования генетических систем по праву считается важнейшим разделом информационной и системной биологии. В данной области, методами математического моделирования и эксперимента in silico, изучаются закономерности функционирования живых систем в пространстве и времени, исследуются теоретические проблемы реализации генетических программ развития на уровне биохимических, физиологических и морфологических характеристик живых систем, разрабатываются методы решения целевых задач, стоящих перед биотехнологией, фармакологией и другими прикладными разделами биологии. На
современном этапе перед системной биологией стоят две сверхзадачи: (1) разработка нового поколения методов функциональной расшифровки генетических программ (вывод динамики из структуры генома) и (2) разработка виртуальных клеток - молекулярно-биологических лабораторий in silico. Математические модели целевых биологических систем, несомненно, будут ядром нового поколения экспериментально-компьютерных технологий анализа живых систем. В связи с этим работы в области математического моделирования молекулярно-генетических систем становятся особенно актуальным направлением системной биологии.
Цель и задачи исследования. Целью данной работы является теоретическое изучение закономерностей функционирования молекулярно-генетических систем и выявление взаимосвязи структурно-функциональной организации генных сетей (ГС) с их динамическими свойствами и фенотипическими характеристиками живых систем. Конкретные задачи исследования состояли в следующем:
разработка методологии моделирования, алгоритмов и программного обеспечения, ориентированного на поддержку технологической цепочки процесса моделирования генных сетей с учетом специфики их строения на генетическом, клеточном и надклеточном уровнях организации;
разработка и компьютерный анализ математических моделей природных и искусственных ГС, имеющих фундаментальное и прикладное значения, исследование вопросов теории генных сетей:
из области теории моделирования;
из области теории функционирования регуляторных контуров генных сетей. Научная новизна. В области методологии математического и компьютерного моделирования разработаны и программно реализованы:
оригинальный обобщенный химико-кинетический метод моделирования и новый язык SiBML спецификации моделей молекулярно-генетических систем (МТС); новые алгоритмы и программное обеспечение для конструирования моделей по картам связных компартментов и генетическим картам с учетом полиаллельности, взаимного расположения и ориентации генов относительно друг друга.
В области моделирования генных сетей: впервые разработана база математических моделей элементарных подсистем прокариот и эукариот природного и искусственного происхождения; разработаны новые математические модели:
онтогенеза бактериофага лямбда,
репрессилятора Еловица - Лейблера,
генной сети, контролирующей кругооборот холестерина в клетке,
транспорта ауксина из побега в корень,
простейшей самовоспроизводящейся системы,
проведен компьютерный анализ разработанных математических моделей, получены новые теоретические результаты и биологически значимые интерпретации.
В области теории генных сетей получены следующие новые результаты:
- впервые доказаны предельные теоремы, которые обосновывают адекватность
моделирования матричных процессов уравнениями с запаздывающими аргументами, что
является новым результатом в области теории моделирования ГС;
впервые для специальных классов гипотетических генных сетей проблема поиска стационаров сведена к проблеме анализа ориентированных графов;
впервые для специальных классов симметричных гипотетических генных сетей (ГГС) сформулирован (й,)-критерий, который позволяет, не прибегая к расчетом, предсказать наличие или отсутствие у ГГС устойчивых стационаров или циклов, подсчитать их количество и указать конструктивную процедуру выхода на каждый аттрактор;
- впервые разработаны алгоритмы построения устойчивых и неустойчивых
симметричных циклов для циклических ГГС. Впервые, для циклических ГГС четной
размерности, численно открыты 2-симметричные циклы;
впервые для специального класса дискретных генетических автоматов, моделирующих симметричные ГГС, доказано, при расширении разнообразия механизмов регуляции в условиях неизменности структурного графа ГГС, число точек покоя уменьшается до двух или меньше.
Практическая значимость. Предложена новая методология моделирования динамики функционирования молекулярно-генетических систем. Разработаны базы элементарных моделей подсистем прокариот и эукариот. Разработаны математические модели ряда генетических систем природного и искусственного происхождения. Полученные результаты могут быть использованы для разработки фундаментальных проблем геномики, а также при решении прикладных задач, в том числе при решении задач конструирования генных сетей с заранее заданными свойствами, задач разработки суперпродуцентов, геносенсоров и т. д. Полученные в работе результаты используются при чтении лекций и проведении практических занятий в НГУ.
Апробация работы. Материалы диссертации доложены на 17 международных конференциях: BGRS (Novosibirsk, 2000, 2002, 2004, 2006), 1С Human and Computer (Japan, 2003, 2004, 2005), 1С on Comput. Мої. Biol. (Moscow, 2003), 1С on the Bioscience of Lipids, Chemistry and Physics of Lipids (2004), ISMB (2004), ECCB (2004), 1С on Inverse Problems: Modeling and Simulation (Turkey, 2004), MHK «Современные проблемы
генетики» (Минск, 2005), FEBS Congress «Molecular Machines» (Austria, 2007), YSF «Molecular Networks» (Austria, 2007), ICSB (Sweden, 2005, USA, 2007); на 12 российских конференциях: Biodiversity and Dynamics of ecosystems in North Eurasia (Novosibirsk, 2000), Электронные библиотеки: перспективные методы и технологии, электронные коллекции (Протвино, 2000), Моделирование неравновесных систем-2000 (Красноярск, 2000), Wita (Novosibirsk, 2001), Modelling and Analysis of Logic Controlled Dynamic Systems (Irkutsk, 2003), MK «Информационные системы и технологии» (Новосибирск, 2003), Актуальные проблемы генетики (Москва, 2003), Съезд биофизиков России (Воронеж, 2004), ССМВ (Москва, 2005), МКВМ (Moscow, 2007), МК «Фундаментальные науки - медицине» (Новосибирск, 2007), Проблемы молекулярной и клеточной биологии (Томск, 2007), IV съезд Российского общества биохимиков и молекулярных биологов (Новосибирск, 2008). Результаты выступлений на конференциях опубликованы в 77 тезисах, из них 54 - в рецензируемых трудах конференций.
Структура и объем работы. Диссертация состоит из введения, шести глав, заключения, выводов и списка цитируемой литературы, включающего 363 наименования. Работа изложена на 378 страницах и иллюстрирована 18 таблицами и 119 рисунками. По теме диссертации опубликовано 44 научные статьи.
Методы моделирования молекулярно-генетических систем
Начало теоретического исследования и математического моделирования МТС принято отсчитывать от классических работ Жакоба и Моно о механизмах генетической регуляции бактериальных генов. Из них можно отметить работу по исследованию особенностей регуляции экспрессии lac оперона E.coli (Jacob, Monod, 1961), а также работу, посвященную генетической репрессии, аллостерическому ингибированию и клеточной дифференцировке (Jacob, Monod, 1963).
В середине 1960-х - начале 1970-х гг. был опубликован ряд работ, в которых были разработаны и исследованы модели молекулярного триггера (Simon, 1965), кинетики биосинтеза рибонуклеиновых кислот (Ruckenstein, Simon, 1966), белков (Simon, Ruckenstein, 1966), клеточного цикла (Simon, 1973). Для моделирования был применен химико-кинетический подход к описанию процессов, протекающих в МГС (биохимических процессов, активного и пассивного переноса веществ и энергии, функционирования генов и т. п.). В условиях полного перемешивания в рамках данного подхода процессы описываются на основе закона действующих масс, что в общем случае приводит к системам обыкновенных дифференциальных уравнений, в которых динамическими переменными являются концентрации соответствующих веществ.
Дискретные методы моделирования для изучения биохимических систем и процессов примерно в тот же период применили (Sugita, 1961, 1963; Sugita, Fukuda, 1963; Walter et al., 1967). Первые фундаментальные публикации по применению дискретного подхода к исследованию генетических систем опубликовал С. Кауфман. Используя метод булевых сетей, автор изучил вопросы метаболической стабильности и эпигенеза (Kauffman, 1969а), а также гомеостаза и дифференцировки в случайных генных сетях (Kauffman, 1969b). В этих работах Кауфман ввел в научный оборот термин «генные сети». Эти и ряд более поздних работ Кауфмана (Kauffman, 1974; 1977), а также Р. Тома (Thomas, 1973) в последующие годы заметно стимулировали применение дискретных методов к моделированию динамики МГС.
Усилиями Р.Н.Чураева и В.А.Ратнера был развит дискретный подход для моделирования динамики молекулярно-генетических систем управления (МГСУ), использующий язык теории автоматов (Чураев, Ратнер, 1972; Чураев, 1975). В рамках этого подхода пара «оперон-репрессор» рассматривается как дискретный, функционирующий потактно автомат с конечной памятью. По входным каналам в автомат поступают двоичные сигналы, которые способны менять его состояние -режим функционирования. С использованием предложенной техники были построены и изучены модели нескольких оперонных систем, в частности модель молекулярного триггера, обобщение которой привело Р.Н.Чураева к формированию концепции эпигена (Чураев, 1975).
Следует также отметить две работы, опубликованные в начале 1970-х гг., посвященные изучению регуляторных генных сетей с использованием численного эксперимента. Одна из них посвящена логическому анализу непрерывных нелинейных сетей, контролирующих биохимические процессы (Glass, Kauffman, 1973), а другая - системам регуляции индуцибельных оперонов (Savageau, 1974). Модели, представленные в этих статьях, демонстрировали сложные динамические особенности нелинейных механизмов генетической регуляции и свидетельствовали о наличии большого потенциала применения вычислительных методов для изучения МГС.
Изучение закономерностей простейшего молекулярного триггера было продолжено в 1975 году А.С.Чернавским (Чернавский, 1975). Богатый содержательный потенциал имела модель генетической регуляции, с использованием нелинейных дифференциальных уравнений. В дальнейшем модель использовалась А.С.Чернавским для исследования роли генетического аппарата клетки в процессах возникновения жизни, ее эволюции и тканевой дифференцировки.
С начала 1970-х гг. в ИЦиГ СО РАН была начата самая масштабная по тем временам теоретическая работа по созданию математической модели системы управления развитием бактериофага X (Чураев, Ратнер, 1975) - наиболее экспериментально изученной на тот период МГС. Имевшийся в то время методический арсенал не позволял осуществить моделирование сложных биологических систем типа фага X, функционирование которых основано на работе десятков генов. Поэтому для достижения поставленной цели авторы разработали оригинальный пороговый метод моделирования МГСУ. В 1975 г. была опубликована первая модель динамики системы управления А,-фага (Чураев, Ратнер, 1975).
Пороговый метод занимает промежуточное положение между дискретными и непрерывными методами. Его суть состоит в разбиении «фазового пространства на области, внутри которых поведение системы описывается линейными дифференциальными уравнениями, а условия перехода между областями -булевыми функциями» (Чураев, Ратнер, 1975). Решения линейных систем «сшиваются» на границах зон. В результате вся исследуемая система разбивается на конечное число функциональных блоков. Каждый блок описывает один процесс, например, синтез белка. Динамические переменные блоков имеют смысл концентраций продуктов. Скорости их наработки и утилизации задаются с помощью линейных дифференциальных уравнений. В единую систему блоки соединяются с помощью логических переменных, принимающих значение 0 либо 1 в зависимости от того, превосходит или нет концентрация определенного продукта некоторую пороговую величину. Модели, построенные на основе данного подхода, позволяют описывать динамику очень сложных МГС (Чураев, Ратнер, 1975). Этот подход идеологически близок к методу моделирования сложных систем с лимитирующими факторами, основанному на использовании систем нелинейных дифференциальных уравнений, развивавшемуся в 1960-1970-е гг. известным кибернетиком И.А. Полетаевым в Институте математики СО РАН (Полетаев, 1973).
Пороговые методы моделирования динамики МГС получили свое развитие при создании нового поколения портретных моделей управления онтогенезом бактериофага X (Кананян и др., 1979; Kananyan et al., 1981). Эти модели давали детальное описание биосинтеза ДНК, мРНК и белков фага А, в процессе его внутриклеточного развития, а также механизмов их генетической регуляции. В результате Р.Н. Чураев с соавторами разработал обобщенный пороговый метод моделирования, который активно применяется к моделированию динамики широкого круга МГС, в том числе, функционирующих в клетках эукариот (Tchuraev, 1991; Prokudina et al., 1991; Tchuraev, Galimzyanov, 2003).
Математическое моделирование в настоящее время стало важным инструментом изучения МГС. В целом 45 лет, которые насчитывает данная область науки можно условно разделить на три этапа. Начальный этап (начало 60-х - середина 70-х гг. XX в.) развития математического моделирования МГС характеризуется крайне ограниченным экспериментальным материалом о закономерностях функционирования МГС. В связи с этим математические модели описывали гипотетические конструкции и механизмы, изучая которые исследователи пытались понять возможные закономерности функционирования генетических систем. Ранние работы заложили важный методический фундамент для дальнейшего развития области математического моделирования генетических систем.
Стационарный химико-кинетический подход
Система снабжена средствами решения задачи комбинаторного моделирования процессов передачи сигналов. Комбинаторная сложность возникает по той причине, что у сигнальных молекул существует множество путей для взаимодействия и изменения своей структуры: пост-трансляционная модификация белков, множественность сайтов фосфорилирования, гликозилирования и т.д. В результате один и то же белок, или комплексы, в которых он участвует, могут существовать во многих формах, обладающих перекрестными функциями. Эта сложность не устранима, если мы ставим цель разработки предсказательной модели, учитывающей детали строения системы на уровне молекулярных доменов, фундаментальных элементов систем передачи сигналов.
Система имеет собственный формат представления информации для описания моделируемой системы. На вход подается специально подготовленный текстовый файл содержащий 1) константы скоростей реакций и концентрации веществ; 2) молекулярные компоненты, такие как домены белкового взаимодействия и потенциальные состояния этих доменов; 3) правила реакций, по одному на каждый тип рассматриваемой реакции; и 4) выходная функция. Система транслирует данное описание в сеть химических реакций, по которой, затем, соответствующими средствами строятся математические модели в виде системы обыкновенных дифференциальных уравнений (ODE). Также поддерживается экспорт модели в формат «SBML».
Complex Pathway Simulator «COPASI» (Hoops et al., 2006) «COPASI» - программная система для анализа и моделирования биохимических систем. Это автономная система, которую возможно использовать в двух вариантах: с использованием графического пользовательского интерфейса и в консольном режиме. Консольный вариант полезен в тех случаях, когда пользователю нет необходимости во взаимодействии с программой, а нужен, к примеру, только результат расчета. Эта возможность позволяет также использовать данную систему другими приложениями как средство численного исследования.
Вариант с графическим интерфейсом предоставляет широкие возможности для пользователя при создании, редактировании модели и отображении результатов моделирования.
Выше мы рассмотрели ряд компьютерных ресурсов, которые предназначены для обеспечения процесса разработки и компьютерного анализа математических моделей биологических систем с учетом разных уровней их организации. Мы не преследовали цель дать описание всех ресурсов, так как их количество уже достаточно велико. Рассмотренные системы показывают, что на современном этапе развития системной биологии идет интенсивное развитие компьютерных средств моделирования. Проведенный выше анализ показывает, что такие системы должны включать значительный набор компьютерных инструментов поддерживающих этапы формализации модели, численного расчета и эксперимента, этапы адаптации параметров и структурных элементов модели, этапы решения целевых задач, интерпретации результатов компьютерного анализа и сохранения результатов работы в соответствующих базах. Каждый этап требует применения специализированных компьютерных ресурсов.
В итоге, специалисты в области разработки компьютерных средств решения задач системной биологии, пришли к выводу, что наиболее эффективным способом решения проблемы является обеспечение совместимости различных специализированных компьютерных систем. Это позволит создать единую распределенную компьютерную систему (систему, состоящую из множества совместимых компьютерных ресурсов, независимо развиваемых различными коллективами), которая позволит проводить комплексный анализ моделей молекулярно-генетических систем, с использований самых передовых компьютерных технологий. В результате был разработан открытый формат «SBML» (Hucka et al., 2003), который призван обеспечить совместимость развиваемых ресурсов. Благодаря этому возросло количество совместимых компьютерных систем, ориентированных на решение узких задач, поддерживающих эти стандарты обмена информацией. Такая организация позволяет эффективно конструировать модели в одной среде, и затем эффективно исследовать разработанную модель в другом компьютерной системе. Однако, такой подход, несмотря на прогрессивность (декомпозиция разработки отдельных частей виртуальной среды моделирования), сам по себе еще не обеспечивает автоматического возникновения компьютерной системы, способной обеспечить все этапы моделирования больших и сверхбольших биологических систем с учетом генетических процессов. Количество в данном случае не может перейти в нужное качество. Объясняется это тем, что средства построения, конструирования, редактирования, математических моделей, их численного расчета, компьютерного анализа и т.д., должны более тесно взаимодействовать между собой, чем это достигается в рамках реализации идеологии декомпозиции ресурсов на базе стандарта SBML. А именно, компьютерный ресурс, предназначенный для моделирования биологических систем с учетом генетического, компартментного уровней организации, полиаллельности и многофункциональности, а также с учетом других специфических особенностей строения живых систем (например, матричность процессов синтеза ДНК, РНК, белков, динамическая струкутура геномов, компартментов и т.д.) должны развиваться на базе языка моделирования, ориентированного на разработку и хранение моделей биологических систем, информация о строении которых должна описываться и накапливаться на разных иерархических уровнях. В общем случае, модели биологических систем, молекулярно-генетических систем, не могут храниться в готовом, собранном виде. В исходных базах должны отдельно описываться и храниться модели элементарных подсистем, модели генетических карт, модели сообщающихся компартментов, должны храниться модели отдельных экспериментов и пакетов экспериментов (сценариев), должны описываться и храниться модели оптимизации параметров (обратная параметрическая проблема) и элементов модели (обратная структурная проблема), модели решения целевых задач и т.д. Иными словами, процесс построения моделей биологических систем должен представлять сквозной процесс моделирования, в котором моделируется не только биологическая система, но также вся цепочка работы с ней, а также моделируется интерфейс системы работы с моделью. Для решения данной проблемы необходимо разработка языка моделирования высокого уровня. В диссертации мы предлагаем язык моделирования SiBML, который позволяет последовательно реализовывать идеологию сквозного моделирования биологических систем. Мы разрабатываем а-версию компьютерной системы MGSmodeller, реализующей минимальный набор требований, предъявляемый к системам, ориентированным на моделирование молекулярно-генетических систем. MGSmodeller предоставляет средства моделирования многокомпартментных систем, что также предоставляется многими компьютерными системами (см.выше). Кроме того, в рамках MGSmodeller мы реализуем генетический уровень моделирования и полиаллельность, что является нашей оригинальной разработкой, так как в существующих компьютерных системах данные возможности не предоставляются.
Подсистема элонгации и терминации репликации
Репликация мутанта XN подавляется в клетках с низкими энергетическими запасами. Но при этом копия генома мутанта XN не встраивается в геном E.coli (система рекомбинации ехо, у не достигает функционально активного уровня). Одновременно мутант неспособней к стабильной автономной репликации из-за ранней наработки функциональных количеств А,-репрессора. Дальнейшее поддержание высокого уровня в клетке белка СІ не зависит от активности промотора Рге, поэтому, подавление репликации ДНК XN в дальнейшем становится практически необратимым. Поэтому в ходе роста клеточной культуры количество клеток, утративших фаговую кольцевую ДНК, будет непрерывно возрастать. Иными словами, мутант XN не способен устойчиво передаваться дочерним клеткам в ходе деления исходной материнской клетки и постепенно утрачивается популяцией зараженных клеток.
Мутант XN О дает устойчивый плазмидный вариант, поскольку он несет мутантный ген CI и поэтому не нарабатывает активный Х-репрессор. Из расчетов следует, что устойчивость плазмиды может достигаться в результате непрерывной автономной репликации мутанта AN СІ в клетке. При равновероятном распределении геномного материала плазмиды между дочерними клетками и среднем времени деления клетки - 40 мин, скорость репликации A,N СІ , реализованная в машинном эксперименте (Рис. 5.27), обеспечивает частоту освобождения клетки от плазмиды после деления, равную примерно 10"6, что практически гарантирует достаточно высокую стабильность генома А N СІ в клеточной популяции.
Мутант AN СІ синтезирует некоторое количество конкатемерной ДНК. Это позволяет предполагать, что литический режим можно восстановить, если обеспечить каким-либо образом синтез морфологических структур и лизис клетки.
Экспериментальные данные показывают, что для восстановления литического режима развития достаточно, либо использовать р-дефектный штамм Е. coli (Belfort, Oppenheim, 1976), либо удалить терминатор tR2 (Kleckner, Singner, 1977). В норме р-зависимый терминатор t подавляет транскрипцию очень эффективно. Так, если терминатор tR1 задерживает около 50% транскрипционных комплексов, то на t терминируется более 90% мРНК. Поэтому тандем tRr tR2 в отсутствие белка N на 95% ослабляет транскрипцию гена Q с промотора Рг. Следовательно, если удалить терминатор tR2, используя делецию участка NIN5, который не кодирует других существенных функций фага А, то удельная активность транскрипции гена будет составлять у AN NIN5 примерно половину удельной активности транскрипции гена Q у фага А,.
Результаты расчетов полностью согласуются с этими выводами. Действительно, делеция NIN5 восстанавливает активность транскрипции области гена Q (Рис. 5.29). В результате в клетке накапливаются количества белка Q, обеспечивающие валовый синтез белков лизиса и морфологических белков. Морфологические белки в поздний период инфекции вовлекаются в процессы формирования зрелых фаговых частиц, поскольку мутант AN CI NIN5 , так же как и AN О , способен синтезировать конкатемерную ДНК. Белки лизиса в поздний период инфекции участвуют в процессах разрушения клеточной мембраны и тем самым обеспечивают выход потомства во внеклеточное пространство.
Суммируя вышесказанное, можно заключить, что выводы, которые следуют из анализа численных результатов, проведенных для мутантов AN , Ш CI и AN CI NIN5 , находятся в полном согласии с экспериментальными данными (Kleckner, Singner, 1977).
Для численной адаптации функции белка его были использованы мутанты Aero , Aero CI857 и Aero CI . Эти мутанты при попадании в клетку проявляют свойства, которые однозначно определяют их фенотипические особенности. Так, у мутантов Асго и Aero CI вскоре после заражения происходит подавление репликации. Напротив, мутант Асго CI857 при температуре 37С способен не только к репликации, но дает также зрелое фаговое потомство. При температуре, равной 32С или 40С Xcro CI857 проявляет черты, сходные с мутантами А,сго и Xcro CI . Результаты численных расчетов синтеза ДНК у мутантов Xcro , Xcro CI857 и А.СГО CI представлены на Рис. 5.30.
Расчеты проводились в условиях, которые обеспечивают литический путь развития дикого типа фага X, т.е. виртуальная клетка-хозяин имеет высокий уровень Hfl. Из Рис. 5.30 хорошо видно, что в эксперименте in silico репликация ДНК Хсго и Xcro CI и A,cro CI857 начинается приблизительно в одно и тоже время, примерно через пять минут после формирования в инфицированной клетке кольцевой молекулы ДНК фага (данный момент в численном эксперименте принят на нулевое время). Репликация ДНК всех мутантов подавляется достаточно быстро, примерно через 5-8 мин после ее начала. Подавление репликации достигается в результате наработки функциональных количеств гипотетического белка-ингибитора (Рис. 5.31). В дальнейшем мутант A,cro CI не реплицируется, так как у него уровень белка-ингибитора остается все время на достаточно высоком уровне, который поддерживается с конститутивного в этих условиях промотора PR (Рис. 5.30). Таким образом, из модели прогнозируется, что у природного мутанта xro CI ингибирование репликации и ее последующее поддержание детерминируется гипотетическим ингибитором репликативной системы клетки Е. со И.
Модели ферментативных реакций метаболического пути синтеза холестерина в клетке
Однако, не смотря на данное различие, все они имеют на кончике корня распределение ауксина, качественно соответствующее экспериментально наблюдаемому (Рис. 5.88).
Введем классификацию типов распределений. Распределение будем обозначать вектором (i,j,k). Первый компонент і и третий компонент к обозначают наличие (1) или отсутствие (0) максимума в начале (і) и в конце корня (к). Значение среднего компонента j соответствует число внутренних максимумов ауксина и принимает целые значения от 0 и выше.
В результате расчетов мы выявили четыре типа распределений. (0,0,1)-распределения имеют только один концевой пик концентрации ауксина и низкую концентрацию ауксина в начале и в середине корня. Данный тип распределений реализуется, если в модели (5.49) длина корня задается достаточно большой (N 37), а концентрации ауксина в клетках в начале эксперимента задается низкой. Второй тип - (1,0,1)-распределения также имеют максимум концентрации ауксина на конце корня, но в отличии от распределений (0,0,1) данные распределения характеризуются дополнительным максимумом концентрации ауксина в виде ниспадающего градиента концентрации ауксина от соединения корня со стеблем в сторону его конца. Данный тип распределения реализуется из нулевых начальных данных, если длина корня достаточна мала. Если же N достаточно велико (N 37 при параметрах из Табл. 5.17), то начальные данные для выхода на (ІДІ)-распределение, также должны качественно соответствовать распределению (1,0,1). Третий и четвертый типы распределений составляют (0,j,l)- и (lj,l) распределения. У них в середине корня имеется несколько пиков концентрации ауксина (1 или больше).
Из данных экспериментов известно, что в процессе роста корня положение ПЦ остается на одном и том же месте относительно кончика корня (Jiang, Feldman, 2005). В ID-модели этому положению при наборе параметров из Табл. 5.17 соответствует последняя клетка перед максимумом на кончике корня. Поскольку в ID-модели наблюдается большое количество стационаров, мы провели выборочную проверку чувствительности от длины корня N позиции максимума концентрации ауксина в кончике корня. Сначала мы рассмотрели стационары, которые реализуются в ID-модели при начальном нулевом распределении. На рис.5.89 представлены конечные стационарные распределения концентрации ауксина в 15 концевых клетках корня, полученные для N=15,27,37,52,82,102. Видно, что положение максимума на кончике корня чувствительно к длине корня при N 37 и устойчиво при N 27. Объясняется это тем, что при малых длинах корня формируется (ІДІ)-распределение, которое является более устойчивым к N по данному показателю (см. ниже). Напротив, при большой длине корня из нулевых начальных данных формируется (ОДІ)-распределение. Именно оно и является чувствительным к длине корня. Однако, методом продолжения по параметру мы выявили, что получаемое из нулевой задачи Коши распределение принадлежит к целому семейству (0,0,1 распределений.
Среди членов этого семейства, есть и такие, в которых максимум ауксина приходится на 5-ую клетку. Так как концентрации подвержены флуктуациям, то можно предположить, что при росте корня реализуется не единственное (0,0,1)-распределение, а целое семейство (0,0,1)- распределений, которое в целом более устойчиво к длине корня по сравнению с отдельным (0,0,1) распределением.
В отличие от (0,0,1 распределения, (1,0,1)-распределение в численном эксперименте оказалось устойчивым к изменению длины корня при табличных значениях параметров. Независимо от длины корня концевой максимум приходился на 5 клетку (Рис. 5.90).
Кривые стационарного распределения ауксина, полученные из Ша_модели с набором параметров из Табл. 5.17 в результате расчета задачи Коши с начальными данными aj=8, аг=9, а3=10,а4= 1 l,as=12, аб-ан-4=1, ак-з=8, ан-2=15, aN_i=25, aN=35. Кривая 1 -N=52, кривая 2 -N=37, кривая 3 -N=27, кривая 4-N=15.
Приняв во внимание полученные данные, можно заключить, что Ш-модель воспроизводит феномен динамического равновесия распределения ауксина на кончике растущего корня. Этот феномен не зависит от типа стационарного распределения ауксина, но разные распределения демонстрируют различную чувствительность к позиции концентрационного максимума в кончике корня. Расположение пика наиболее устойчиво в (1,0,1)- и (l,j, -распределениях, в то время как (0,0,1 )-распределения более чувствительны. Тем не менее, каждое из охарактеризованных семейств распределений имеет хотя бы одно решение, наиболее хорошо соответствующее экспериментальным данным.
В связи с большим влиянием начальных данных на тип реализующегося стационарного распределения, нами был проведен численный анализ устойчивости распределений различных типов к флуктуациям концентраций ауксина в клетках. Численные эксперименты проводились по ID-модели при N=52 и значениями параметров из Табл. 5.17. Основу численного анализа составляет следующий типовой эксперимент. Мы брали стационарное распределение определенного типа и изменяли в нем в некоторой клетке (или в группе клеток) концентрацию ауксина. Затем мы решали задачу Коши, взяв в качестве начальных данных полученное возмущенное распределение концентрации ауксина. В результате устанавливалось новое распределение. В одном расчете фиксировались: тип начального распределения; характер флуктуации (номер клетки в которой происходит флуктуация и величина флуктуации, выражающаяся в значении установленной концентрации ауксина); тип конечного распределения.
Возмущение (0,0,1)-распределения. Расчеты показывают, что увеличение концентрации ауксина в некоторой выделенной клетке может привести к смене (0,0,1)-распределения на (1,0,1)- или (0,1,1)-распределение. Существует переходный порог повышения концентрации ауксина аі в выделенной клетке, который примерно равен 4 си (единицы концентрации). При концентрациях ниже пороговой исходное распределение не меняется. При концентрациях ауксина выше пороговой устанавливается новый тип стационарного распределения. Единичная флуктуация с не очень большой величиной изменения концентрации вызывает формирование пика шириной в одну клетку. Повышение величины флуктуации более чем в 10 раз относительно порогового значения, приводит к размыванию пика (расширению и снижению высоты пика) на несколько клеток. (ІДІ)-распределение устанавливается, если флуктуация приходится на ближайшие к стеблю клетки (№-52 при а; 4 си и в №51 при а; 45 cu). (0,j,l)-распределенне устанавливается, если флуктуация приходится на внутренние клетки корня (№№ 51- 8). Стоит заметить, что позиции максимумов концентрации ауксина в итоговых стационарных (0,1,1)- и (ІДІ)-распределений приходились на те же клетки, в которых происходили начальные флуктуации. Одновременно с этим, независимо от величины начальной флуктуации наблюдалось изменение концентрации ауксина в максимуме до 11-17 си. Формирование (0, 0, 1)-распределения. Переход в (ОДІ)-распределение из (1,0,1)- или (0,j,l)- распределений осуществляется при уменьшении концентрации ауксина в точках максимума ниже порогового ( 4 си). Если учесть, что значения концентраций ауксина в максимумах в стационарных распределениях устанавливаются на уровне 11-17 си, то такой переход менее вероятен, нежели обратный, так как требует большей величины флуктуации. In
Формирование (1, ], 1)- распределения. Переход из (0, j, 1)- в (1, j, 1)-распределение, осуществляется аналогично переходу из (0,0,1) в (1,0,1). Интересно, что переход из (1,0,1)- в (l,j,l распределение требует гораздо более сильных флуктуации (aj 25 cu). Поэтому вероятность такого перехода будет меньше вероятности перехода (1,0,1)- в (ОДІ)-распределение. Аналогично, переход из (l,j,l) в (0,0,1) будет осуществляться предпочтительно через (1,0,1), так как величина флуктуации для такого перехода будет минимальной. Помимо вышесказанного, в численном эксперименте не возможны прямые и обратные переходы из (0,j,l)- в (ІДІ)-распределение без промежуточных переходов в (0,0,1) или (1J,1) распределение. Сводные данные о вероятностях переходов между разными типами распределений, полученные в численных экспериментах, позволяют выявить некоторую схему смены очередности типов распределения ауксина в корне (Рис. 5.91). Последовательная смена типов распределений ауксина может быть соотнесена с фазами в развитии корня и интерпретируется в разделе «Обсуждение».