Введение к работе
Актуальность проблемы. Исследование биологической эволюции является одной из актуальных задач современной науки. Большие объёмы качественно новых экспериментальных данных о генах и белках, появившиеся в последние годы, привели к развитию новых методов исследования эволюции, прежде всего, эволюционной биоинформатики и, в частности, методов филогенетического анализа. Однако методы компьютерного филогенетического анализа ограничены в своей применимости, поскольку имеют дело не столько с эволюцией организмов, сколько с эволюцией последовательностей макромолекул. При таком подходе затруднительно учесть влияние таких факторов эволюции, как мо-дификационная изменчивость, стресс, экологические факторы. Экспериментальное исследование эволюции также крайне затруднено для большинства таксонов, поскольку процессы макро- и микро-эволюции протекают на интервалах от тысяч до миллионов лет. Поэтому математическое и компьютерное моделирование становится важным инструментом исследования эволюции, и разработка реалистичных многопараметрических моделей эволюции и видообразования, учитывающих влияние условий окружающей среды, трофических взаимодействий, географических факторов, генетической структуры организмов и ряда других факторов является одной из актуальных задач на стыке биологии, математики и информатики XXI века.
Сообщества прокариот являются незаменимой частью биосферы Земли. Кооперируясь в сообщества, различные виды прокариот являются незаменимой частью биосферы Земли и обеспечивают протекание всех основных глобальных биогеохимических циклов: серы, азота и значительную долю цикла фосфора. При этом биопленки, маты и другие сложные прокариотические системы часто формируют внутренние замкнутые циклы метаболизма. Тесная трофическая и топическая взаимосвязь микроорганизмов в таких экосистемах повышает вероятность горизонтального переноса генетического материала. Например, у термофильных бактерий Thermotoga maritima и Aquifex aeolicus -15 - 20% генома -типично архейные гены. Важность горизонтального переноса подтверждают недавно открытые в геномах прокариот естественные векторы для клонирования чужеродных генов - интегроны и суперинтегроны. Коэволюция в таких высо-коинтегрированных сообществах имеет свои качественные особенности, и не сводима к эволюции отдельных особей и макромолекул.
Традиционные подходы к моделированию эволюционно-популяционных процессов включают в себя методы динамики популяций и методы популяцион-ной генетики. Большая часть первых основана на теории динамических систем и с их помощью, как правило, нельзя исследовать изменение генетической структуры популяции. Что касается методов популяционной генетики, то они, напротив, позволяют исследовать эволюцию генетической структуры популяции, но не позволяют детально моделировать процессы популяционной динамики и экологических отношений. Дальнейшее развитие методов эволюционно-популяционного моделирования привело к появлению «гибридных» методик, позволяющих одновременно исследовать изменение, как численности, так и генетической структуры популяции. Структура моделей, построенных с использо-
ванием описанных выше подходов, в определённом смысле является статичной -число уравнений, переменных и параметров модели в процессе расчета не меняется. Это накладывает ограничение на возможные постановки задач - например, на появление нового вида в экосистеме. Имитационное моделирование отчасти устраняет это ограничение, но имитационные модели весьма требовательны к размеру оперативной памяти и имеют большую вычислительную сложность. И если для моделирования популяций диплоидных организмов с половым размножением мощностей современных компьютеров достаточно (ввиду достаточно малой эффективной численности таких популяций), то для моделирования популяций гаплоидных организмов (в частности бактерий) прямое имитационное моделирование зачастую проблематично (эффективная численность бактериальных популяций составляет 10б-109 особей и выше).
Исходя из вышеизложенного, для адекватного моделирования эволюции бактериальных сообществ (сообществ одноклеточных гаплоидных организмов) необходима методика моделирования, позволяющая строить и исследовать существенно динамические модели (модели с изменяющимся числом как переменных, так и уравнений) сообществ высокой численностью (109 особей и более) с приемлемой вычислительной сложностью. Теоретическое исследование бактериальных сообществ с учётом как генетико-популяционных, так и экологических факторов является попыткой замены редукционистского подхода синтетическим и находится в русле современной системной биологии.
Цели и задачи работы. Целью настоящей работы является исследование эволюции сообществ одноклеточных гаплоидных организмов методами математического и компьютерного моделирования. В этой связи в работе решаются следующие задачи:
Разработка методики моделирования эволюции сообществ одноклеточных гаплоидных организмов с учётом генетической структуры популяций-членов сообщества, трофических отношений популяций с окружающей средой, а также между собой. Методика должна позволять моделировать горизонтальный перенос генетического материала между организмами разных видов и сопутствующее видообразование. Проверка адекватности методики на классических задачах математической биологии.
Компьютерное моделирование функционирования сильно замкнутых сообществ одноклеточных гаплоидных организмов с различными механизмами трофического взаимодействия между членами сообщества (симбиотическими и антагонистическими).
Теоретическое исследование эволюционной роли горизонтального переноса генетического материала между клетками разных видов.
Компьютерное моделирование популяций одноклеточных гаплоидных организмов с богатым метаболизмом. Исследование эволюции внутриклеточного метаболизма.
Теоретическое исследование сообществ, реализующих различные механизмы трофических отношений, анализ их конкурентных преимуществ в различных экологических условиях.
Научная новизна и практическая ценность. Впервые разработана методика компьютерного моделирования эволюции сообществ одноклеточных гап-
лоидных организмов, учитывающая, с одной стороны, генетическую структуру популяций-членов сообществ, а с другой стороны, популяционно-динамичсские и экологические отношения популяций со средой обитания и между собой для популяций огромного размера. Разработан программный комплекс «Эволюционный конструктор», реализующий данную методику. Арифметика генетических спектров, разработанная для описания генетического разнообразия популяций, позволяет вычислительно эффективно описывать полиаллельность одного или нескольких генов в популяции, причём число аллелей в процессе расчёта может изменяться (отдельные аллели могут появляться и исчезать). Отличительной особенностью методики является возможность моделирования таких эволю-ционно-популяционных процессов, которые требуют интенсивной перестройки структуры модели в процессе её расчёта. К таким процессам относятся, например, горизонтальный перенос генетического материала и видообразование. Эти процессы могут изменять количество переменных и уравнений в модели непосредственно в процессе расчёта, что также является оригинальной особенностью методики моделирования.
Впервые с помощью компьютерного моделирования исследованы эволюционные последствия горизонтального переноса генетического материала между бактериями для доноров и акцепторов, построены математические модели эволюционного усложнения метаболизма бактериальных клеток, согласующимися с данными о происхождении эукариот.
Для трофически замкнутых (циклически) симбиотических бактериальных сообществ в жёстких условиях окружающей среды впервые показана возможность несовпадения краткосрочного и долгосрочного эволюционного преимущества: сообщества, обладавшие более высокой средней приспособленностью, имели большую скорость потери биоразнообразия, чем сообщества менее приспособленные.
Положения, выносимые на защиту.
Методика и программный комплекс «Эволюционный конструктор» являются высокоэффективным инструментом для моделирования и компьютерного анализа функционирования и эволюции сообществ одноклеточных гаплоидных организмов.
Формулируются биологически значимые теоретические результаты, основанные на анализе моделей, разработанных с помощью программы «Эволюционный конструктор»:
эволюции симбиотических прокариотических трофических сетевых сообществ;
эволюции взаимно-ингибирующих прокариотических сетевых сообществ;
усложнения метаболизма прокариот вследствие симбиогенеза;
функционирования сообществ, реализующих различные трофические
отношения.
Апробация работы. Основные результаты работы были представлены на первом международном рабочем совещании «Biosphere origin and evolution» (Новосибирск, 2005), Международной школе-семинаре BGRS «Эволюция, сис-
темная биология и суперкомпьютерные вычисления в биоинформатике» (Новосибирск, 2005), Международной конференции по биоинформатике геномной регуляции и структуры (BGRS 2006, BGRS 2008, Новосибирск, 2006, 2008), Международной конференции по вычислительной молекулярной биологии (МССМВ 07,. МССМВ 09, Москва, 2007, 2009), Второй международной конференции «Biosphere origin and evolution» (Loutraki, Greece, 2007), Международной летней школе для молодых учёных «Evolution, Systems Biology and High Performance Computing Bioinformatics» (Новосибирск, 2008), IX Всероссийской конференции молодых учёных по математическому моделированию и информационным технологиям (YM2008, Кемерово, 2008), V съезде Вавиловского общества генетиков и селекционеров (Москва, 2009).
Публикации. По теме диссертации опубликовано 13 работ, из них 1 статья в рецензируемой коллективной монографии, 3 — в журналах, входящих в Перечень ВАК РФ.
Структура и объем диссертации. Диссертация состоит из введения, пяти глав, заключения, выводов, списка цитируемой литературы (396 ссылок) и двух приложений. Работа изложена на 189 страницах, содержит 58 рисунков и 6 таблиц. Нумерация рисунков и таблиц производится отдельно для каждой главы.