Электронная библиотека диссертаций и авторефератов России
dslib.net
Библиотека диссертаций
Навигация
Каталог диссертаций России
Англоязычные диссертации
Диссертации бесплатно
Предстоящие защиты
Рецензии на автореферат
Отчисления авторам
Мой кабинет
Заказы: забрать, оплатить
Мой личный счет
Мой профиль
Мой авторский профиль
Подписки на рассылки



расширенный поиск

Анализ регуляторных последовательностей и динамики молекулярно-генетической системы, контролирующей G1/S-переход клеточного цикла эукариот Дейнеко Игорь Владимирович

Анализ регуляторных последовательностей и динамики молекулярно-генетической системы, контролирующей G1/S-переход клеточного цикла эукариот
<
Анализ регуляторных последовательностей и динамики молекулярно-генетической системы, контролирующей G1/S-переход клеточного цикла эукариот Анализ регуляторных последовательностей и динамики молекулярно-генетической системы, контролирующей G1/S-переход клеточного цикла эукариот Анализ регуляторных последовательностей и динамики молекулярно-генетической системы, контролирующей G1/S-переход клеточного цикла эукариот Анализ регуляторных последовательностей и динамики молекулярно-генетической системы, контролирующей G1/S-переход клеточного цикла эукариот Анализ регуляторных последовательностей и динамики молекулярно-генетической системы, контролирующей G1/S-переход клеточного цикла эукариот Анализ регуляторных последовательностей и динамики молекулярно-генетической системы, контролирующей G1/S-переход клеточного цикла эукариот Анализ регуляторных последовательностей и динамики молекулярно-генетической системы, контролирующей G1/S-переход клеточного цикла эукариот Анализ регуляторных последовательностей и динамики молекулярно-генетической системы, контролирующей G1/S-переход клеточного цикла эукариот Анализ регуляторных последовательностей и динамики молекулярно-генетической системы, контролирующей G1/S-переход клеточного цикла эукариот
>

Диссертация - 480 руб., доставка 10 минут, круглосуточно, без выходных и праздников

Автореферат - бесплатно, доставка 10 минут, круглосуточно, без выходных и праздников

Дейнеко Игорь Владимирович. Анализ регуляторных последовательностей и динамики молекулярно-генетической системы, контролирующей G1/S-переход клеточного цикла эукариот : Дис. ... канд. биол. наук : 03.00.15 Новосибирск, 2005 152 с. РГБ ОД, 61:05-3/1104

Содержание к диссертации

Введение

Глава 1. Обзор литературы. 11

1.1 Структурно-функциональная организация геномов эукариот

1.1.1 Структура ДНК, общие сведения. 11

1.1.2 Особенности организации геномов эукариот 12

1.2 Модульная структура регуляторных районов генов эукариот транскрибируемых РНК полимеразой II. 15

1.2.1 Одиночные сайты связывания транскрипционных факторов 15

1.2.2 Композиционные элементы 16

1.2.3 Промоторы и энхансеры 18

1.2.4 Полифункциональность ДНК регуляторных областей генов эукариот. 20

1.3 Ядро молекулярно-генетической системы управления клеточным циклом эукариот 21

1.3.1 Клеточный цикл. Основные регуляторы клеточного цикла высших эукариот. 21 Семейство факторов E2F 22

Факторы pRb, р 107, р130 и р53 25

Циклины СусА, CycD, СусЕ и их партнеры Cdk2,4>6. 26

Факторы группы АР-1 26

Механизмы взаимодействий E2F, pRb и циклинов 27

1.3.2 Молекулярно-генетические системы управления (МГСУ) 30

Понятие МГСУ, первая работа по моделированию морфогенеза фага лямбда 30

Некоторые свойства МГСУ, положительные и отрицательные обратные связи. 31

Модели клеточного цикла и его фаз 33

1.4 Методы распознавания регуляторных геномных последовательностей 37

1.4.1 Методы распознавания одиночных регуляторных элементов 37

Методы поиска сайтов связывания 37

Метод консенсусов

Метод реализаций

Метод весовых матриц

Динуклеотидные весовые матрицы

Эксперементально полученные весовые матрицы

Характеристики, используемые для оценки качества методов распознавания

Методы поиска мотивов 43

Статистические методы

Поиск мотивов алгоритмами выравнивания.

1.4.2 Методы распознавания блочных (композиционных) регуляторных элементов. 44

1.4.3 Методы распознавания кластеров/групп регуляторных элементов 45

Методы, основанные на эмпирических оценках

Аналитические подходы в оценке статистической значимости кластеров сайтов

1.5 Математические модели для описания динамики регуляторных систем 48

Качественные/булевы модели

Стохастические модели

Модели основанные на дифференциальных уравнениях

Модели с запаздывающим аргументом

Пороговые и комбинированные модели.

Современные программные средства для построения и анализа регуляторных систем.

Заключение по обзору литературы и постановка задач

исследования 54

Глава 2. Поиск и анализ регуляторных районов 59

2.1 Распознавание композиционных элементов. 59

Комбинаторная модель композиционного элемента 59

Обучение комбинаторной модели КЭ 61

Оценка ошибок недо- и перепредсказания 64

Определение параметров расслабления для модели КЭ Spl/E2F-1 68

Анализ промоторов генов клеточного цикла и генов АР-1 факторов 71

Изучение промоторных районов генов c-fos 78

2.2 Распознавание кластеров сайтов связывания транскрипционных факторов. 82

Метод поиска кластеров сайтов связывания 82

Оценка параметров «независимого» распределения 85

Поиск кластеров сайтов связывания факторов группы E2F в промоторах генов, кодирующих факторы группы АР-1. 90

Глава 3. Построение и моделирование динамики молекулярно-генетической системы управления Gl-фазой и Gl/S-переходом клеточного цикла эу кар йот 100

Построение модели клеточного цикла 100

Вывод формулы для уровня экспрессии при наличии активатора и репрессора 102

Анализ динамики модели 106

Дополнение построенной молекулярно-генетической системы предсказанной регуляторной связью 110

Дополнение модели циклином CycD, промежуточной стадией фосфорилирования pRB и реальными параметрами скоростей деградации белков. 113

Заключение 120

Выводы 126

Список литературы 128

Введение к работе

Актуальность ппавлемы

Последнее десятилетие характеризуется массовым секвенированисм последовательностей ДНК, что дает широкие возможности для исследования функций, особенностей структуры и эволюции генетического материала. Эти задачи обуславливают широкое применение компьютерной техники, как для хранения получаемых данных, так и для их анализа, причем сложность методов и моделей увеличивается не только с ростом объемов знаний, но и с возможностями современных компьютеров. Теоретические методы анализа генетических макромолекул (ДНК, РНК, белков) создали возможность предварительного выявления заведомо ложные вариантов опытов, формирование круга потенциальных мишеней и оптимальное планирование экспериментов, что обеспечило широкую популярность этих методов.

Одной из важных задач исследования геномов является выявление регуляторных сигналов в ДНК, отвечающих за контроль транскрипции генов. Накопление новых экспериментальных данных о структурах регуляторных районов позволяет развивать новые методы поиска, основанные на композиционной и кластерной моделях регуляторных модулей. Однако, не смотря на имеющиеся подходы, эта задача остается до конца не решенной, в том числе из-за значительных ошибок недо- и перепредсказания.

Другой важной задачей является построение молекулярно-генетических регуляторных систем и изучение их динамических характеристик. Дополнение известных регуляторных систем потенциальными связями, выявленными на основе анализа регуляторных районов генов, и изучение их влияния на динамику системы может дать дополнительные доказательства наличия в реальной системе той или иной регуляторной связи. Такой всесторонний анализ генной регуляции, как на уровне транскрипции отдельных генов, так и на уровне регуляторных систем, представляется нам новым и актуальным направлением исследований.

Цели и задачи исследования

Целью данной диссертационной работы является комплексное исследование регуляторних последовательностей генов, кодирующих факторы группы АР-1, и генов машины клеточного цикла эукариот. Поскольку факторы транскрипции E2F и кодирующие их гены, являются одними из ключевых звеньев в регуляции клеточного цикла, представляется необходимым, с одной стороны, исследовать регуляторные области ряда генов как возможных мишеней факторов группы E2F, с другой — влияние этих дополнительных генов и их продуктов на динамику поведения молекулярно-генетической системы, контролирующей прохождение Gl-фазы и Gl/S-перехода клеточного цикла эукариот.

Для достижения поставленной цели необходимо было решить следующие задачи:

  1. Разработать новый метод выявления композиционных элементов, основанный на комбинаторных матричных моделях известных композиционных элементов.

  2. Разработать метод поиска кластеров регуляторных сайтов связывания транскрипционных факторов, основываясь на вероятностной модели распределения одиночных сайтов.

  3. Исследовать регуляторные районы генов, кодирующих компоненты факторов группы АР-1, на наличие потенциальных одиночных сайтов связывания, композиционных элементов и кластеров сайтов связывания транскрипционных факторов.

  4. Построить молекулярно-генетическую систему, контролирующую Gl-фазу и Gl/S-переход клеточного цикла эукариот, исследовать динамику поведения этой системы и влияние на нее предсказанных обратных связей к генам группы АР-1.

Научная новизна работы

Впервые в данной работе комплексно исследована регуляция транскрипции генов, участвующих в контроле Gl-фазы клеточного цикла. С одной стороны, был проведен анализ регуляторних районов генов, кодирующих факторы АР-1, с другой — их влияние на динамику функционирования регуляторной системы управления клеточным циклом эукариот, В задаче по изучению регуляции генов эукариот, оригинальными методами поиска потенциальных композиционных элементов и кластеров сайтов, было показано: а) статистически значимое превышение частоты композиционных элементов Spl/E2F-I в промоторах генов факторов АР-1 и генов машины клеточного цикла; б) наличие кластеров сайтов связывания факторов группы E2F в промоторных районах большинства генов факторов АР-1. При анализе динамики регуляторной системы, контролирующей Gl-фазу клеточного цикла эукариот, показано, что предполагаемая регуляция генов группы АР-1 транскрипционными факторами группы E2F, качественно влияет на динамические режимы функционирования системы. Так при учёте предсказанной регуляторной связи, молекулярно-генетической система переходит в режим соответсвующий пролиферации клетки при значительно меньшем необходимом времени внешнего митогенного воздействия, а при некоторых параметрах вообще не нуждается во внешнем стимулировании для такого перехода.

Практическая и научная значимость

Разработан метод рапознавания композиционных элементов, использующий матричные комбинаторные модели экспериментально установленных композиционных элементов. Для этого было создано 265 таких моделей. Данный метод, отличается не только лучшими характеристиками распознавания в сравнении с существующими методами, он охватывает намного большее число различных типов КЭ, среди которых: APl/Ets, АРШШарраВ, APl/Spl, APl/Smad, CEBP/Ets, CEBP/NFkappaB, CREB/GATA, ER/Spl, Ebox/Ets, Ets/AML, Ets/NFkappaB, Ets/SRF, IRF/NFkappaB, Myb/AML, NFkappaB/HMGrV, Sp 1/NfkappaB, а также, подробно рассмотренные в данной работе КЭ NFAT/AP-I и Spl/E2F-1. Метод распознавания реализован в виде пакета программ MatrixCatch, доступного по сети Internet (bttp://compel.bionet.nsc.ru/cpi-bin/MatrixCatch/MatrixCatch.pD. Разработан метод выявления кластеров регуляторных сайтов связывания транскрипционных факторов с помощью оценки вероятностных

характеристик их совместного расположения на нуклеотидной последовательности. Отличительной особенностью предложенного подхода является широкий спектр рассматриваемых типов сайтов связывания, при этом учитывается возможная корреляция расположения между отдельными сайтами, как одинаковых, так и различных типов. Показано, что расположение в геноме кластеров сайтов, найденных этим методом коррелирует с позицией стартов транскрипции известных генов.

Аппобаиия паботм Результаты данной работы были представлены на Второй международной конференции "Biomformatics of Genome Regulation and Structure" Новосибирск, 2000г, Германской конференции по биоинформатике "German Conference on Bioinformatics", Берлин, 2000г, Международной конференции " Intelligent Systems for Molecular Biology" Эдмонтон, Канада, 2002 г. и Московской международной конференции "Moskow conference on computational molecular biology" Москва, 2003.

Публикаиии no теме паботы

Всего по теме диссертации опубликовано одиннадцать научных работ.

  1. Olga V.Kel-Margoulis, Alexander E.Kel, Ingmar Reuter, Igor V. Deineko and Edgar Wingender, TRANSCompel: a database on composite regulatory elements in eukaryotic genes. Nucleic Acids Research, 2002, vol. 30, no.l, p 332-334.

  2. И.В Дейнеко, А.Э. Кель, O.B. Кель-Маргулис, Э. Вингендер, В.А. Ратнер, Моделирование динамики генных сетей, регулирующих клеточный цикл в клетках млекопитающих. Генетика, 2003, т 39, №9, с 1285-1292.

  3. Deineko I.V., Kel-Margoulis O.V., Ratner V.A., Kel A.E., Modeling of cell cycle gene regulatory network. A role of positive feedback loop implying potential E2F target sites in the regulatory regions of AP-1. Proceedings of the second international conference on bioinformatics of genome regulation and structure, Novosibirsk, IC&G SB RAS, 2000, v.l.p 226-229.

  4. Kel-Margoulis O.V., Romaschenko A.G., Deineko I.V., KolchanovN.A., Wingender E., Kel A.E., Database on composite regulatory elements in eukaryotic genes (compel). Proceedings of the second international conference on bioinformatics of genome regulation and structure, Novosibirsk, IC&G SB RAS, 2000, v.l. p 45-48.

  5. Alexander Kel, Igor Deineko, Olga Kel-Margoulis, Edgar Wingender, Vadim Ratner, Modeling of gene regulatory network of cell cycle control. Role of E2F feedback loops. GCB 2000: Proceedings of the German Conference on Bioinformatics / E. Bomberg-Bauer, Berlin: Logos-VerL, 2000, p 107-114.

  6. Olga V. Kel-Margoulis, Igor V. Deineko, Ingmar Reuter, Edgar Wingender, Alexander E. Kel. TRANSCompel - a professional database on composite regulatory elements in eukaryotic genes. Proceedings of the German Conference on Bioinformatics (GCB 2001).

  7. Deineko I., Kel A., Genome-wide search for composite clusteres of transcription factor binding sites. ISMB 2002. Abstract/ Edmonton, Canada 2002. p. 124.

  1. Igor Deineko, A.Kel., Probabilistic approach for revealing composite clusters of transcription factor binding sites in genomic scale. MCCMB 2003: Proceedings of the international Moscow conference on computational molecular biology/ Moscow, Russia, 2003, p54-55.

  2. Deineko I.V., Kel-Margoulis O.V., Kel A.E. Mathematical Model OFThe Mitogen-Dependent Gl/S Transition In Mammalian Cell Cycle. Proceedings of the fifth international conference on Systems Biology (ICSB 2004), Heidelberg, Germany, 2004, p 385.

  3. Kolpakov F., Deineko I., Kel A., Cyclonet a database on cell cycle regulation. Proceedings of the fifth international conference on Systems Biology (ICSB 2004), Heidelberg, Germany, 2004, p 385.

  4. Swat M., Kel A., Kel-Margoulis 0., Deineko I., Herzel H. Modeling the influence of feedback loops on the GI/S transition. Proceedings of the European Conference on Computational Biology, 2002 (ECCB 2002).

Структура диссептаиии

Диссертационная работа состоит из введения, обзора литературы (первая глава), двух глав результатов, заключения, выводов и списка литературы. Первая глава представляет собой обзор литературы по регуляции транскрипции генов эукариот за счет регуляторных сайтов, приводится классификация рсгуляторных районов различных уровней иерархии. Вводятся основные элементы машины клеточного цикла эукариот (гены и их продукты) и их взаимоотношения. Приведены модели, описывающие клеточный цикл эукариот и его фазы. Далее описываются методы, используемые для поиска одиночных сайтов связывания транскрипционных факторов, композиционных элементов и кластеров регуляторных сайтов, а также методы, подходы и программные средства, применяемые в моделировании динамики сетей образованных генами и их белковыми продуктами. Обзор литературы завершает заключение по обзору литературы и постановка задач исследования.

В первой главе результатов рассматриваются предложенные методы поиска композиционых элементов и кластеров регуляторных элементов, а также применение этих методов к анализу промоторных районов генов, кодирующих факторы группы АР-1. Во второй, главе представлена построенная молекулярно-генетическая система, регулирующая Gl-фазу и Gl/S-переход клеточного цикла эукариот, проанализирована динамика этой системы и динамика системы, дополненной потенциальной регуляторпой связью.

Завершают диссертационную работу главы Заключения, Выводов и Списка литературы. Диссертация содержит 37 рисунков, 15 таблиц и 31 формлу, имеющих сквозную нумерацию.

Структурно-функциональная организация геномов эукариот

Сегодняшняя модель молекулы ДНК была предложена Д. Уотсоном и Ф. Криком в 1953 году. Согласно этой модели ДНК представляет собой правозакрученную спираль, состоящую из двух нитей полинуклеотидов. Эти цепи образуют водородные связи между пуриновыми основаниями (A, G) и пиримидиновыми (С, Т), последовательность которых на одной цепи строго соответствует последовательности на другой, поэтому цепи называют комплиментарными. С помощью методов кристаллографического анализа удалось более подробно изучить структуру ДНК. In vivo ДНК может находиться в А, В и Z формах, различающихся размерами и закрученностью. А и В формы правозакручены, один виток составляет 10,5 и 11-12 пн соответственно, диаметр спирали 19А и 23А соответственно. Отличительной особенностью Z формы является ее левозакрученность (van Holde, 1989). В клеточном ядре ДНК суперспирализована и компактизована. Так, например, длина одной цепи ДНК человека равна 3 109 0,34 1СГ9 1м, тогда как средний линейный размер ядра клеток эукариот около 10"6м (Olmo Е., 1983). Заметим, что степень компактизации может сильно влиять на активность экспрессии генов (Grunstein М., 1990; Felsenfeld, 1992; Жимулев, 1993).

Различают несколько уровней упаковки ДНК — нуклеосомный, нуклеомерный, хромомерный и хромонемный. При этом, структура нижних уровней компактизации изучена наиболее полно. Наиболее интересным с точки зрения регуляции транскрипции является нуклеосомный уровень компактизации нитей ДНК (Alberts et al., 1994;Wallrathe/a/., 1994).

Показано, что, например, во время репликации гистоновые белки конкурируют с транскрипционными факторами, что может приводить к подавлению или активации транскрипции генов. Интересен и тот факт, что скорость связывания транскрипционных факторов с нуклеосомной ДНК снижается при перемещении сайта связывания внутрь нуклеосомной укладки (Anderson and Widom, 2000).

Геномы эукариот организованы существенно более сложно, чем геномы прокариот. Характерным отличием эукариотических геномов является значительно больший размер и при этом достаточно низкая плотность кодирующих районов. Так, например, в геноме человека кодирующие районы занимают всего около 2% всего генома. Основную массу некодирующей ДНК составляют повторы, интроны и межгенные спейсеры (International Human Genome Sequencing Consortium, 2001).

Повторяющиеся последовательности имеют различную длину: от десятков до сотен пн для диспергированных повторов и тысяч пн для мобильных элементов. Их можно разделить на два вида: тандемные повторы (следующие друг за другом), в т.ч. различные виды сателлитной ДНК, гены рРНК (Heslop-Harrison, 2000), и диспергированные повторы, чередующиеся в геноме с уникальными последовательностями, сюда же относятся и различного рода мобильные генетические элементы (Smit, 1996; Kumor and Bennetzen, 1999).

Экзон-интронная структура генома так же является характерной чертой эукариот. За счет этого гены эукариот достигают значительно больших размеров, например, ген дистрофина человека занимает более 2 106 пн (Shilatifard et al, 1997), тогда как весь геном E.coli составляет около 4,6 106 пн (Blattner et al., 1997). Количество экзонов в генах сильно варьирует и может достигать сотен (Lewin, 1994). В среднем у млекопитающих один ген содержит примерно 7 экзонов. При этом среднее отношение длин интронов к длинам экзонов составляет 6,5:1 (Lewin, 1994).

Межгенные спейсеры занимают большую часть генома эукариот. Хотя они не кодируют белкового продукта, они не являются излишними. В частности, в них располагаются такие регуляторные структуры как энхансеры, сайленсеры, инсуляторы и элементы упаковки хроматина MAR/SAR. Так, например, важную роль в регуляции транскрипции гена 1L5 человека имеет дистальный регуляторный элемент, расположенный на расстоянии 6.2 тпн выше старта транскрипции и состоящий из двух сайтов связывания фактора GATA-3 (Urwin et аї.,2004).

Транскрипция генов эукариот также существенно отличается от таковой у прокариот. Во-первых, транскрипцию осуществляют три РНК-полимеразы: РНК-полимераза I транскрибирует гены рибосомальных РНК (5,8S, 18S и 28S рРНК) РНК-полимераза II обеспечивает транскрипцию генов, кодирующих белки и малые ядерные РНК (за исключением гена U6). РНК-полимераза III транскрибирует гены тРНК, SSpPHK, 7SL РНК и U6 РНК.

Во-вторых, существует процесс созревания мРНК из пре-мРНК. В результате процессинга первичного транскрипта интроны вырезаются, а экзоны сшиваются в готовую к трансляции мРНК. При этом может происходить альтернативный сплайсинг, т.е. в состав зрелой мРНК могут входить различные комбинации экзонов (Russell, 1998). Множественные старты транскрипции приводят к еще большему разнообразию вариантов готового белкового продукта, первоначально считанного с одного и того же района ДНК (Lewin, 1994).

Еще одной важной отличительной особенностью эукариотических генов является на порядок более сложное управление ими (Struhl, 1999; Wolberger, 1999). Итоговый уровень конечного белкового продукта зависит от таких молекулярно-генетических процессов, как транскрипция ДНК, сплайсинг пре-мРНК (McKeown, 1992), 3 -концевой процессинг/полиаденшгарование мРНК (Wahle and Keller, 1996), транспорт мРНК через ядерные мембраны, трансляция мРНК (Van der Velden and Thomas, 1999; Evdokimova and Ovchinnikov, 1999), стабильность мРНК в цитоплазме (Decker and Parker, 1994), скорость мультимеризации/активирования белкового продукта и др. (McCarthy, 1998). Интенсивность каждого из этих процессов регулируется различными механизмами, определяя тем самым итоговый уровень экспрессии гена. Однако, именно транскрипция инициирует цепь перечисленных выше процессов, и часто определяет итоговый уровень экспрессии (Olson and Klein, 1994; Nikolov and Burley, 1997).

Клеточный цикл. Основные регуляторы клеточного цикла высших эукариот. 21 Семейство факторов E2F

Клеточный цикл относится к числу базовых (основных) процессов жизни организмов. В результате клеточного цикла происходит удвоение генетического материала и последующее образование двух идентичных дочерних клеток (митоз), их объемный рост и дифференцировка, образование половых клеток (мейоз). Хотя иногда встречается амитотическое деление, при котором генетический материал распределяется неравномерно, тем не менее основное внимание исследователей сосредоточено на процессе митотического деления (Yanishevsky and Stein, 1981; Draetta, 1990; Nurse, 1997; Anion, 1998; Morgan et al, 1998; Lundberg and Weinberg, 1999; McGowan, 2003; Омельянчук и др, 2004). Клеточный цикл подразделяют на фазы: Gl, S, G2 и М. Фаза G1 — объемный рост клетки, характеризуется высокой транскрипционной активностью. S — синтетическая фаза, удвоение цепей ДНК. Эта фаза характеризуется экспрессией генов, белки которых необходимы для постройки и упаковки вновь синтезируемой ДНК. G2 - подготовка к делению, М — собственно деление, которое в свою очередь подразделяют на прометафазу, метафазу, анафазу и телофазу. Именно благодаря митотическому процессу (когда хромосомы конденсируются и становятся видимыми) клеточный цикл и был описан как циклический процесс деления (Flemming et ah, 1879). Продолжительность полного цикла может варьировать от 30 мин у клеток эмбриона, когда все компоненты, необходимые для образования новых клеток, имеются в избытке. В этом случае можно говорить, что клеточный цикл состоит всего из двух фаз S и М (Murray and Kirschner, 1989). Во взрослом организме клеточный цикл может занимать дни, и даже годы, например, нервных клетках. Более того, он может меняться под воздействием внешних факторов, индуцирующих пролиферацию (например, фибробласты кожи при повреждении). В среднем же принято считать, что клеточный цикл эукариот занимает около 24 часов (Wilsman et ah, 1996).

Клеточный цикл сложный и высокоточный процесс, и его нарушения чаще всего приводят к запрограммированной гибели клетки через программу апоптоза, реже к различным аномалиям, в том числе и бесконтрольному делению - раку (Kobayashi, 1996; Massague, 2004; Yamasaki and Pagano, 2004). Прохождение стадий клеточного цикла во многом зависит от внешних факторов, но при этом клетка имеет и свои системы внутренней регуляции и контроля. Контроль осуществляется в специальных точках (checkpoint) (Johnson and Walker, 1999; Kastan and Bartek, 2004). Выделяют три таких точки между фазами Gl/S, G2/M и Метафаза/Анафаза (Hartwell and Weinert, 1989; Lewin 1990), и при прохождении одной точки клетка необратимо движется к следующей, в которой опять принимается решение. Схема клеточного цикла, точки контроля и основные регуляторы показаны на рисунке 3.

В данной работе нас будет интересовать фаза G1 и Gl/S-переход (первая критическая точка), поэтому подробно рассмотрим основные регуляторы клеточного цикла, активные именно в этой фазе.

Семейство Лаптопов E2F

Переходы клетки из одной стадии клеточного цикла в другую контролируются многими регуляторними белками и кодирующими их генами, называемыми машиной клеточного цикла. Ключевую роль активации генов клеточного цикла играют факторы семейства E2F (DeGregori et яЛ, 1995; Farnham et ah, 1993; Johnson and Schneider—

Broussard, 1998). Прежде всего, факторы E2F активируют транскрипцию генов машины клеточного цикла (сами гены факторов E2F, ген белка Rb, гены различных циклинов и циклин-зависимых киназ), гены, продукты которых необходимы для репликации и репарации ДНК, формирования хроматина, чей уровень экспрессии максимален на границе фаз G1/S и в начале S-фазы (DeGregori et al., 1995; Farnham et al., 1993; Slansky and Farnham, 1996; Dyson, 1998).

Семейство факторов E2F кодируется шестью генами (e2f-1,...,б), входящими в так называемую группу протоонкогенов (Jooss et al., 1995; Trimarchi and Lees, 2001). Протоонкогены характеризуются тем свойством, что при возникновении мутации, приводящей к повышению их экспрессии или уменьшению воздействия на них негативных факторов, превращают такие протоонкогены в онкогены (Bishop, 1991). Основным и наиболее изученным представителем этого семейства является фактор E2F-1. Белок имеет ДНК-связывающий и димеризационный домен типа "основная спираль-петля-спираль-застежка", расположенный ближе к N-концу молекулы (Ivey-Hoyle et al., 1993), и С-концевой транс-активационный домен, в пределах которого локализованы ТВР-связывающие домены (Hagemeier et al., 1993) и MDM2-связывающие домены (Martin and Green, 1995). Внутри ТВР-связывающего домена находится pRb-связывающий домен (Hagemeier et al., 1993, рис. 4). При этом разные представители семейства имеют различное сродство к факторам семейства Rb. Так, например, E2F-1,2,3 преимущественно связываются с pRb, a E2F-4,5 с р107 и р130 (Ginsberg et al., 1994; Beijersbergen et al, 1994).

Комбинаторная модель композиционного элемента

Как было отмечено в обзоре литературы, сегодняшние методы распознавания потенциальных композиционных единиц, в большинстве основаны на статистических оценках перепредставленных пар мотивов в наборе некоторых нуклеотидных последовательностей, и небольшое число работ посвящены определению КЭ на основе известных примеров. Так, например, в работе (Kel et ai, 1999) был предложен метод распознавания одного КЭ - NFATp/AP-1, в котором сайты NFATp и АР-1 определялись на основе выборок экспериментально выявленных сайтов связывания для обоих факторов.

Метод, предложенный в данной работе, базируется на комбинаторной модели композиционного элемента, в которой учитывается как сама последовательность экспериментально установленного КЭ, так и последовательности одиночных сайтов связывания факторов, выявленных в различных экспериментах. Данный метод применен к анализу промоторных районов генов машины клеточного цикла и генов, кодирующих факторы семейства АР-1.

Комвинатлпная модель композиционного элемента

Композиционные элементы, являясь регуляторными единицами второго уровня иерархии, функционально состоят из двух, близко расположенных сайтов связывания транскрипционных факторов (Heinemeyer et ai, 1998; Diamond et ah, 1990, глава Обзора литературы 1.2.2). Поскольку экспериментально выявленный КЭ это прежде всего отрезок нуклеотидной последовательности, для которой показана некоторая регуляторная функция, то очевидным, было бы применить известные методы, например, BLAST, для распознавания потенциальных КЭ.

В нашей ранней работе (Kel-Margoulis et ah, 2002), был предложен метод поиска потенциальных КЭ CATCH (http://compel. bionel.nsc.ru/FunSite/

CompelPatternSearch.html), который был основан на методе мотивов. В этой работе, учитывая функциональную структуру КЭ, мы положили, что нуклеотидный состав последовательности между выявленными сайтами связывания в меньшей степени влияет на регуляторную функцию КЭ, чем последовательности самих сайтов. Стоит отметить, что экспериментальных данных о КЭ накоплено значительно меньше, в

сравнении с данными об одиночных сайтах связывания транскрипционных факторов, и поэтому представления о вариабельности позиций и структуре КЭ являются весьма отрывочными. Так, например, рассматриваемый в данной работе КЭ Spl/E2F-1 был установлен всего в двух локусах - в геноме Mus musculus в промоторе гена тимидин киназы и Cricetulus griseus у старта транскрипции гена DHFR. Очевидно, что, используя только эти две последовательности, можно ожидать невысоких характеристик распознавания.

Для частичного решения этих проблем в данной работе, исходя из функционального строения КЭ, было предложено привнести дополнительную информацию о вариабельности отдельных сайтов, составляющих КЭ, полученную в экспериментах по изучению аффинности факторов к различным последовательностям молекул ДНК.

В данном подходе каждый экспериментально установленный композиционный элемент будет определять в нашей комбинаторной модели КЭ только ее структуру, то есть связывающиеся факторы и их относительное расположение. Нуклеотидные последовательности обоих сайтов связывания будут определяться с помощью наборов известных одиночных сайтов связывания для интересующих факторов, в частности, с помощью метода весовых матриц.

Таким образом, рассмотренная комбинаторная модель композиционного элемента состоит из (рис. 15): весовой матрицы, порога и ориентации для первого сайта связывания, расстояния между матрицами, весовой матрицы, порога и ориентации для второго сайта связывания. Обучение комбинаторной модели КЭ

Для обучения данной модели на распознавание определенного КЭ, были использованы базы данных COMPEL (Kel-Margoulis et al., 2000) и TRANSFAC (Wingender et al., 2001). Каждый композиционный элемент в базе данных COMPEL описывается своей нуклеотидной последовательностью, расположением относительно старта транскрипции и позициями обоих сайтов связывания транскрипционных факторов. В базе данных TRANSFAC нас будут интересовать весовые матрицы для определения потенциальных сайтов связывания транскрипционных факторов.

В целом, алгоритм построения модели конкретного КЭ следующий: Для фактора, связывающегося с первым сайтом, определяем набор весовых матриц; Используя нуклеотидную последовательность КЭ, выбираем ту весовую матрицу из набора, которая имеет наибольший вес на данной последовательности, запоминаем ее положение, ориентацию и значение веса; То же для второго сайта, составляющего КЭ; Вычисляем расстояние между матрицами.

Таким образом, имея коллекцию известных композиционных регуляторных модулей, можно построить набор моделей КЭ и уже на их основе разрабатывать методы поиска новых, потенциальных КЭ.

Рассмотрим алгоритм построения модели конкретного КЭ на примере КЭ Spl E2F-l, который будет использоваться далее в работе для анализа промоторов (рис. 16). Композиционный элемент Spl/E2F-1 (номер в базе данных COMPEL С00132 ) является КЭ синергичного типа, и его активность специфична для стадий клеточного цикла эукариот. Располагается данный КЭ вблизи гена ТЫ мыши (thymidine kinase, GenelD: 21877, синонимы: Tk-1). Этот КЭ имеет шесть примеров реализации, то есть был установлен в шести различных экспериментах (Karlseder et al., 1996; Rotheneder et al., 1999), в том числе, направленных на проверку синергичного взаимодействия факторов, проверку прямых белок-белковых взаимодействий между факторами и кооперативного связывания с ДНК

Вывод формулы для уровня экспрессии при наличии активатора и репрессора

Накопленные к настоящему времени обширные экспериментальные факты показывают, что в регуляции клеточного цикла участвует большое количество генов и их продуктов, и экспрессия одних больше походит на всплески, специфические для различных этапов клеточного цикла, других — на циклически (синусоидально) изменяющуюся концентрацию (Hengstschlager et al., 1999; Iyer et al., 1999; Pines, 1999). Кроме того, сложные системы чувствительны к параметрам, и, как показано в (Каегп and Hunding, 1998), погрешности в коэффициентах могут приводить к качественному изменению картины поведения. Одним из способов упрощения модели клеточного цикла является разделение его на фазы (Aguda and Tang, 1999; Qu et al., 2003), каждая из которых описывается своей системой дифференциальных уравнений. Другой способ - переход к системам дифференциальных уравнений, содержащих упрощенные функции, которые включают пороговые или булевы переменные (Farnham et al., 1993; Чураев и др., 2001). В данной работе мы рассмотрим один из самых ключевых этапов клеточного цикла - Gl-фазу и переход из G1 в S-фазу. Именно на этом этапе происходит определение дальнейшего пути развития клетки - дальнейшая пролиферация или выход в фазу GO (Hartwell and Weinert, 1989).

Как было подробно описано в обзоре литературы, регуляция клеточного цикла в большей степени зависит от координированного взаимодействия транскрипционных факторов семейства E2F (Farnham et al., 1993; DeGregori et al., 1995). Это семейство объединяет в себе два подсемейства: белки группы E2F — 1,. ..,6 и DP — 1,2, образующие в клетке гетеродимеры (DeGregori et al, 1995), однако в нашей модели они будут рассмотрены как одна единица - фактор E2F. Активность факторов E2F регулируется специфическими взаимодействиями с белками pRb, р107 и р130, которые так же будут представлены одним членом семейства pRb. Активация циклин-киназного комплекса CycE/Cdk2 посредством киназ и фосфатаз семейств Cdc25 и САК будет смоделирована неявно, через самоактивацию циклина Е (подобное упрощение рассматривалось в (Aguda and Tang, 1999). Митогенная стимуляция Cdc25A «ч (a)CycE/cdk2 ч ч

Модель молекулярно-генетической системы, контролирующей Gl/S-переход клеточного цикла эукариот. Концентрации: yi—транскрипционного фактора E2F; У2-гипофосфорилированного белка pRb; уз-гиперфосфорилированного белка pRb; у4-неактивного циклин-киназного комплекса CycE/Cdk2; у5-активного циклин-киназного комплекса CycE/Cdk2; Уб-трансктипционного фактора АР-1. Жирными стрелками показан процесс производства белка с соответствующих генов (в данном случае производство белка объединяет в себя процессы транскрипции, трансляции и модификации белка, процессы: gl,g2,g3,g4); тонкими стрелками -процессы фосфорилирования-дефосфорилирования (процессы: pl,p2,p3); жирными пунктирными стрелками - каталитические ферментативные реакции (процессы: el,e2); тонкими пунктирными стрелками - положительная регуляция транскрипционными факторами группы E2F; тонкой тупой стрелкой - подавление транскрипции белком ретинобластомы, двойной пунктирной стрелкой -активация циклина Е фактором АР-1 в ответ на митогенную стимуляцию (опосредованная реакция через CycDl); пунктирной стрелкой со знаком вопроса - теоретически предсказанную активацию генов семейства АР-1 фактором E2F.

На рисунке 30 представлена исследуемая молекулярно-генетичекая система, контролирующая фазу G1 и Gl/S-переход клеточного цикла.

Предлагаемая модель основана на регуляции экспрессии входящих в нее генов факторами E2F и pRb, а также на биохимических реакциях фосфорилирования-дефосфорилирования. В данной модели семейство факторов E2F активирует экспрессию генов e2f, репрессора pRb, циклина Е и семейства факторов АР-1. Белок ретинобластомы в нефосфорилированном состоянии связывается с фактором E2F и тем самым подавляет экспрессию вышеперечисленных генов. В модели продукт гена ретинобластомы рассматривается только в двух функциональных состояниях -гипофосфорилированном (активном) и гиперфосфорилированном (неактивном). В данной модели не рассматривается процесс дефосфорилирования белка ретинобластомы, так как это выходит за пределы фазы G1. В схему реакций также был включен цикл фосфорилирования-дефосфорилирования циклина Е с участием cdc25A, который ранее был рассмотрен в работе (Aguda and Tang, 1999). Воздействие внешних факторов посредством митогенной стимуляции моделируется одноступенчатой функцией концентрации АР-1:

Фактор E2F является центральным звеном системы, поэтому мы применили подход Михаэлиса-Ментен для более детального описания его производства. Для этого была подробно рассмотрена схема взаимодействия факторов E2F и pRb на сайте связывания E2F.

Вывод ЛОПМУЛЫ для уровня экспрессии пои наличии активатора и оеппессопа Рассмотрим схему взаимодействия активатора E2F, репрессора pRb и сайта связывания E2F, как было описано выше. Сайт связывания может находиться в трех функциональных состояниях: свободном (1), связанном с активатором (2) и комплексом E2F+pRb (3) (рис. 31). Переходы допускаются во всех направлениях, скорости соответствующих реакций обозначены Ку, где і YLJ означают состояния. Таким образом, промотор переходит из одного функционального состояния в другое при посадке или разрушении того или иного фактора. Транскрипция возможна только в состоянии (2). Нас будет интересовать, какую часть времени промотор будет находиться в активном состоянии в зависимости от различных концентраций активатора и репрессора.

Обозначим эту искомую величину через СЕ, часть времени, в которой сайт свободен от факторов, через С, связан с комплексом - через CER. Концентрации E2F и pRb обозначим через Е и R, соответственно (заметим, что величины С, C , CER можно так же трактовать как часть клеток многоклеточной ткани, в которых рассматриваемый ген находиться в соответствующем состоянии (активен или подавлен)). Отметим, что сумма

Похожие диссертации на Анализ регуляторных последовательностей и динамики молекулярно-генетической системы, контролирующей G1/S-переход клеточного цикла эукариот