Содержание к диссертации
Введение
1 Введение 8
1.1 Актуальность работы 8
1.2 Цель и задачи исследования 9
1.3 Научная новизна и практическая значимость работы 10
1.4 Положения, выносимые на защиту 11
1.5 Степень достоверности и апробация результатов 12
CLASS 2 Обзор литературы 13
2.1 Особенности регуляции транскрипции у эукариот 13 CLASS
2.1.1 Регуляторные элементы генов, транскрибирующихся РНК-полимеразой II. 14
2.1.1.1 Промоторы 14
2.1.1.2 Энхансеры 16
2.1.1.3 Сайленсеры. 17
2.1.1.4 Области контроля локуса (LCR) 18
2.2 Инсуляторы. 19
2.2.1 Механизмы действия инсуляторов 20
2.2.2 Образование контактов между удаленными участками ДНК 21
2.2.3 Формирование границ топологически ассоциированных доменов (TAD) 23
2.2.4 Примеры инсуляторов дрозофилы
2.2.4.1 Инсуляторы Bithorax-комплекса (BX-C) 27
2.2.4.2 scs- и scs -инсуляторы 30
2.2.4.3 gypsy –инсулятор 31
2.2.4.4 Другие инсуляторы дрозофилы 32
2.3 Известные инсуляторные белки дрозофилы 32
2.3.1 ДНК-связывающие инсуляторные белки дрозофилы 32
2.3.1.1 Исследование ДНК-связывающих инсуляторных белков с помощью метода ChIP-seq 33
2.3.1.2 dCTCF 34
2.3.1.3 Suppressor of Hairy-wing (Su(Hw)) 35
2.3.1.4 GAGA-фактор (GAF) 36
2.3.1.5 Zeste-white 5 (Zw5) 37
2.3.1.6 Boundary element-associated factor of 32kD (BEAF-32) 39
2.3.1.7 Elba-комплекс 40
2.3.1.8 Insensitive (Insv) 41
2.3.1.9 Insulator binding factor (Ibf1 и Ibf2)
2.3.2 Разнообразие ДНК-связывающих инсуляторных белков дрозофилы 42
2.3.3 Белки дрозофилы, ассоциированные с инсуляторами 43
2.3.3.1 Centrosome-associated zinc finger protein 190 (CP190) 43
2.3.3.2 Modifier of mdg4(Mod(mdg4)-67.2) 44
2.3.3.3 Enhancer of yellow 2 (E(y)2) 45
2.4 Домены инсуляторных белков 46
2.4.1 ДНК-связывающие домены белков дрозофилы 46
2.4.1.1 Домен цинковых пальцев C2H2-типа 47
2.4.1.2 BEN-домен 49
2.4.1.3 BED-домен 50
2.4.2 Домены белок-белковых взаимодействий белков дрозофилы 50
2.4.2.1 BTB/POZ-домен 50
2.4.2.2 Zinc finger associated domain (ZAD-домен) 52
2.4.2.3 Структура ZAD-домена 53
2.4.2.4 Димеризация ZAD-домена 55
3 Материалы и методы 57
3.1 Методы работы с бактериями E.coli 57
3.1.1 Использованные штаммы E.coli 57
3.1.2 Использованные плазмиды 57
3.1.3 Получение компетентных клеток 57
3.1.4 Трансформация E. coli 58
3.1.5 Отбор колоний после трансформации бактерий лигазной смесью 58
3.2 Методы работы с ДНК 58
3.2.1 Выделение плазмидной ДНК (Maxiprep) 58
3.2.2 Обработка ДНК с помощью эндонуклеаз рестрикции 59
3.2.3 Лигирование ДНК 59
3.2.4 Полимеразная цепная реакция (ПЦР) 59
3.2.8 Количественная ПЦР (кПЦР) 61
3.2.11 Горизонтальный гель-электрофорез ДНК 63
3.2.12 Очистка ДНК из геля после электрофореза 63
3.3 Методы работы с РНК 63
3.3.1 РНК-интерференция 63
3.3.2 Выделение РНК из S2-клеток 64
3.3.3 Обратная транскрипция 64
3.4 Методы работы с белками 64
3.4.1 Экспрессия и выделение белков из клеток E.coli 64
3.4.2 Получение ядерного белкового экстракта S2-клеток 65
3.4.3 Выделение ядерного белкового экстракта из эмбрионов 66
3.4.4 Использованные антитела 66
3.4.5 Сшивка белков глутаральдегидом 67 3.4.6 Соосаждение белков на глутатион-сефарозе (GST pull-down) и иммобилизованной амилозе (MBP pull-down) 67
3.4.7 Коиммунопреципитация 67
3.4.8 Электрофорез белков в денатурирующих условиях 68
3.4.9 Окрашивание Coomassie Blue R250 3.4.10 Окрашивание гелей после электрофореза серебром 68
3.4.11 Western blot-гибридизация 69
3.4.12 Метод торможения в геле ДНК-белковых комплексов (EMSA – electrophoretic mobility shift assay) 69
3.5 Дрожжевая двугибридная система 70
3.5.1 Использованный дрожжевой штамм 70
3.5.2 Использованные плазмиды 70
3.5.3 Наращивание дрожжей 70
3.5.4 Трансформация дрожжей 71
3.6 Иммунпреципитация хроматина 72
3.6.1 Фиксация и выделение хроматина из S2-клеток 72
3.6.2 Фиксация и выделение хроматина из куколок. 72
3.6.3 Иммунопреципитация хроматина (ChIP – chromatin immunoprecipitation) 73
3.6.4 Иммунопреципитация хроматина с последующим секвенированием 73
3.7 Методы работы с культурой S2-клеток Drosophila melanogaster 74
3.7.1 Культура S2-клеток Drosophila melanogaster 74
3.7.2 Использованные плазмиды 74
3.7.3 Ведение культуры S2-клеток 74
3.7.4 Трансфекция S2-клеток 74
3.8 Методы работы с линиями мух 75
3.8.1 Использованные линии мух 75
3.8.2 Использованные плазмиды 75
3.8.3 Получение трансгенных линий дрозофил 75
3.8.4 Фенотипический анализ экспрессии генов yellow и miniwhite в трансгенных линиях 76
3.8.5 Генетические скрещивания 76
3.8.6 Сбор эмбрионов 77
3.9 Методы компьютерной обработки данных 78
3.9.1 Поиск пиков связывания белков с ДНК 78
3.9.2 Визуальная оценка полученных профилей связывания белков с ДНК 78
3.9.3 Анализ колоколизации пиков связывания белков с аннотрированными промоторами и другими геномными участками 78
3.9.4 Поиск мотивов связывания белков с ДНК 78
4 Результаты 79
4.1 Взаимодействие белков Pita и ZIPIC с белком CP190 79
4.2 Поиск доменов белков Pita и ZIPIC, участвующих в белок-белковых взаимодействиях in vitro 82 4.2.1 Доменная структура белков Pita, ZIPIC и CP190 82
4.2.2 Картирование участков белков Pita и ZIPIC, взаимодействующих с белком CP190 83
4.2.3 Димеризация ZAD-доменов белков Pita и ZIPIC 85
4.3 Анализ связывания белков Pita и ZIPIC с ДНК in vivo 86
4.3.1 Полногеномные профили связывания белков Pita и ZIPIC с ДНК 86
4.3.2 Проверка некоторых мест связывания белков Pita и ZIPIC с помощью количественной ПЦР 88
4.4 Белки Pita и ZIPIC способны напрямую связываются с ДНК 91
4.4.1 Поиск специфичных последовательностей ДНК, с которыми связываются белки Pita и ZIPIC 91
4.4.2 Подтверждение прямого связывания белков Pita и ZIPIC со специфичными последовательностями ДНК in vitro 93
4.4.3 Вариабельность сайта связывания белка ZIPIC 94
4.5 Инсуляторная активность сайтов связывания белков Pita и ZIPIC 95
4.5.1 Использование трансгенных линий для изучения инсуляторной активности 95
4.5.2 Энхансер-блокирующая и барьерная активность сайтов связывания белков Pita и ZIPIC 98
4.5.3 Pita вместе с dCTCF участвует в работе Mcp-инсулятора 99
4.5.4 Связывание белка ZIPIC с разными вариантами мотива связывания in vivo 1 5 Обсуждение 103
6 Выводы 107
7 Благодарности 108
8 Список литературы 109
- Положения, выносимые на защиту
- Образование контактов между удаленными участками ДНК
- Домены белок-белковых взаимодействий белков дрозофилы
- Метод торможения в геле ДНК-белковых комплексов (EMSA – electrophoretic mobility shift assay)
Введение к работе
Актуальность работы
Многоклеточные организмы состоят из разных типов клеток, которые отличаются друг от друга набором белков, определяющих их признаки. Сложные организмы проходят несколько стадий развития, во время которых профиль экспрессии белков может меняться. У многоклеточных эукариот экспрессия белков может отличаться между клетками и этапами развития.
Транскрипция – это одна из стадий экспрессии генов. Транскрипция определяет количество РНК в клетке и напрямую связана с синтезом белка. Таким образом, транскрипция – один из основных этапов реализации генетической информации, она важна для определения признаков разных типов клеток.
У эукариот регуляция транскрипции – это одна из ключевых стадий, влияющих на количество образующихся белков. Основные стадии регуляции транскрипции происходят на уровне привлечения специфичных транскрипционных факторов на особые регуляторные последовательности ДНК (выполняющие функции энхансеров или сайленсеров транскрипции), сборки основного транскрипционного комплекса. Многие пути регуляции экспрессии генов связаны с образованием контактов между удаленными участками генома или распространением регуляторного сигнала по хроматину. Данные механизмы позволяют осуществлять сложную регуляцию экспрессии генов, но для своей реализации на необходимом уровне специфичности требуют особых средств.
Одним из способов ограничения действия энхансеров и распространения
гетерохроматиновых доменов являются инсуляторы. Инсуляторы – это геномные элементы, блокирующие действие энхансера и распространение репрессии, опосредованной белками группы Polycomb. При этом инсулятор блокирует энхансера, если расположен между ним и промотором. Также инсуляторы могут образовывать контакты между удаленными участками ДНК и образовывать петлевые домены ДНК.
У дрозофилы известно несколько ДНК-связывающих инсуляторных белков – это Zw5, dCTCF, Su(Hw), GAF и BEAF-32 [Espins и др., 1999; Gaszner, Vazquez, Schedl, 1999; Moon и др., 2005; Parkhurst и др., 1988; Zhao, Hart, Laemmli, 1995]. В последнее время были описаны еще несколько белков с подобными функциями [Aoki и др., 2012; Cuartero и др., 2014; Duan и др., 2011]. Все известные ДНК-связывающие инсуляторные белки взаимодействуют с белком CP190 и участвуют в его привлечении на ДНК-последовательности. Показано, что этот белок играет важную роль в работе инсуляторов [Bartkuhn и др., 2009; Mohan и др., 2007; Pai и др., 2004]. Однако, во многих точках генома, в которых связывается CP190, не показано связывание известных инсуляторных ДНК-связывающих белков. Поэтому мы предположили, что в геноме дрозофилы существуют неизвестные ДНК-связывающие инсуляторные белки, и данная работа посвящена поиску и анализу таких белков.
Цель и задачи исследования
Целью данной работы был поиск и анализ функций новых ДНК-связывающих инсуляторных белков дрозофилы.
Для достижения поставленной цели были сформулированы следующие задачи:
-
Провести поиск белков, взаимодействующих с CP190, с помощью дрожжевой двугибридной системы. Подтвердить найденные взаимодействия в системах in vitro и in vivo.
-
Выявить белковые домены, участвующие во взаимодействии найденных инсуляторных белков с CP190, с помощью дрожжевой двугибридной системы и соосаждения белковых молекул.
-
Провести полногеномный анализ связывания белков с помощью иммунопреципитации хроматина из S2-клеток Drosophila melanogaster с последующим глубоким секвенированием. Определить степень колокализации сайтов связывания изучаемых инсуляторных белков с сайтами связывания белка CP190. Определить консенсусную последовательность ДНК для связывания изучаемых белков.
-
Проверить способность изучаемых инсуляторных белков связывать напрямую специфичные последовательности ДНК in vitro с помощью метода торможения в геле ДНК-белковых комплексов.
-
Проанализировать энхансер-блокирующую и барьерную активности мотивов связывания изучаемых инсуляторных белков в стандартных трансгенных модельных системах.
Научная новизна и практическая значимость работы
В данной научной работе были обнаружены и охарактеризованы два новых ДНК-связывающих инсуляторных белка – Pita и ZIPIC. Мы показали, что эти белки взаимодействуют с белком CP190 – партнером всех известных ДНК-связывающих инсуляторных белков D. melanogaster. Мы проанализировали полногеномное распределение белков Pita и ZIPIC с помощью метода иммунопреципитации хроматина с последующим глубоким секвенированием. Дальнейший анализ позволил нам обнаружить мотивы ДНК, с которыми белки Pita и ZIPIC могут связываться напрямую с помощью доменов цинковых пальцев. В трансгенных модельных системах мы продемонстрировали, что мотивы связывания белков Pita и ZIPIC обладают инсуляторными активностями.
В данной работе предлагается и апробируется экспериментальный подход для поиска новых инсуляторных белков D. melanogaster. Так как имеются основания полагать, что в дополнение к белкам Pita и ZIPIC существуют другие неохарактеризованные инсуляторные белки дрозофилы, то предлагаемый подход может быть востребован в дальнейших исследованиях.
Кроме того, уже сейчас полученные данные можно использовать для выявления более полной картины структуры хроматина. Так, проведенный нами предварительный анализ данных литературы о структуре хроматина показывает, что пики связывания белков Pita и ZIPIC преимущественно располагаются на границах TAD (топологически ассоциированных доменов) и в местах поддержания дистанционных контактов.
Методология и методы работы
Работа выполнена с использованием современного оборудования и методов молекулярной
биологии (молекулярное клонирование, анализ белковых взаимодействий,
иммунопреципитация хроматина, метод изменения подвижности ДНК-белковых комплексов в геле) и биоинформатики.
Положения, выносимые на защиту
1. Обнаружены новые ДНК-связывающие белки D. melanogaster – Pita и ZIPIC,
которые взаимодействуют с белком CP190 in vitro и in vivo.
-
Белок Pita с помощью участка между ZAD-доменом и цинковыми пальцами взаимодействует с BTB-доменом белка CP190 in vitro и в дрожжевой двугибридной системе. Белок ZIPIC с помощью участка между ZAD-доменом и цинковыми пальцами взаимодействует с M-доменом белка CP190 in vitro и в дрожжевой двугибридной системе. ZAD-домены белков Pita и ZIPIC димеризуются in vitro.
-
По результатам иммунопреципитации хроматина из S2-клеток D. melanogaster с последующим секвенированием для белка Pita найдено около 2750 пиков связывания в геноме, для белка ZIPIC – около 3061 пиков связывания. Белки Pita и ZIPIC связываются преимущественно с промоторными областями генов.
-
Белки Pita и ZIPIC связываются со значительной долей тех же участков ДНК, что и белок CP190, и участвуют в привлечении белка CP190 на некоторые участки ДНК in vivo.
-
Белки Pita и ZIPIC напрямую связываются со специфичными ДНК-мотивами in vitro.
-
Мотивы связывания белков Pita и ZIPIC обладают энхансер-блокирующей и барьерной активностями в трансгенных конструкциях in vivo.
-
На основании полученных данных можно заключить, что исследованные ДНК-связывающие белки Pita и ZIPIC проявляют инсуляторную активность.
Степень достоверности и апробация результатов работы
Цели, поставленные в работе, достигнуты, результаты приведенных в работе экспериментов грамотно интерпретированы и сделанные в работе выводы обоснованы, их достоверность не вызывает сомнений. Результаты работы были опубликованы в рецензируемых научных журналах и представлены на российских и международных конференциях.
Публикации
Результаты работы были представлены на четырех научных конференциях и опубликованы в двух статьях в рецензируемых научных журналах (см. перечень в разделе «Список работ, опубликованные по теме диссертации»).
Структура и объем работы
Диссертационная работа состоит из введения, обзора литературы, материалов и методов исследования, результатов и их обсуждения, а также выводов и списка литературы. Работа изложена на 121 странице машинописного текста, включая 31 рисунок. Список цитируемых литературных источников включает 162 наименования.
Положения, выносимые на защиту
Энхансеры – регуляторные элементы, расположенные на расстоянии от промотора (до нескольких десятков тысяч пар нуклеотидов) (рисунок 2). Основная функция энхансера – активация транскрипции – осуществляется за счет привлечения специфичных транскрипционных факторов на их сайты связывания. Так как расстояние между промотором и энхансерами может достигать миллионов пар оснований, необходимо образование петли ДНК, сближающей эти регуляторные элементы в пространстве. Энхансер способен активировать промотор независимо от относительной ориентации двух геномных элементов.
Так же как и промоторы, активные энхансеры характеризуются специфичными модификациями гистонов. Основной модификацией является гистон H3, монометилированный по лизину 4 (H3K4Me1).
Активные энхансеры, как и активные промоторы, являются областями открытого хроматина [19].
Один и тот же промотор может активироваться несколькими энхансерами. При этом на разных стадиях развития промотор может находиться под контролем разных энхансеров. Однако контакты между энхансерами и промоторами в разных типах клеток практически не отличаются. Можно заключить, что контакт между энхансером и промотором не является достаточным условием для активации промотора [20].
Энхансеры генов разных типов имеют определенную специфичность по отношению к типу промотора, который они могут активировать. Так, энхансеры генов домашнего хозяйства могут активировать промоторы генов домашнего хозяйства, но не промоторы регулируемых генов. С другой стороны, энхансеры регулируемых генов не могут активировать гены домашнего хозяйства. Кроме того, энхансеры генов разных типов имеют значительные структурные различия. Энхансеры генов домашнего хозяйства расположены в непосредственной близости от промотора, в отличие от регулируемых генов [16].
Несмотря на то, что энхансеры имеют определенную специфичность и не могут активировать любой промотор, различные энхансеры генов определенной группы могут активировать многие промоторы. То есть каждый конкретный энхансер не уникален по отношению к тому гену, который он активирует в геноме [16].
Разные типы клеток могут значительно отличаться по тому, какие энхансеры активны в них. Именно за счет активации энхансером специфичного промотора в определенном типе клеток достигаются различия в наборе мРНК, необходимых для синтеза специфичных белков.
Сайленсеры – это геномные элементы, подавляющие активность определенных генов на некотором расстоянии (рисунок 2). У дрозофилы есть два типа подобных элементов: действующие на небольшом расстоянии от промотора (около 100 п.н.) и способные репрессировать многие промоторы на расстоянии нескольких тысяч пар нуклеотидов [21].
К сайленсерам также относят геномные элементы, связывающие белки группы Polycomb (PRE) [22], которые способны создавать протяженные гетерохроматиновые домены [23,24]. Большая часть регулируемых генов на протяжении значительной части развития организма находится в репрессированном состоянии, но в некоторых тканях эти гены активируются. Именно такую репрессию и осуществляют белки группы Polycomb. Такой переход связан не только со связыванием активаторов, но и со снятием репрессии.
Несмотря на то, что места связывания комплексов Polycomb достаточно небольшие, они создают протяженные домены гетерохроматина. Основным маркером данных доменов является модификация гистона H3K27Me3, которую вносит PRC2-комплекс [24]. Пока не ясно, что привлекает белки группы Polycomb на хроматин. Предполагается, что убиквитинилирование гистона H2A (H2AK119Ub1) может играть роль в привлечении PRC и последующей репрессии [23,25].
Для работы сайленсеру необходимо связывание специальных репрессорных белков. Было предложено несколько механизмов действия репрессоров. По первой модели, репрессор может связываться недалеко от места посадки активатора [26] или конкурировать за один и тот же сайт связывания [27,28]. В этой модели непосредственное взаимодействие между активатором и репрессором препятствует связыванию активатора [12]. Во второй модели, репрессор блокирует связывание основных транскрипционных факторов с промотором за счет поддержания репрессированных структур хроматина с помощью привлечения ферментов модификации гистонов [24]. Третья модель работы репрессоров предполагает нарушение сборки преинициаторного комплекса при связывании репрессора [29].
Область контроля локуса – это группа регуляторных элементов, контролирующая целый локус или кластер генов (рисунок 2) [12]. Область контроля локуса обычно состоит из энхансеров, сайленсеров и инсуляторов, а также может включать в себя структурные элементы (участки, ассоциированные с ядерным матриксом (MAR) или хромосомным скаффолдом (SAR)). Различные регуляторные элементы в составе LCR могут быть активны на разных стадиях развития организма.
Так же как и для отдельных энхансеров и сайленсеров, для работы LCR необходимо привлечение специальных транскрипционных факторов – активаторов или репрессоров.
LCR был впервые найден в -глобиновом локусе человека [30]. Позднее LCR были найдены у многих генов млекопитающих, что говорит о важности подобных элементов для регуляции экспрессии [31–34]. Также подобные элементы были найдены у других млекопитающих [31], у птиц и у рыб [12].
Так как LCR состоит из нескольких регуляторных элементов, которые могут быть активны в разное время, то LCR может содержать несколько сайтов гиперчувствительности к ДНКазе I. Кроме того LCR поддерживает открытый хроматин в хроматиновом домене [35].
Образование контактов между удаленными участками ДНК
CP190 – это кофактор, необходимый для функционирования большинства инсуляторов (рисунок 10, 11). Изначально с помощью генетических скринингов было найдено, что CP190 участвует в работе gypsy-инсулятора вместе с белками Su(Hw) и Mod(mdg4) [9]. Впоследствии было обнаружено, что CP190 взаимодействует с большинством известных инсуляторных белков [10]. Эти взаимодействия подтверждены in vitro и in vivo с помощью различных методов (дрожжевой двугибридной системы, иммунопреципитации, GST-pulldown). Также обнаружено, что на ДНК практически все известные инсуляторные белки колокализуются с CP190 [49,81,91,92]. Также показано, что CP190 связывается с промоторами активных генов [11]. Это согласуется с тем, что значительная часть ДНК-связывающих инсуляторных белков находится на промоторах.
При этом CP190 не взаимодействует с ДНК напрямую, поэтому привлекается на ДНК через взаимодействие с ДНК-связывающими белками [120]. Без CP190 энхансер-блокирующая функция многих инсуляторов снижается [9]. Также без CP190 инсуляторы не могут блокировать распространение гетерохроматиновых доменов H3K27Me3 [11]. CP190 содержит BTB/POZ-домен на N-конце, аспартат-богатый домен (D-домен), центросомный домен (CENT или M-домен), три домена цинковых пальцев C2H2-типа, C-концевой глутамат-богатый домен (E-домен) [119].
Наличие цинковых пальцев не позволяет CP190 напрямую связывать ДНК [9]. Вероятно, в данном случае домены цинковых пальцев участвуют в белок-белковых взаимодействиях [71]. CP190 привлекается на ДНК через взаимодействие с ДНК-связывающими белками. Например, на gypsy-инсулятор CP190 привлекается с помощью белка Su(Hw). При этом, для привлечения на gypsy-, 1A2-, 1A6-инсуляторы необходим BTB-домен белка CP190, но не цинковые пальцы или M-домен. К другим инсуляторам CP190 могут привлекать dCTCF, BEAF-32 и другие белки. На сайты связывания белков CTCF и BEAF-32 CP190 привлекается с помощью D-домена, без участия BTB-домена [119].
Взаимодействие между Mod(mdg4)-67.2 и CP190 нарушается при внесении мутаций в BTB/POZ-домен Mod(mdg4)-67.2 или CP190 [119,121]. При этом CP190 не взаимодействует с GAGA-фактором, вероятно, вследствие отличия BTB/POZ-домена CP190 от аналогичных доменов белков Mod(mdg4)-67.2 и GAF.
Также CP190 является центросома-специфичным белком в течение митоза. Но у мутантов CP190 не обнаружено изменений деления клетки [9,119].
Mod(mdg4) – ген, кодирующий множество изоформ белков с общим N-концевым участком и разными C-концами. При этом разные изоформы Mod(mdg4) образуются с помощью транс-сплайсинга [122,123].
Mod(mdg4)-67.2 (также известен, как E(var)3-93D и Mod(mdg4)-2.2) – это одна из многочисленных изоформ белка Mod(mdg4) массой 67,2 кДа (рисунок 10). Именно эта изоформа участвует в работе Su(Hw)-зависимых инсуляторов [98,99].
На N-конце белка Mod(mdg4)-67.2 находится BTB/POZ-домен, который необходим для олигомеризации. Этот же домен может взаимодействовать с BTB/POZ-доменом GAF) [109]. На C-конце Mod(mdg4)-67.2 расположен кислый домен, негомологичный другим изоформам Mod(mdg4). Этот домен необходим для взаимодействия с Su(Hw) и привлечения белка Mod(mdg4)-67.2 на ДНК [9]. Без этого C-концевого домена белок нефункционален в тестах на инсуляторную активность [108]. В составе Mod(mdg4)-67.2 также присутствует глутамин-богатый домен с неизвестной функцией [109]. При этом белок с делецией глутамин-богатого домена также спасает мутантный фенотип и позволяет фунционировать инсуляторам, связанным с Mod(mdg4)-67.2 [108].
Mod(mdg4)-67.2 напрямую не связывается с ДНК, но этот белок необходим для работы Su(Hw)-зависимых инсуляторов. Su(Hw) и Mod(mdg4)-67.2 колокализуются на многих известных инсуляторах [109] и других точках в геноме [49,81]. Mod(mdg4)-67.2 участвует в сближении удаленных инсуляторов в пространстве и необходим для образования петель [109].
Enhancer of yellow 2 (E(y)2) – небольшой консервативный белок. Его гомологи есть и у дрожжей (Sus1), и у человека (Eny2) [124]. E(y)2 обнаружен как функциональный партнер белка Zeste, эти два белка вместе участвуют в регуляции гена white [125].
Белок E(y)2 представлен единственным доменом из 5 -спиралей. На рисунке 12 представлена структура дрожжевого белка Sus1 – гомолога белка E(y)2 [126]. Внутренняя поверхность белка может взаимодействовать с -спиральными участками других белков так, как это показано на рисунке 12 [126]. Также, возможно, E(y)2 может димеризоваться [45]. Рисунок 12. Структура дрожжевого белка Sus1 (синяя) – гомолога белка E(y)2 – и его взаимодействие с -спиралью белка Sgf11 (коричневая). Структура PDB ID 3KJL [126]. Белок E(y)2 взаимодействует с инсуляторными белками: Su(Hw) [124] и CTCF [45]. Это подтверждено с помощью различных методов in vivo и in vitro (дрожжевая двугибридная система, иммунопреципитация, MBP-pulldown) [45]. В обоих случаях E(y)2 взаимодействует с доменом цинковых пальцев, вероятно, обхватывая его -спираль сходным образом, как это показано на рисунке 12 [45].
E(y)2 неспособен самостоятельно связывать ДНК. За счет взаимодействия белков E(y)2 с CTCF происходит привлечение E(y)2 на некоторые сайты связывания CTCF [45].
E(y)2 необходим для функционирования Su(Hw)-зависимых инсуляторов (1A2 и gypsy) и dCTCF-зависимых инсуляторов [124] [45]. При его инактивации происходит распространение хроматина репрессированного белками группы Polycomb и содержащего модификацию нуклеосом H3K27Me3 [45].
Также E(y)2 необходим для образования контакта между инсуляторами и образования петлевых доменов ДНК [125].
Домен цинковых пальцев C2H2-типа – самый распространенный ДНК-связывающий домен среди эукариот. Типичный домен цинковых пальцев C2H2 состоит из 28-30 аминокислот, образующих -структуру из двух -тяжей и одной -спирали (рисунок 13 из [128]). Несколько аминокислотных остатков -спирали специфично узнают нуклеотиды в большой бороздке ДНК (рисунок 14 из [129]). Атом цинка в C2H2-домене координируется консервативными аминокислотными остатками: двумя цистеинами и двумя гистидинами – отсюда и следует название домена [128]. Остатки цистеина входят в состав характерной последовательности CPXCG [130].
Домены белок-белковых взаимодействий белков дрозофилы
Генетические конструкции, содержащие повторы P-элемента и целевой участок, а также плазмиду, содержащую транспозазу (P25.7wc), инъецировали в пребластодерму эмбрионов линии y1w1118 [151]. Полученных мух скрещивали с мухами линии y1w1118. Наличие конструкций определяли по появлению в потомстве мух с окрашенными глазами.
Для определения хромосомы, на которую произошло встраивание конструкции, трансформанты последовательно скрещивались с линиями y1w1118; SM5 и y1w1118; TM3. 3.8.4 Фенотипический анализ экспрессии генов yellow и miniwhite в трансгенных линиях Для работы использовали модельную систему, описанную ранее [101]. В данной системе используются репортерные гены yellow и miniwhite.
Ген yellow отвечает за окраску тела, крыльев и щетинок мух. Энхансеры, активирующие экспрессию гена yellow в теле и крыльях, расположены в 5-области локуса. Ээнхансеры, активирующие экспрессию гена yellow в щетинках, расположены в интроне гена yellow. Уровень пигментации кутикулярных структур, отражающий степень экспрессии yellow, оценивался визуально у 3-5-дневных самцов, развившихся при 25C. Оценку проводили по 5-балльной шкале, где 1 соответствует отсутствию пигмента (желтый цвет), 5 – уровню пигментации дикого типа (черный цвет).
Ген miniwhite отвечает за окраску глаз. Уровень экспрессии этих генов напрямую коррелирует со степенью пигментации. Пигментацию глаз оценивали в соответствии со следующей шкалой: белые (W) (полная инактивация гена), светло-желтые (pY), желтые (Y), темно-желтые (dY), оранжевые (Or), темно-оранжевые (dOr), коричневые (Br), красные (R) (уровень пигментации дикого типа).
Мух, инъецированных плазмидой, скрещивали с линией y1w1118: F0: y1w1118; K y1w1118 Из потомства F1 отбирали линии, у которых конструкция встроилась в геном. Затем отобранных индивидов еще раз скрещивали с y1w1118. Поколение F2 использовали для дальнейшего анализа. Для индукции сайт-специфической рекомбинации по frt-сайтам мух с конструкцией скрещивали следующим образом: F0: y1w1118; K{w+y+}/+ y1w1118; S2 CyO, FLP, ISA/Sco Личинки второй-третьей стадий подвергались тепловому шоку при температуре 37C в течение 2 часов. F1: y1w1118/ y1w1118; S2 CyO, FLP, ISA/+; K{w+y+}/+ y1w1118 Среди потомков F2 для анализа отбирались мухи с генотипом: y1w1118; K{w+y+ frt} /+ Удаление элемента, расположенного между frt-сайтами в полученной линии мух, подтверждали с помощью ПЦР. Для индукции сайт-специфической рекомбинации по lox-сайтам мух с конструкцией скрещивали следующим образом: F0: y1w1118 K{w+y+} y1w1118; CyO[w+ Cre]/Sco; F1: y1w1118/ y1w1118; CyO[w+ Cre]/+; K{w+y+}/+ y1w1118 Среди потомков F2 для анализа отбирались мухи с генотипом: y1w1118; K{w+y+ lox}/+ Удаление элемента, расположенного между lox-сайтами в полученной линии мух, подтверждали с помощью ПЦР. Определение хромосомы, содержащей копию конструкции, проводили по следующей схеме: F1: y1w1118 K{w+y+} y1w1118; TM3 Если конструкция встроена на вторую хромосому: F2: y1w1118/ y1w1118; TM3/+; K{w+y+}/+ y1w1118; SM5 Среди потомков F3 можно наблюдать мух: y1w1118; SM5/ K{w+y+}; TM3/+ Если конструкция встроена на третью хромосому: F2: y1w1118/ y1w1118; SM5/+; K{w+y+}/+ y1w1118; TM3 На чашки со средой для сбора эмбрионов (0,6% сахар, 25% сок, 2% агар, 1,5% нипагин) наносили суспензию дрожжей. Чашки помещали в специальную камеру с мухами и выдерживали 12 часов. Эмбрионов на чашках хранили при 4C не более 3 суток. С помощью кисти смывали эмбрионов с чашек на сито и промывали водой от дрожжей. Помещали эмбрионов на сите в 3% раствор гипохлорита натрия до полной дехорионизации эмбрионов. Быстро промывали 1 литром промывочного раствора (120мМ NaCl, 0,04% Triton X-100). Промывали дистиллированной водой до удаления остатков раствора гипохлорита натрия и промывочного раствора. Эмбрионов высушивали бумагой и взвешивали.
Поиск мотивов связывания белков проводили с помощью программы MEME-ChIP [154]. Для этого использовали 500 наиболее достоверных пиков (по показателю FDR). Были выбраны последовательности длиной 100 п.н. вокруг максимума пика связывания.
Метод торможения в геле ДНК-белковых комплексов (EMSA – electrophoretic mobility shift assay)
Мы также провели РНК-интерференцию белков Pita, ZIPIC и CP190. Изменение количества мРНК соответствующих белков после РНК-интерференции можно видеть на рисунке 26А. Анализ с помощью western blot-гибридизации также подтвердил снижение количества белков после иммунопреципитации (данные не показаны).
Результаты иммунопреципитации хроматина с антителами к белкам Pita, ZIPIC и CP190 из контрольных S2-клеток и после нокдауна белков Pita, ZIPIC и CP190 приведены на рисунках 26Б и В. Видно, что белки Pita и ZIPIC связываются с выбранными контрольными точками. Белок CP190 также присутствует на данных точках. Однако на некоторых точках, где связывание белка было показано с помощью ChIP-seq, не удалось обнаружить связывание с помощью метода ChIP-qPCR. Мы можем предложить два возможных объяснения данному факту. Во-первых, можно предположить, что способ детекции связывания с помощью секвенирования позволяет наблюдать эффекты непрямого привлечения белков на ДНК, реализующегося не за счет ДНК-белковых взаимодействий, а при взаимодействии с другими белками, например, CP190. Во-вторых, возможно, что некоторые пики в экспериментах ChIP-seq могут быть ложноположительными.
Для того чтобы убедиться, что белки Pita и ZIPIC сопособны связываться с последовательностями обнаруженных пиков напрямую, мы провели эксперименты по изменению подвижности ДНК-белковых комплексов в геле (EMSA), которые описаны ниже. Рисунок 26. Проверка мест связывания белков Pita и ZIPIC с помощью количественной ПЦР. А – изменение количества мРНК белков Pita, ZIPIC и CP190 после обработки дцРНК к генам Pita, ZIPIC и CP190 по сравнению с контролем. Б – иммунопреципитация хроматина с последующей количественной ПЦР (ChIP-qPCR) с антителами к белкам ZIPIC и CP190 при РНК-интерференции белков ZIPIC и CP190. В – ChIP-qPCR с антителами к белкам Pita и CP190 при РНК-интерференции белков Pita и CP190. Для экспериментов ChIP-qPCR на графиках приведено количество ДНК после иммунопреципитации в процентах от input – образца до иммунопреципитации хроматина.
Мы проанализировали несколько пиков связывания белка ZIPIC (57B5 и 60A9R) и белка Pita (60A9L, 100B7 и 100C). Кроме того, мы рассмотрели несколько пиков связывания белка CP190, которые не перекрывались с пиками связывания белков Pita и ZIPIC (Fab-8 и 62D), а также геномные точки Rpl32 и Tub37C в качестве отрицательного контроля.
Для тех участков, где белки Pita и ZIPIC не связывались (Fab-8 и 62D), связывание белка CP190 уменьшалось только при РНК-интерференции CP190, но не белка Pita (рисунок 26В). Это говорит о независимом связывании белка CP190 на данных участках. Возможно, к данным сайтам белок CP190 привлекается с помощью других ДНК-связывающих белков.
Для исследованных пиков связывания белка ZIPIC (57B5 и 60A9R) заметно снижение связывания белка ZIPIC с ДНК при нокдауне ZIPIC, но не CP190 (рисунок 26Б). С другой стороны, связывание белка CP190 снижалось при нокдауне и ZIPIC, и CP190. Это означает, что на исследованные сайты CP190 привлекается через взаимодействие с белком ZIPIC. Связывание белка ZIPIC с данными сайтами не зависит от привлечения CP190.
Для пика связывания белка Pita 100B7 связывание белка Pita не зависит от белка CP190, аналогично исследованным пикам связывания белка ZIPIC (рисунок 26В). Для пиков 60A9L и 100C при РНК-интерференции CP190 уменьшалось связывание белка Pita. При этом для пика 100C при нокдауне белка Pita связывание белка Pita уменьшалось сильнее, чем при нокдауне CP190. Связывание белка CP190 зависело от присутствия белка Pita на всех изученных участках. Можно заключить, что белок Pita может привлекать белок CP190 на некоторые участки ДНК. При этом полученные данные могут свидетельствовать о кооперативном характере привлечения белка Pita на ДНК.
Эти результаты подтверждают наше предположение о том, что CP190 привлекается на некоторые точки генома с помощью белков Pita и ZIPIC.
Белки Pita и ZIPIC содержат кластеры доменов цинковых пальцев (рисунок 20). Это может означать, что эти белки могут связывать ДНК напрямую. Для того чтобы найти последовательности ДНК, с которыми могут связываться белки Pita и ZIPIC, мы провели de novo поиск мотивов связывания белков с помощью программы MEME ChIP [154]. Для анализа мы взяли последовательности длиной 40 пар нуклеотидов вокруг максимума каждого пика связывания.
Для белка Pita мы обнаружили последовательность длиной 17 нуклеотидов (E-value 3,9E-187) (рисунок 27A). Такой мотив находится в 1090 пиков белка Pita (то есть в 36% пиков). Данный мотив интересен тем, что состоит из нескольких частей, разделенных несколькими неспецифичными нуклеотидами. Рисунок 27. Прямое связывание белков Pita и ZIPIC со специфичными последовательностями ДНК in vitro.
А – LOGO мотивов связывания белков Pita и ZIPIC. Б – эксперимент по анализу изменения подвижности ДНК-белковых комплексов в геле (EMSA) белков Pita и ZIPIC с идентифицированными мотивами связывания белков Pita (Px5) и ZIPIC (Zx4). В – EMSA-анализ связывания белка Pita с участками генома, содержащими мотив связывания белка Pita. Г – EMSA-анализ связывания белка ZIPIC с участками генома, содержащими мотив связывания белка ZIPIC. Д – EMSA-анализ связывания белков CTCF и Pita с Mcp-инсулятором дикого типа и с делецией мотивов связывания белков CTCF или Pita. Е – EMSA-анализ связывания белка ZIPIC с двумя вариантами мотива связывания белка ZIPIC (Zx4). Белок Grau использован в качестве отрицательного контроля.
Найденный мотив связывания белка Pita совпадает с мотивом, обогащенным в пиках белка CP190, не перекрывающихся с известными ДНК-связывающими факторами (dCTCF, BEAF-32, GAF или Su(Hw)) [49]. Это может быть связано со значительной колокализацией белков CP190 и Pita.
Для белка ZIPIC мы обнаружили последовательность длиной 11 нуклеотидов (E-value 3E-224) (рисунок 27А). 1147 пиков (41%) белка ZIPIC содержат найденный мотив. Ранее мотив связывания белка ZIPIC был исследован с помощью дрожжевой моногибридной системы [159]. С помощью принципиально иного метода анализа был найден сходный мотив, отличающийся только по одному нуклеотиду в пятом положении.
Мы провели эксперимент по анализу изменения подвижности ДНК-белковых комплексов в геле (EMSA), для того чтобы проверить, связываются ли белки Pita и ZIPIC с найденными последовательностями ДНК напрямую. Во всех экспериментах использовали аффинно очищенные белки, слитые с MBP, экспрессированные в клетках бактерий. Использование чистых белков позволяет судить о прямом взаимодействии белков с последовательностью ДНК без участия дополнительных белков.
Эксперимент проводили с несколькими вариантами последовательностей ДНК. Для первого эксперимента использовали мотив связывания белка Pita, мультиплицированный 5 раз (Px5), и мотив связывания белка ZIPIC, мультиплицированный 4 раза (Zx4). Из рисунка 27Б видно, что каждый фрагмент ДНК связывает только соответствующий белок. Второй белок выступает в качестве отрицательного контроля.