Содержание к диссертации
Введение
Обзор литературы 11
I. Доменная гипотеза организации эукариотического генома 11
II. Подтверждение доменной гипотезы в экспериментах по изучению домена бета-глобиновых генов 19
III. Основные функциональные элементы геномных доменов 31
1. Области контроля локуса различных геномных доменов 31
2. Инсуляторы 33
IV. Геномные домены с размытыми границами 42
1. Что такое геномные домены с размытыми границами? 42
2. Можно ли картировать домен, если тест на предпочтительную чувствительность к ДНКазе I не работает ? 44
3. Регуляция экспрессии генов в доменах с невыраженными границами 46
V. Хроматиновые домены 50
Vi. Домены альфа-глобиновых генов позвоночных 60
1. Хромосомная локализация 60
2. Структура домена 61
3. Пространственная организация домена 65
4. Ген «домашнего хозяйства» 66
5. Организация хроматина 68
Экспериментальная часть материалы и методы
1. Работа с культурами клеток 71
2. Работа с ДНК и РНК 71
3. Гибридизация in situ 80
4. Приготовление олигонуклеотидных матриц 81
5. Связывание in vitro фрагментов ДНК с препаратами ядерного матрикса 82
РЕЗУЛЬТАТЫ
- Подтверждение доменной гипотезы в экспериментах по изучению домена бета-глобиновых генов
- Инсуляторы
- Можно ли картировать домен, если тест на предпочтительную чувствительность к ДНКазе I не работает
- Пространственная организация домена
Введение к работе
Транскрипционная активность эукариотических генов регулируется на нескольких уровнях, в том числе на уровне индивидуальных промоторов и на уровне так называемых геномных доменов, которые правильнее было бы называть хроматиновыми доменами. Принципиальным отличием пространственной организации эукариотического генома является упаковка его в хроматин, которая позволяет значительно сократить линейные размеры ДНК, обеспечивая возможность размещения ее в относительно небольшом (~ 10 мкм в большинстве случаев) клеточном ядре. Было бы, однако, неправильным утверждать, что упаковка ДНК в хроматин обеспечивает лишь сокращение линейных размеров ДНК. На этом уровне работают и специальные регуляторные механизмы, контролирующие транскрипционный статус протяженных областей генома. Более 30 лет назад было продемонстрировано, что транскрипционная активность большинства генов коррелирует с уровнем доступности этих генов для переваривания ДНКазой I и другими нуклеазами. Позднее было продемонстрировано, что предпочтительной чувствительностью к нуклеазам обладают не только собственно транскрибирующиеся гены, но и фланкирующие геномные области, которые могут быть достаточно длинными и включать как транскрибирующиеся, так и нетранскрибирующиеся гены. Такие области и получили название геномных доменов. Мы говорим о том, что более правильно было бы называть эти области хроматиновыми доменами в связи с тем, что транскрипционный статус таких областей-доменов регулируется на уровне изменения характера упаковки ДНК в наднуклеосомные хроматиновые структуры. Имеется в виду, прежде всего 30 нм. хроматиновая фибрилла, которая может разворачиваться в так называемую нуклеосомную нить (структуру типа «бусинок на нити», описание и фотографии которой можно найти во всех современных учебниках по молекулярной биологии). Динамика конформационных изменений 30 нм хроматиновой фибриллы регулируется ацетилированием гистонов.
Четкая связь между геномными доменами (как функциональными единицами генома, находящимися под контролем определенных регуляторных механизмов) и хроматиновыми доменами впервые была продемонстрирована в экспериментах Грудина и соавторов [Forrester et. al., 1990]. Этими авторами было показано, что не затрагивающая собственно глобиновых генов делеция 5'-концевой области кластера бета-глобиновых генов человека приводит к одновременному прекращению транскрипции бета-глобиновых генов и переходу в компактную (устойчивую к ДНКазе I) конфигурацию протяженного хроматинового домена, включающего весь кластер бета-глобиновых генов и фланкирующие последовательности ДНК. Одновременно изменялось и время репликации (тайминг репликации) соответствующей геномной области. Подобно большинству геномных областей, не содержащих активных генов, репликация этой области происходила в конце S-фазы, в то время как активно работающий домен бета-глобиновых генов реплицируется в начале S-фазы. Последующие эксперименты позволили идентифицировать ключевой регуляторный элемент, контролирующий транскрипционный статус домена бета-глобиновых генов [Grosveld et. al., 1987]. С этого времени домен бета-глобиновых генов человека стал классической моделью для изучения механизмов, контролирующих транскрипционный статус протяженных геномных областей на доменном уровне. Со временем к этой модели добавились домены бета-глобиновых генов других позвоночных, домен овальбуминовых генов и гена лизоцима кур, домен гена аполипопротеина В человека. Анализируя все эти исследования в ретроспективе, невольно удивляешься тому, что целый ряд принципиальных заключений, касающихся доменной организации генома был сделан на основе анализа столь малого числа экспериментальных моделей. О каких, собственно, заключениях идет речь? Прежде всего, о том, что домены тканеспецифичиых генов могут находиться в активном, либо неактивном состоянии, что четко коррелирует с чувствительностью (соответственно высокой иди низкой) этих доменов к ДНКазе I. Вторым важным заключением являлось то,
что геномные домены являются изолированными и в определенном смысле самодостаточными единицами генома, что обеспечивается наличием в их составе регуляторных элементов доменного уровня получивших название Областей Контроля Локуса (Locus Control Region, LCR). Ключевым аргументом, подтверждающем это второе утверждение явилась демонстрация того, что полноценные домены либо мини-домены, сконструированные из области контроля локуса и одного или нескольких генов, были способны нормально работать в эктопических геномных позициях, в том числе и в геноме трансгенных животных других видов.
Было бы очень заманчивым представить, что весь геном состоит из более или менее единообразно построенных структурно-функциональных единиц (доменов), работа которых регулируется сходными механизмами. Это, несомненно, могло бы существенно облегчить познание общих принципов работы генома, однако в природе даже для решения сходных задач часто используются совершенно различные пути. Это в полной мере относится и к геномным доменам. Известно, что гемоглобин построен из цепей альфа- и бета- типов. Альфа-глобиновые цепи кодируются альфа-глобиновыми генами, которые организованы в кластер. Этот кластер находится в хроматиновом домене, который резко отличается от тех доменов, которые обсуждались выше. Основной особенностью этого домена является то, что он одинаково чувствителен к ДНКазе в эритроидных и неэритроидных клетках. Иными словами нарушается казавшийся классическим принцип корреляции между транскрипционным статусом гена (генного кластера) и чувствительностью к ДНКазе, а, следовательно, и способом упаковки хроматинового домена. Неясным становится и вопрос о том, что собственно следует считать в данном случае геномным доменом. Ведь при рассмотрении всех упоминавшихся выше модельных систем границы домена определялись по чувствительности к ДНКазе. Тем не менее, существуют веские основания считать, что альфа-глобиновые гены также являются частью протяженного хроматинового домена, транскрипционный статус которого
регулируется особыми механизмами. Мы назвали такие домены доменами открытого типа или доменами с размытыми границами. В настоящей работе будут рассмотрены основные принципы организации и регуляции работы доменов открытого типа на примере домена альфа-глобиновых генов кур. Актуальность работы определяется тем, что домены открытого типа встречаются в геноме достаточно часто, а возможно, составляют большую его часть. Именно по этой причине столь узок был круг экспериментальных моделей, использовавшихся при изучении «классических» доменов, подобных домену бета-глобиновых генов кур. Раскрытие базовых принципов работы доменов открытого типа существенно расширяет наши представления об организации и работе эукариотического генома в целом. Очевидно, что эта информация является принципиально важной и для решения практических задач в области биотехнологии и генной терапии.
ОБЗОР ЛИТЕРАТУРЫ
I. ДОМЕННАЯ ГИПОТЕЗА ОРГАНИЗАЦИИ ЭУКАРИОТИЧЕСКОГО ГЕНОМА.
Хотя о доменах эукариотического генома написано немало экспериментальных и обзорных статей [Goldman, 1988; Razin et. al., 1993; Razin, 1996; Geyer et. al., 1997; Dillon et. al., 2000], термин этот остается неоднозначным. Можно говорить, по меньшей мере, о двух типах доменов: функциональных и структурных. Классическими функциональными доменами являются единицы транскрипции (транскриптоны) и единицы репликации (репликоны). Наиболее четко определенными структурными доменами являются предпочтительно чувствительные к нуклеазам области. Предпочтительная чувствительность к ДНКазе I активных генов была впервые продемонстрирована в работах Вайнтрауба и Грудина [Weintraub et. al., 1976]. Они показали, что в процессе обработки ДНКазой I изолированных ядер клеток из разных тканей, ДНК, кодирующая глобины, преимущественно переваривается в красных кровяных клетках, но не в фибробластах или клетках мозга. В то же время, не транскрибирующиеся в этих типах клеток гены овальбумина были относительно устойчивы к действию ДНКазы. Результаты этих экспериментов позволили предположить, что транскипционно активные и неактивные гены по-разному упакованы в хроматине. В последующих экспериментах других авторов эта точка зрения получила дополнительные подтверждения. Кроме того, было показано, что предпочтительной чувствительностью к ДНКазе I обладают потенциально активные гены. Фактический уровень транскрипции тех или иных генов не коррелировал с чувствительностью к ДНКазе кодирующих последовательностей ДНК. Изучая домен овальбуминовых генов, Гаррел с соавторами показали, что предпочтительная чувствительность к ДНКазе I характерна для протяженного геномного домена, включающего как активные гены, так и нетранскрибирующиеся псевдогены
[Garel et. al., 1976; Garel et. al., 1977]. Мультигенное семейство овальбуминовых генов -классический пример ДНКаза-чувствительного домена, который включает как активные, так и неактивные гены, а именно: два псевдогена (X,Y) и собственно ген овальбумина.
X Y OV
т.п.н.
Рисунок 1. Относительная чувствительность ДНК к расщеплению ДНКазой І в клетках яйцеводов курицы. Домен овальбуминовых генов кур. Положение овальбуминовых генов показано прямоугольниками.
Транскрипция генов происходит под воздействием эстрогена в яйцеводе курицы в пропорции OV:X:Y=100:10:1 [Knoll et. al., 1981]. Лоусон и соавт. [Lawson et. al., 1982] показали, что область, включающая овальбуминовый ген, упомянутые выше псевдогены, спейсерные и фланкирующие последовательности, находится в ДНКаза-чувствительной конфигурации в клетках яйцеводов (Рис.1). ДНКаза-чувствительная область распространяется и далее в 5'-направлении от псевдогена X приблизительно на 20 т.п.н., и на такое же расстояние в 3'-сторону после овальбуминового гена. На границах домена переход к закрытой (нечувствительной к ДНКазе I) области происходит достаточно быстро - на отрезке в 10 т.п.н. Таким образом, полный размер ДНКаза-чувствителыюго домена составляет около 100 т.п.н. Надо сказать, что организация ДНКаза-чувствительного домена связана с клеточной дифферецировкой, а не с транскрипцией
овальбуминового гена. При прекращении гормональной стимуляции транскрипция овальбумина останавливается, но конфигурация домена остается открытой -чувствительной к ДНКазе І. В других тканях (печени, селезенке) весь домен характеризуется относительной устойчивостью к ДНКазе I. Авторы цитированной выше работы предложили модель, связывающую феномен предпочтительной чувствительности к ДНКазе тканеспецифичных генов и клеточную дифференцировку (Рис.2). Они предположили, что в процессе дифференцировки эмбриональных стволовых клеток тканеспецифичные гены в разных типах клеток включаются в состав предпочтительно чувствительных к нуклеазам доменов. В отсутствие дополнительных модуляторов транскрипции эти декомпактизованные домены не транскрибируются. Под воздействием индукторов, таких как гормоны для овальбуминового семейства в клетках яйцевода, гены в домене становятся транскрипциоино активными, а домен продолжает оставаться ДНКаза-чувствительным. В настоящее время схема поэтапной активации генов (сначала на уровне хроматинового домена, а потом на уровне индивидуальных промоторов) является общепризнанной.
Изменение чувствительности к ДНКазе І в зависимости от типа клеточной дифференцировки характерно и для доменов ряда других тканеспецифичных генов. Так, домен гена лизоцима кур характеризуется повышенной чувствительностью к ДНКазе І в клетках макрофагов и относительной резистентностью к ДНКазе в других типах клеток. [Janzen et. al., 1986]. ДНКаза-чувствительная область включает в себя транскрипционную единицу размером 4 т.п.н. и распространяется на 14 т.п.н. в 5'- и на 6 т.п.н. в 3'-направлении. Переход к ДНКаза-устойчивой конфигурации хроматина достаточно постепенный с 5'-стороны и резкий в З'-области, как и в случае доменов генов овальбумина [Lawson et. al., 1982] и GAPDH [Alevy et al., 1984].
ДНКаза І
устойчивая
структура
/
, I» I DUJ1VDDIC MIC I ПП.
дифференцировка \
» (гормоны?) л _ ииі _
ДНКаза І
чувствительные
домены
клеточный тип 1
клеточный тип 2
индукция (гормоны)
транскрипционно неактивный ген транскрипционно активный ген
Рисунок 2. Модель образования чувствительных к ДНКазе I доменов во время клеточной дифференцировки (комментарий в тексте) [Lawson et. al., 1982].
Феномен повышенной чувствительности к ДНКазе I обычно объясняют переходом 30 нм хроматиновой фибриллы в так называемую развернутую структуру типа «бусинок на нити». Постепенное изменение чувствительности на границе может быть связано с тем, что в популяции клеток изменение конформации хроматиновой фибриллы начинается в разных точках в пределах некоторой зоны на молекуле ДНК. Помимо общей повышенной чувствительности к ДНКазе I существуют так называемые участки гиперчувствительности к этому ферменту. Как правило, это свободные от нуклеосом участки, в которых расположены разные регуляторные последовательности. В домене гена лизоцима цыпленка участки гиперчувствительности к ДНКазе I расположены кластерами перед и после транскрипционной единицы, за одним исключением, и все в границах домена. Наличие гиперчувствительных сайтов на достаточном расстоянии от гена, но внутри домена указывает на возможность контроля экспрессии из отдаленных районов. Эта точка
зрения нашла прямое подтверждение в работах Тейсена [Theisen et. al., 1986] и Гревала [Grewal et. al., 1992]: выяснилось, что гиперчувствительный сайт -6.1 т.п.н. проявляет энхансерную активность и является мишенью для связывания ядерного фактора NF1 и некоторых других регуляторных белков.
Домен бета-глобиновых генов кур необычен с точки зрения расположения генов и компактности (Рис.3).
FR ген
CTCF 5'HS4
п LCR
Инсулятор
CTCF 3'HS
ррн(3Ає tit III I
\7
16 т.п.н. конденсированный хроматин
(З/є ORvm энхансер
Рисунок 3. Схематическое изображение домена бета-глобиновых генов кур.
Гены расположены в следующем порядке 5'-р-(Зн-(Зд-є-3'; расположенные в центре гены взрослых животных (Рн и рА) окружены эмбриональным геном р и фетальным геном s [Villeponteau et. al., 1982]. Согласно гипотезе К. Шеррера о том, что АТ-богатые области являются естественными границами геномных доменов, считалось, что домен имеет размер порядка 20 т.п.н. [Moreau et al., 1982], однако более поздние эксперименты Хеббса и соавт. расширили его границы до 33 т.п.н. Также в работе Хеббса было продемонстрировано, что область чувствительности хроматина к ДНКазе I совпадает с областью гиперацетилирования коровых гистонов [Hebbes et al., 1994]. Индивидуальные промоторы регулируют экспрессию каждого бета-глобинового гена при участии
эритроидных и общих транскрипционных факторов: GATA-1, EKLF, NF-E2, Spl и других. Кроме того, в состав домена входит эритроидспецифичный энхансер (13А/е), который расположен между взрослым 6А и эмбриональным є генами [Choi et al., 1986; Hesse et al., 1986]. Энхансер ВА/є является общим для двух генов и содержит сайты связывания различных транс-действующих факторов, специфичных для каждой стадии развития. Конкуренция между этими регуляторными факторами и определяет предпочтительную мишень для действия энхансера [Foley et al., 1992]. Энхансер ВА/є может направлять экспрессию, зависящую от количества копий, репортерного гена у трансгенных мышей [Reitman et al., 1990], но этот энхансер сам по себе не может «открывать» хроматин. В 5'-некодирующей области домена идентифицировано четыре сайта гиперчувствительности к ДНКазе I [Reitman et al., 1993] В домене бета-глобиновых генов три эритроидспецифичньгх гиперчувствительных сайта расположены относительно близко к генам. С 5'-стороны домен отделен от прилегающего хроматина четвертым сайтом гиперчувствительности, который содержит CTCF-зависимый инсулятор и определяет границы домена [Reitman et al., 1990; Chung et al., 1993; Bell et al., 1999]. Еще один участок гиперчувствительности к ДНказе I колокализуется с ВА/є энхансером. В 3'-концевой области домена бета-глобиновых генов не обнаружено никаких регуляторных элементов. З'-граница домена отмечена, по-видимому, сайтом гиперчувствительности, расположенным на расстоянии 3 т.п.н. после эмбрионального гена. В этом участке гиперчувствительности к ДНКазе I располагается CTCF-зависимый инсулятор. Любопытно, что этот инсулятор обладает способностью блокировать активность энхансеров, но не защищает трансгены от позиционных эффектов [Saiton et al., 2000]. Таким образом, весь домен бета-глобиновых генов кур расположен между двумя инсуляторами. Перед доменом располагается область конденсированного хроматина, протяженность которой (на молекуле ДНК) составляет 16 т.п.н. [Prioleau et al., 1999; Litt et
al, 2001]. Далее следует ген фолатного рецептора. С З'-стороны к домену бета-глобиновых генов примыкает кластер генов обонятельных рецепторов.
Можно привести и другие примеры доменов тканеспецифичных генов, обладающих повышенной чувствительностью к ДНКазе в тех типах клеток, где соответствующие гены экспрессируются. Это домены гена глицеральдегид-3-фосфат-дегидрогеназы (GAPDH) [Alevy et al., 1984], аполипопротеина В человека [Levy-Wilson et al., 1989], вителлогенина [Tata et al., 1980], протамина [Levy-Wilson et al., 1980 ], инсулина [Wu et al., 1981], домены бета-глобиновых генов млекопитающих [Stalder et. al., 1980; Tuan et. al., 1985; Forrester et. al., 1986]. Все перечисленные домены являются достаточно протяженными (более 100 т.п.н. в случае домена овальбуминовых генов кур) и характеризуются предпочтительной чувствительностью к ДНКазе только в определенных типах клеток. Они могут включать один или несколько (часто функционально сцепленных) генов и межгенные пространства. Границы ДНКаза-чувствительных доменов являются достаточно четкими. Переход от ДНКаза-чувствительной области к области, характеризующейся относительной устойчивостью к ДНКазе, происходит в пределах фрагмента ДНК протяженностью в несколько т.п.н. Это позволяет предположить, что существуют некие специальные элементы генома и соответствующие им структуры хроматина, которые являются границами ДНКаза-чувствительных доменов. Разумеется, ДНКаза-чувствительные домены не являются единственным типом структурных доменов хроматина. Существуют еще закрепленные на ядерном матриксе петли ДНК, имеющие размеры, сопоставимые со средними размерами ДНКаза-чувствительных доменов [Razin et. al., 1996] и существенно более протяженные домены - "изохоры", характеризующиеся относительным постоянством нуклеотидного состава ДНК [Bernardi, 2000].
ДНКаза-чувствительные домены генома привлекли особое внимание исследователей, прежде всего потому, что очевидна была определенная зависимость между статусом этих доменов и транскрипционной активностью соответствующих генов.
Механизм этой зависимости долгое время оставался неясным. Серия недавно проведенных исследований позволяет предложить, что переход геномного домена в открытую (чувствительную к ДНКазе) конфигурацию связан с ацетилированием гистонов [Davie, 1996].
Можно говорить о том, что чувствительные к ДНКазе I домены хроматина являются некими структурно-функциональными блоками генома, которые могут находиться в активном либо неактивном состоянии в зависимости от типа клеток, или, иными словами, в зависимости от неких дополнительных сигналов. Это положение составляет основу так называемой доменной гипотезы структурно-функциональной организации эукариотического генома [Bodnar, 1988; Goldman, 1988]. Данная гипотеза приобрела особую привлекательность после того, как были обнаружены так называемые области контроля локуса (LCRs), которые, как следовало из результатов первоначальных экспериментов, осуществляют контроль над всеми параметрами (характер ацетилирования гистонов, транскрипционный статус и время репликации) протяженных доменов генома [Grosveld et. al., 1987; Forrester et. al., 1990].
II. ПОДТВЕРЖДЕНИЕ ДОМЕННОЙ ГИПОТЕЗЫ В ЭКСПЕРИМЕНТАХ ПО ИЗУЧЕНИЮ ДОМЕНА БЕТА-ГЛОБИНОВЫХ ГЕНОВ.
Домен бета-глобиновых генов человека расположен в GC-бедной области (изохоре) 11-й хромосомы. Для подобных бедных генами и поздно реплицирующихся областей характерны высокая степень упаковки хроматина и множественность контактов с ядерным матриксом [Hardison et al., 1998; Craddock et al., 1995]. Домен бета-глобиновых генов, размером около 100 т.п.н., включает эмбриональный ген - є, два фетальных гена -Gy и Ау и два взрослых гена - 8 и р (Рис.4). Все эти гены транскрибируются в одном направлении. Порядок генов в домене соответствует времени их активации в процессе развития. В эритроидных клетках взрослого человека экспрессируются только 5 и |3 гены. При изучении домена бета-глобиновых генов человека была обнаружена первая, и в известном смысле «классическая» область контроля локуса (рис.4). Областью контроля локуса - LCR (locus control region) принято называть регуляторный элемент, контролирующий транскрипционный статус одного или группы генов на уровне геномного домена. В экспериментах для идентификации области контроля локуса часто используют тест на обеспечение независимого от позиции интеграции уровня экспрессии трансгенов (смотри ниже). Первые свидетельства существования области контроля локуса домена бета-глобиновых генов человека были получены при изучении делеций, приводящих к талассемиям (заболеваниям, связанным с нарушением экспрессии глобиновых генов). Анализ характера геномных нарушений при разных формах талассемии показал, что участки ДНК, расположенные на расстоянии более 5 т.п.н. перед кластером бета-глобиновых генов человека, необходимы для нормальной экспрессии этих генов [Kiossis et. al., 1983; Curtin et. al., 1985].
HSS-6.1 - -21.5
GY Ay
D
Ют.п.н.
I 1
5 p
эмбриональный фетальные взрослые
Ранореплицирующийся. ДНКазочувствнтельнын. транскрнпцнонно активный
Испанская деления
п.
G/ Ау
8 р
эмбриональный фетальные взрослые
Позднореплицирующийся. ДНКазоустойчивый. транскрнпцнонно неактивный
HSS-6.1- -21.5
Ют.п.н.,
Опыты на трансгенных Nu>miax
І1Ш п
V/////////////A
\
Строение мини-домена
Gy Ay
п
8 р
п п
шгшш
1 Ю II
-I 1
число копий
Рисунок 4. А - Идентификация области контроля локуса домена бета-глобиновых генов человека. Схема нормального бета-глобинового локуса человека и локуса, поврежденного Испанской делецией. Гены обозначены белыми прямоугольниками. Стрелками показаны позиции ДНКаза I гиперчувствительных сайтов (HSS)l-5. Пунктиром обозначена область распространения Испанской делеции [Grosveld et. al., 1987; Forrester et. al., 1990]. Б. Демонстрация активности области контроля локуса из домена бета-глобиновых генов человека.в экспериментах с трансгенными мышами [Grosveld et. al., 1987]: схема конструирования мини-домена (слева); анализ экспрессии трансгена - зависимость уровня синтеза р-глобиновой мРНК от количества копий интегрированного конструкта (справа).
В независимых экспериментах было установлено, что на расстоянии 6-22 т.п.н. перед кластером бета-глобиновых генов человека находится блок участков гиперчувствительности к ДНКазе I, включающий четыре эритроидспецифичных и один перманентный участок [Forrester et. al., 1986; Tuan et. al., 1985]. Как уже говорилось, участки гиперчувствительности к ДНКазе І в хроматине, как правило, обозначают положение различных регуляторных последовательностей в ДНК. Были обнаружены делении 5'-концевой области домена, не затрагивающие собственно глобиновые гены и их промоторы, но приводящие, тем не менее, к развитию талассемий. В данном случае делеции и другие геномные перестройки, приводящие к талассемиям, всегда затрагивали блок участков гиперчувствительности к ДНКазе I. Наиболее короткая из известных делеций такого типа, так называемая Испанская делеция (приводящая к у8|3-талассемии), содержит четыре участка гиперчувствительности и 25 т.п.н. перед ними (рис.5А). В эритроидных клетках, с Испанской делецией, домен бета-глобиновых генов находится в транскрипционно неактивном состоянии, является устойчивым к действию ДНКазы и позднореплицирующимся, в то время как в нормальных эритроидных клетках он активно транскрибируется и реплицируется в начале S-фазы [Forrester et. al., 1990].
Это позволило предположить, что блок участков гиперчувствительности к ДНКазе I, находящийся на расстоянии 6-22 т.п.н. перед кластером бета-глобиновых генов человека, является особым регуляторным элементом, который контролирует транскрипционный статус протяженного геномного домена на уровне упаковки этого домена в хроматин. Этот регуляторный элемент был назван областью контроля локуса (LCR).
Ключевые опыты, подтверждающие эту точку зрения, были сделаны на трансгенных мышах. В лаборатории Гросвельда было продемонстрировано, что фрагмент ДНК домена бета-глобиновых генов человека, содержащий четыре гиперчувствительных сайта (5'HSS 2-5, рис.5Б), будучи помещен перед всем кластером бета-глобиновых генов или перед одним из генов, обеспечивает высокий и не зависящий от места интеграции уровень
экспрессии этих генов в эритроидных клетках трансгенных мышей [Grossveld et. al., 1987; Dillon et. al., 1993]. Практически сразу после этого было показано, что LCR домена бета-глобиновых генов человека работает аналогичным образом и в отношении других трансгенов, поставленных под его контроль [van Assendelft et. al., 1989; Talbot et. al., 1989].
В течение многих лет изучение организации и функциональной активности LCR было возможно лишь в модельных опытах на трансгенных мышах. Однако любая модельная система позволяет лишь частично воспроизвести реальную ситуацию. Существенным недостатком первых опытов по интеграции полного или частично делетированного локуса бета-гл оби новых генов в геном трансгенных мышей была множественная интеграция конструкций. При микроинъекции конструкций в пронуклеус яйцеклетки, как правило, наблюдается тандемная интеграция значительного числа копий конструкции в одно и то же место генома [Henikoff, 1998]. Понятно, что в таком искусственно возникшем «ампликоне» возможно взаимное влияние регуляторных элементов, расположенных в повторяющихся блоках. Использование фаговых [Ramires-Solis et. al., 1995] и дрожжевых [Schlake et. al., 1994] систем сайт-специфической рекомбинации позволило получать трансгенных животных, геном которых содержит только одну копию генной конструкции [Tanimoto et. al., 1999]. Хотя такая модель более совершенна, однако и она не полностью отражает условия работы LCR в нормальной геномной позиции. Сейчас все более очевидно, что макроокружение и пространственная организация тех или иных геномных элементов в ядре эукариотической клетки заметно влияют на их работу [Francastel et. al., 2000]. В связи с этим чрезвычайно важен детальный анализ функциональной активности LCR и его отдельных блоков в нормальной геномной позиции.
Первый опыт такого рода поставила, в сущности, сама природа. В данном случае имеется в виду Испанская делеция и различные талассемии. Развитие техники направленных делеций (knock-out) позволило охарактеризовать результаты удаления
отдельных блоков либо всего LCR из хромосомы. Понятно, что в случае с LCR человека опыты такого рода возможны лишь на культурах клеток. Результаты экспериментов по направленным делениям различных элементов LCR оказались довольно неожиданными. Как и предполагалось, делении протяженных участков бета-глобинового LCR на человеческой хромосоме приводили к подавлению экспрессии глобиновых генов. Но в противоположность предположениям, базирующимся на изучении клеток с Испанской делецией, домен оставался чувствительным к ДНКазе и ранореплицирующимся. После удаления LCR сохранялось гиперацетилирование гистонов, характерное для активного хроматинового домена.
На основе этих экспериментов были сделаны выводы о том, что LCR не является необходимым для поддержания активной конфигурации бета-глобинового домена. Поскольку данные эксперименты были выполнены на культурах клеток, существовала вероятность того, что функция LCR является существенной на некоторых стадиях эмбрионального развития. Однако, вероятность подобного факта была исключена при изучении мышей, содержащих делеции в эндогенном бета-глоби новом LCR. Направленные делеции некоторых внутренних элементов мышиного бета-глобинового LCR практически не сказывались экспрессии бета-глобиновых генов, а делеции некоторых из 5'-гиперчувствительных сайтов приводили к снижению уровня транскрипции не более чем на 20%. Делеция большей части мышиного LCR приводила к резкому снижению уровня транскрипции бета-глобиновых генов, как в культурах клеток, так и у трансгенных мышей. Однако, в отличие от сходной делеции у человека, транскрипция не была полностью подавлена в отсутствие LCR. Домен оставался ДНКаза-чувствительным и обнаруживал гиперацетилирование гистонов НЗ и Н4 на всем своем протяжении. Кроме того, был сохранен правильный порядок включения бета-глобиновых генов в процессе развития. В соответствии с результатами этих исследований, делеция 5' HSS 1-4 у мышей также вызывала бета-талассемический фенотип с низким уровнем
экспрессии взрослых бета-глобиновых генов в мутантной аллели гетерозиготных мышиных особей. При низком уровне экспрессии в мутантной аллели нормальный уровень экспрессии наблюдался только в 1-3% эритроидных клеток, так как аллель была инактивирована в большей части клеток. Однако хроматиновая структура локуса еще не была подвержена изменениям в результате этой мутации.
Исходя из этих данных, было сделано заключение о том, что у мыши LCR не является необходимым ни для поддержания активной конформации домена бета-глобиновых генов, ни для обеспечения правильного порядка экспрессии этих генов в ходе развития [Bender et. al., 2000].
Все модели, предложенные для объяснения действия областей контроля локуса, фактически были разработаны для того, чтобы объяснить механизмы действия «классических» бета-глобиновых областей контроля локуса доменов млекопитающих и птиц. Гросвельд предположил, что для активации экспрессии какого-либо гена в домене бета-глобиновых генов, LCR должен непосредственно взаимодействовать с промотором соответствующего гена [Dillon et. al, 1997; Wijgerd et. al., 1995]. Это взаимодействие могло быть реализовано посредством выпетливания фрагмента ДНК, разделяющего LCR и промотор данного гена [Bulger et. al., 1999]. Со статистической точки зрения, возможность подобного взаимодействия возрастает при уменьшении расстояния между LCR и промотором. Следовательно, гены, расположенные ближе к LCR должны были иметь преимущество перед генами, расположенными дальше. В этом смысле может оказаться важным то обстоятельство, что бета-глобиновые гены млекопитающих расположены в порядке их активации в процессе развития [Peterson et. al., 1993].
У трансгенных мышей, несущих единственную копию кластера бета-глобиновых генов человека, эмбриональный ген є, расположенный ближе всего к LCR, наиболее сильно экспрессируется в желточном мешке, тогда как взрослый глобиновый ген (3 на этой стадии не экспрессируется. Противоположный характер экспрессии (активная экспрессия
взрослого гена Р в желточном мешке и отсутствие экспрессии гена е) наблюдался в результате экспериментально индуцированной инверсии кластера бета-глобиновых генов, при которой ген Р был перемещен на ближнюю позицию к LCR, а ген s на наиболее отдаленную позицию [Tanimoto et. al., 1999]. Другие эксперименты также подтвердили предпочтительную экспрессию гена, наиболее близко расположенного к LCR [Dillon et. al., 1997]. Вторым важным аргументом в пользу «конкурентной» модели действия LCR является то, что только один из пяти бета-глобиновых генов может экспрессироваться на одной хромосоме в данный момент времени. Действительно, если LCR, находящийся на хромосоме, взаимодействует с промотором для инициации транскрипции, то одновременная инициация транскрипции на нескольких LCR-зависимых промоторах невозможна, что и было продемонстрировано экспериментально. Прямое взаимодействие промотора и LCR было названо «flip-flop» механизмом [Gribnau et. al., 1998; Trimborn et. al., 1999].
Хотя «конкурентная» модель и объясняет, почему эмбриональный глобиновый ген є начинает экспрессироваться первым в ходе развития, она не может объяснить механизм переключения экспрессии глобиновых генов, равно как и полное отсутствие экспрессии «взрослых» глобиновых генов человека на эмбриональной стадии развития. Действительно, домен бета-глобиновых генов находится в открытой конфигурации на протяжении эритроидного развития, а экспрессия гена s, который занимает наиболее близкую позицию по отношению к LCR, ограничена эмбриональной стадией. Следовательно, должен существовать особый механизм, предотвращающий экспрессию этого гена в эритроидных клетках взрослого организма. Более того, у человека взрослые бета-глобиновые гены не экспрессируются в желточном мешке даже на низком уровне, хотя «конкурентная» модель подразумевает, что все гены должны экспрессироваться, хотя и на разных уровнях. По-видимому, это имеет место у мышей, включение генов которых
происходит в относительно небольшой промежуток времени, вследствие того, что у них короткие эмбриональная и фетальная стадии.
У человека экспрессия взрослых бета-глобиновых генов вероятно, сильно подавляется на эмбриональной стадии посредством механизма, отличного от простой конкуренции промоторов за LCR. Этот механизм может функционировать на уровне разделения кластера бета-глобиновых генов человека на «эмбрионально-фетальный» и «взрослый» субдомены [Gribnau et. al., 2000], о чем будет сказано ниже.
Стоит обратить особое внимание на то, что в «конкурентной» модели работы LCR промоторы индивидуальных генов рассматриваются как часть регуляторной системы доменного уровня. Для эффективного взаимодействия с LCR или, возможно, с белковым «холокомплексом», связанным с ним, белковые комплексы, связанные с промотором, должны иметь определенный уровень пространственной комплементарное с LCR-связывающим «холокомплексом» [Amrolia et. al., 1998; Bulger et. al., 2002; Langdon et. al., 1998; Sawado et. al., 2001]. В соответствии с вышеизложенным, можно сказать, что взаимодействие между LCR и эритроидспецифичиыми промоторами бета-глобиновых генов является существенным для функционирования регуляторных систем домена бета-глобиновых генов.
Вторая группа моделей, объясняющая механизм действия LCR постулирует, что LCR является местом сборки некоего активаторного комплекса, сигнал от которого потом распространяется в сторону промоторов. В этой связи важным представляется то, что для всех областей контроля локуса характерна высокая концентрация сайтов связывания транскрипционных факторов [Goodwin et. al, 2001; Hardison et. al., 1997].
Связавшись с LCR, транскрипционные факторы могут привлекать комплексы ремоделирования хроматина и ацетилирования гистонов. Действительно, было показано, что эритроидный Krueppel-like фактор (EKLF), который может связываться с G-T последовательностью в HSS 3 LCR и САССС-последовательностью в промоторе
Р-глобинового гена [Tewari et. al., 1998; Wijgerde et. al., 1996], формирует комплексы с факторами ремоделирования хроматина SWI/SNF [Armstrong et. al., 1998]. Кроме того, было показано, что GATA-1, EKLF и NF-E2 взаимодействуют с гистонацетилтрансферазами [Zhang et. al., 1998]. Можно предположить, что гистонацетилтрансферазы и комплексы ремоделирования хроматина, имеющие сродство к LCR, в конечном итоге активируют соседние хроматиновые участки [Bresnick et. al., 1997; Elefant et. al., 2000; Forsberg et. al., 1999]. Однако это предположение не может объяснить активации удаленных промоторов, т.е. прогрессивного распространения активирующего сигнала. Поэтому было выдвинуто предположение о том, что транскрипция инициируется в LCR. Продолжаясь в направлении глобиновых генов, она обеспечивает активацию домена [Ashe et. al., 1997; Jonson et. al., 2003]. Известно, что элонгирующая PHK-полимераза, продвигаясь вдоль организованной в хроматин молекулы ДНК, перемещает вместе с собой сложный комплекс ферментов, обеспечивающий возможность так называемой «транскрипции через нуклеосомы». К числу этих ферментов относятся гистонацетилазы и факторы ремоделирования хроматина [Cho et. al., 1998; Wilson et. al., 1996; Wittschieben et. al., 1999]. Таким образом, низкоуровневая транскрипция может быть необходима для активации хроматинового домена [Travers, 1999]. В случае доменов бета-глобиновых генов эта гипотеза подтверждается рядом экспериментальных данных, свидетельствующих о том, что как сам LCR, так и межгенные области домена бета-глобиновых генов транскрибируются в эритроидных клетках [Kong et. al., 1997; Plant et. al., 2001]. Интересно, что полнодоменные транскрипты были обнаружены и в домене альфа-глобиновых генов кур [Broders et. al., 1990].
Строго говоря, упомянутая выше гипотеза Траверса может рассматриваться как развитие «сканирующей модели» работы LCR [Herendeen et. al., 1992; Tuan et. al., 1992]. Эта модель предполагает, что LCR служит местом сборки активаторного комплекса, сигнал от которого неким образом распространяется в сторону промоторов глобиновых
генов. Траверс предложил конкретный механизм распространения активирующего сигнала. Подобно «flip-flop» модели сканирующая модель может объяснить важность порядка расположения в домене генов, работа которых находится под контролем LCR. Предпочтительно транскрибируется первый ген, с которым сталкивается на своем пути от LCR РНК-полимераза II. Но и эта модель не объясняет, каким образом осуществляется переключение работы глобиновых генов в ходе развития. Для инактивации эмбриональных генов в клетках взрослого организма должен существовать дополнительный механизм. Следовательно, «сканирующая» модель не полностью соответствует экспериментальным данным, по крайней мере, не в случае домена бета-глобиновых генов. Однако активация хроматиновых доменов посредством LCR в эктопических сайтах может происходить с помощью вышеописанного механизма. Смысл заключается в том, что функцией LCR является доставка транскрипционных факторов к нужному сайту. Это становится возможным вследствие высокой концентрации сайтов связывания для большого количества факторов (в пределах LCR). Важное значение высокой концентрации участков узнавания транскрипционных факторов в области LCR подтверждается двумя группами экспериментальных данных. Во-первых, было показано, что функция частично поврежденного LCR в эктопической прецентромерной позиции может быть компенсирована посредством суперэкспрессии таких транскрипционных факторов как EKLF или Spl [Grosveld, 1999; McMorrow et. al., 2000]. Во-вторых, конструкции, содержащие единственный участок гиперчувствительности (HSS 2), примыкающий к репортерному гену, обеспечивает позиционно-независимую экспрессию этого гена в эктопических сайтах, но только в случае множественной интеграции, то есть когда имеет место высокая локальная концентрация сайтов связывания транскрипционных факторов. Косвенно эта гипотеза подтверждается и тем фактом, что не было обнаружено ни одного особого транскрипционного фактора, связывающегося исключительно с LCR. Таким образом, нет оснований предполагать, что механизм работы
этого регуляторного элемента должен принципиально отличаться от механизма работы обычного энхансера или тканеспецифичного энхансерно-промоторного блока.
Как уже было сказано ранее, бета-глобиновый локус млекопитающих может быть разделен на субдомены, регулируемые в процессе развития. На основе чувствительности к ДНКазе І в бета-глобиновом локусе человека можно выделить минимум три субдомена: LCR-субдомен, эмбрионально-фетальный и взрослый субдомены. LCR-субдомен находится в чувствительной к ДНКазе I хроматиновой конфигурации на протяжении всех эритроидных стадий развития, в то время как эмбрионально-фетальный и взрослый субдомены обнаруживают повышенную чувствительность к ДНКазе I только на эмбриональной, фетальной и взрослой стадиях соответственно. Примечательно то, что повышенная чувствительность к ДНКазе этих субдоменов коррелирует с появлением межгенных транскриптов, которые могут быть необходимы для активации субдоменов в соответствии с гипотезой Траверса. Лучшим подтверждением этого предположения является то, что делеция, которая включает сайт начала транскрипции межгенного транскрипта взрослого субдомена, приводит к исчезновению межгенной транскрипции и повышенной чувствительности к ДНКазе всего субдомена, равно как и к прекращению транскрипции находящихся внутри этого субдомена глобиновых генов [Gribnau et. al., 2000]. Таким образом, есть веские основания полагать, что «межгенная» транскрипция действительно нужна для «открывания» хроматинового домена [Engel et. al., 2000]. В соответствии с обсуждаемой моделью, транскрипция и открытая конформация LCR необходимы на всех стадиях развития для взаимодействия между LCR и эмбрионально-фетальным или взрослым субдоменами в течение определенной стадии, когда этот субдомен транскрибируется.
В дополнение к хроматиновым субдоменам, выделенным на основе чувствительности к ДНКазе, в бета-глобиновых локусах можно обнаружить различия в уровнях ацетилирования гистонов [Forsberg et. al., 2000; Forsberg et. al., 2001]. При этом
области гиперацетилирования фактически колокализуются с областями предпочтительной чувствительности к ДНКазе I. При Испанской делеции уровень ацетилирования гистонов в домене бета-глобиновых генов резко снижается. Напротив, повышается уровень метилирования гистонов по ряду специфических позиций (например, К9 в гистоне НЗ), что приводит к переходу домена в более компактную конфигурацию.
III. ОСНОВНЫЕ ФУНКЦИОНАЛЬНЫЕ ЭЛЕМЕНТЫ ГЕНОМНЫХ ДОМЕНОВ.
1. Области контроля локуса различных геномных доменов.
Идентификация и характеристика LCR домена бета-глоби новых генов человека стимулировали поиск аналогичных регуляторных элементов в других геномных областях. При этом внимание, прежде всего, обращали на способность анализируемых регуляторных последовательностей обеспечивать высокий, не зависящий от позиции интеграции и специфичный в отношении типа ткани уровень экспрессии поставленных под их контроль трансгенов. Действительно влияние LCR домена бета-глобиновых генов человека на характер экспрессии находящихся под его контролем генов в нормальной хромосомной позиции было обнаружено, можно сказать, случайно при анализе делеций, приводящих к наследственным заболеваниям. Количество экспериментальных систем, позволяющих реализовать подобный экспериментальный подход, крайне ограничено. По понятным причинам исследователи обратили внимание на домены альфа-глобиновых генов человека и других млекопитающих. В геноме человека и мыши удалось обнаружить обладающий определенными свойствами LCR регуляторный элемент, расположенный на расстоянии 40 (у человека) и 26 (у мыши) т.п.н. перед эмбриональным глобиновым геном а-типа [Higgs et. al., 1990; Jarman et. al., 1991; Sharpe et. al., 1992; Gourdon et al., 1995]. Сходство этого регуляторного элемента с LCR домена бета-глобиновых генов является далеко не полным. Вообще говоря, несмотря на очевидную функциональную взаимосвязь, домены альфа- и бета-глобиновых генов позвоночных организованы весьма различно. Достаточно упомянуть о том, что домены альфа-глобиновых генов постоянно находятся в открытой (ДНКаза-чувствительной) копформации во всех типах клеток [Craddock et al., 1995]. Более подробно вопрос обсуждается в недавно опубликованном обзоре [Recillas-Targa et. al., 2001]. Регуляторные элементы, которые можно квалифицировать, как LCR на
основании их способности обеспечивать высокий, специфичный в отношении типа клеток и не зависящий от позиции интеграции уровень экспрессии трансгенов, были идентифицированы в З'-концевой области локуса гена CD2 человека [Greaves et. al., 1989], домене гена аденозиндезаминазы (ADA) человека [Ess et. al. 1995], а/5-локусе Т-клеточного рецептора мыши [Diaz et. al., 1994], локусе металлотионеиновых генов мыши [Palmiter et. al., 1993], домене гена тирозиназы мыши [Porter et. al., 1994] и некоторых других геномных доменах. Во всех перечисленных случаях подобные LCR регуляторные элементы были локализованы в относительно коротких фрагментах ДНК, расположенных в 5'-концевых, либо З'-концевых областях изучаемых геномных доменов. В то же время в некоторых геномных доменах, которые мы упоминали ранее в качестве классических примеров доменов, характеризующихся предпочтительной чувствительностью к ДНКазе I, LCR обнаружить не удалось. Таковым является, в частности, домен гена лизоцима кур. Подробные исследования продемонстрировали, что домен в целом несет в себе все необходимые регуляторные элементы, которые обеспечивают высокий и не зависящий от позиции интеграции уровень экспрессии куриного лизоцима в соответствующих тканях трансгенных мышей. В то же время ни одна из известных регуляторных областей домена, равно как и всевозможные их комбинации не обладали ожидаемыми свойствами LCR [Bonifer et al., 1996]. В данном случае можно, по-видимому, говорить о принципиально отличной организации области контроля локуса. Область контроля локуса такого типа можно назвать «делокализованной». Делокализованный LCR существует, по-видимому, и в домене альфа-лактальбуминового гена человека [Fujivara et. al., 1999]. До сих пор усилия большинства исследователей были направлены на идентификацию локализованных LCR, подобных LCR домена бета-глобиновых генов. Учитывая тот факт, что LCR такого типа было обнаружено достаточно мало, можно предположить, что делокализованные LCR встречаются гораздо чаще, чем локализованные LCR.
2. Инсуляторы.
Современные представления об организации геномных доменов в значительной мере базируются на результатах изучения нескольких конкретных моделей, таких как домены Р-глобиновых генов позвоночных, локус гена лизоцима кур, локус генов теплового шока дрозофилы, домен гена аполипопротеина В человека и т.д. Помимо сложного комплекса позитивных регуляторных элементов многие из этих доменов имеют специальные пограничные элементы - инсуляторы, ограничивающие влияние на домен регуляторных элементов и хроматиновых структур, находящихся за его пределами. Инсуляторы обладают двумя функциональными активностями: способностью ограничивать распространение гетерохроматина (barrier activity) и способностью ограничивать действие цис-регуляторных элементов (enhancer blocking activity). Классическим тестом, позволяющим продемонстрировать наличие второго из перечисленных эффектов, получившим название эффекта инсуляции, является помещение изучаемого регуляторного элемента между энхансером и промотором. Инсулятор полностью блокирует активность энхансера в отношении промотора, расположенного за инсулятором, не оказывая прямого негативного влияния на работу самого по себе промотора или энхансера. Инсуляторы впервые были обнаружены в локусе гена hsp 70 Drosophila melanogaster. Этот локус, содержащий две копии противоположно ориентированных генов теплового шока, разделенных участком ДНК, был выбран для исследований, так как гены экспрессировались независимо от окружающего хроматина и, следовательно, на границе локуса должны были существовать структуры, отделяющие его от других доменов и обеспечивающие независимость экспрессии. Сначала было продемонстрировано, что локус фланкирован с обеих сторон участками гиперчувствительности к ДНКазе I. Они получили названия SCS и SCS' (specialized chromatin structure). В серии экспериментов,
проведенных в лаборатории Шедла, было показано, что SCS и SCS' элементы блокируют действие энхансера на промотор и, кроме того, способны изолировать ген от эффекта положения, то есть от воздействия окружающего хроматина, как активирующего, так и репрессирующего [Kellum et. al., 1991, 1992].
Почти в то же время в регуляторной области ретротранспозона дрозофилы gypsy был обнаружен su (Hw) - инсулятор [Geyer et. al., 1992]. Первым охарактеризованным инсулятором позвоночных животных стал инсулятор домена бета-глобиновых генов кур [Chung et al., 1993]. Этот инсулятор находится на границе области контроля локуса домена - 5' HS 4 (см. Рис.3 на стр.15) и обладает как активностью блокирующего энхансеры элемента, так и активностью пограничного элемента (Рис 5).
Конденсированный Конденсированный
хроматин хроматин
Рисунок 5. Схема, иллюстрирующая две активности инсулятора: активность энхансер-блокирующего элемента (А) и барьерную активность (Б).
С целью картирования минимального инсуляторного элемента и областей, ответственных за обе активности был проведен делеционный анализ инсулятора. Параллельно, с использованием техники фут-принтинга были картированы сайты связывания белков в границах инсулятора [Bell et.al., 1999; Chung et. al., 1997]. Было показано, что минимальный фрагмент ДНК, обладающий обеими инсуляторными активностями, имеет протяженность 250 п.н. В границах этого фрагмента было выявлено пять сайтов связывания белковых факторов (футпринты I-V; сокращенно - FI - FV) [Chung et. al., 1997]. При последующем анализе было продемонстрировано, что 90 п.н. фрагмент ДНК, содержащий сайты связывания FII и Fill, представляет собой минимальный элемент, блокирующий энхансер, с максимумом активности в сайте FII. Оказалось, что в этой области с ДНК связывается белковый фактор CTCF, который ранее был идентифицирован, как один из белков, регулирующих активность гена с-тус. Это большой ДНК-связывающий белок, в составе которого присутствуют 13 цинковых пальцев. Этот белок обладает рядом активностей и способен узнавать различные последовательности ДНК посредством различных комбинаций цинковых пальцев [Ohlsson et. al., 2001]. Хотя, как уже говорилось ранее, этот фактор был исходно идентифицирован как активатор и репрессор транскрипции, результаты последующих исследований указывают на то, что он играет ключевую роль в работе блокирующих энхансеры элементов, в частности в доменах альфа- и бета-глобиновых генов, в домене генов Igf2/H19 [Yang et. al., 2003; Recillas-Targa et. al., 2002].
С 5'-концевой областью домена бета-глобиновых генов кур (футпринт FII) CTCF связывается при посредстве одиннадцатого цинкового пальца. Это связывание абсолютно необходимо для работы блокирующего энхансеры элемента. С помощью направленного мутагенеза участка связывания CTCF было показано, что утрата способности связывать CTCF коррелирует с утратой энхансер-блокирующей активности [Bell et. al., 1999].
Для того чтобы идентифицировать минимальный элемент, ответственный за защиту от позиционных эффектов, была протестирована серия субфрагментов 1.2 т.п.н. фрагмента ДНК HS 4, обладающего обеими инсуляторными активностями. Было выяснено, что CTCF не требуется для защиты от позиционных эффектов. Делеция сайтов связывания FII (CTCF) и Fill не влияла на пограничную активность инсулятора [Recillas-Targa et. al., 2002]. В совокупности эти результаты показывают, что две функциональные активности инсулятора могут быть разделены (не являются общим свойством одного и того же геномного элемента). Действительно, в последующем были обнаружены энхансер-блокирующие элементы, не обладающие барьерной функцией и барьерные элементы, не обладающие способностью блокировать энхансеры [West et. al, 2002]. Таким образом, можно утверждать, что полноценные инсуляторы представляют собой комбинацию из двух функциональных элементов. В 5'-концевом инсуляторе домена 0-глобиновых генов кур CTCF-зависимая функция блокирования энхансера может являться необходимой для предотвращения несвоевременного взаимодействия между рецептором и регуляторными элементами бета-глобиновых генов в процессе различных эритроидных стадий развития. С другой стороны, барьерная функция может быть необходима для предотвращения распространения области конденсированного хроматина на домен бета-глобиновых генов.
Для получения более полной картины геномной организации домена бета-глобиновых генов кур была также проанализирована его 3'-граница. На расстоянии приблизительно 5 т.п.н. после эмбрионального є-глобинового гена был обнаружен участок гиперчувствительности [Saiton et. al., 2000]. Были проведены тесты для определения функциональной активности соответствующего фрагмента ДНК. Внутри гиперчувствительного участка обнаружили 700 п.п. фрагмент ДНК, обладающий позиционно-зависимой энхансер-блокирующей активностью. Детальный анализ
последовательности позволил обнаружить CTCF-связывающий сайт. Позже было продемонстрировано, что З'-инсуляторная активность является CTCF-зависимой.
В случае с бета-глобиновыми локусами мыши и человека инсуляторные элементы представлены 5' HS 4 и 3' HS1 [Farrel et. al., 2002]. Эти элементы могут связывать CTCF in vitro, и обладают энхансер-блокирующей активностью. В целом же 5'-пограничный элемент домена бета-глобиновых генов (у всех изучавшихся позвоночных животных) является полноценным инсулятором, который обладает как CTCF-зависимой энхансер-блокирующей активностью, так и активностью пограничного элемента хроматинового домена, т. е. способностью защищать трансген от позиционных эффектов [West et, al., 2002].
В противоположность этому, 3'-пограничный элемент домена обладает только CTCF-зависимой способностью направленно блокировать работу энхансеров, но не способностью подавлять распространение неактивного гетерохроматина. В настоящее время существует определенная терминологическая путаница. Термин «инсулятор» часто употребляют как для обозначения полноценных инсуляторов (обладающих двумя упомянутыми выше активностями), так и для обозначения блокирующих действие энхансеров элементов. В рамках данного обзора мы будем употреблять термин «инсулятор» только для обозначения полноценных инсуляторов.
Блокирующие действие энхансеров элементы были идентифицированы на границах целого ряда геномных доменов. Общим свойством этих элементов является то, что они предотвращают взаимодействие между энхансером и промотором в случае, если находятся между ними. Классический энхансер-блокирующий элемент может блокировать взаимодействие между любым энхансером и промотором, то есть он действует неспецифически. При этом как промотор, так и энхансер сохраняют свою активность. Это легко продемонстрировать, поставив промотор под контроль другого
энхансера, не отделенного от промотора блокирующим элементом, либо поместив
энхансер между двумя генами, один из которых отделен от энхансера блокирующим элементом, а другой - нет (Рис.6). У позвоночных животных эффективность блокирующего действие энхансеров элемента пропорциональна количеству сайтов связывания CTCF.
Рисунок 6. Схема, иллюстрирующая свойства классического энхансер-блокирующего элемента: блокирует взаимодействие между энхансерами и промоторами, но не влияет непосредственно на активность энхансера и промотора.
Были предложены к рассмотрению несколько моделей, объясняющих механизм действия блокирующих работу энхансеров элементов. Понятно, что все эти модели, так или иначе, базируются на существующих моделях работы энхансеров.
Согласно структурной (она же доменная) модели свойства блокирующих действие энхансеров элементов являются результатом их участия в организации (и реорганизации) хроматиновых структур высшего порядка [Labrador et. al., 2002]. Эта модель основана на экспериментах с ретротранспозоном gypsy у Drosophila melanogaster, обладающим свойствами полноценного инсулятора. Показано, что последовательности gypsy-инсулятора могут связываться между собой и взаимодействовать с ядерными структурами, создавая, таким образом, хроматиновые петли - домены [Gerasimova et. al., 2000; Muravyova et.al., 2001]. В лаборатории Фельзенфельда показали, что CTCF соочищается вместе с ядрышковым белком нуклеофосмином, локализованным на периферии ядрышек, и оба белка связаны с 5"HS 4 инсулятором in vivo. Принимая во
внимание то, что CTCF, в свою очередь, связывается с ядерным матриксом, предполагается, что эти взаимодействия могут генерировать петли, сходные с описанными для инсуляторного элемента «gypsy» у Drosophila melanogaster [Yusufzai et. al., 2004; Yusufzai et. al., 2004]. Следует подчеркнуть, что образование таких петлевых доменов могло бы объяснить и барьерную функцию инсулятора. Не исключено, что это объяснение вполне корректно в случае инсулятора ретранспозона gypsy. Однако участок связывания CTCF, как уже говорилось выше, не является необходимым для барьерной функции инсулятора из домена бета-глобиновых генов кур.
Другая группа моделей действия инсуляторов, так или иначе, может быть названа моделями «дорожной пробки». Предполагается, что энхансеры (в том числе и энхансеры, располагающиеся в области контроля локуса), генерируют некий положительный активирующий сигнал, который распространяется вдоль хроматиновой фибриллы. Согласно модели Траверса [Travers, 1999] в областях контроля локуса инициируется транскрипция. Перемещаясь вдоль геномного домена, транскрипционный комплекс исполняет роль транспортного средства, которое обеспечивает одновременное перемещение гистон-ацетилаз, факторов ремоделирования хроматина и других факторов, необходимых для активации геномного домена на уровне реконфигурации хроматиновой [Geyer, 1997; Bell, 1999].
Какова бы не была природа активирующего сигнала, распространяющегося вдоль хроматиновой фибриллы, предполагается, что блокирующие действие энхансеров элементы останавливают распространение этого активирующего сигнала. В этом случае они действуют как физические барьеры, способные остановить активацию гена энхансером. Иллюстрацией этой модели служат эксперименты, проведенные с транскрипционным фактором GAGA из Drosophila melanogaster [Majumder et. al., 2002]. GAGA может стимулировать транскрипцию, соединяя энхансер с промотором, находящимся под контролем этого энхансера. Это облегчает дальнодействующую
активацию путем создания белковых мостиков. Инсуляторы ограничивают поставку этого фактора к промотору. То есть инсулятор «конкурирует» с промотором за сигнал от энхансера.
Описанные выше модели не исключают одна другую, но и не являются универсальными. Изучение свойств и механизмов работы инсуляторов - динамично развивающаяся область исследований: предлагаются вниманию новые факты и новые модели. Показаны участие инсуляторов в модификации гистонов [Burgess-Beusse et. al., 2002], обнаружена связь между энхансер-блокирующей активностью и импринтированными локусами, указывающая на роль инсуляторов в установлении эпигенетических маркеров [Engel et. al., 2004] и т.д.
Заманчиво было бы предположить, что весь геном организован в построенные по единому образцу структурно-функциональные домены, которые разграничиваются инсуляторами. Такие домены можно назвать фиксированными, имея в виду то обстоятельство, что границы их четко определены позициями специальных пограничных элементов. В настоящее время ясно, что подобная схема организации генома в целом не соответствует экспериментальным фактом. Прежде всего, не все изученные к настоящему времени ДНКаза-чувствительные домены тканеспецифичных генов имеют инсуляторы на обоих флангах. Даже домен бета-глобиновых генов млекопитающих ограничен инсулятором только с 5' конца. При этом функциональное значение этого инсулятора не очевидно. Направленная делеция фрагмента ДНК, включающего потенциальный инсулятор (участок гиперчувствительности 5) находящийся на 5'-конце LCR домена бета-глобиновых генов мыши, не сказывается сколько-нибудь серьезным образом на характере экспрессии бета-глобиновых генов [Farrell et, al., 2000].
Следует принять во внимание и то обстоятельство, что в геноме высших эукариот существуют перекрывающиеся генные домены. Например, в 5'-концевой области домена альфа-глобиновых генов человека расположен ген, который транскрибируется в
РОССИЙСКАЯ ГОСУДАРСТВЕННАЯ
направлении, противоположном направлению транскрипции глобиновых генов. LCR-подобный регуляторный элемент домена альфа-глобиновых генов (HS-40) расположен в одном из интронов данного гена [Vyas et al., 1995]. Аналогичный ген присутствует и в домене альфа-глобиновых генов кур [Sjakste, et. al., 2000]. Все перечисленные факты не укладываются в традиционную модель "фиксированных" геномных доменов. В этой связи в последнее время были предложены другие модели доменной организации генома высших эукариот. Наиболее интересной из них представляется модель, предполагающая, что границы доменов не являются строго определенными и что основой функционирования доменов является комплексное взаимодействие позитивных регуляторных сигналов.
Что касается инсуляторов, то им вообще не отводится важной роли. Предполагается, что эти элементы имеют многофункциональный характер и могут входить в состав промоторов и энхансеров определенного типа. На границах доменов или, точнее говоря, между доменами они оказываются в силу негативного отбора, так как присутствие такого рода элементов внутри доменов должно существенно нарушать скоординированную работу промоторов и позитивных регуляторных элементов [Dillon et. al., 2000]. Будущие эксперименты покажут, насколько адекватной является данная модель. Скорее всего, до определенной степени верными являются и эта модель и модель фиксированных доменов [Bell et. al., 1999]. В определенных хромосомных позициях инсуляторы могут оказаться необходимыми для предотвращения распространения гетерохроматина на активные домены. В этом случае будет работать механизм позитивного отбора инсуляторов, и домены будут иметь фиксированные границы. В других случаях наличие инсуляторов на границах доменов не является необходимым в силу того, что весь домен находится в окружении активных генов. В таких хромосомных позициях границы доменов будут иметь достаточно условный характер.
IV. ГЕНОМНЫЕ ДОМЕНЫ С РАЗМЫТЫМИ ГРАНИЦАМИ
1. Что такое геномные домены с размытыми границами?
Несмотря на то, что термин «геномный домен» часто употребляется в научной литературе, он до сих пор не определен четко. Есть два подхода к определению геномных доменов: структурный и функциональный. Типичными доменами, определенными по структурному принципу являются домены, характеризующиеся повышенным уровнем чувствительности к нуклеазам, и домены, характеризующиеся повышенным уровнем ацетилирования гистонов. С функциональной точки зрения геномным доменом является фрагмент ДНК, включающий ген или группу генов, связанных со всем комплексом цис-регуляторных последовательностей.
В течение многих лет считалось, что существует прямое соответствие между доменами, определенными по структурному и функциональному принципам. Эта точка зрения подкреплялась результатами изучения ограниченного числа доменов тканеспецифичных генов. Примеры таких доменов мы подробно описали в первой главе обзора. Отличительной чертой всех этих доменов является то, что они являются предпочтительно чувствительными к ДНКазе І в клетках, где соответствующие гены экспрессируются, и относительно резистентными к ДНКазе І в клетках, не экспрессирующих эти гены. ДНКаза-чувствительная область охватывает весь ген (генный кластер) и комплекс цис-регуляторных последовательностей. Эта же область характеризуется повышенным уровнем ацетилирования гистонов [Hebbes et al., 1994; Forsberg et al., 2001]. Иными словами, для всех перечисленных примеров границы доменов, картированных по функциональному и структурному принципам, совпадают.
На границах доменов находятся инсуляторы, которые ограничивают область действия позитивных регуляторных элементов (функциональная граница) и препятствуют
распространению репрессивных хроматиновых структур (структурная граница). Было бы заманчиво предположить, что весь геном построен из единообразно организованных доменов, напоминающих, например, домены бета-глобиновых генов позвоночных. Такое предположение, однако, не соответствует действительности. Широкомасштабное изучение организации геномов различных организмов (прежде всего, генома человека) показало, что существует множество «неканонических» доменов, в том числе доменов с перекрывающимися генами и регуляторными системами. Даже «классический» домен гена лизоцима кур оказался комплексным, так как внутри этого домена находится еще один ген (cGas41), который экспрессируется в различных типах клеток, в том числе и в клетках, не экспрессирующих лизоцим [Chong et al., 2002]. При этом следует подчеркнуть, что локус лизоцима кур предпочтительно чувствителен к нуклеазам лишь в клетках, экспрессирующих лизоцим. Ген cGas41 экспрессируется в клетках, в которых соответствующий домен не является предпочтительно чувствительным к нуклеазам.
Таким образом, корреляция между экспрессией гена и предпочтительной чувствительностью соответствующего домена к нуклеазам не является абсолютной. Это подтверждают и некоторые другие примеры. Так, сообщалось о том, что в пеэритроидных клетках бета-глобиновые гены абортивно транскрибируются, несмотря на то, что в этих клетках домен бета-глобиновых генов метилирован и находится в ДНКаза-устойчивой конфигурации [Lois et al., 1990].
Домены альфа-глобиновых генов позвоночных еще в меньшей степени соответствуют «классической» модели, чем домен гена лизоцима кур. Эти домены расположены в богатой генами хромосомной области и являются предпочтительно-чувствительными к нуклеазам во всех типах клеток [Craddock et. al., 1995]. Непосредственно перед кластером альфа-глобиновых генов расположен ген, который транскрибируется во всех изученных типах клеток: ген «-14» у человека [Vyas et. al., 1995], ген «mPProxl» у мыши [Kidman et. al., 1996], ген «ggPRX» у курицы [Sjakste et. al.,
2000]. Напоминающий область контроля локуса (LCR) элемент домена альфа-глобиновых генов расположен в одном из интронов гена «-14»/«mPProxl»/«ggPRX» [Kidman et. al., 1993; Flint et. al., 2001; Sharp et. al., 1992]. Можно привести и другие примеры перекрывающихся геномных доменов у высших эукариот [Adolph et. al., 2001; Faurholm et. al., 2001; Wong et. al., 2001; Wagenar et. al., 2001]. Существование такого рода перекрывающихся доменов потребовало теоретического переосмысления доменной гипотезы организации генома. Было предложено различать домены с четкими границами и домены с невыраженными границами [Dillon et. al., 2000]. Понятно, что регуляторные системы доменов с невыраженными границами должны существенно отличаться от регуляторных систем доменов с фиксированными границами. Дополнительной задачей регуляторных систем доменов с невыраженными границами является дискриминация «своих» и «чужих» мишеней, которые могут находиться в непосредственной близости. По-видимому, это достигается на пути повышения специфичности взаимодействия энхансеров и сайленсеров с промоторами находящихся под их контролем генов. Далее мы проанализируем некоторые особенности работы регуляторных систем доменов с невыраженными границами.
2. Можно ли картировать домен, если тест на предпочтительную чувствительность к ДНКазс I не работает?
Тест на предпочтительную чувствительность к ДНКазе сыграл важную роль в идентификации ряда геномных доменов с четкими границами. Закономерен вопрос о том, существуют ли иные экспериментальные подходы, позволяющие картировать геномные домены по структурному принципу. Мы полагаем, что можно дать положительный ответ на данный вопрос.
Прежде всего, анализ уровня ацетилирования гистонов в протяженных геномных областях позволяет идентифицировать некий особый домен даже внутри области, обладающей одинаковой чувствительностью к ДНКазе. В качестве примера можно указать домен альфа-глобиновых генов. Как уже говорилось, этот домен находится в предпочтительно чувствительной к ДНКазе конфигурации как в эритроидных, так и в неэритроидных клетках. В то же время в пределах -100 т.п.н. домена, включающего кластер альфа-глобиновых генов и удаленные регуляторные последовательности, уровень специфического ацетилирования гистона Н4 по лизину 5 существенно выше в эритроидных клетках, чем в клетках другого происхождения. Сходные домены, характеризующиеся повышенным уровнем ацетилирования гистона Н4 и совпадающие с функциональными границами домена альфа-глобиновых генов, обнаружены в клетках человека, мыши и курицы [Anguita et. al., 2001]. Существуют и другие примеры того, что анализ соотносительного уровня ацетилирования гистонов в достаточно протяженных геномных областях позволяет картировать геномные домены, соответствующие функциональным доменам, идентифицированным с помощью независимых тестов [Forsberg et. al., 2001; Litt et. al., 2001].
Еще один экспериментальный подход, позволяющий картировать примерные границы доменов тканеспецифичных генов, заключается в картировании ткане-специфичных участков гиперчувствительности к ДНКазе I.. Позиции тканеспецифичных участков гиперчувствительности, как правило, указывают на позиции регуляторных элементов, контролирующих экспрессию соответствующих генов. В этой связи можно сказать, что данный экспериментальный подход объединяет структурный и функциональный подходы к картированию геномных доменов. Картирование эритроидспецифичных участков гиперчувствительности в 5'-фланкирующей области кластера альфа-глобиновых генов кур позволило нам продемонстрировать, что домен альфа-глобиновых генов включает как минимум 17 т.п.н. ДНК перед первым из генов
альфа-глобинового кластера [Razin et. al., 1994]. Другие авторы, используя аналогичный подход, продемонстрировали, что 5'-концевая область домена альфа-глобиновых генов является еще более протяженной [Vyas et. al., 1992; Sharp et. al., 1993].
Третий подход к идентификации геномных доменов является в полной мере функциональным. Он заключается в картировании транскрипционных единиц, направляющих синтез полноразмерных транскриптов всего домена. Такого рода транскрипты были обнаружены более 20 лет назад при изучении характера транскрипции домена альфа-глобиновых генов кур [Imaizumi et. al., 1973;]. В последующем они были охарактеризованы более подробно. Оказалось, что транскрибируется фактически весь домен альфа-глобиновых генов, включая протяженную 5'-концевую область [Broders et. al., 1987; Broders et. al., 1990]. Транскрипты «доменного типа» были обнаружены и в домене р - глобиновых генов человека [Ashe et. al., 1997; Gribnau et. al., 2000; Plant et. al., 2001].
Значение полноразмерных транскриптов всего домена не вполне ясно. Согласно одной из гипотез такого рода постоянная транскрипция всего домена необходима для поддержания его активного статуса. Действительно, известно, что работающая РНК-полимераза может привлекать к месту транскрипции гистонацетилазы и ферменты реорганизации хроматина (chromatin remodelling enzymes). Анализ транскриптов «доменного типа» и картирование соответствующих транскрипционных единиц может быть использовано как инструмент картирования геномных доменов и субдоменов [Gribnau et. al., 2000].
3. Регуляция экспрессии генов в доменах с невыраженными границами
До сих пор при обсуждении проблемы регуляции экспрессии генов на уровне геномных доменов основной постулат заключался в том, что домен в целом неактивен в
большинстве типов клеток. Примером домена такого рода может служить уже многократно упоминавшийся домен бета-глобиновых генов человека. Первым этапом активации этого домена должно быть изменение его хроматиновой конфигурации (переход из ДНКаза-резистентной в ДНКаза-чувствительную конфигурацию). Лишь после этого возможна избирательная активация промоторов тех или иных генов под действием соответствующих энхансеров. Утрата позитивного регуляторного элемента доменного уровня исключает возможность активации любого из присутствующих в домене генов [Forrester et. al., 1990].
Большинство доменов с невыраженными границами всегда находятся в потенциально активной (предпочтительно чувствительной к ДНКазе) конфигурации. В таких доменах, типичным примером которых является домен альфа-глобиновых генов кур, актуальной является задача поддержания неактивного статуса домена в большинстве типов клеток. Действительно, в домене альфа-глобиновых генов кур было обнаружено два блока негативных регуляторных элементов доменного уровня [Razin et. al., 1999; Razin et. al., 2000]. Один из этих регуляторных элементов представляет собой богатую CpG-динуклеотидами последовательность ДНК, часть которой избирательно метилирована в неэритроидных клетках. Есть основания полагать, что метилирование этой последовательности подавляет активность промоторов глобиновых генов. Таким образом, данный регуляторный элемент может выполнять функцию молекулярного переключателя, который разрешает транскрипцию глобиновых генов в эритроидных клетках и запрещает транскрипцию этих генов в неэритроидных клетках.
Особую проблему в перекрывающихся доменах составляет возможность перекрестного действия регуляторных элементов различных генов. Действительно, одной из важных характеристик «классических» энхансеров является их способность активировать практически любые промоторы [Wasylyk et. al., 1988; Muller et. al., 1988]. В последние годы, однако, обнаружено большое число энхансеров, которые способны
избирательно активировать определенные промоторы. В качестве примера укажем на энхансеры имагинальных дисков Drosophila melsnogaster. Эти энхансеры располагаются между геном decapentaplegic {dpp) и двумя другими генами (oaf и slh), которые экспрессируются не одновременно с геном dpp. Оказалось, что энхансеры имагинальных дисков способны активировать промотор гена dpp, но не промоторы генов oaf и slh. Замена промотора гена оа/промотором гена теплового шока делает этот ген зависимым от энхансера «имагинальных дисков» [Merli et. al., 1996]. Таким образом, некие особенности организации промоторов генов oaf и slh делают эти промоторы нечувствительными к энхансеру имагинальных дисков, что позволяет последнему избирательно активировать экспрессию гена dpp. Можно привести и другие примеры избирательного действия энхансеров на определенные промоторы [Li et. al., 1994; Zutter et. al., 1995; Harendza et. al., 1995; Keplinger et. al., 2001].
Понятно, что такого рода избирательность может обеспечить необходимую специфичность работы регуляторных систем различных генов, расположенных в перекрывающихся доменах. Работа этих регуляторных механизмов может дополнительно модулироваться посредством однонаправленных [Melfi et. al., 2000; Chen et. al., 2001] и инактивируємых (например, посредством CpG метилирования [Bell et. al., 2000; Holmgren et. al., 2001; Filippova et. al., 2001]) инсуляторов. Эти регуляторные элементы могут разделять домен на динамические функциональные зоны (субдомены), в рамках которых возможно сконцентрировать работу позитивных регуляторных механизмов на промоторе одного гена или промоторах нескольких функционально-связанных генов.
В настоящее время недостаточно исследован вопрос о том, могут ли инсуляторы подавлять влияние сайленсеров на промоторы расположенных за инсуляторами генов. В одной из работ, предпринятых с целью прояснения данного вопроса, были получены результаты, показывающие, что эффект сайленсеров не подавляется инсуляторами [Modin et. al., 2000]. Нельзя, однако, исключить того, что в других системах могут быть получены
и противоположные результаты. Если хотя бы в некоторых специальных случаях эффект сайленсеров может подавляться инсуляторами, это еще в большей мере расширит возможности избирательной модуляции активности промоторов индивидуальных генов в перекрывающихся доменах.
Подтверждение доменной гипотезы в экспериментах по изучению домена бета-глобиновых генов
Домен бета-глобиновых генов человека расположен в GC-бедной области (изохоре) 11-й хромосомы. Для подобных бедных генами и поздно реплицирующихся областей характерны высокая степень упаковки хроматина и множественность контактов с ядерным матриксом [Hardison et al., 1998; Craddock et al., 1995]. Домен бета-глобиновых генов, размером около 100 т.п.н., включает эмбриональный ген - є, два фетальных гена -Gy и Ау и два взрослых гена - 8 и р (Рис.4). Все эти гены транскрибируются в одном направлении. Порядок генов в домене соответствует времени их активации в процессе развития. В эритроидных клетках взрослого человека экспрессируются только 5 и 3 гены. При изучении домена бета-глобиновых генов человека была обнаружена первая, и в известном смысле «классическая» область контроля локуса (рис.4). Областью контроля локуса - LCR (locus control region) принято называть регуляторный элемент, контролирующий транскрипционный статус одного или группы генов на уровне геномного домена. В экспериментах для идентификации области контроля локуса часто используют тест на обеспечение независимого от позиции интеграции уровня экспрессии трансгенов (смотри ниже). Первые свидетельства существования области контроля локуса домена бета-глобиновых генов человека были получены при изучении делеций, приводящих к талассемиям (заболеваниям, связанным с нарушением экспрессии глобиновых генов). Анализ характера геномных нарушений при разных формах талассемии показал, что участки ДНК, расположенные на расстоянии более 5 т.п.н. перед кластером бета-глобиновых генов человека, необходимы для нормальной экспрессии этих генов [Kiossis et. al., 1983; Curtin et. al., 1985].
В независимых экспериментах было установлено, что на расстоянии 6-22 т.п.н. перед кластером бета-глобиновых генов человека находится блок участков гиперчувствительности к ДНКазе I, включающий четыре эритроидспецифичных и один перманентный участок [Forrester et. al., 1986; Tuan et. al., 1985]. Как уже говорилось, участки гиперчувствительности к ДНКазе І в хроматине, как правило, обозначают положение различных регуляторных последовательностей в ДНК. Были обнаружены делении 5 -концевой области домена, не затрагивающие собственно глобиновые гены и их промоторы, но приводящие, тем не менее, к развитию талассемий. В данном случае делеции и другие геномные перестройки, приводящие к талассемиям, всегда затрагивали блок участков гиперчувствительности к ДНКазе I. Наиболее короткая из известных делеций такого типа, так называемая Испанская делеция (приводящая к у83-талассемии), содержит четыре участка гиперчувствительности и 25 т.п.н. перед ними (рис.5А). В эритроидных клетках, с Испанской делецией, домен бета-глобиновых генов находится в транскрипционно неактивном состоянии, является устойчивым к действию ДНКазы и позднореплицирующимся, в то время как в нормальных эритроидных клетках он активно транскрибируется и реплицируется в начале S-фазы [Forrester et. al., 1990].
Это позволило предположить, что блок участков гиперчувствительности к ДНКазе I, находящийся на расстоянии 6-22 т.п.н. перед кластером бета-глобиновых генов человека, является особым регуляторным элементом, который контролирует транскрипционный статус протяженного геномного домена на уровне упаковки этого домена в хроматин. Этот регуляторный элемент был назван областью контроля локуса (LCR).
Ключевые опыты, подтверждающие эту точку зрения, были сделаны на трансгенных мышах. В лаборатории Гросвельда было продемонстрировано, что фрагмент ДНК домена бета-глобиновых генов человека, содержащий четыре гиперчувствительных сайта (5 HSS 2-5, рис.5Б), будучи помещен перед всем кластером бета-глобиновых генов или перед одним из генов, обеспечивает высокий и не зависящий от места интеграции уровень экспрессии этих генов в эритроидных клетках трансгенных мышей [Grossveld et. al., 1987; Dillon et. al., 1993]. Практически сразу после этого было показано, что LCR домена бета-глобиновых генов человека работает аналогичным образом и в отношении других трансгенов, поставленных под его контроль [van Assendelft et. al., 1989; Talbot et. al., 1989].
В течение многих лет изучение организации и функциональной активности LCR было возможно лишь в модельных опытах на трансгенных мышах. Однако любая модельная система позволяет лишь частично воспроизвести реальную ситуацию. Существенным недостатком первых опытов по интеграции полного или частично делетированного локуса бета-гл оби новых генов в геном трансгенных мышей была множественная интеграция конструкций. При микроинъекции конструкций в пронуклеус яйцеклетки, как правило, наблюдается тандемная интеграция значительного числа копий конструкции в одно и то же место генома [Henikoff, 1998]. Понятно, что в таком искусственно возникшем «ампликоне» возможно взаимное влияние регуляторных элементов, расположенных в повторяющихся блоках. Использование фаговых [Ramires-Solis et. al., 1995] и дрожжевых [Schlake et. al., 1994] систем сайт-специфической рекомбинации позволило получать трансгенных животных, геном которых содержит только одну копию генной конструкции [Tanimoto et. al., 1999]. Хотя такая модель более совершенна, однако и она не полностью отражает условия работы LCR в нормальной геномной позиции. Сейчас все более очевидно, что макроокружение и пространственная организация тех или иных геномных элементов в ядре эукариотической клетки заметно влияют на их работу [Francastel et. al., 2000]. В связи с этим чрезвычайно важен детальный анализ функциональной активности LCR и его отдельных блоков в нормальной геномной позиции.
Инсуляторы
Современные представления об организации геномных доменов в значительной мере базируются на результатах изучения нескольких конкретных моделей, таких как домены Р-глобиновых генов позвоночных, локус гена лизоцима кур, локус генов теплового шока дрозофилы, домен гена аполипопротеина В человека и т.д. Помимо сложного комплекса позитивных регуляторных элементов многие из этих доменов имеют специальные пограничные элементы - инсуляторы, ограничивающие влияние на домен регуляторных элементов и хроматиновых структур, находящихся за его пределами. Инсуляторы обладают двумя функциональными активностями: способностью ограничивать распространение гетерохроматина (barrier activity) и способностью ограничивать действие цис-регуляторных элементов (enhancer blocking activity). Классическим тестом, позволяющим продемонстрировать наличие второго из перечисленных эффектов, получившим название эффекта инсуляции, является помещение изучаемого регуляторного элемента между энхансером и промотором. Инсулятор полностью блокирует активность энхансера в отношении промотора, расположенного за инсулятором, не оказывая прямого негативного влияния на работу самого по себе промотора или энхансера. Инсуляторы впервые были обнаружены в локусе гена hsp 70 Drosophila melanogaster. Этот локус, содержащий две копии противоположно ориентированных генов теплового шока, разделенных участком ДНК, был выбран для исследований, так как гены экспрессировались независимо от окружающего хроматина и, следовательно, на границе локуса должны были существовать структуры, отделяющие его от других доменов и обеспечивающие независимость экспрессии. Сначала было продемонстрировано, что локус фланкирован с обеих сторон участками гиперчувствительности к ДНКазе I. Они получили названия SCS и SCS (specialized chromatin structure). В серии экспериментов, проведенных в лаборатории Шедла, было показано, что SCS и SCS элементы блокируют действие энхансера на промотор и, кроме того, способны изолировать ген от эффекта положения, то есть от воздействия окружающего хроматина, как активирующего, так и репрессирующего [Kellum et. al., 1991, 1992].
Почти в то же время в регуляторной области ретротранспозона дрозофилы gypsy был обнаружен su (Hw) - инсулятор [Geyer et. al., 1992]. Первым охарактеризованным инсулятором позвоночных животных стал инсулятор домена бета-глобиновых генов кур [Chung et al., 1993]. Этот инсулятор находится на границе области контроля локуса домена - 5 HS 4 (см. Рис.3 на стр.15) и обладает как активностью блокирующего энхансеры элемента, так и активностью пограничного элемента (Рис 5).
С целью картирования минимального инсуляторного элемента и областей, ответственных за обе активности был проведен делеционный анализ инсулятора. Параллельно, с использованием техники фут-принтинга были картированы сайты связывания белков в границах инсулятора [Bell et.al., 1999; Chung et. al., 1997]. Было показано, что минимальный фрагмент ДНК, обладающий обеими инсуляторными активностями, имеет протяженность 250 п.н. В границах этого фрагмента было выявлено пять сайтов связывания белковых факторов (футпринты I-V; сокращенно - FI - FV) [Chung et. al., 1997]. При последующем анализе было продемонстрировано, что 90 п.н. фрагмент ДНК, содержащий сайты связывания FII и Fill, представляет собой минимальный элемент, блокирующий энхансер, с максимумом активности в сайте FII. Оказалось, что в этой области с ДНК связывается белковый фактор CTCF, который ранее был идентифицирован, как один из белков, регулирующих активность гена с-тус. Это большой ДНК-связывающий белок, в составе которого присутствуют 13 цинковых пальцев. Этот белок обладает рядом активностей и способен узнавать различные последовательности ДНК посредством различных комбинаций цинковых пальцев [Ohlsson et. al., 2001]. Хотя, как уже говорилось ранее, этот фактор был исходно идентифицирован как активатор и репрессор транскрипции, результаты последующих исследований указывают на то, что он играет ключевую роль в работе блокирующих энхансеры элементов, в частности в доменах альфа- и бета-глобиновых генов, в домене генов Igf2/H19 [Yang et. al., 2003; Recillasarga et. al., 2002].
С 5 -концевой областью домена бета-глобиновых генов кур (футпринт FII) CTCF связывается при посредстве одиннадцатого цинкового пальца. Это связывание абсолютно необходимо для работы блокирующего энхансеры элемента. С помощью направленного мутагенеза участка связывания CTCF было показано, что утрата способности связывать CTCF коррелирует с утратой энхансер-блокирующей активности [Bell et. al., 1999].
Можно ли картировать домен, если тест на предпочтительную чувствительность к ДНКазе I не работает
Тест на предпочтительную чувствительность к ДНКазе сыграл важную роль в идентификации ряда геномных доменов с четкими границами. Закономерен вопрос о том, существуют ли иные экспериментальные подходы, позволяющие картировать геномные домены по структурному принципу. Мы полагаем, что можно дать положительный ответ на данный вопрос.
Прежде всего, анализ уровня ацетилирования гистонов в протяженных геномных областях позволяет идентифицировать некий особый домен даже внутри области, обладающей одинаковой чувствительностью к ДНКазе. В качестве примера можно указать домен альфа-глобиновых генов. Как уже говорилось, этот домен находится в предпочтительно чувствительной к ДНКазе конфигурации как в эритроидных, так и в неэритроидных клетках. В то же время в пределах -100 т.п.н. домена, включающего кластер альфа-глобиновых генов и удаленные регуляторные последовательности, уровень специфического ацетилирования гистона Н4 по лизину 5 существенно выше в эритроидных клетках, чем в клетках другого происхождения. Сходные домены, характеризующиеся повышенным уровнем ацетилирования гистона Н4 и совпадающие с функциональными границами домена альфа-глобиновых генов, обнаружены в клетках человека, мыши и курицы [Anguita et. al., 2001]. Существуют и другие примеры того, что анализ соотносительного уровня ацетилирования гистонов в достаточно протяженных геномных областях позволяет картировать геномные домены, соответствующие функциональным доменам, идентифицированным с помощью независимых тестов [Forsberg et. al., 2001; Litt et. al., 2001].
Еще один экспериментальный подход, позволяющий картировать примерные границы доменов тканеспецифичных генов, заключается в картировании ткане-специфичных участков гиперчувствительности к ДНКазе I.. Позиции тканеспецифичных участков гиперчувствительности, как правило, указывают на позиции регуляторных элементов, контролирующих экспрессию соответствующих генов. В этой связи можно сказать, что данный экспериментальный подход объединяет структурный и функциональный подходы к картированию геномных доменов. Картирование эритроидспецифичных участков гиперчувствительности в 5 -фланкирующей области кластера альфа-глобиновых генов кур позволило нам продемонстрировать, что домен альфа-глобиновых генов включает как минимум 17 т.п.н. ДНК перед первым из генов альфа-глобинового кластера [Razin et. al., 1994]. Другие авторы, используя аналогичный подход, продемонстрировали, что 5 -концевая область домена альфа-глобиновых генов является еще более протяженной [Vyas et. al., 1992; Sharp et. al., 1993].
Третий подход к идентификации геномных доменов является в полной мере функциональным. Он заключается в картировании транскрипционных единиц, направляющих синтез полноразмерных транскриптов всего домена. Такого рода транскрипты были обнаружены более 20 лет назад при изучении характера транскрипции домена альфа-глобиновых генов кур [Imaizumi et. al., 1973;]. В последующем они были охарактеризованы более подробно. Оказалось, что транскрибируется фактически весь домен альфа-глобиновых генов, включая протяженную 5 -концевую область [Broders et. al., 1987; Broders et. al., 1990]. Транскрипты «доменного типа» были обнаружены и в домене р - глобиновых генов человека [Ashe et. al., 1997; Gribnau et. al., 2000; Plant et. al., 2001].
Значение полноразмерных транскриптов всего домена не вполне ясно. Согласно одной из гипотез такого рода постоянная транскрипция всего домена необходима для поддержания его активного статуса. Действительно, известно, что работающая РНК-полимераза может привлекать к месту транскрипции гистонацетилазы и ферменты реорганизации хроматина (chromatin remodelling enzymes). Анализ транскриптов «доменного типа» и картирование соответствующих транскрипционных единиц может быть использовано как инструмент картирования геномных доменов и субдоменов [Gribnau et. al., 2000].
До сих пор при обсуждении проблемы регуляции экспрессии генов на уровне геномных доменов основной постулат заключался в том, что домен в целом неактивен в большинстве типов клеток. Примером домена такого рода может служить уже многократно упоминавшийся домен бета-глобиновых генов человека. Первым этапом активации этого домена должно быть изменение его хроматиновой конфигурации (переход из ДНКаза-резистентной в ДНКаза-чувствительную конфигурацию). Лишь после этого возможна избирательная активация промоторов тех или иных генов под действием соответствующих энхансеров. Утрата позитивного регуляторного элемента доменного уровня исключает возможность активации любого из присутствующих в домене генов [Forrester et. al., 1990].
Пространственная организация домена
Опыты по гибридизации клонированных фрагментов ДНК домена альфа-глобиновых генов с радиоактивными пробами ДНК, ассоциирующейся с ядерным матриксом из куриных эритроцитов и эритробластов, позволили выявить перманентные и транскрипционно - зависимые участки связывания ДНК с ядерным матриксом. [Farache et. al., 1990]. Перманентные участки связывания фланкируют кластер альфа-глобиновых генов кур с 5 - и З -сторон, располагаясь рядом с CR1-повторами. В тех клетках, где альфа глобиновые гены активно транскрибируются (эритробласты), к ядерному матриксу прикрепляется вся транскрибируемая область.
В других экспериментах для изучения пространственной организации домена альфа-глобиновых генов кур был использован метод вырезания петель хромосомной ДНК топоизомеразой II ядерного матрикса [Razin et. al., 1991, 1993]. С использованием этого экспериментального подхода границы петли ДНК, включающей кластер альфа-глобиновых генов кур, были картированы на расстоянии 4 т.п.н. перед эмбриональным геном л и на расстоянии 8 т.п.н. после гена аА. Те же результаты были получены и при использовании для вырезания петель ДНК нуклеазы SI [Recillasarga et. al., 1994]. Эти данные свидетельствуют о том, что в эритроидных клетка домен альфа-глобиновых генов может быть организован 20 т.п.н. петлю хроматина, которая с 5 -конца закреплена на ядерном матриксе в области расположения участка начала репликации [Razin et. al., 1986; Verbovaia and Razin, 1995].
Особенностью организации доменов альфа-глобиновых генов всех позвоночных животных является то, что непосредственно перед кластером альфа-глобиновых генов располагается крайне консервативный ген «домашнего хозяйства», который транскрибируется в направлении, противоположном направлению транскрипции глобиновых генов. Впервые этот ген был обнаружен у человека. Продукты транскрипции этого гена были найдены в клетках, выделенных из различных эмбриональных тканей человека, что послужило основанием для отнесения его к генам «домашнего хозяйства» [Vyas et. al., 1995]. В серии экспериментов по тестированию промоторной активности фрагментов ДНК помещением их перед репортерным геном, не имеющим собственного промотора, было выяснено, что промоторная область данного гена располагается на расстоянии 14 т.п.н. перед кластером а-глобиновых генов, в составе расположенного здесь CpG-островка, отчего ген и получил название «-14». Нахождение промотора в пределах CpG-островка хорошо соотносится с принадлежностью гена к генам «домашнего хозяйства». В результате анализа кДНК продуктов транскрипции гена «-14» было установлено, что ген содержит 15 экзонов и 14 интронов. Открытая рамка считывания начинается во втором и заканчивается в тринадцатом экзонах. Было показано также, что пятый экзон длиной 75 п.н. может вырезаться или нет из соответствующей пре-мРНК в результате альтернативного сплайсинга, следствием чего является образование двух типов мРНК. Весьма интересным представляется тот факт, что обсуждавшийся выше главный регуляторный элемент домена альфа-глобиновых генов (MRE) располагается в пятом интроне гена «-14».
Несмотря на то, что промотор гена «-14» располагается даже ближе к данному элементу, чем промоторы альфа-глобиновых генов, активирующее действие LCR-подобного элемента распространяется только на промоторы альфа-глобиновых генов, не усиливая транскрипцию гена «-14». Возможно, это связано с тем, что промоторная область гена «-14» не содержит классических TATA и ССААТ консенсусов, свойственных большинству промоторов генов, транскрибируемых РНК полимеразой II, в частности, промоторам всех трех альфа-глобиновых генов. Было предположено, что механизмы контроля инициации транскрипции альфа-глобиновых генов, с одной стороны, и гена «-14», с другой, могут отличаться. В частности, разные транскрипционные факторы могут участвовать в инициации транскрипции альфа-глобиновых генов и гена «-14» Это могло бы объяснять специфичность воздействия MRE на промоторы альфа-глобиновых генов, но не на промотор гена «-14». Действительно для эффективной работы энхансера может быть необходимо взаимодействие белковых комплексов, связанных с энхансером и с промоторами