Содержание к диссертации
Введение
Обзор литературы 14
Классификация мобильных генетических элементов эукариот 14
Автономные ДКП-ретроэлементы 18
Мобильные элементы группы Ty3/Gypsy 21
Мобильные элементы группы BEL/Pao 22
Семейство Retroviridae 23
Неавтономные ДКП-ретроэлементы 25
Не содержащие ДКП ретроэлементы 26
ретроэлементы, кодирующие тирозинрекомбиназу 27
Ретротранспозоны семеЙства Penelope (PLE) 28
Формирование новых мобильных элементов и вирусов 32
Интеграза как ключевой фермент ДКП-ретроэлементов 34
Сходство жизненных циклов ДКП-ретротранспозонов и ретровирусов 34
Структура интегразы 36
Реакции, катализируемые интегразой 41
Реакция 3 -концевого процессинга 41
Реакция переноса цепи 43
Реакция дезинтеграции 44
Взаимодействие интегразы с ДНК 46
Взаимодействие интегразы с ДНК-субстратом 46
Взаимодействие интегразы с ДНК-мишенью 47
Роль клеточных белков в распознавании ДНК-мишени интегразой 48
Влияние вторичной структуры хромосомной ДНК на связывание ДНК-мишени
интегразой 49
Генетический контроль транспозиции Ретроэлементов 51
Цис- и транс-факторы, регулирующие экспрессию ДКП-ретротранспозонов у
Drosophila melanogaster 51
Роль локуса flamenco в контроле транспозиции ДКП-ретроэлементов 53
Роль гетерохроматиновых белков семейства НР1 в регуляции активности ДКП ретроэлементов 58
Другие механизмы противовирусной защиты 60
Взаимоотношения ДКП-ретроэлементов с хозяйским геномом 63
Потенциальные эффекты транспозиций мобильных элементов 63
Молекулярная доместикация генов мобильных элементов 67
Доместикация гена gag ДКП-ретроэлементов 71
Материалы и методы 74
Линии Drosophila melanogaster и условия культивирования 74
Сбор эмбрионов, личинок и тканей взрослых особей 74
Индукция иммунного ответа у Drosophila melanogaster 74
Штаммы Escherichia coli и условия культивирования 75
Молекулярный анализ ДНК 76
Разделение фрагментов ДНК и РНК методом электрофореза 76
Векторы и Конструирование рекомбинантных плазмид 76
Экспрессия конструкций, кодирующих рекомбинантные белки, в клетках
Escherichia coli, и выделение рекомбинантных белков 77
Диализ растворов белков 78
Выделение мембранной фракции белка для вестерн-блот гибридизации 78
Электрофорез белков в полиакриламидном геле 78
Эндонуклеазная реакция 79
Анализ продуктов активности рекомбинантной интегразы 80
Анализ ДНК-связывающей активности интегразы 80
Вестерн-блот-гибридизация 81
Выделение геномной ДНК из мух 81
Выделение тотальной РНК из мух 82
Синтез кДНК 82
Полимеразная цепная реакция 82
Полимеразная цепная реакция в режиме реального времени 85
Вычитающая гибридизация 85
Инвертированная ПЦР 88
Быстрая амплификация 5 -конца кДНК (RACE) 88
Секвенирование 88
Саузерн-блот-гибридизация 89
Биоинформатический анализ последовательностей 89
Результаты 92
Исследование активности и функции интегразы дкп ретроэлемента gypsy 92
Исследование «точных» эксцизий ДКП-ретротранспозона gypsy в модельной системе в клетках Escherichia coli 93
Получение рекомбинантной интегразы gypsy и исследование ее активности in vitro 98
Исследование активности доменов рекомбинантной интегразы gypsy 105
Исследование in vitro активности рекомбинантной интегразы в отношении мишеней других ДКП-ретротранспозонов группы gypsy 110
Исследование генетического контроля транспозиции дкп- ретротранспозонов группы gypsy 113
Транскрипция локуса flamenco в лабораторных линиях SS и MS Drosophila melanogaster, мутантных по локусу flamenco 114
Сравнительный анализ геномной локализации ретротранспозонов Idefix и ZAM с в линииях Drosophila melanogaster SS и MS, мутантных по локусу flamenco 121
Исследование транскрипции и анализ транспозиционной активности МГЭ Tirant в линиях, мутантных по локусу flamenco 125
Филогения и систематика дкп-ретроэлементов дрозофилы 133
Классификация дкп-ретротранспозонов в геноме Drosophila melanogaster 136
Ген env у ДКП-ретротранспозонов 141
Молекулярная филогения ДКП-ретротранспозонов группы gypsy с двумя открытыми рамками считывания у D. melanogaster 142
Молекулярная эволюция ДКП-ретротранспозонов у членистоногих 146
Классификация ДКП-ретротранспозонов, основанная на комплексном анализе последовательностей интеграз, сайтов интеграции и последовательностей длинных концевых повторов 152
Доместикация последовательностей дкп-ретротранспозонов группы gypsy 168
Ген CG4680 Drosophila melanogaster – гомолог gag эррантивирусов и производных
от них ретротранспозонов группы gypsy 169
Анализ экспрессии гена Grp на уровне транскрипции и трансляции 178
Обсуждение 187
Выводы 203
Список литературы 205
- Неавтономные ДКП-ретроэлементы
- Взаимодействие интегразы с ДНК-мишенью
- Разделение фрагментов ДНК и РНК методом электрофореза
- Полимеразная цепная реакция в режиме реального времени
Неавтономные ДКП-ретроэлементы
Поскольку ДКП-ретроэлементы – предмет нашего исследования, мы более подробно остановимся на классификации этого подкласса.
ДКП-ретроэлементы классифицируют по наличию длинных прямых концевых повторов, фланкирующих внутреннюю часть МГЭ (рис. 3). Эти повторы обычно идентичны друг другу (в связи с особенностями обратной транскрипции ДКП-ретроэлементов) и, как правило, начинаются нуклеотидами 5 G и заканчиваются нуклеотидами CA-3 , которые, по-видимому, участвуют в связывании с интегразой [Eickbush, Jamburuthugoda, 2008]. Процент сходства между 5 - и 3 -концевым ДКП отражает эволюционную историю МГЭ и используется для оценки возраста МГЭ [Bowen, McDonald, 2001]. ДКП варьируют по размеру от 100 до 2000 п.н. и фланкированы короткими инвертированными повторами. Канонический ДКП имеет три района: U3-регион размером 200-1200 п.н., который содержит промоторы, повторяющийся R-регион и U5-регион размером 75-250 п.н., который представляет собой начало ретротранскрибируемой последовательности МГЭ (рис. 3). ДКП играют ключевую роль в жизненном цикле МГЭ: они не кодируют белки, но содержат промоторы и регуляторные элементы, влияющие на транскрипцию МГЭ [Kumar, Bennetzen, 1999]. Непосредственно за 5 -концевым ДКП расположен сайт связывания рибосомы (PBS) размером 18 п.н., он комплементарен клеточной тРНК, используемой в качестве праймера для обратной транскрипции. Перед 3 -концевым ДКП расположен полипуриновый тракт (PPT) ( 10 A/G н.). Он вовлечен в синтез +-цепи ДНК.
Организация регуляторных областей ДКП-ретроэлемента. U3/R/U5 – районы длинного концевого повтора, PBS - сайт связывания рибосомы, PPT - полипуриновый тракт.
ДКП-ретротранспозоны делят на автономные и неавтономные. Неавтономные МГЭ не способны перемещаться самостоятельно и используют ферменты родственных МГЭ.
Автономные ДКП-ретротранспозоны могут содержать одну, две или три кодирующие рамки считывания (ОРС). Ретротранспозоны с одной gag-pol рамкой или двумя отдельными рамками gag и pol кодируют соответственно белок Gag, образующий капсид, и белки протеазу, обратную транскриптазу, РНКазу Н и интегразу в составе рамки pol, ответственные за образование кДНК-копии элемента и его интеграцию в геном. Третья рамка считывания присутствует не у всех ДКП-ретротранспозонов. Она кодирует белок Env, ответственный за инфекционность. Наличие гена env характерно только для ретровирусов и некоторых ДКП-ретротранспозонов, обладающих инфекционными свойствами.
На основании анализа сходства последовательностей обратной транскриптазы и интегразы как самых консервативных ферментов ретроэлементов ДКП ретротранспозоны делят на четыре суперсемейства, или группы: Ty1/Copia, Ty3/Gypsy, BEL/Pao и Retroviridae. Мобильные элементы группы Ty1/Copia
Элементы группы Ty1/Copia широко представлены в геномах растений (начиная от одноклеточных водорослей и заканчивая высшими растениями) и животных. Название семейства пошло от названий гомологичных элементов Ty1 и copia, обнаруженных в геномах дрожжей и дрозофилы соответственно. Кодирующая часть МГЭ представлена, как правило, единой ОРС gag-pol, но может иметь отдельные рамки gag и pol. Единственный представитель группы, обладающий рамкой env, обнаружен у растений, в бобах Glicine max, и называется SIRE (рис. 4). Последовательность закодированных белков в рамке pol следующая: протеаза, интеграза, обратная транскриптаза и РНКаза Н, что является главной отличительной чертой группы. Представители остальных групп имеют другую последовательность белков, закодированных в рамке pol: протеаза, обратная транскриптаза, РНКаза Н и интеграза.
Классификация этой группы – процесс непрерывный, она дополняется по мере секвенирования геномов. Согласно международной классификации вирусов (ICTV) группа Ty1/Copia определена таксономически как Pseudoviridae и делится на три рода: псевдовирусы (Ty1-элемент, или SceTy1V, S.cerevisiae), хемивирусы (copia-элемент, или DmeCV, D.melanogaster) и сиревирусы (SIRE-1, или GmaSIRE-1V, G.max) (табл. 2) [Boeke et al., 2006). Эти роды выделены на основании сравнительного анализа последовательностей их обратных транскриптаз. Кроме того, псевдовирусы и гемивирусы различаются типом праймера для обратной транскрипции [Havecker et al., 2004). Последние исследования показывают, что классификацию этого суперсемейства необходимо пересматривать [Llorens et al., 2009]. Так, показано, что некоторые МГЭ группы Ty1/Copia (например, CoDi-A) кодируют интегразы, содержащие хромодомен, характерный для интеграз представителей суперсемейства Ty3/Gypsy.
Ген gag кодирует полипротеин Gag, содержащий гипотетические домены матрикса (MA), капсида (CA) и нуклеокапсида (NC). Ген pol кодирует полипротеин pol, содержащий домен протеазы (PR), интегразы (INT) и обратной транскриптазы/РНКазы Н (RT/RNaseH). Ген env входит в состав рамки pol и кодирует гликопротеин Envelope (env). PBS - сайт связывания рибосомы, PPT - полипуриновый тракт.
Семейство Род EnvНет Хромодомен Хозяин Ту Pseudovirus Нет Fungi CoDi-A Pseudovirus Нет Есть Heterokontophyta CoDi-B Pseudovirus Нет Нет Heterokontophyta GalEA Pseudovirus Нет Нет Marine Arthropoda Sire Sirevirus Есть Нет Viridiplantae Oryco Sirevirus Нет Нет Viridiplantae Osser Sirevirus Нет Нет Viridiplantae PyRElGl Sirevirus Нет Нет Rhodophyta Hydra Sirevirus Нет Нет Cnidaria Copia Hemivirus Нет Нет Arthropoda 1731 Hemivirus Нет Нет Arthropoda Tricopia Hemivirus Нет Нет Arthropoda Мобильные элементы группы Ty3/Gypsy
Название группы ДКП-ретроэлементов Ty3/Gypsy также, как и в случае названия Ty1/Copia, пошло от названий элементов, в данном случае Ty3 и gypsy, обнаруженных первоначально в геномах дрожжей и дрозофилы соответственно. Позже представители группы были обнаружены в других организмах – грибах, растениях и животных. Почти все ретроэлементы группы имеют следующую последовательность белков, закодированных в рамке pol: протеаза, обратная транскриптаза, РНКаза Н и интеграза (рис. 5) [Eickbush, Jamburuthugoda, 2008]. Исключение составляют элементы семейства Gmr1, которые имеют организацию рамки pol такую же, как элементы группы Ty1/Copia [Goodwin, Poulter, 2002]. В настоящее время ICTV делит суперсемейство Ty3/Gypsy на два рода на основании наличия/отсутствия рамки env: Metavirus и Errantivirus [Boeke et al., 2006]. Однако эта классификация требует серьезного пересмотра, поскольку группа Ty3/Gypsy одна из самых многочисленных и разнообразных по структуре.
Взаимодействие интегразы с ДНК-мишенью
МГЭ этого типа имеют размер до 630 п.н. и носят название SINE (Short INterspersed repetitive Elements) (рис. 9). Они не кодируют обратную транскриптазу и перемещаются за счет автономных элементов [Kroutter et al., 2009]. Так же, как и гены транспортных РНК эукариот, многие SINE содержат внутренний расщепленный промотор РНК-полимеразы-III (А- и В-последовательности). Наиболее известными представителями этого семейства являются Alu-повторы в геноме человека и элементы B-семейств в геномах грызунов. Alu-повторы в среднем встречаются в геноме человека через каждые 4 т.п.н., составляя 5% от суммарного количества ДНК. Аналогичные в структурном отношении повторы, названные B1, обнаружены в геноме мышей и под другими названиями описаны у многих млекопитающих. Также гомологичные последовательности найдены и у растений.
ТР-ретроэлементы обнаружены у растений, грибов, простейших, в разнообразных позвоночных, включая иглокожих и нематод. Организация центральной части элементов сходна с таковой у ДКП-ретроэлементов: gag-RT-RNaseH, но отличается отсутствием последовательности, кодирующей протеазу, а вместо интегразы они кодируют тирозинрекомбиназу. ТР-элементы делят на три семейства: DIRS, Ngaro и VIPER [Goodwin, Poulter, 2004; Lorenzi et al., 2006] (рис. 10). DIRS-элементы имеют инвертированные концевые повторы (ИКП), фланкирующие ОРС и внутренний комплементарный регион, образующийся за счет дупликации ИКП. DIRS-элементы отличаются от двух других семейств присутствием домена метилтрансферазы (МТ), сходной с МТ, кодируемыми различными бактериофагами [Goodwin, Poulter, 2004]. Ngaro-элементы имеют организацию ОРС такую же, как и DIRS-элементы, но отличаются ориентацией фланкирующих повторов: Ngaro-элементы фланкированы прямыми повторами, которые обозначают как А1, А2, В1 и В2. VIPER-элементы (Vestigial interposed retroelement) описаны только в геномах трипаносом и отличаются тем, что фланкированы SINE-элементами (называют SIRE). А1, А2, В1, В2 – прямые повторы, ИКП – инвертированные концевые повторы, SIRE – фланкирующие элементы, ICR – внутренний комплементарный регион. Кодируемые домены: RT – обратная транскриптаза, RH – РНКаза Н, МТ –метилтрансфераза, YR – тирозинрекомбиназа.
Это семейство обнаружено более чем в 80 видах животных, а также у растений, грибов и простейших [Arkhipova, 2006]. МГЭ этого типа фланкированы ДКП, которые могут быть как прямыми, так и инвертированными. Центральная часть кодирует в составе рамки pol обратную транскриптазу и эндонуклеазу (рис. 11). Молекулярный филогенетический анализ показывает, что обратная транскриптаза Penelope-элементов более всего ближе к обратной транскриптазе теломераз (TERTs) [Arkhipova, 2006]. Напротив, эндонуклеаза Penelope-элементов ближе к бактериальной эндонуклеазе, относящейся к семейству эндонуклеаз Uri [Pyatkov et al., 2004]. Еще одна характерная особенность элементов этого семейства – наличие интрона [Arkhipova, 2006].
Кодируемые домены: RT – обратная транскриптаза, Uri – эндонуклеаза. ИКП – инвертированный концевой повтор, ДКП – длинный концевой повтор. ДНК-ТРАНСПОЗОНЫ По механизмам транспозиции ДНК-транспозоны можно разделить на три группы (Kapitonov, Jurka, 2008]: элементы с перемещением по механизму «вырезание встраивание»; элементы, перемещающиеся с помощью полурепликативной транспозиции по типу «катящегося кольца» - хелитроны (Helitrons); и элементы с самостоятельным синтезом ДНК-копий - полинтоны (Polintons). Большинство из описанных ДНК-транспозонов эукариот принадлежат к группе с типом транспозиции «вырезание-встраивание». Перенос ДНК-транспозонов из одного сайта генома в другой осуществляет транспозаза, которая действует как эндонуклеаза. Классификация семейств внутри этой группы транспозонов построена на основе сходства инвертированных концевых повторов и последовательностей транспозаз МГЭ. По структуре в группе выделяют две подгруппы элементов: содержащие короткие инвертированные концевые повторы (элементы Р, HB, mariner и hobo D.melanogaster, Tc1 нематоды, Tam у львиного зева) и содержащие длинные инвертированные концевые повторы (FB-элементы). По наличию/отсутствию ОРС, кодирующей транспозазу, различают автономные ДНК-транспозоны и неавтономные, использующие транспозазу других МГЭ для своего перемещения по геному [Wessler, 1998]. К автономным транспозонам эукариот относят не менее девяти различных семейств МГЭ, в том числе Tc1/mariner, Mutator, P, PIF-Harbinger, CACTA и другие [Wicker at al., 2007]. Некоторые семейства, например Tc1/mariner, Mutator, P, включают МГЭ длиной до 3 т.п.н. с инвертированными повторами длиной 20-30 п.н. и сайтом ДНК-мишени ТА [Plasterk et al., 1999]. Транспозоны Tc1/mariner кодируют либо только транспозазу, либо имеют одну дополнительную рамку считывания. P-элемент дрозофилы содержит единственный ген – транспозазы, состоящий из четырех экзонов, трех интронов и двух фланкирующих последовательностей с 5 - и 3 -концов длиной 31 п.н. Однако нормальный сплайсинг третьего интрона, необходимый для синтеза полноценной транспозазы, происходит лишь в герминативных клетках. В соматических тканях этот процесс блокирован.
К семействам PIF-Harbinger и CACTA относятся транспозоны различной длины – от 3 до 8 т.п.н., кодирующие, как правило, не только транспозазу, но и различные вспомогательные белки. Транспозоны этого семейства имеют инвертированные концевые повторы длиной 12-15 п.н. [Smit et al., 1996]. Полноразмерные активные представители семейства Ac/hobo обнаружены в геномах многих растений и животных.
К неавтономным транспозонам эукариот можно отнести семейство Fold-back (FB) элементов Drosophila , а также подобные им элементы, обнаруженные у Xenopus. Семейство получило свое название за способность МГЭ складываться в шпильки за счет длинных инвертированных концевых повторов-палиндромов, которые имеют протяженность от 200 до 1300 п.н. [Roiha et al., 1980]. Концевые повторы содержат внутренние повторы длиной 31 п.н., количество которых неодинаково не только в разных FB-элементах, но и в разных концевых повторах одного и того же элемента. Центральный участок у разных FB-элементов имеет неодинаковый размер и нуклеотидную последовательность, однако концы инвертированных повторов высококонсервативны даже для разных семейств. При встраивании FВ-элемента появляется дупликация в сайте-мишени длиной 9 п.н. [Roiha et al., 1980]. FB-элементы способны перемещаться не только как независимые единицы, но и вместе с длинными участками генома.
Хелитроны, в отличие от других МГЭ, не удваивают сайта-мишени при интеграции и не имеют терминальных инвертированных повторов. Хелитроны содержат от одной до трех ОРС. Подобно плазмидам, одноцепочечным бактериофагам и хеминивирусам растений они перемещаются с помощью полурепликативной транспозиции по принципу катящегося кольца, в связи с чем их также называют RC-транспозонами [Feschotte et al., 2001]. Для RC-репликации они используют собственный белок RCR Rep и хеликазу. Однако показано, что хелитроны также способны к транспозиции путем вырезания [Li et al., 2009] и могут существовать в автономной и интегрированной форме. Данный класс транспозонов широко распространен от простейших до млекопитающих [Kapitonov, Jurka, 2007]. Возможно, хелитроны являются отсутствующим эволюционным звеном между RC-элементами прокариот и хеминивирусами.
Самыми сложными ДНК-транспозонами считаются полинтоны, или самосинтезирующиеся транспозоны. Они встречаются в геномах представителей разных таксонов от простейших до позвоночных. Полинтоны имеют длину 10-20 т.п.н. и кодируют уникальные белки, включая ДНК-полимеразу B (POLB), интегразу ретровирусного типа (IN), протеазу аденовирусного типа (PRO) и АТФазу [Kapitonov, Jurka, 2006]. Как и большинство ДНК-транспозонов, полинтоны имеют инвертированные концевые повторы длиной несколько сотен п.н., содержащие 5 -AG- и TC-3 -концы (табл. 1). Согласно модели транспозиции, предложенной Kapitonov и Jurka, 2006, ДНК полинтона вырезается интегразой из генома хозяина и служит матрицей для внехромосомной репликации, которую осуществляет POLB-полимераза. Двуцепочечная копия встраивается в геном интегразой, при этом происходит удвоение 6 п.н. сайта-мишени.
Разделение фрагментов ДНК и РНК методом электрофореза
Интегразы ДКП-ретротранспозонов и ретровирусов относятся к семейству полинуклеотидилтрансфераз, в которое входят такие ферменты, как транспозаза бактериофага Mu, РНКазы Н E.coli и HIV-1, резолваза Ruv C E.coli. Также отмечено сходство интеграз с эндонуклеазами рестрикции класса II. Все эти ферменты не используют энергию АТФ или других источников энергии и могут существовать в виде мономеров, гомодимеров или гомотетрамеров.
Интегразы высококонсервативны и обладают гомологией между собой, а также с множеством транспозаз [Rice et al., 2001]. На основании результатов сравнительного анализа аминокислотных последовательностей интеграз, лимитирующего протеолиза, а также индуцированного мутагенеза с последующими экспериментами по комплементации, в структуре интеграз выделяют три домена: N-концевой, коровый (каталитический) и С-концевой (рис. 14) [Engelman et al., 1992, Vink and Plasterk, 1993, Katz and Skalka, 1994]. Низкая растворимость фермента, а также его высокая склонность к агрегации долгое время не позволяли установить точную пространственную структуру интегразы [Lee et al., 1997]. Структуры отдельных ее доменов, а также белков, состоящих из двух доменов: без С-концевого и без N-концевого, удалось определить благодаря внесению точечных мутаций, повышающих растворимость. Данные исследования были проведены на интегразе вирусов HIV-1, HIV-2 [Van Gent et al., 1992], саркомы Рауса (RSV) [Kulkosky et al., 1992] и Mo-MuLV [Jonsson and Roth, 1993]. Не исключено, что строение доменов интегразы в нативном ферменте может несколько отличаться.
Рис. 14. Модель интегразы ретровирусов с тремя главными доменами и эволюционно консервативными аминокислотами.
Числами над доменами обозначены их длины в аминокислотных остатках. Интегразы имеют размер 270-350 аминокислотных остатков (а.о.). [Andrace, 1996]. Коровый (каталитический) домен интегразы представляет собой центральную область размером около 150 а.о. Он наиболее консервативен по первичной структуре и является наиболее устойчивым к протеолизу участком интегразы [Engelman et al., 1992]. Три а.о.: Asp64, Asp116 и Glu152 (номера а.о. остатков приведены для интегразы HIV-1) формируют каталитический центр фермента, так называемый DDE-мотив. Он характерен для каталитических доменов большинства известных ретровирусных интеграз [Khan et al., 1991, Bujacz et al., 1995]. Данный мотив необходим для протекания реакций 3 -концевого процессинга, переноса цепи и дезинтеграции, так как именно он взаимодействует с концевыми нуклеотидами ДКП и сайтом-мишенью [Katzman et al., 1995, Heuer et al., 1997]. Однако изолированный каталитический домен способен осуществлять только реакцию дезинтеграции, в то время как для поведения 3 концевого процессинга и переноса цепи необходимо наличие всех трех доменов [Drelich et al., 1992, Bushman et al., 1993].
Asp64 и Asp116 способны связывать один двухвалентный ион. Возможно, что в катализе могут участвовать два иона: второй привносится в активный центр при связывании ДНК, как это, вероятно, происходит у транспозазы Tn5 [Lovell et al., 2002]. В системе in vitro с активный центр каталитического домена интегразы способен связывать различные двухвалентные катионы: Mg2+, Mn2+, Ca2, Zn2+ и Cd2+ [Bujacz et al., 1997]. Для интеграз вируса Mo-МuLV и пенистого вируса человека (human foamy virus) обязательным условия активности in vitro является присутствие ионов Mn2+, который предпочтительнее, чем Mg2+ [Pahl, Flugel, 1993]. В противоположность этому, интегразы вирусов AMV, саркомы Рауса (RSV), HIV-1 и HIV-2 проявляют свою активность в присутствии ионов Mg2+ [Goldgur et al., 1998, Chen et al., 2000, Yang et al., 2000], а интеграза HIV-1 также в присутствии ионов Ca2+ [Drelich et al., 1992]. Тем не менее, специфическую эндонуклеазную активность интеграза HIV-1 проявляет только в присутствии ее природного кофактора – иона Mg2+ [Goldgur et al., 1998]. Ионы Zn2+ могут служить кофактором вместо Mn2+ или Mg2+ при никирующей активности интегразы (3 -концевой процессинг), но не способствуют полинуклеотидилтрансферазной активности - реакции переноса цепи [Bojja et al., 2011]. N-концевой домен составляет примерно первые 50 а.о., четыре из которых: His12, His16, Cys40 и Cys43 (номера а.о. остатков приведены для интегразы HIV-1), образуют так называемый HHCC-мотив, характерный для большинства ретровирусных интеграз [Vincent et al., 1993]. Ряд ферментов, содержащих подобный мотив, формируют Zn2+-связывающий домен типа «цинковых пальцев», который наряду с координацией иона цинка выполняет и ДНК-связывающую функцию.
Исследование активности химерной интегразы, состоящей из каталитического и C-концевого домена интегразы вируса Visna и N-концевого домена интегразы HIV-1, показало, что данный фермент в качестве ДНК-субстрата предпочитал ДНК вируса Visna [Katzman et al., 1996]. На основании этих данных сделан вывод о том, что N-концевой домен не играет роли в специфическом связывании ДНК интегразой. Тем не менее, в полноценном белке этот домен способен связывать ДНК [Hazuda et al., 1994, Ellison et al., 1995]. Показано, что мутантный фермент, в котором N-концевой домен отсутствует, либо в HHCC-мотив введены замены, теряет способность координировать ион цинка и осуществлять реакции 3 -концевого процессинга и переноса цепи [Zheng et al., 1996]. Присутствие ионов цинка стимулирует тетрамеризацию интегразы HIV [Zheng et al., 1996, Lee et al., 1997], Mg-зависимый процессинг [Lee and Han, 1996], специфичность интеграции [Yang et al., 1999], а также обеспечивает образование стабильного комплекса интегразы с ДКП [Vink et al., 1994, Ellison et al., 1995]. Это может быть связано с тем, что наличие Zn2+ в N-концевом домене стабилизирует все домены между собой, изменяя пространственную структуры интегразы [Donzella et al., 1998].
C-концевой домен составляет примерно концевых 80-100 а.о. интегразы. По сравнению с N-концевым или каталитическим доменами он обладает наименьшей консервативностью. В растворе C-концевой домен образует димер, в результате чего формируется большая седлообразная бороздка. Она богата положительно заряженными а.о. лизина и аргинина, которые участвуют в неспецифическом связывании кДНК и хромосомной ДНК за счет электростатических взаимодействий с фосфатными группами ДНК [Lutzke et al., 1994, Chen et al., 2000, Bugreev et al., 2003]. Наряду с положительно заряженными аминокислотами, в связывании ДНК могут принимать участие и гидрофобные аминокислоты, например, Leu234 у интегразы HIV-1 [Lutzke et al., 1994]. Показано, что участок C-концевого домена интегразы HIV-1, содержащий с 220 по 270 аминокислотный остаток, способен связывать ДНК с эффективностью полного фермента [Lutzke et al., 1994].
С-концевой домен необходим для протекания 3 -конецвого процессинга [Nymark-McMahon, Sandmeyer, 1999]. Он взаимодействует с областью ДНК-субстрата, расположенной на расстоянии 5-10 п.н. от конца вирусной ДНК. Также этот домен необходим для тетрамеризации интегразы [Wang et al., 2001]. В системе in vitro показано, что интегразы ретровирусов функционируют в виде мультимеров [Jones et al., 1992, Engelman et al., 1993, van Gent et al., 1993]. Выявлено, что вирусоподобная частица MLV содержит больше молекул интегразы, чем нужно для интеграции одной молекулы вирусной ДНК [Jones et al., 1992].
Каждый из доменов интегразы способен в отдельности образовывать димеры. В случае каталитического домена это происходит за счет водородных связей и солевых мостиков [Bujacz et al., 1995]. Димеризация N-концевого домена происходит за счет гидрофобных взаимодействий, а С-концевого за счет водородных связей и гидрофобных взаимодействий [Агапкина и др., 2005]. При этом С-концевой домен не может образовывать димеры, находясь в комплексе с каталитическим доменом, но может в изолированном виде [Chen et al., 2000].
В работах со смесью мутантных интеграз HIV, дефектным по различным доменам, показано, что для осуществления своих функций фермент задействует домены, принадлежащие разным мономерам (транс-состояние) [Engelman et al., 1993]. Такое же транс-дополнение доменов наблюдается также у транспозаз фага Mu [Savilahti and Mizuuchi, 1996] и транспозона Tn5 [Naumann and Reznikoff, 2000].
Димеры, образованные субъединицами полноразмерной интегразы, возникают за счет взаимодействий между коровыми доменами. Кроме того, такие димеры стабилизируются взаимодействием между двумя С-концевыми доменами двух субъединиц, а также взаимодействием между N-концевым доменом одной субъединицы с коровым и С-концевым доменами другой субъединицы [Bojja et al., 2011].
Данные о несоответствии расстояний между активными центрами каталитических доменов в димере (35 ) и концами вирусной ДНК, которые встраиваются в ДНК-мишень на расстоянии 5 п.н. друг от друга ( 15-20 ), свидетельствует о неспособности одного и того же димера осуществлять интеграцию обоих концов вирусной ДНК в сайт-мишень [Vincent et al., 1993]. Эти данные свидетельствуют о тетрамерной организации интегразы, что подтверждается работой Kukolj и Skalka, 1995. Кроме того, из ядерного экстракта удалось выделить гомотетрамер интегразы HIV-1 [Cherepanov et al., 2003]. По аналогии с транспозазами фага Mu и Tn5, предполагается, что реакцию 3 -концевого процессинга интеграза выполняет в виде тетрамера, а для переноса цепи необходима октомерная организация фермента [Cherepanov et al., 2003].
Считается, что с каждым из концов ДНК-субстрата взаимодействует по одному димеру. В каждом димере одна субъединица предоставляет для реакции каталитический домен, а другая – С-концевой [Gao et al., 2001]. При этом, как показано на транспозазе Mu, только два из четырех активных сайтов тетрамера участвуют в реакциях [Aldaz et al., 1996]. Это означает, что функциональной единицей интегразы является димер, который содержит один активный сайт.
Полимеразная цепная реакция в режиме реального времени
Поскольку МГЭ gypsy является одним из одиннадцати родственных ДКП-ретротранспозонов D.melanogaster, закономерно возникает вопрос, контролирует ли локус flamenco транспозиции других ДКП-ретротранспозонов группы gypsy. Ранее при исследовании нестабильных линий, характеризующихся повышенной частотой транспозиций ретротранспозонов Idefix и ZAM, был найден локус, участвующий в контроле их транспозиции, который назвали COM (centre organisateur de mobilization) [Desset et al., 2003]. Несмотря не то что на генетической карте D.melanogaster локус СОМ (район 20A2-3 Х-хромосомы) локализован рядом локусом flamenco (район 20A1-3 Х-хромосомы), исследователи предположили, что COM и flamenco представляют собой отдельные контролирующие транспозиции локусы. С целью исследования участия гена flamenco в генетическом контроле транспозиций других ДКП-ретротранспозонов группы gypsy нами проведен анализ транспозиционной активности десяти МГЭ этой группы - ZAM, Idefix, Tirant, nomad, springer, 17.6, 297, Springer и rover - в линиях D.melanogaster SS и MS, мутантных по гену flamenco.
Для анализа транспозиций использовали адаптированный для нашего случая метод ПЦР – инвертированную ПЦР. На первом этапе мы убедились, что все ДКП-ретротранспозоны присутствуют и транскрибируются в исследуемых линиях.
Оказалось, что это так для всех МГЭ. При этом необычным образом вел себя только МГЭ Tirant (его транскрипция различалась в разных отводках линии SS, и мы этот факт исследовали отдельно, см. следующий раздел). Затем к последовательностям ДКП-ретротранспозонов группы gypsy, помещенным в базе данных GenBank, подбирали пары праймеров, направленные из центральной части МГЭ к концам. Далее выделяли геномную ДНК из мух линий SS и MS и гидролизовали рестриктазами, подобранными таким образом, чтобы внутри последовательности ретротранспозона между местами посадки праймеров не было сайтов узнавания для этой рестриктазы (рис. 45). В независимых экспериментах использовали 3-5 рестриктаз. Таким образом, в результате проводимой далее ПЦР-амплификации подвергались фрагменты геномного окружения ДКП-ретротранспозона, ограниченные с одной стороны последовательностью МГЭ (сайты связывания с праймерами) и сайтами узнавания соответствующих рестриктаз – с другой. Анализ продуктов ПЦР проводили с помощью электрофореза в агарозном геле. Типичная картина распределения фрагментов ДНК показана на рис. 45.
В результате проведенных экспериментов в исследованных линиях выявлен целый спектр амплифицированных фрагментов, различающихся по размерам. Однако нас интересовали только те из них, величина которых различалась в линиях SS и MS. Поскольку эти линии имеют единое происхождение (MS получена относительно недавно из SS путем ее трансформацией активной копией gypsy) и полностью изогенны, SS может служить контролем для MS и наоборот. Если бы транспозиции gypsy не происходили, набор амплифицированных ПЦР-фрагментов геномного окружения gypsy был бы одинаковым в обеих линиях. Если же линии отличаются набором ПЦР-фрагментов, это свидетельствует о разном геномном окружении копий gypsy.
В результате проведенных экспериментов различное генетическое окружение обнаружено только у двух МГЭ, кроме gypsy: ZAM и Idefix. Однако для ZAM мы выявили отличия между линиями только при использовании трех рестриктаз из пяти, а для Idefix – одной из пяти. Это может быть связано с тем, что некоторые сайты рестрикции могут находиться на большом удалении от ДКП ретротранспозонов, что приводит к образованию более длинных фрагментов (свыше 5 т.п.н.) после лигирования, которые не могут амплифицироваться в стандартной реакции ПЦР.
Схема проведения эксперимента методом обратной ПЦР и результаты электрофоретического анализа продуктов ПЦР, полученных при амплификации окружения МГЭ ZAM. Показаны размеры отличающихся в линиях SS и MS фрагментов. М – маркер размеров ДНК. бразом, метод инвертированной ПЦР может быть использован для установления факта транспозиций, а также может быть использован для поиска сайтов транспозиций МГЭ (для этого достаточно секвенировать амплифицированное геномное окружение инсерции). В последнем случае метод инвертированной ПЦР может конкурировать с методом гибридизации хромосом in situ, который обычно используется для обнаружения инсерций МГЭ. Однако следует отметить, что этот метод может быть не достаточно чувствительным и не позволяет в нашем случае достоверно утверждать, что другие ДКП-ретротранспозоны группы gypsy не способны к к изменентю геномной локализации в линиях flamenco. Так, с использованием другого метода (вычитающей гибридизации, см. далее) мы показали транспозиционную активность МГЭ Tirant.
В ходе исследования экспрессии на уровне транскрипции МГЭ Tirant, принадлежащего к группе gypsy, в пяти изогенных линиях D.melanogaster, мутантных по локусу flamenco (четыре отводки линии SS - 7K1SS, 7Kw1, SS, 7K1 и линия MS), обнаружено, что Tirant транскрибируется в линиях 7K1SS, 7Kw1 и MS, и его транскрипция не зависит от пола. Но при этом имеются линии, где транскрипты Tirant не выявляются: 7K и 7K1 (рис. 47). А) амплификация кДНК Tirant взрослых самок и самцов в отводках линии SS и в линии MS; Б) амплификация кДНК гена rp49. В качестве маркера длин фрагментов ДНК использовали Gene Ruler DNA Ladder Mix («Fermentas»).
Анализируя полученные результаты, мы выдвинули несколько предположений, объясняющих причины гетерогенной экспрессии МГЭ Tirant в изогенных линиях. Во-первых, на характер экспрессии МГЭ могут влиять особенности структуры его регуляторной области, для которой характерен полиморфизм (тандемные повторы длиной 102 п.н., число которых может быть различным у разных копий элемента – от 2 до 6 [Fablet et al., 2006]). Во-вторых, дифференциальную картину экспрессии Tirant в изогенных линиях можно объяснить способностью данного МГЭ к перемещению. Положение МГЭ в геноме может оказывать влияние на эффективность его транскрипции. Например, при внедрении в область какого-либо энхансера, МГЭ попадает под его влияние, что выражается в усилении транскрипции МГЭ. Мы также не исключали случая, когда в процессе разделения отводок, часть линий могла не унаследовать активно транскрибируемых копий МГЭ Tirant либо утратить их при изогенизации и раздельном разведении.
Чтобы выявить причины обнаруженной гетерогенной экспрессии Tirant, мы поставили прямое и обратное скрещивания между отводками линии SS - линиями 7К1 (нет экспрессии) и 7Кw1 (есть экспрессия) (рис. 48, А). Анализировали самок и самцов гибридов F1, полученных в ходе обоих скрещиваний. Электрофореграмма амплифицированных фрагментов их кДНК показана на рис. 48, Б.
По результатам эксперимента сделан вывод, что отсутствие экспрессии Tirant в изогенных линиях не связано с возникновением нового регуляторного механизма, а, вероятно, является следствием неравномерного распределения транскрипционно активных копий МГЭ по геномам линий при разделении отводок.