Введение к работе
Актуальность темы. Ген с-тус представляет собой клеточный аналог онкогена v-myc вируса миелоцитоматоза птиц. ДНК-сьязываюший фосфобелок Мус, продукт гена с-тус, играет важную роль в регуляции клеточной пролиферации и дифференцировки (Магси et al., 1992). Нарушения в структуре4 гена (амплификация, хромосомные транслокааии, точечные мутации) могут изменять нормальное пролиферативное состояние клеток и вызывать их злокачественное перерождение (Cole, 1986). Регуляция экспрессии гена с-тус осуществляется на разных уровнях - инициации и элонгации транскрипции, стабильности РНК, трансляции, ауторегуляции (Marcu et al., 1992) - с вовлечением ряда клеточных факторов. В настоящее время во многих лабораториях активно изучают транскрипционные фак-торы (ТФ), участвующие в регуляции инициации транскрипции этого гена (Ray & Miller, 1991; Bossone et al.,, 199?; Pyre ei al., 1992; DesJardins & Hay', 1993).
Большой интерес представляет поиск и изучение ТФ, вовлеченных в интерферон(IFN)-3aBHCHMyro регуляцию экспрессии гена с-тус (Kelly et al., 1985). Ген с-тус человека содержит четыре ISRE (interferon-^timuTated response element) подобных участка (A)exandrova et al., 1990). Эти участки обнаружены в регуляторных областях многих lFN-зависимых генов (Williams, 1991). Консенсус 1SRE имеет структуру GGAAAN GAAA. Первый ISRE-подобный участок irlA (jSRE-iike с-шус A site) расположен в 5'-некодируюяей области гена и имеет координаты -76/-67 относительно точки инициации транскрипции Р1 (+1), второй участок ігІВ расположен между основными стартами транскрипции Р1 и Р2 (+100/+110). IFN-зависимая регуляция транскрипции гена с-тус, вероятно, осуществляется через связывание специфических ТФ с этими участками.
Ранее в ядерном экстракте клеток HeLa обнаружены два белка,
:вязывающиеся с элементами 1SRE генов с-тус и 6-16 (Turpaev et
її., 1991).. Одним из них, имеющим одинаковое сродство к . 1SRE
енов с-тус и 6-16, возможно, является какой-либо из известных
FN-индуийбельных чТФ: С (Imam et al., 1990; Pine et al., .1990),
І1-2 (Rutherford et al., 1988) и/или IRF-2 (Harada et al., 1989).
Тогда как другой белок, константа связывания которого с ISRE гена с-тус превышает таковую для гена 6-16, по-видимому, ранее не был описан.
Естественным продолжением этих исследований (Alexandrova et а/.,. 1990; Turpaev et al.,- 1991) мог бы стать структурно-' функциональный анализ обнаруженного белка. В настоящее время наиболее рациональным подходом к изучению ДНК-связываюших белков служит молекулярное клонирование кодирующих их генов.
Цель и задачи исследования. Основная цель настоящей работы состояла в обнаружении гена, кодирующего новый белок, который связывается с ISRE-повобной последовательностью гена ' с-тус человека.
В ходе исследования предполагалось решение следующих экспериментальных задач:
-
Клонировать кДНК белкового фактора, связывающегося с ISRE-подобной последовательностью гена с-тус человека, установить первичную структуру кДНК и на этой основе - первичную структуру кодируемого ею белка.
-
Изучить влияние интерферонов на экспрессию клонированного гена.
3. Получить бактериальный штамм-продуцент исследуемого
белка.
-
Исследовать специфичность связывания полученного белка с участками ISRE различных интерферон-зависимых генов.
-
Определить участок связывания белка в гене с-тус.
-
Клонировать ген, кодирующий исследуемый белок, установить его первичную структуру и экзон-интронную организацию.
Научная новизна и практическая ценность работы. Клонирована кДНК, кодирующая новый ДНК-связывающий белок IRLB, участок связывания которого находится в промоторной области гена с-шус человека. Установлена первичная структура кДНК 1RLB и соответствующая ей аминокислотная последовательность белка 1RLB. В С-концевой области белка обнаружен мотив, называемый "лейциновой застежкой" (leucine- zipper), что позволяет отнести IRLB к соответствующему семейству ДНК-связывающих белков. Получен бактериальный штамм-продуцент 1RLB. В опытах по сдвигу полосы связывания в геле (electrophoretic raobiі іty-shift assay) показано, что сродство продуцируемого в E.coli белка к
двуаепочечным (дц) олигонуклеотидам, содержащим элементы 1SRE различных IFN-завпсимых генов, убывает в следующем порядке: і г 1В (ген с-тус) > 1SRE (ген 6-16) > ISRE (ген 9-27) > irlA (ген с-тус). Методом защиты от ДНКазы (DNasel footprinting) определен участок связывания, IRLB в промоторной области гена с-тус человека.. Защищаемая область имеет координаты +98/+112 и включает IFN-индуциоельный элемент ігіВ (+100/+110). Клонирован фрагмент хромосомной ДНК (18,5 тпн), содержащий ген IRLB человека и построена физическая карта локуса IRLB. Определена нуклеотидная последовательность гена IRLB и установлена его экзон-интронная организация. 3 геномах эволюционно удаленных видов животных обнаружены нуклеотидные последовательности, гибридизуюшиеся в нестрогих условиях с кДНК IRLB. Показано, что в диплоидных' фибробластах человека образуется пять видов мРНК IRLB. Обнаружена стимуляция синтеза мРНК 1RLB интерферонами т и а.
Данная работа вносит вклад в изучение IFN-зависимых процессов, контролирующих регуляцию экспрессии- прото-онкогена с-тус, что может быть использовано в поисках рациональных путей терапии некоторых форм злокачественных заболеваний у человека.
Структура и об'єм работы. Диссертация изложена на /ЗО страницах машинописного текста и включает следующие главы: Роль ' ДНК-СБйзывающих белков в регуляции инициации транскрипции у эукариот (обзор литературы), Материалы и методы, Результаты и их обсуждение, Выводы и Список литературы ( /сЭ наименований). Диссертация содержит /-^рисунков и 1 таблицу.
Апробация. Основные, результаты работы докладывались и обсукдались на X Российско-германском симпозиуме "Структура и функция генома" (Суздаль, ,1993); III отчетной конференции ГНТП "Приоритетные направления генетики" (Москва, 1993); V Всероссийской конференции по генетике соматических клеток в культуре (Черноголовка, 1993), IV Всероссийской конференции "Геном человека" (Черноголовка, 1994); международном симпозиуме "Genome Mapping к Sequencing" (Cold Spring Harbor, 1994); международном симпозиуме "Современные тенденции в вирусологии и иммунологии опухолей" (Москва, 1994); конференции Института молекулярной биологии им.В.А.Энгельгардта РАН с участием International Advisory Board (Москва, 1994).
Публикации. По материалам диссертации опубликовано 3
печатных работы. ...
ОСНОВНОЕ СОДЕРЖАНИЕ'РАБОТЫ
1. Скрининг библиотеки кДНК из фибробластов человека.
Первым этапом исследования был функциональный скрининг экспрессирупцей библиотеки кДНК с целью обнаружения в ней клонов, кодирующих белки, связывающиеся с вторым ISRE-подобным участком гена с-тус человека - irlB.
Для скрининга библиотеки кДНК применили дц олигонуклеотид
s'gatcGGCGGGAAAAAGAACGGA3', содержаний элемент і г 1В с
фланкирующими нухлеотидами и выступающие 5'-концевые
4-нуклеотидные линкеры (обозначены строчными буквами). Дц олигонуклеотиды олигомеризрвали в реакции лигирования. Один из полученных дц олигомеров (гекса-ігІВ)" радиоактивно метили и использовали в качестве зонда для поиска связываюшихся с ним гибридных полипептидов. В результате анализа ЗхЮ5 клонов фаговой библиотеки кДЙК из фибробластов человека (Clontech) в экспрессируювюм векторе Xgtll отобрали четыре клона,_ гибридные полипептиды которых связывали ДНК-зонд.
2. ДНК-связываюшие свойства гибридных полипептидов.
В опытах по сдвигу полосы связывания в геле исследовали специфичность связывания гибридных полипептидов * с дц олигонуклеотидоы JrlB. Оказалось, ^что белковый продукт только одного (Xgt-L/62/4) из четырех клонов, отобранных в результате скрининга, ' способен образовывать комплекс с ISRE-подобным элементом (Рис.1). Связывание с irlB гибридного полипептида оказалось специфичным. Так, при инкубировании фаголизатов бактерий, инфицированных фагом xgt-L/62/4, с меченым ігіВ в присутствии 30-кратного молярного избытка немеченого irJB интенсивность полосы связывания, . соответствующей специфичному ДНК-белковому : комплексу, ослаблялась (Рис.1). Доказательством того, что ЛНК-связызаквая активность в гибридном белке - продукте клона xgt-L/62/4 принадлежит не 0-галактозидазе, а слитому с ней. эукариотическому'полипептиду IRLB, служит отсутствие специфичной
ДНК-связывающей активности в фаголизате бактерий, инфицированных диким типом фага >gtll (Рис.1).
mj>
fuse wild -+- +
free
Рис.1. Электрофоретический анализ (5%-ный ПААГ) связывания белков из фаголизатов бактерий, инфицированных фагами Agt-L/62/4 (fuse) и Xgtll (wild), с меченым дц олигонуклеоти-дом і г IB в присутствии ( + ) и отсутствии (-) 30-кратного молярного избытка немеченого irIB. Комплекс рекомбинантного белка из фаголиза-та Agt-L/62/4 с irIB показан стрелкой. Контрольная дорожка (free) -олигонуклеотид без добавления белка.
3. Структура фрагмента клонированной кЛНК.
Для определения нуклеотидной последовательности фрагмента
EcoRL-coRI (655 пн) клона Agt-L/62/4 проводили его
субклонирование в плазмидном векторе pUC19. Полученную
рекомбинантную конструкцию обозначили pUCIRL. Клонированный фрагмент кДНК плазмиды pUCJRL секвенировали по методу Sanger (1977). ~
Компьютерный анализ клонированной кДНК с помощью пакета программ /PC/GENE показал, что наиболее протяженная открытая рамка считывания (ОРС) состоит из 573 пн. Основная ОРС клонированного фрагмента совпадает с ОРС гена JacZ (xgtll), - свидетельство того, что эта ОРС кодирует полипептид, способный в составе гибридного белка связываться с ISRE-подобной последовательностью гена с-тус. В других рамках размеры ОРС не превышают 100 пн. Таким образом, клонированная кДНК может кодировать полипептид, состоящий из 191"аминокислотного остатка. 8 положении 646(574) л-л холится стоп-кодон ТАА, между ним и З'-кскиом кДНК расположены
еше два стопч-кодоча - ТАА и TGA . Участок ААТАА,
703(631) 712(640)
подобный сигналу полиаденилирования (ААТААА), расположен з позиции 701(629) (на Рис.З показан точками). -,
Первый ATG колон в ОРС расположен в положений 191(119), однако; он не имеет характерного для инициаторных кодонов эукариотических генов нуклеотидного окружения, называемого консенсусом Козак. Структура минимального консенсуса Козак - NNANNAIG.G, где N - любой нуклеотид, а инициаторный колон подчеркнут (Kozak, 1989). С другой стороны, эукариотические мРНК, как правило, имеют на своем 5'-конце нетранслируемую область, в которой в рамке считывания белкового продукта часто расположены) стоп-кодон(ы). В довольно протяженной 5'-некодирующей области кДКК клона L/62/4"(более 100 пн) нет ни одного терминирующего колона. Следовательно: либо клонирован фрагмент полноразмерной кДНК, лишенный 5'-концевой области (что довольно часто происходит при конструировании библиотек кДНК), либо кДНК полноразмерна, и синтез белка инициируется с первого или второго AUG. Истиный(е) размер(ы) экспрессируюшейся(ихся) в клетке мРНК можно установить методом Northern-гибридизации, а размер белкового(ых) продукта-(ов), кодируемого данной мРНК - методом трансляции in vitro.
Кодируемый кДНК подипептид, назван. IRLB (то есть, белок, связывающийся с участком ігІВ гена с-гаус человека).
4. Экспрессия гена IRLB.
Экспрессию гена IRLB в диплоидных фибробластах человека изучали методом Northern-гибридизации. Суммарную РНК из клеток человека выделяли по методу Chomczynski & Sacci (1987). Фракционированную в геле РНК иммобилизовали на фильтре Hybond N и гибридизовали с радиоактивным одноцепочечным (оц) антисмысловым РНК-зондом, представлявшим собой продукт транскрипции in vitro некодирующей цепи кДНК IRLB. Оказалось, что в фибробластах человека обнаруживается пять видов мРНК IRLB с размерами 7,2; 5,3; 2,0; 1,2 и 0,7 тно. (Рис.2). Множественность мРНК 1RLB может быть ' обусловлена альтернативным сплайсингом пре-мРНК. Наименьшая мРНК (0,7 тно) сопоставима по размеру с клонированной
В ходе исследования исходная кДНК была удлинена с 5'-конца на 72
пн (раздел 5), поэтому начальные координаты различных
структурных единиц приводятся в скобках после уточненных.
нами кДНК (0,65 тно), из чего можно предположить, что в этой кДНК отсутствует 5'-концевая часть (б ходе синтеза кДНК было утеряно около 50 нуклеотидов).
Для изучения влияния интерферонов а и 7 на экспрессию мРНК 1RLB в растущую культуру диплоидных фибробластов человека добавляли IFNa до конечной концентрации 500 ед/мл или IFNr (100 ед/мл). Через б часов инкубации с IFNa и через 24 часа в случае IFNr (Kelly et al., 1985) выделяли суммарную клеточную РНК. После фракционирования в геле и переноса на .мембрану Hybond N гнбридизовали препараты РНК с радиоактивными РНК- или ДНК-зондами. В качестве зондов, помимо описанного выше, использовали зонд МР1, представляющий собой фрагмент +3/+112 первого экзона гена с-тус (гибридизуется только с мРНК, синтезируемой с точки P1J, и зонд МР12 - фрагмент +3/+335 (гибридизуется с Р1 и Р2 мРНК). Для сопоставления относительных количеств анализируемых препаратов РНК проводили их гибридизацию с меченым фрагментом кДНК (3-актина чеповекг.. Результаты Northern-гибридизации ^представлены на Рис.2.
В обработанных интерферонами фибробластах индуцируется синтез всех видов мРНК IRLB, причем влияние IFNr на экспрессию гена 1RLB сильнее, чем IFNa. Интересно отметить факт стимулируюэего влияния IFNr на синтез мРНК гена с-гаус, инициируемый в точке Р2 (Рис.2). С данного промотора синтезируется 75-90 зрелой мРНК (в 5-7 раз больше, чем с PI) поэтому при использовании меченого зонда МР12, гибридизующегося с обеими мРНХ гена, в основном происходит детекция экспрессии мРНК, синтезируемой со старта Р2. Индукция интерфероном г синтеза мРНК гена с-иус описана Kelly et al., 1985. Нами же впервые обнаружено стимулирующее воздействие IFNr на транскрипцию с-тус с промотора Р2 (Рис.2). Это наблюдение становится особенно любопытным, если сопоставить его с данными по стимуляции интерфероном г синтеза мРНК IRLB и свойствами полипептида IRLB, участок связывания которого с ДНК гена с-тус имеет координаты -62/-48 относительно старта транскрипции Р2 (см. раздел 10).
Таким образом, экспрессия всех видов мРНК IRLB в диплоидных фибробластзх человека индуцируется интерферонами г и а. Не исключено, что белок IRLB относится к числу IFN-зависимых ТФ и участвует в регуляции инициации транскрипции гена с-тус в точке Р2.
- a g
28S- +
IRLB
18S - ^^
c-myc (MP1)
c-myc (MP12) actin
Рис.2. Экспрессия генов IRLB и c-myc в диплоидных фибробластах человека, обработанных интерферонами о и г На дорожки наносили по 10 мкг суммарной РНК, выделенной из: необработанных интерферонами клеток (-), обработанных IFNa (а) и обработанных IFNjr (g). Фракционированную в 1%-ном агарозном геле, содержащем формальдегид, РНК иммобилизовали на мембране Hybond N. В качестве радиоактивно меченных зондов для гибридизации использовали антисмысловую РНК IRLB, фрагметы первого экзона гена c-myc (МР1 и МР12) и кДНК э-актина (показаны справа). Слева приведены положения 28S и 18S рибосомных РНК.
5. Определение S'-конца кДНК IRLB.
Для определения 5*-конца кДНК IRLB был применен метод Р.АСЕ . (rapid amplification of C.DNA nds), описанный Frohman et al.
(1988). Синтез первой цепи кДНК проводили обратной транскрипцией, используя в качестве матрицы поли(АУ*РНК из диплоидных фибробластов человека. С помощью терминальной дезоксирибонуклео-тидилтрансферазы удлиняли 3'-конец путем присоединения к синтезированной оц кДНК поли(<Ю)-участка. Проводили 35 циклов ПЦР-амплификации кДНК с использованием в качестве затравок синтетических оц олигонуклеотидов ^Асхжхитссоссссссссс3' (неспецифичный, отжигается на поли(dG)-трактах всех молекул кДНК) и S'GTGTGCATTCCAGAGAATGTAC3' (специфичный, комплементарен участку 261/282(189/210) некодирующей цепи кДНК 1RLB)., ДНК после амплификации расщепляли рестриктазой BamHI (участки узнавания которой присутствуют в кДНК IRLB - 243(171) и в поли(гіС)-содержашем олнгокуклеотиде). ВашНІ-гидролизат фракционировалм в 1,5%-ном агарозном геле. Элюировали из геля фракцию фрагментов ДНК, размер которых превышал 200 пн (размер продукта амплификации исходной кДНК с учетом длины ojmro(dG)). Проводили субклонирование пула кДНК е линеаризованном рестриктазой BamHI плазмидном векторе pUC19. 15 клонов-трансформантов из 400 отобранных для анализа давали положительные сигналы при гибридизации in situ с меченой кДНК 1RLB. Анализ первичной структуры клонированных фрагментов кДНК_ показал, что все они содержат ._5'-концевые области, _ отсутствующие в исходной кДНК.
В кДНК одной из анализируемых рекомбинантных плазмид (N68) размер козой 5*-концевой области составляет 72 пн (Рис.3, показана курсивом). В удлиненной кДНК 1RLB отсутствуют ATG и терминирующие кодокы в ОРС. Мы полагаем, что результаты, полученные с помощью Northern-гибридизации и„ метода RACE, свидетельствуют либо о том, что клонирована кДНК, соответствующая наименьшей изоформе мРНК (около 700 нуклеотидных остатков) гена IRLB. В таком случае 5'-концевой экзон этой мРНК является " общим для всех изоформ, являющихся продуктами альтернативного сплайсинга пре-мРНК IRLB, не затрагивающего 5'-концевую область. Либо у высокомолекулярных мРНК гена в результате альтернативного сплайсинги отсутствует участок -261/282, с которым отжигается один из праймеров, используемых з ПЦР-амплификации, и размер их 5'-концевой области не может быть определен с помощью метода RACE. После ПЦР мы провели Southern-блот гибридизацию
электрофоретически разделенных продуктов амплификации. Оказалось, что размер образующихся фрагментов достигает 2,0 тпн (результат неспецифического отжига поли(dC )-праймера) тогда как размер фрагментов кДНК, гибридизующихся с радиоактивно меченой кДНК 1RLB, не превышает 0,3 тпн, что.соответствует размеру фрагмента кДНК в клоне N68.
Удлиненный вариант кДНК IRLB (717 пн) содержит lSRE-подобный элемент 'GGAAAATGAA18 (Рис.3). Возможно, этот интерферон-индуцибельный элемент является участком связывания IFH-зависимых ТФ, вызывающих стимуляцию синтеза мРНК IRLB в клетках, обработанных (інтерферонами г и а.
6. Определение инициаторного ATG кодона кДНК 1RI.B.
С помощью компьютерной программы PCGENE/SIGNAL провели поиск в ОРС, кодирующей полипептид 1RLB, потенциальных инициаторных ATG-кодонов. "Претенденты" на роль инициирующего трансляцию кодона имеют- координаты 373, 535, 214,. 229, 298. и 394 (расположены по порядку снижения вероятности инициации трансляции в данном месте). С них могут синтезироваться полипептиды с молекулярными массами (в кДа): 10,6; 4,2; 16,9; 16,3; 13,5 и 9,8, соответственно. Как.ой же из перечисленных .кодонов (кроме ATG, с которого может синтезироваться полипептид (4,2 кДа), лишенный ДНК-связывающих мотивов) является инициаторным?
Для ответа на этот вопрос провели трансляцию синтезированной in vitro РНК IRLB в бесклеточной белоксинтезируюшей системе из ретикулоцитов кролика. Продукты трансляции анализировали злектрофоретическиї Оказалось, что с данной РНК in vitro
синтезируются 2 полипептида с приблизительными размерами 17 кДа и 14 кДа (данные приведены в диссертации, раздел- 3.6). Синтез полипептидов с такими размерами может инициироваться в положениях 211/217 и 263/269 ОРС, соответственно. Однако, ввиду того, что-участок 263/269 не содержит метиониновых кодонов, и количество синтезируемого і л vitro 14 кДа-полипептида меньше, чем его 17 кДа-аналога, лами сделан выгод о неспецифической инициации in vitro синтеза белка в области 263/269. Напротив, участок 211/217 содержит ATG , с которого может инициироваться синтез полипептида IRLB размером 16,9 кДа (PCGENE/PHYSCHEM). Таким образом, на основании теоретических и экспериментальных данных,
мы полагаем, что синтез белка IRLB инициируется in vitro -со второго метионинового колона ОРС - ATG Отсутствие в позициях -3 и +4 окружения этого кодона консервативных - нуклеотидов консенсуса Козак, повидимому, позволяет части рибосом пропускать данный кодон с последующей абортивной инициацией-с триплетов, 263 или 266.
Однако, если в кДНК 1RLB (717 пн) все же отсутствует
5'-концевая область, то с помощью трансляции in vitro обнаружена
внутренняя инициация (из-за отсутствия первого ATG-кодона). В
. таком случае данная кДНК кодирует функциональный С-концевой
полипептид (домен) ДНК-связываюшего белка IRLB.
7. Структурный анализ белка 1RLB.
С помощью программы PCGENE/PHYSCHEM установили, что полипептид IRLB имеет молекулярную массу 16,9 кДа и состоит из 144 аминокислотных остатков. Изоэлектрическая точка pi равна 8.8, что согласуется с высоким содержанием в . полипептиде положительно заряженных остатков (Arg - 4,9. Lys - 8,3. всего -13,2). Заряд молекулы белка при рН 7.0 равен +3,3.
Компьютерный анализ обнаружил в IRLB два потенциальных
участка фосфорилирования - протеинкиназой С: LWNAH1GKYPM
(однобуквенкые обозначения аминокислот, модифицируемый остаток подчеркнут) и KSMVK1XMND, а также один участок фосфорилирования казеиноьсй киназой II MECRKJFGEPY. Возможно, регуляция ДНК-связывающей активности IRLB осуществляется посредством его фосфорилирования или дефосфорилирования.
Мы полагаем, что IRLB относится к семейству ДНК-связываюших белков b—ZIP (basic leucine zipper proteins), содержащих "лейциновую застежку". В его первичной структуре присутствует характерный для представителей данного семейства белков димеризулщий мотив ( L-X ) , где L - лейцин, X - любая аминокислота, п - число повторов (обычно = 4 или 5).
Роль ДНК-связываюшего домена может выполнять богатая остатками Lys и Arg область, расположенная между Lys и *Г8В2 (Рис.3). Сразу же за ней находится упомянутый димгризуюиий домен, содержащий расположенные через 7 аминокислотных остатков Leu , Leu . lie и.Leu , (последний отстоит от Не на 14
8S' 92 99 113 ч 99
ISKE
i-agcttattggaaaatgaiggtgatcatgcaata
34 acagtagcagaotttgtggaccatcatccaatt^ttttttggaacctegtatggtatttc
TrpAsnleuYalTrpTyrPhe
9« agacirtcttgacttgcccagtaacttacctggattgattctttcttctgagcactgtaac" ArgArgLeuAspLeuProSerAsiu\euPrT>GlyLeuIleLeuSerSerGluHlsCysAsn
is* aagtattcaaagattccccgccactgtatgtctgaagatagcaaatatgttttaatacaa LysTyrSerlysHeProArgHisCysMetSerGluAspSarLysTyfValLeuIleGln
214 ATGTTATGGGACAATATGAAGTrACATCAGGATCCGGCACAGCCCTTGTACATTCTCTCG i. MetteuTrpAspAsnliettysLeuHisGlnAspProGlyGlnProLeuTyrl leLeuTrp
274 MTGCACACACCCAAAMTATCCMTGCTCCATTTATTGCAAAAAAGTGATAACTCATTT 21 AsnAlaHlsThrGlnLysTyrProMetValHisLeuLeuGlnLysSer AspAsnSerPhe
3 34 AACCAGGAACTGTTGAAAAGTATGGTAAAAAGC ATTAAAATGAATGATGTCTATGGACCA 4i AsnGlnGluteuteuLysSerlfetValLysSerlleLysMetAsnAspValTyrGlyPro
3 94 ATCAGTCACArnTAGAGACACTCMTMCTGTCCACATTTTAAAAGACACAGGAGTTTA 6i MetSerGlnlleLeuGluThrLeuAsnLysCysProHisPheLysArnGlnArgSerLeu
+ + +
454 TACACAGAAATACTATTTCTCTCACTTCTGGCACTGGCAAGACAAAACATTGATATAGAT
si I^rArsGlalleLeitfheLeuSerLeuValAlaLeuGlyAreGluAsiiIleAspIleAsp
+ «»« ** **
514 GCTTTTGATAAAGAGTACAAGATGCCATACGATCGTCTCACACCTAGTCAAGTCAAGAGT і о і AlaPheAspLysGluTyrLystotAlaTyr AspArgLeuTlirProSerGlnValLysSer
574 AC AC ACAACTCTGATAGACC ACC AAGTAC AGGGCTGATGGAATGTCGAAAAACCTrTGGA і г і ThrHls AsnCysAspArgProPro5erTJirGlyValMetGluCysArgI.ysrhrPheGiy
634 GAACCTTATCTTtaagatgrtatttgtatetgtaaacat'tcaatgtatattgtatarttag 141 CluProTyrLeu
6S4 tgtataaaataacacttttagagc-7i7
Рис.3. Первичные структуры кЛНК IRLB и кодируемого ею белка IELB.
Аминокислотные остатки синезируемого 1л vitro полипептида IRLB
обозначены амрнъш шрифтом, их нумерация начинается с Н-концевого
Met (ATG-214). Аминокислотная последовательность N-концевой части
продуцируемого в E.coll полипептида bsIELB показана (без нумера
ции) тонким шрифтом. Удлиненная с помощью техники RACE
5'-концезая область кДНК (1/72) выделена курсивом,
3'-нетранслируеыая область (646/717) обозначена строчными буква
ми. Потенциальный ЯНК-связываюшия мотив белка IRLB подчеркнут,
-положительно заряженные остатки- мотива (Arg и Lys.l обозначены
"+". Остатки Leu и Не, предположительно участвующие в образова
нии леишшовоя застежки, показана "»«". Терминирующие" колоны по
дчеркнуты. Потенциальный сигнал полиаденилирования показан " '
остатков). Лейциновая застежка IRLB не является полностью канонической (присутствие Не и неканонического TyriQ6). '
Предсказанная с помощью программы PC/GENE вторичная структура IRLB характеризуется присутствием амфипатическои о-спирали между Leu и Leu , необходимой для образования характерной для димеров белков семейства b—ZIP формы "coiled coil".
Белок IRLB содержит 17 остатков Leu (11,8 от обшего
количества аминокислотных остатков в полипептиде). В
литературе уже описан подобный Leu-богатый ТФ АР-2 (Williams &
Tjian, 1991). Он не относится ни к одному из известных семейств
ТФ, и связывается с элементом CCCCAGGC в промоторах многих
клеточных и вирусных генов. Гомология между аминокислотными
последовательностями IRLB и АР-2 нами не обнаружена. -
В N-концевой части IRLB между Gin и Pro расположена Pro/Gln-богатая область, содержащая по 3 остатка Pro и Gin (Рис.3). Этот участок может выполнять роль активирующего транскрипцию домена. Pro/Gin домены обнаружены в некоторых ДНК-связывающих белках, в частности в белке Мус (Marcu et а/., 1992). -Таким образом, структрная организация белка 1RLB сходна с таковыми для ТФ, принадлежащих к семейству b-ZIP.
'Поиск гомологии аминокислотной последовательности белка IRLB с помощью программы DNA-SUN в базе данных SwissProt (release ЗО) не привел к обнаружению существенных сходств с первичными _, структурами уже известных белков.
В случае, если клонированная кДНК неполноразмерна и в ней отсутствует истиный инициаторный АТС-кодон, белок IRLB окажется длиннее, чем 144 остатка. Удлиненная методом RACE кДНК может кодировать полипептид размером 215 аминокислотных остатков. Его молекулярная масса составит не менее 24,4 кДа, изоэлектрическая точка - 8.4, а суммарный заряд при рН 7.0 будет равен +3;7 (PCGENE/PHYSCHEM). По физико-химическим свойствам такой белок близок к белку 16,9 кДа.
8. Бактериальный штамм-продуцент белка IRLB.
Для получения бактериального штамма-продуцента белка IRLB в качестве экспрессирующего вектора применили плазмиду pC0V2 (Queen, 1983), содержащую температурочувствительный промотор. Р-
фага X, участок инициации трансляции фагового гена его и сайт для клонирования фрагментов ДНК, белковые продукты которых необходимо экспрессировать. С учётом того, что в кДНК 1RLB может отсутствовать 5'-концевая область, при созданий плазмидной конструкции субклонировали в векторе pC0V2 полноразмерный EcoRI-EcoRI фрагмент (655 пн) ДНК фага Agt-L/62/4. Полученной, конструкцией (pCOIRL) трансформировали штамм E.coli K802hptr (лсбезно предоставлен В.Речинским, ИМБ РАН), в котором изучали экспрессию белкового продукта, обозначенного bsIRLB (bacterialiy-synthesized IRLB). bsIRLB состоит из 195 аминокислотных остатков (Рис.3) и на N-конце имеет тетрапептид MetAspGlnPhe, кодируемый векторной ДНК. С помощью электрофореза в 10%-ном ПААГ, содержащем 0,1 SDS, определена молекулярная масса белка bsIRLB - 23 кДа, что .согласуется с величиной, предсказанной по аминокислотной последовательности, - 22,6 кДа (Рис.4). Причем, в бесклеточном экстракте бактерий, трансформированных pCOIRL, но не индуцированных температурным шоком, белок bsIRLB не экспрессируется (Рис.4). Количество продуцируемого в E.coli полипептида bsIRLB составляет около 40 от общего клеточного белка. В опытах по сдвигу полосы ^в геле использовали препараты bsIRLB из бесклеточных экстрактов бактериального штамма-продуцента.
+
Рис.4. Электрофоретический анализ
белков, экспрессируюшихся в
Е.соП/pCQIRL (10%-ный ПААГ/0,1%-ный
SDS), индуцированных ( + ) и
неиндуцированных, (-) температурным,
40,0 шоком. Стрелка указывает белок bsIRLB. Справа приведены положения маркерных белков: альдолазы (40,0
14,4 кДа) и лизоцима (14,4 кДа)^"
9. Исследование ДНК-связывающей специфичности белка bsIRLB.
В опытах по сдвигу полосы связывания в геле мы использовали препараты белка bsIRLB и дц олигонуклеотиды, воспроизводящие ISRE-подобные элементы различных IFN-зависимых генов (с-тус, б-іб, 9-27) или их слитые химерные комбинации. Олигонуклеотиды irlA, ігІВ и 6-16 ISRE были любезно предоставлены Б.Черновым (ИМБ РАН), остальные - I.Kerr и G.Stark (Imperial Cancer Research Fund, London). Обозначения и структуры этих олигонуклеотидов следующие:
irlA " - GGGAAAAGAAAAAA
і г IB - GGCGGGAAAAAGAACGGA
б-J б ISRE - GGAAAATGAAACT
6-16 wt - GAGCTGGGAGAGA-GGGGAAAATGAAA-CTGCAGAGTGCAC
9-27 wt - TTTACAAACAGCA-GGAAATAGAAACT-TAAGAGAAATACA
6-9-9 - GAGCTGGGAGAGA-GGAAATAGAAACT-TAAGAGAAATACA
g-6-6 - TTTACAAACAGCA-GGGGAAAATGAAA-CTGCAGAGTGCAC
6-6-9 - GAGCTGGGAGAGA-GGGGAAAATGAAA-TAAGAGAAATACA -
Подчеркнут консенсус ISRE. Олигонуклеотиды 6-16 wt, 9-27 wt и их производные состоят из 3-х 13-нуклеотидных участков (длина каждого олигонуклеотида - 39 остатков) - 5'- и 3'-фланкирующих и центрального "корового" (собственно ISRE)-. Гибридные варианты' 6-16 wt,K 9-27 wt обозначены тремя цифрами, каждая из которых показывает происхождение соответствующего участка. Например, в состав химерного олигонуклеотида 6-9-9 входит 5'-концевой участок олигонуклеотида 6-16 wt (6-), а также коровий (-9-) и З'-концевой (-9) участки олигонуклеотида 9-27 wt.
Связывание белка bsISRE с дц олигонуклеотидами, воспроизводящими ISRE-подобные элементы различных IFN-зависимых генов (с-шус, 6-16, 9-27), специфично (Рис.5А и Б). Наибольшее сродство белок проявляет при связывании с дц олигонуклеотидом ігІВ. Образование комплекса белка bsIRLB с олигонуклеотидом irlA удается обнаружить только при конкурентном вытеснении немеченым irlA, взятым в 30-кратном молярном избытке, меченого irJB из комплекса с белхом (Рйс.5А). -Комплексне участием меченых irlA и 6-16 ISRE обнаружить не удалось (Рис.5А), что' свидетельствует о низком сродстве bsIRLB к этим олигоиуклеотидам. Однако, дц олигонуклеотиды б-J б wt и 9-27 wt, а также их гибридные варианты
связываются белком, причем специфичность связывания олигонуклеотидов, содержащих элемент ISRE гена 6-16, выше, чем у олигонуклеотидов с ISRE гена 9-27. Это наблюдение свидетельствует о том, что замена в элементе ISRE - А7Т (6-16) на Т.А (9-27) приводит к, снижению сродства белка bsIRLB к последовательности-мишени. Связывание белка с длинными (39 пн) олигонуклеотидами, содержащими элементы ISRE гена 6-16" (6-16 wt, 6-6-9, 9-6-6), и отсутствие взаимодействия с коротким олиго:гуклеотидом 6-16 ISRE (13 пн) говорит о важности присутствия в структуре олигонуклеотидов участков, фланкируюших узнаваемую bsIRLB "коровую" область (Рис.5А,Б).
6-6-9 6-9-9 -+ -+ - + -*-*
Рис.5. Электрофоретический анализ (7,5%-ный ПААГ) связывания белка bsIRLB с радиоактивно меченными дц олигонуклеотиаами, воспроизводящими элементы ISRE различных IFN-завискмых генов. (А) (1) irlB, (2) ігІВ в присутствии 30-кратного молярного избытка немеченого irJfl, (3) irlB и 30-кратный молярным избыток немеченото ітїА, (4) irlA и (5) 6-16 ISKE; (Б) (9-9-9) 9-27 wt, (6-6-6) 6-16 wt, (6-6-9) 6-6-9, (9-6-6) 9-6-6 и (6-9-9) 6-9-9. На дорожках, обозначенных "+", разделялись олигонуклеотиды с белком, а на дорожках "-" олигонуклеотиды без добавления белка. Комплексы белка bsIRLB с олигонуклеотидами показаны стрелками.
Таким образом, нами установлено, что консенсус для
AT связываемых белком bsIRLB участков имеет формулу GGAAA—.GAA. ДНК-
- связывавшая специфичность белка bsIRLB в опытах по сдвигу полосы
в геле убывает в ряду ISRE-подобных участков различных генов:
ігіВ -> 6-16 ISRE -> 9-27 ISRE -> irlA.
10. Определение участка связывания белка bsIRLB в гене с-шус человека.
(1 мкг/мл) в течение 5 расщепления анализировали ПААГ (Рис.6).
Для определения участка связывания белка bsIRLB в гене с-тус человека применили метод ДНКазного футпринтинга. Поскольку наибольшую специфичность в связывании ^ с анализируемыми ISRE-подобными олигонуклеотидами полипептид bsIRLB проявляет при образовании комплекса с интерферон-индуцибельным элементом і г 1В гена с-кус, поиск участка связывания белка проводили на фрагменте Xho\-Avzl\ (+71/+335) гена, содержащем элемент ігіВ (+100/+ПО). Бесклеточный экстракт бактериального штамма-продуцента белка bsIRLB инкубировали 20 мин с меченным (по участку растепления рестриктазой Xhol ) фрагментом первого экзона гена с-шус в растворе, содержащем 10 мМ трис-HCI, рН 7.6/ 50 мМ NaCl/ 10 мМ MgCl , при 20С. Обрабатывали образовавшийся комплекс ДНКазой I
мин в тех же условиях. Продукты электрофоретически в денатурирующем
Рис.6. Определение сайта связывания белка bsIRLB на участке первого экзона (Xhol-Avall, +71/+335) гена с-шус человека (12%-ный ПААГ/ 7 М мочевина). Фрагменты, образующиеся при: пурин-специфическом расшеплении анализируемой ДНК (1); обработке ДНКазой I свободного (2) и связанного " с ' белком bsIRLB (3) фрагмента Xhol-Avall гена с-шус. Защищенная от нуклеазы последовательность приведена справа.
Белох bslRLB в комплексе с ДНК зашишает участок *'eCGGGAAAAAGAACGG*n2, включаюїаий lSRE-подобный элемент і г IB (+100/+110). Этот участок перекрывается с участками связывания двух ТФ - E2F и ZF87/MAZ (Yee el al., 1989; Bossone et al., 1992; Pyre et al., 1992), которые вовлечены в регуляцию транскрипции гена с-тус, что подтверждает важность данной области ДНК в регуляции экспрессии онкогена. Однако, ответ на вопрос об участии белка 1RLB в регуляции транскрипции гена с-тус могут дать только дальнейшие исследования.
11. Клонирование гена /ДІВ и определение его первичной структуры. Методом Southern-гибридизации EcoRI-гидролизатов геномной ДНК (любезно предоставлены А.Акопяном и Т.Тихомировой, ИМБ РАН) из различных видов животных с меченым фрагментом кДНК IRI.B установлено, что в геномах насекомых, земноводных, рыб, птиц и грызунов существуют нуклеотидные последовательности, гибридизуюшиеся в мягких температурных и солевых условиях (5бС, SSC 6х) с ДНК-зондом (Рис.7).
23,1 ---.*-Sf4' -Ш*~
4,4 - *Й8
2,3 -
2,0 -
Рис.7. Поиск в геномах
различных . . видов . животных
/RIB-подобных нуклеотидных
последовательностей.
EcoRI-гидролизаты препаратов
хромосомной ДНК человека (1),
крысы (2), ~ суслика (3),
цыпленка (4), вьюна (5),
лягушки (6) и дрозофилы (7)
разделяли в 0,8%-ном агарозном
геле, иммобилизовали на
мембране Hybond N и
,гибридизовали с радиоактивно
меченным зондом - кДНК IRLB. В
качестве маркера использовали
расиепленнную рестриктазой
Hindi II ДНК фага к (размерь: образующихся фрагментов в тпн приведены слева).
гибридизация . выявила в анализируемых геномах последовательности, имеющие нестрогую гомологию со структурой зонда. Эволюционная стабильность последовательностей, подобных IRLB, з сочетании с приведенными выше структурно-функциональными свойствами белка IRLB свидетельствуют о возможной универсальности функций продуктов /iJiB-подобных генов различных "организмов.
Установлено, что размер фрагмента хромосомной ДНК человека, содержащего ген IRLB, составляет около 13,0 тпн (суммарная длина двух фрагментов coRI-EcoRI, гибридизующихся с кДНК 1RLB; Рис.7).
Геномную библиотеку человека сконструировали в фаговом векторе AEMBL3 (Promega). В результате скрининга из 0,8x10 рекомбинантных клоноа выделен один, названный XIRL. Размер клонированного в XIRL фрагмента хромосомной ДНК человека составляет около 18,5 тпн. С помощью расщепления различными ферментами рестрикции построена физическая карта этого фрагмента (Рис.8А). На основании данных о блот-гибридизации гидролизатов Д.IRL, полученных после обработки рестриктазами, с меченой кДКК IRLB установлена локализация гена в клонированном фрагменте ДНК.
Стратегия секвенирования представлена на Рис.8Б. Для определения нуклеотидной последовательности гена IRLB субклонировали в плазмидиом векторе pUC19 перекрывающиеся- фрагменты- ДНК, полученные при расщеплении ДНК xIRL различными рестриктазами. Клонированные фрагменты секвенировали по двум цепям. После совмещения перекрывающихся участков с помощью программы PCGENE/ASSEMGEL получили нуклеотидную последовательность гена IRLB, включающую 5'- и З'-некодируюшие области, размером 7432 пн (приведена в разделе 3.11 диссертации). При сравнении первичных структур кДНК 1RLB и гена IRLB установили экзон-интронную организацию гена (Рис.ЗВ), размер кодирующей части которого составляет 5830 пн. Ген состоит из. 5-ти экзонов и 4-х интронов (Табл.1).
Поиск гомологии нуклеотидной последовательности гена IRLB с помощью программы EMBL/FASTSCAN в базе данных EMBL Database (release 40) не привел к обнаружению существенных сходств с первичными структурами уже известных генов.
и НІ IV
В і
Рис.8. Структура гена IRLB человека. (А) Физическая карта фрагмента хромосомной ДНК в фаговок клоне A.IRL. Тонкой линией показана ДНК вектора (AEMBL3), толстей - клонированная ДНК. (Б) Стратегия секвенирования фрагмента Hindll1-соРЛ (7,4 тпн), содержащего ген IRLB. Стрелками указаны направления "чтения" нуклеотидных последовательностей по одной из цепей. Полученные субклоны показаны линиями с соблюдением топографии на клонированной ДНК, -сверху приведены их обозначения. Участки расаепления ДНК ферментами рестрикции BamHI, Hindlll, EeoRI, Kpn\, Fstl, Sail, Sph) обозначены E, H, R, K, P, SJ, S, соответственно. (В) Экзоп-интронная организация гена IRLB человека. 5'- и З'-некодируюшие последовательности обозначены тонкими линиями, интроны - штриховкой, а экзоны - вертикальными прямоугольниками с их порядковыми номерами.
3'-иєтранслнруемая область
Таблица 1. Нуклеотидные последовательности участков слияния экзонов и нитронов гена 1RLB человека. Нуклеотиды, входящие в состав экзонов показаны заглавными буквами, интронов - строчными. Аминокислотные остатки синтезируемого in vitro полипептида IRLB, показаны трехбуквенными обозначениями. Рядом с остатками, находяшимися в точках сплайсинга, приведены их порядковые номера в полипептидной цепи 4
Таким образом, цель настоящего исследования достигнута -обнаружен и клонирован неописанный ранее ген, кодирующий новый ДНК-связываюгаий белок IRLB, который связывается с ISRE-подобной последовательностью гена с-шус человека.
ВЫВОДЫ
1. Клонирована кДНК нового ДНК-связывающего белка IRLB.
Установлена первичная структура кДНК и на ее основе - первичная
структура полипептида bslRLB.
-
В 5'-концевой области кДНК IRLB (+9/+18) обнаружен lSRE-подобный интерферон-индуцибельный элемент.
-
Установлено, что в диплоидных фибробластах человека синтезируются несколько видов мРНК IRLB, экспрессия гена IRLB в этих клетках стимулируется интерферонами г к а. _
-
Получен бактериальный штамм-продуцзнт функционально активного белка IRLB.
-
Продуцируемый в Е.соП белок IRLB связывается с
1SRE-подобным элементом ігІВ гена с-тус человека предпочтительнее, чем с участками ISRE других интерферон-зависимых генов.
-
Определен участок связывания IRLB в промоторной . области гена с-тус человека с координатами +98/+112, включающий интерферон-индуцибельный элемент irlB (+100/+110).
-
В геномах эволюционно удаленных организмов обнаружены нуклеотидные последовательности, гибридизующиеся с кДКК IRLB.
8. Клонирован фрагмент хромосомной ДНК (18,5 тпн),
содержащий ген IRLB человека. Построена физическая карта - покувъ
IRLB. Определена нуклеотидная последовательность гена IRLB и установлена его экзон-интронная организация.