Электронная библиотека диссертаций и авторефератов России
dslib.net
Библиотека диссертаций
Навигация
Каталог диссертаций России
Англоязычные диссертации
Диссертации бесплатно
Предстоящие защиты
Рецензии на автореферат
Отчисления авторам
Мой кабинет
Заказы: забрать, оплатить
Мой личный счет
Мой профиль
Мой авторский профиль
Подписки на рассылки



расширенный поиск

Молекулярно-генетическая характеристика последовательности HS.633957 человека Полев, Дмитрий Евгеньевич

Молекулярно-генетическая характеристика последовательности HS.633957 человека
<
Молекулярно-генетическая характеристика последовательности HS.633957 человека Молекулярно-генетическая характеристика последовательности HS.633957 человека Молекулярно-генетическая характеристика последовательности HS.633957 человека Молекулярно-генетическая характеристика последовательности HS.633957 человека Молекулярно-генетическая характеристика последовательности HS.633957 человека
>

Диссертация - 480 руб., доставка 10 минут, круглосуточно, без выходных и праздников

Автореферат - бесплатно, доставка 10 минут, круглосуточно, без выходных и праздников

Полев, Дмитрий Евгеньевич. Молекулярно-генетическая характеристика последовательности HS.633957 человека : диссертация ... кандидата биологических наук : 03.02.07 / Полев Дмитрий Евгеньевич; [Место защиты: С.-Петерб. гос. ун-т].- Санкт-Петербург, 2010.- 148 с.: ил. РГБ ОД, 61 11-3/140

Содержание к диссертации

Введение

Глава 1. Обзор литературы 10

1.1 Геном человека 10

1.2 Регуляция транскрипции генов 11

1.2.1 Регуляторные элементы генов 12

1.2.2 Регуляция транскрипции генов за счёт метилирования ДНК 18

1.2.3 Регуляция транскрипции генов за счёт модификаций хроматина 21

1.2.4 Роль клеточного протооикогена с-Мус в регуляции транскрипции генов 25

1.3 Некодирующие РНК 26

1.3.1 История обнаружения миРНК 28

1.3.2 Функции миРНК 31

1.3.3 Основные признаки мпРНК 31

1.4 РНК-маркёры опухолей 36

Глава 2. Материал и методы 41

Глава 3. Результаты 52

3.1 Результаты анализа структуры кластера Hs.633957 базы данных UniGene 52

3.2 Результаты экспериментальной проверка экспрессии локуса Hs.633957 в нормальных и опухолевых тканях 53

3.3 Определение первичной структуры транскриптов локуса Hs.633957 59

3.4 Определение основной сплайсинговой формы РНК 64

3.5 Анализ открытых рамок считывания 67

3.6 Анализ вторичной структуры РНК 68

3.7 Поиск потенциальных мишеней предсказанной миРНК 70

3.8 Изучение регуляторных участков локуса 71

3.9 Модификации хроматина в районе локуса Hs.633957 72

3.10 Связь хроматина в районе первого экзона локуса Hs.633957 с транскрипционными факторами 75

3.11 Идентификация сайтов связывания транскрипционного фактора с-Мус 79

3.12 Филогенетический анализ локуса Hs.633957 81

3.13 Поиск гомологичных транскрнптов 85

3.14 Происхождение повторов L2 и AluJo в локусе Hs.633957 85

3.15 Происхождение шпильки пре-миРНК Hs.633957 86

Глава 4. Обсуждение 91

4.1 Локус Hs.633957 транскрибируется с образованием различных форм транскрипта, но имеет одну доминирующую форму 91

4.2 В локусе Hs.633957 закодирована миРНК, потенциально способная регулировать экспрессию гена DPYS 92

4.3 Экспрессия локуса Hs.633957 обусловлена Мус-зависимым промотором, специфическим для приматов 94

4.4 Структурная и регуляторные области гена миРНК Hs.633957 произошли de novo у приматов 100

4.5 Последовательность Hs.633957 как онкомаркер 104

Заключение 107

Выводы 109

Благодарности 110

Список литературы 111

Приложения 129

Введение к работе

Актуальность проблемы.

В 2001 году двумя независимыми группами исследователей были опубликованы черновые данные по секвенированию генома человека (The Genome Sequencing Consortium, 2001; Venter et al., 2001); в 2003 году завершился проект по расшифровке генома человека The Human Genome Project. На сегодняшний день полностью отсеквенировано уже несколько индивидуальных человеческих геномов (Levy et al., 2007; Wheeler et al., 2008; Bentley et al., 2008; Wang et al., 2008; Ley et al., 2008; Ahn et al., 2009; Kim et al., 2009; McKernan et al., 2009; Drmanac, et al., 2010). Согласно данным по секвенированию размер гаплоидного генома человека составляет около 3*10 п.н., из которых только 5% относится к белок-кодирующим областям (The Genome Sequencing Consortium, 2001), тогда как транскрибируется 74-93% всего генома человека (The ENCODE Project Consortium, 2007). Очевидно, что основная часть транскриптов не кодирует белки. Возможно, они имеют некие регуляторные функции, но какие именно, в большинстве случаев мы не знаем, поэтому аннотация транскрибируемых участков генома человека остаётся актуальной задачей.

Одним из таких неаннотированных транскрибируемых участков генома человека является локус Hs.633957, ставший объектом данного исследования. Предпосылкой его изучения явились теоретические работы А.П. Козлова, в которых он развивает гипотезу об эволюционной роли опухолей в возникновении новых клеточных типов, получившей недавно название «эволюция путём дифференцировки опухолевых клеток» (Kozlov 1979, 1996, 2010; Kozlov et al., 1992; Козлов 1976, 1983, 1987, 2008). Согласно этой гипотезе, неоплазмы предоставляют пространство и ресурсы для экспрессии и апробации новых генов, которые не могут проявится в нормальных тканях в силу отлаженной там регуляции экспрессии. Одним из основных следствий данной гипотезы является предсказание активации экспрессии множества молчащих участков генома в опухолях. Данное следствие получило подтверждение в биоинформатическом исследовании Барановой с соавторами (Baranova et al., 2001), в котором было обнаружено большое количество участков генома с опухолеспецифической экспрессией.

Среди таких участков был локус, соответствующий кластеру Hs.633957 (ранее -Hs. 104073) по классификации базы данных UniGene. Кластер Hs.633957 содержал 6 EST (от англ. Expressed Sequence Tag - ярлык экспрессирующейся последовательности), полученных из опухолевых клеток. Он был описан в базе как «транскрибируемый локус», поскольку входящие в него последовательности не кодируют белки. Ранее данный участок генома человека специально не изучался, и его роль в организме не была описана.

Характер экспрессии локуса Hs.633957 вызывает к нему практический и теоретический интерес. Перед нами встали следующие вопросы: действительно ли локус экспрессируется только в опухолях и его РНК-продукт может быть использован как онкомаркёр, за счёт чего это происходит, какова структура транскриптов локуса, кодирует ли он белок и может ли он иметь какую-то функцию в организме?

Цель и задачи исследования. Целью данной работы является молекулярно-генетическая характеристика локуса человека, соответствующего кластеру Hs.633957 базы данных UniGene.

В соответствии с целью были поставлены следующие задачи:

  1. Определить полную нуклеотидную последовательность РНК-продукта локуса Hs.633957

  2. Выявить возможные альтернативные РНК-продукты данного локуса

  3. Описать регуляторную область локуса Hs.633957

  4. Определить, в каких органах и тканях экспрессируется локус Hs.633957

  5. Провести филогенетический анализ последовательности локуса Hs.633957

  6. Определить функцию локуса Hs.633957

Практическая ценность. В ходе работы было обнаружено, что локус Hs.633957 транскрибируется лишь в небольшом количестве нормальных органов взрослого человека, при этом представленность его РНК в образцах тканей здоровых органов низка. В лейкоцитах периферической крови изучаемая РНК не была обнаружена. В опухолях, напротив, локус Hs.633957 экспрессируется часто и на относительно высоком уровне. Полученные данные свидетельствуют о потенциальной возможности использования РНК Hs.633957 в качестве молекулярного маркёра опухолей различного происхождения.

Апробация работы. Результаты работы были представлены на XIV, XVI, XVII, XVIII и XIX международных конференциях «СПИД, рак и общественное здоровье» (Санкт-Петербург, 2005, 2007, 2008, 2009, 2010); III, IV и VI Российской конференции по фундаментальной онкологии «Петровские чтения» (Санкт-Петербург, 2007, 2008, 2010); на международной конференции Frontiers in Cancer Prevention Research (Балтимор, США, 2005), на международной конференции SMBE 2010 (Society for Molecular Biology and Evolution) (Лион, Франция, 2010).

Публикации. По материалам диссертации опубликовано 12 работ.

Объем и структура диссертации. Диссертационная работа состоит из «Введения», «Списка сокращений», «Обзора литературы», «Материала и методов», «Результатов», «Обсуждения», «Выводов», «Списка литературы», состоящего из 211 источников. Работа изложена на 148 страницах машинописного текста и содержит 26 рисунков и 6 таблиц.

Основные признаки мпРНК

Первые миРНК Нп-4 и let-7 были обнаружены путём последовательного клонирования участков генома C.elegans и поиска фрагментов, способных восстановить нормальный фенотип у червей с нарушениями развития (Lee et al., 1993; Reinhart et al., 2000). Сегодня основнуЕо часть миРНК обнаруживают путём клонирования фракций малых РНК определённого размера (Ambros et al., 2003), или предсказывают биоинформатическими методами (Li et al., 2006), после чего могут подтверждать экспериментально (Grad et al., 2003).

Единая система для аннотирования новых миРНК, направленная преимущественно на потенциальные миРНК, обнаруженные путём клонирования малых РНК, была предложена в 2003 году (Ambros et al., 2003). Она включает следующие критерии причисления малой РНК к классу миРНК:

1. Обнаружение специфических фрагментов РНК размером около 22 нт в образце РНК, фракционированном по размеру.

2. Обнаружение последовательности размером около 22 нт в библиотеке фракционированной по размеру РНК.

3. Обнаружение шпильки при предсказании вторичной структуры РНК. Шпилька должна иметь минимальную свободную энергию и включать последовательность миРНК в одном плече. Размер шпильки должен быть порядка 80 н г.

4. Филогенетическая консервативность последовательности миРНК и содержащей её шпильки.

5. Обнаружение накопления пре-миРНК в клетках с подавленной активностью Dicer.

По мнению авторов, идеальным случаем можно считать тот, в котором кандидатная миРНК удовлетворяет критериям 1, 4 и 5, т.е. есть надёжные свидетельства накопления специфических 22-нуклеотидных фрагментов. являющихся частью консервативной шпильки, которую может процессировать Dicer. Удовлетворение некоторым другим комбинациям критериев может служить доказательством того, что обнаруженная шпилька - это миРНК, но в таких случах авторы призывают к осторожности в оценках (Ambros et al., 2003).

Если говорить о механизмах, стоящих за структурными критериями идентификации миРНК, то они определяются свойствами основных ферментов, участвующих в биогенезе миРНК. Ферменты Dicer и Drosha относятся к семейству рибонуклеаз 111 типа. У человека Drosha формирует комплекс с DGCR8 и в ядре разрезает длинную первичную миРНК с образованием шпилечных РНК размером около 70 нуклеотидов, имеющих но два 3 -концевых неспаренных нуклеотида (Lee et al., 2003). По данным Зенг (Zeng) с соавторами для эффективного разрезания первичной миРНК белком Drosha шпилечная структура должна содержать достаточно большую концевую петлю размером от 10 нуклеотидов и двунитевой участок размером около 8 п.н., предшествующий участку миРНК (так называемый «базальный столбик»). При этом нежелательно наличие больших петель в месте разрезания ферментом Drosha, или слишком длинного базального столбика (Zeng et al., 2005). Обязательным условием является наличие однонитевого участка в основании шпильки (Zeng and Cullen, 2005). Тогда Drosha осуществляет разрезание шпильки на расстоянии двух витков спирали от терминальной петли (Zeng et al., 2005). С другой стороны, эти требования частично ставятся под сомнение результатами других авторов, показавших в экспериментах in vitro, что концевая петля не важна для работы комплекса Drosha-DGCR8, зато критичным является наличие однонитевых участков в основании шпилечной структуры. При этом место разрезания комплексом Drosha-DGCR8 определяется расстоянием от начала однонитевого участка (около 11 п.н.) (Han et al., 2006). Обе группы авторов сходятся на том. что важно количество спаренных нуклеотидов в шпильке. Для нормальной работы Drosha их должно быть не менее 26 (Zeng et al.. 2005). При уменьшении их количества до 21 разрезание шпильки ещё происходит, но с относительно низкой эффективностью (Han et al., 2006). В целом, из результатов обеих групп следует, что пре-миРНК с неоптимальными вторичными структурами тоже могут процессироваться белком Drosha, хотя и с меньшей эффективностью, т.е. допустимы достаточно большие отклонения в строении шпильки. Это согласуется с результатами исследования специфичности выбора точки разрезания РНК данным ферментом. Оказалось, что Drosha в значительной доле случаев осуществляет разрезание мишени по альтернативным сайтам (Wu et al., 2009).

Таким образом, для эффективной работы комплекса Drosha-DGCR8 необходима шпилька общим размером около 70 нуклеотидов, имеющая не менее 26 спаренных нуклеотидов, концевую петлю более 10 нт и базальный столбик около 8 п.н., которому предшествует неструктурированный участок РНК. Между участком миРНК и базальным столбиком не должно быть больших петель и выпячиваний. Отклонения от оптимальной структуры допустимы (Zeng et al., 2005; Zeng and Cullen, 2005; Han et al., 2006).

В цитоплазме Dicer избирательно режет двунитевые РНК, имеющие по два 3 -концевых неспаренных нуклсотида. В результате образуется дуплексная РНК, имеющая порядка 20 спаренных нуклеотидов и по 2 свободных нуклеотида на каждом 3 -конце (Zhang et al., 2004). В большинстве случаев только одна нить становится направляющей, тогда как вторая деградирует, хотя в некоторых случаях обе нити могут быть активны (Stark et al., 2008).

Недавно был обнаружен альтернативный путь созревания миРНК, независимый от Dicer и опосредованный белком Argonaute2 (Cifuentes et al., 2010). При таком пути зрелые миРНК могут включать в себя терминальную петлю пре-миРНК, что значительно расширяет спектр возможных миРНК.

Взаимодействие большей части миРНК с их мишенями опосредовано так называемым «зерном» - участком со 2 по 7 (8) нуклеотид, который полностью комплементарен сайту-мишени, расположенному в З -нетранслируемой области мРНК (Rajewsky, 2006; Lewis et al., 2005; Mourelatos, 2008). Напротив, в положениях 9-11 необходимо наличие хотя бы одного нуклеотида, не комплементарного мишени (Selbach et al., 2008). Предполагают, что зерно служит для быстрого узнавания мишени и начала формирования дуплекса (Rajewsky, 2006). С помощью такого взаимодействия миРНК способна оказывать модулирующее (1,5-2 раза) влияние на уровень трансляции РНК-мишени (Selbach et al, 2008; Mourelatos, 2008; Baek et al., 2008). В случае полной комплементарное миРНК и мишени включается механизм интерференции РНК, приводящий к деградации мРНК (Hutvagner and Zamore, 2002). В то же время, степень комплементарное между миРНК и её мишенью влияет и на стабильность миРНК. Было показано, что миРНК, которые полностью комплементарны своим мишеням, быстро деградируют. Данное явление может объяснять, почему большинство миРНК имеет только небольшой участок, комплементарный мишени (Ameres et al., 2010). Интересно, что это же явление используется вирусами для контроля над экспрессией генов хозяина. Так, недавно было показано, что последовательности HSUR1 и HSUR2 вируса Herpesvirus saimiri имеют участки, комплементарные клеточной миРНК miR-27, которые, при взаимодействии с данной миРНК, активируют её деградацию. В результате нарушается регуляция активности целого ряда клеточных генов (Cazalla et al., 2010).

Консервативность является одним из обязательных критериев при поиске новых миРНК (Ambros et al., 2003; Stark et al., 2003; Rajewsky, 2006). Начиная с первых миРНК lin-4 и let-7, которые сами оказались консервативными и имели консервативные сайты-мишени (Lee et al., 1993; Moss et al., 1997: Reinhart et al., 2000), считается, что миРНК и их мишени - это консервативные элементы. В то же время, сайт-мишень не обязательно должен быть консервативным, чтобы взаимодействовать с миРНК (Selbach et al., 2008), поэтому критерий консервативности полезен скорее для уменьшения количества ложно-положительных результатов при массовом предсказании новых миРНК и. их мишеней, а не при индивидуальном рассмотрении генов.

Несмотря на то, что миРНК активно изучаются, и известны основные принципы биогенеза миРНК, компьютерные предсказания новых миРНК и их мишеней остаются неточными, а работы разных авторов лишь частично подтверждают друг друга (Rajewsky, 2006; Mendes et al., 2009). Только экспериментально можно окончательно подтвердить или опровергнуть принадлежность РНК-продукта какого-либо гена к миРНК.

Определение первичной структуры транскриптов локуса Hs.633957

На момент начала исследования кластер Hs.633957 (Hs. 104073) включал в себя только несплайсированные EST относительно небольшого размера, секвенированные с З -конца. Преимущественно, они имели сходные З -концы, тогда как их 5 -концы имели различную протяжённость. Мы решили выяснить истинные границы транскриптов, для чего применили методологию RACE, позволяющую амплифицировать 5 - и З -концы кДНК, у которых известна только средняя часть. Существуют различные модификации метода, но в их основе лежит неспецифическое пришивание ко всем молекулам кДНК образца адаптерных последовательностей, которые потом используются как места посадки одного из праймеров при ПЦР. В данной работе мы использовали набор Marathon cDNA amplification kit ("Clontech", США), либо SMART RACE cDNA Amplification Kit ("Clontech", США) и препараты РНК из плаценты и опухолей матки, лёгкого и яичника, в которых предварительно была выявлена экспрессия локуса. Используя различные праймеры, нам удалось получить и просеквенировать несколько вариантов З -концов и один вариант З -конца транскрипта Hs.633957. Результат выравнивания всех просеквенированных последовательностей, сделанного при помощи программы BioEdit, представлен в приложении 1.

На рисунке 6 изображена схема результатов выравнивания полученных фрагментов и EST, составляющих кластер Hs.633957, с геномом человека. DP-3 uterus представляет на рисунке серию последовательностей, полученных при амплификации З -конца транскрипта на матрице кДНК из опухоли матки. Остальные были получены при амплификации 5 -конца транскрипта на матрицах кДНК из опухолей лёгкого (DP-frl-5Iung, DP-4-51ung, DP-51ung), яичника (HUAS-50vary) или плаценты (HUAS-5Placenta). Сплайсированные EST, входящие в кластер Hs.633957, весьма разнородны по своей первичной структуре. Они различаются по количеству экзонов (2 у ВХ119057, 3 у BG822407), точкам старта и терминации транскрипции, началу второго экзона. Абсолютно неизменным является только 3 -конец первого экзона. Несплайсированные EST, преимущественно, имеют одинаковые 3 -концы, сходные с З -концом ВХ119057, но различаются длиной З -копца. В результате нашей работы также показано, что первичная структура транскрип гов локуса Hs.633957 может различаться.

В работе было получено 3 варианта сплайсированного 5 -конца РНК, (HUAS-50vary, DP-5uterus, DP-51ung), 3 варианта несплайсированного 5 -конца (DP-fr 1-5 lung, HUAS-5Placenta, DP-4-51ung) и один вариант 3 -конца. Относительно EST АВ371475, точки начала транскрипции вариантов DP-51ung, HUAS-50vary и EST ВХ119057 расположены в позициях +4, +12 и +33, соответственно. Все сплайсированные формы РНК имеют одинаковые 5 -донорные сайты сплайсинга первого экзона. тогда как их 3 -акцепторные сайты различаются. Так, 3 -акцепторные сайты вариантов DP-5uterus и DP-51ung сходны с таковыми у EST ВХ119057, BG822407, АА190847 и АВ371475, т.е. у большинства сплайсированных EST данного кластера, а 3 -акцепторный сайт варианта HUAS-50vary идентичен 5 -концу несплайсированной EST ВМ792975. Все 5 -концы полученных в нашей работе несплайсированных последовательностей различны. Вариант HUAS-5Placenta интересен тем, что был получен из единственного образца плаценты, в котором была детектирована экспрессия локуса, и при этом его структура уникальна.

Несмотря на то, что- одиш из; праймеров, использованных для детекциш транскриптов локуса Hs.633957, специфичен к; У--концу EST; ВХ119057, щ. соответственно, эта область была; достоверна; представлена транскриптами; в образцах, взятых в. анализ; единственный; вариант. 3?-конца, полученный ; в данной; работе (DP-3uterus)j не перекрывает область праймера: Точка полиаденилирования DP-3uterus совпадает с таковойу EST АВ371475 ис -донорным сайтом второго экзона EST BG822407..

Мы предположили, что возможно существование, транскриптов, объединяющих кластеры- за пределами локуса Hs.633957 за счёт более длинного З -конца, чем у последовательностей кластера Hs.633957. Для проверки этой гипотезы мы провели серию межкластерных ПЦР с парами праймеров, один из которых специфичен для; EST ВХ119057, а другой - для ESTV картирующейся за, пределами изучаемого локуса- На рисунке 7 представлена схема расположения и;направления праймеров, использованных. для межкластерных ИНД Преимущественно, мы пытались" объединить. изучаемый локусс локусами; расположенными в сторону З -концатранскрипта; Для этого мы использовали комбинации праймеров , CB105081F1 х BX119057R1, AA680192F1 х BX1T9057R1, AA077941F1 х BX119057R, AA077783F1 х BX119057R1, AA077543F1 х BX119057R1, AA077731F1 х BX119057R1, AI418255F1 х BX119057R1, AA243851F1. х BX119057R1, AA232990F1 х BX119057R2,. AI962473F1 х BX119057R1. В то же время, мы пытались выяснить, есть ли связь с EST, картирующимися к 5 -концу ВХ119057,и,с EST из егоинтроннойобласти, для чего применяли комбинации праймеров BY799952F1 х BX119057R3i BX119057F1 х BY799952R1, BX119057F1 х AI962473R1, BX119057F1 xELFNlRl.

Амплификацию проводили на матрице.кДТЖ опухолевых клеточных линий Panel и СаСо2;икДНК плаценты; либо на смеси кДНКиз различных опухолей., Транскрипция локуса Hs.633957 была, предварительно показана во всех образцах, кроме плаценты. В случае образования ампликонов их вырезали из геля, чистили и секвенировали. Ни одна из комбинаций праймеров не дала искомого результата, т.е. мы не обнаружили транскриптов, объединяющих разные транскрибируемые участки генома, что дало нам основания предположить, что границы локуса Hs.633957 соответствуют границам EST, входящих в одноимённый кластер.

Для удобства дальнейшей работы мы создали модельную последовательность Hs633957mod, включающую все транскрибируемые участки локуса (Приложение 2), и составили схему сайтов инициации транскрипции, полиаденилирования и сплайсинга (Рисунок 8) на основании обнаруженных нами сплайсированных форм, а так же сплайсированных EST кластера. По нашим представлениям, локус имеет 4 возможных точки старта транскрипции, 2 сайта полиаденилирования и 3 возможных 3 -акцепторных сайта сплайсинга первого интрона. Возможно вырезание или сохранение второго интрона. Следует отметить, что повтор AluJo расположен в геноме сразу после дистальной точки полиаденилирования РНК Hs633957mod. Можно предположить, что терминация транскрипции локуса связана с этим повтором.

Происхождение шпильки пре-миРНК Hs.633957

Мы рассмотрели более детально выравнивание геномов 44 видов позвоночных животных, представленное на сайте UCSC Genome Browser, на участке пре-миРНК Hs.633957 (Рисунок 25). Ортологичные локусы отсутствуют у большинства представленных видов, либо о них нет информации. Появляются они лишь у приматов. Последовательности человека и шиманзе идентичны, у ториллы отсутствуют 22 из 75 нуклеотидов, что делает формирование подобной шпильки невозможным, у орангутана, макака, мартышки и лемура ортологичые последовательности присутствуют, но содержат замены и делеции. Информация по гомологичному участку хромосомы долгопята отсутствует в базе данных, у галаго ортологичная последовательность не обнаружена. В ортологичном локусе тупайи содержатся значительные изменения по сравнению с человеком, включающие делеции, инсерции и нуклеотидные замены.

Чтобы оценить возможность формирования сходной миРНК у других животных, мы смоделировали вторичные структуры ортологичных последовательностей шимпанзе, орангутана, макака, мартышки, мышиного лемура и тупайи с использованием интернет-ресурса The Vienna RNA Websuite (Gruber et al., 2008)- и отметили на них участки, соответствующие предполагаемой зрелой миРНК человека (Рисунок 26, А-3). Затем мы сопоставили последовательности, ортологичные миРНК Hs.633957 человека, друг с другом и с потенциальными сайтами-мишенями этих миРНК в ортологах человеческого гена DPYS у этих животных (Рисунок 26, И).

В первую очередь, следует отметить, что у тупайи нет последовательности, ортологичной сайту-мишени для изучаемой миРНК, хотя она присутсвует у других млекопитающих. Вторичная структура потенциальной шпильки у тупайи резко отличается от человеческой и не соответствует структурам пре-миРНК (Рисунок 26, Ж). Структура шпильки у лемура (Рисунок 26, Е) также сильно отличается от таковой у человека, она раздвоена и имеет много внутренних петель. Последовательности миРНК и её мишени сильно отличаются от человеческих и практически не комплементарны. По всей видимости, такая структура не может претендовать на роль миРНК.

Шпилька мартышки структурно сходна со шпилькой человека и относительно стабильна (Рисунок 26, Д, И). Если предположить, что две терминальные петли могут объединяться в одну за счёт расплетения промежуточного стебелька из трёх пар нуклеотидов, то структура полученной шпильки будет отличаться от человеческой только меньшей базальной петлёй. При этом девятый нуклеотнд предполагаемой миРНК не комплементарен нуклеотиду мишени, как и у человека. Дополнительно, нуклеотиды в положении 11 миРНК и мишени не комплементарны, а 3 -терминальный нуклеотид миРНК попадает в область терминальной петли. Данная структура мартышки потенциально может формировать миРНК, мишенью которой является ген DPYS.

У макака вторичная структура пре-миРНК нарушена. Вероятно, это произошло из-за делении трёх нуклеотидов (с 9 по 11) в области миРНК (Рисунок 26, Г, И), которая привела к смещению нитей относительно друг друга. Важно отметить, что и в сайте-мишени макака нуклеотиды 11 и 12 изменены по сравнению и с человеком, и с мартышкой.

У орангутана структура шпильки сходна со структурой шпильки у человека (Рисунок 26, В, И), но 3 нуклеотидные замены приводят к смещению нитей относительно друг друга и общей дестабилизации структуры. По сравнению с человеком, у орангутана два дополнительных нуклеотидных основания миРНК не имеют комплементарной пары в сайте-мишени. Тем не менее, возможность функционирования данной миРНК у орангутана достаточна вероятна.

Формирование у гориллы структуры, подобной пре-миРНК Hs.633957 невозможно, в связи с делецией. На рисунке данная структура не представлена.

Нуклеотидная последовательность и вторичная структура шпильки шимпанзе и человека идентичны. При этом у данных двух видов также идентичны сайты-мишени в гене DPYS.

Полученные данные свидетельствуют о том. что локус Hs.633957 стал кодировать миРНК у предков подотряда Haplorrhini в результате того, что его РНК-продукт приобрёл характерную шпилечную структуру и участок комплементарности с мРНК гена DPYS. У общего предка человека и шимпанзе пре-миРНК Hs.633957 приобрела свой современный вид, характерный для человека.

Экспрессия локуса Hs.633957 обусловлена Мус-зависимым промотором, специфическим для приматов

Регуляция экспрессии генов эукариот — это сложный процесс, в котором принимают участие как белки-активаторы, так и белки-репрессоры транскрипции. Важную роль играют такие процессы, как метилирование ДНК, модификация гистонов и их перестановки и интерференция РНК (Thiel et al., 2004; Lettini et al., 2007). Известно, что в опухолях процессы регуляции часто бывают нарушены. К примеру, обычно канцерогенез сопровождает глобальное гипометилирование генома, полное деметилирование отдельных участков и гиперметилирование отдельных генов (Wilson et al., 2007). Это может приводить к нестабильности генома и активации транскрипции молчащих генов и нефункциональных участков генома, расположенных вблизи промотороподобньтх последовательностей. В начале нашей работы мы допускали, что нечто подобное имеет место и в случае локуса Hs.633957 -случайная промотороподобная последовательность, находящаяся в норме в области неактивного хроматина, в опухолях активируется в результате гипометилирования генома и активирует транскрипцию прилегающего молчащего бессмысленного участка генома, случайным образом формирующего пре-миРНК-подобиую вторичную структуру. В то же время, наличие регуляторных механизмов свидетельствовало бы в пользу функциональности обнаруженной миРНК.

Мы проанализировали участок ДНК, окружающий точку старта транскрипции последовательности Hs633957mod па наличие самых основных мотивов коровых эукарпотических промоторов: ТАТА-бокса, ССААТ-бокса и GC-бокса (Bucher, 1990). Действительно, мы обнаружили GC-бокс перед самой ТСТ. Таким образом, транскрипция изучаемого локуса должна регулироваться транскрипционными факторами семейства Sp/XKLF, которые могут играть самые разнообразные фукции (Philipsen and Suske, 1999). Ещё два потенциальных GC-бокса были расположены вокруг точек -61 и -43 относительно ТСТ Hs633957mod. При оценке по позиционной матрице весов Бучера (Bucher, 1990) последние две последовательности получили оценку ниже пороговой, однако только после экспериментальной проверки мы сможем достоверно утверждать, какой из обнаруженных GC-боксов действительно функционален. К примеру, в работе Старк с соавторами (Stark et al., 2009) в гене PCFT биоинформатически было обнаружено 5 GC-боксов, из которых экспериментально функциональность была доказана для четырёх. Три из этих четырёх GC-боксов перекрывались. Ни одна из этих трёх функциональных последовательностей не получила бы оценку выше пороговой при использовании матрицы Бучера.

Затем мы проанализировали модификации гистонов в районе первого экзона локуса Hs.633957, для чего воспользовались доступными данными широкомасштабных исследований проекта ENCODE. Мы обнаружили, что в линии лёгочных фиоробластов NHLF, в линии эпидермальных кератиноцитов NHEK и эпителиальных клеток молочной железы НМЕС весь локус находится в области триметилирования лизина 27 гистона НЗ (Таблица 6). Это свидетельствует о неспецифической инактивации (Campos and Reinberg, 2009) протяжённого участка генома, частью которого является локус Hs.633957. В линии эмбриональных стволовых клеток Hl-hESC на фоне общего триметилирования лизина 27 гистона НЗ отмечается общее монометилирование лизина 20 гистона Н4, обычно связанного с транскрипционно активными областями генома. В клетках хронической лейкемии К-562 на фоне инактивирующей модификации НЗК27теЗ присутствуют такие модификации, ассоциированные с активным хроматином, как H3K4mel, H3K4me2, H3K4me3, НЗК9ас, H3K9mel, НЗК27ас, H4K20mel. Более того, хроматин в области первого экзона ассоциирован с РоШ (Рисунок 14). В клетках эндотелия пупочной вены HUVEC обнаружены только модификации, связанные с активным хроматином, H3K4mel, H3K4me2, H3K4me3 и НЗК27ас (Таблица 6). Таким образом, в ряду клеточных линий существует своеобразный переход от полностью закрытого, неактивного до открытого, активного хроматина вокруг первого экзона Hs.633957. Эти данные подтверждают наше предположение, что обнаруженный нами GC-бокс - это элемент действующего промотора.

Мы также обнаружили, что в клетках HUVEC и HeLa-S3 с открытым хроматином в районе локуса Hs.633957, область первого экзона локуса ассоциирована с транскрипционным фактором с-Мус (Рисунок 18). В клетках К-562 с полуоткрытым хроматином в области первого экзона сосредоточен целый комплекс белков (Рисунок 16), включающий транскрипционные активаторы с-Мус, Max, E2F-4 и GATA-2, РНК-полимер азу РоШ, транскрипционные репрессоры E2F-6, SETDB1 и ZNF263, а также фактор YY1, способный как активировать, так и подавлять транскрипцию, в зависимости от белкового окружения. Неслучайность такого состава белков отчасти подтверждается тем, что некоторые из них могут взаимодействовать друг с другом. Так, с-Мус формирует комплекс с Мах, который активирует транскрипцию, связываясь с мотивом Е-бокс и привлекая модификаторы хроматина (Meyer and Penn, 2008; Gallant and Steiger, 2009). В районе максимальной интенсивности сигнала с-Мус и Мах мы обнаружили 7 Е-боксов. Фактор E2F-6 известен тем, что подавляет транскрипцию генов, активируемых другими факторами семейства E2F (Cartwright et al., 1998). В нашем случае он присутствует вместе с E2F-4. Фактор YY1 способен к физическому взаимодействию с Spl (Lee et al., 1993) и к связыванию GC-бокса (Ai et al., 2005), а мы обнаружили сайт связывания Spl — GC-бокс - в области корового промотора локуса lis.633957.

О том, что открытость хроматина и связь с с-Мус могут вместе приводить к активации экспрессии изучаемого локуса, свидетельствует наличие четырёх EST, полученных из клеточной линии HeLa-S3 (Таблица 3). С этими данными также согласуется обнаруженная ассоциация хроматина первого экзона с транскрипционным фактором E2F1 (Рисунок 17), который в большинстве случаев связывается с участками коровых промоторов и вблизи точек старта транскрипции (Bieda et al., 2006).

Из представленных данных особенно обращает на себя внимание связь РоШ с областью первого экзона, причём только с этой областью - сигнал от других участков ниже порогового. Это может свидетельствовать об остановке полимеразы в начале транскрипта, явлении, известном как арест полимеразы. Связь полимеразы РоШ с промоторной областью неактивных генов,, была впервые показана для HSP70 D.melanogaster и считалась необходимой для быстрой активации гена в ответ на внешние воздействия. Впоследствии подобная ассоциация была продемонстрирована для большого числа хромосомных сайтов, указывая на широкое и даже глобальное распространение этого явления (Saunders et al., 2006; Nechaev et al., 2010). В недавней работе группы Р.Меджитова было показано, что промоторы генов первичного ответа, активирующиеся в ответ на сигнал Toll-подобного рецептора (TLR), имеют высокий базовый уровень активирующих модификаций гистонов НЗК4теЗ и НЗК.9ас и преассоциированы с РоШ. В отличие от HSP70 D.melanogaster, в случае генов первичного ответа РоШ не останавливается в начале синтеза РНК, а синтезирует полноразмерные несплайсированные транскрипты, которые быстро деградируют (Hargreaves et al., 2009). Сочетание обширных подавляющих (НЗК27те) и локальных активирующих (НЗК4те) модификаций гистонов известно как бивалентное состояние хроматина, характерное для генов развития в эмбриональных стволовых клетках. Генам, промоторы которых находятся в участках бивалентного хроматина, свойственен низкий базовый уровень транскрипции, а при дальнейшей дифференцировке клетки такие гены могут быть перманентно активированы, или инактивированы под воздействием соответствующих сигналов (Bernstein et al., 2006). Таким образом, обнаруженное нами бивалентное состояние хроматина и арест полимеразы в области первого экзона являются признаками специфической регуляции экспрессии данного локуса служат ещё одним подтверждением активности обнаруженного нами промоторного элемента GC-бокса.

Мы обнаружили, что в первом интроне локуса Hs.633957, вблизи первого экзона, расположен участок сосредоточения сайтов связывания с-Мус-Мах. На небольшом фрагменте генома, всего 110 п.н., у человека собрано 7 сайтов посадки с-Мус-Мах, причём среди приматов наблюдается постепенное увеличение их количества от 1 у тупайи до 7 у человека, шимпанзе и орангутана (Рисунок 23). У других позвоночных в ортологичном участке генома такого не обнаружено. По всей видимости, в данном случае мы наблюдаем формирование de novo Мус-зависимого проксимального промотора у приматов. Расположение с-Мус-Мах -связывающей области в первом интроне согласуется с данными литературы. В работе Зеллер с соавторами (Zellcr et al., 2006) было показано, что Мус наиболее часто связывается с областями размером около 10 т.п.н., расположенными до ТСТ и с первыми нитронами генов. В этой связи важно то. что мы не обнаружили в базах данных транскриптов, начинающихся в спнтеничных участках геномов других позвоночных, включая мышь, которая достаточно хорошо изучена как модельный объект. Об активности нового промотора у приматов мы пока можем судить только по человеку, и, как мы обнаружили, в экспериментах по хроматиновои иммунопреципитации с последующим секвенпрованием к данному участку у человека действительно тяготеет наибольшая плотность сигнала связывания с-Мус-Мах (Рисунок 19). Вероятно, комплекс с-Мус-Мах, взаимодействуя с данной областью, привлекает белковые факторы, модифицирующие гистоны, что ведёт к переходу хроматина в открытую конформацию и возможности связывания с областью первого экзона локуса Hs.633957 других транскрипционных факторов, таких как активаторы транскрипции GATA-2 и E2F4, или негативные регуляторы E2F6 и SETDB1. В этой связи нужно отметить, что GATA-2 - это эндотелиальный транскрипционный фактор, и в клетках эндотелия пупочной вены HUVEC он связывается с областью, в которой предсказан сайт посадки для родственного ему белка GATA-1, что свидетельствует в пользу предложенной модели.

Похожие диссертации на Молекулярно-генетическая характеристика последовательности HS.633957 человека