Содержание к диссертации
Введение
1 Введение 6
1.1 Актуальность темы исследования 6
1.2 Степень разработанности темы исследования 7
1.3 Цель и задачи 8
1.4 Научная новизна 8
1.5 Теоретическая и практическая значимость работы 9
1.6 Методология и методы исследования 9
1.7 Положения, выносимые на защиту 9
1.8 Степень достоверности и апробация результатов 10
2 Обзор литературы 13
2.1 Длинные некодирующие РНК и их участие в регуляции экспрессии генов 13
2.1.1 Линейные lncРНК. Особенности структуры и экспрессии 13
2.1.1.1 Разнообразие линейных lncРНК 13
2.1.1.2 Биогенез линейных lncРНК 16
2.1.1.3 Консерватизм линейных lncРНК 18
2.1.1.4 Особенности экспрессии линейных lncРНК 19
2.1.2 Функции линейных lncРНК 20
2.1.2.1 Взаимодействие lncРНК с белками 20
2.1.2.2 Взаимодействие lncРНК с ДНК. Образование тройных спиралей 21
2.1.2.3 Взаимодействие lncРНК с микроРНК. Конкурентные эндогенные РНК 22
2.1.2.4 Функции антисмысловых lncРНК 23
2.1.3 Циклические РНК 24
2.1.3.1 Разнообразие циклических РНК 25
2.1.3.2 Образование циклических РНК 26
2.1.3.3 Консерватизм и особенности экспрессии циклических РНК.. 27
2.1.3.4 Циклические РНК как сорбенты микроРНК 29
2.1.3.5 Иные функции циклических РНК 31
2.2 Особенности гена сфингомиелинсинтазы 1 32
2.2.1 Структура и экспрессия гена SGMS1 человека 33
2.2.2 Паралоги и ортологи гена сфингомиелинсинтазы 1 36
3 Материалы и методы исследования 39
3.1 Выделение РНК из замороженных тканей и крови 39
3.1.1 Подготовка образцов из замороженных тканей 39
3.1.2 Получение ядерной и цитоплазматической фракций РНК 39
3.1.3 Подготовка образцов белых клеток крови 40
3.1.4 Выделение РНК 40
3.1.5 Спектрофотометрическое определение количества РНК 41
3.1.6 Проверка качества препаратов суммарной РНК с помощью гель-электрофореза 41
3.2 Анализ транскриптов, кодируемых геном SGMS1, с помощью секвенирования RNA CaptureSeq 42
3.2.1 Дизайн зондов 42
3.2.2 Технология RNA CaptureSeq 3.3 Обработка суммарной РНК с помощью РНКазы R 45
3.4 Синтез одноцепочечной кДНК 45
3.5 ОТ-ПЦР и секвенирование продуктов ПЦР 3.5.1 ОТ-ПЦР 45
3.5.2 Электрофорез продуктов ПЦР 46
3.5.3 Секвенирование по Сенгеру 46
3.6 Нозерн-блот анализ 49
3.6.1 Электрофорез в денатурирующем агарозном геле и капиллярный перенос РНК на мембрану 49
3.6.2 Электрофорез в денатурирующем полиакриламидном геле (ПААГ) и электроперенос РНК на мембрану 49
3.6.3 Получение (-32P)dATP-меченых зондов 50
3.6.4 Гибридизация зондов с РНК на мембране 51
3.7 ОТ-ПЦР в реальном времени 52
3.7.1 Анализ данных ОТ-ПЦР в реальном времени и статистика 55
3.8 Выделение белка из замороженных тканей 55
3.8.1 Экстракция белка из буфера с сапонином 55
3.9 Метод иммунодетекции 56
3.9.1 Электрофоретическое разделение белка и электроперенос белка на мембрану 56
3.9.2 Гибридизация антител с белками на мембране
3.10 Анализ количества белка SMS1 57
3.11 Биоинформатические методы анализа
3.11.1 Анализ баз данных транскриптома человека 58
3.11.2 Анализ результатов RNA CaptureSeq 58
3.11.3 Анализ результатов секвенирования по Сенгеру 58
3.11.4 Анализ сайтов сплайсинга 59
3.11.5 Поиск промоторов 59
3.11.6 Поиск Alu-повторов и выравнивание их последовательностей 59
3.11.7 Поиск сайтов связывания микроРНК 59
4 Результаты 60
4.1 Исследование экспрессии гена SGMS1 на транскрипционном и трансляционном уровнях в тканях человека 60
4.1.1 Анализ экспрессии мРНК гена SGMS1 60
4.1.2 Количественный анализ полноразмерного белка SMS1 в тканях человека 60
4.1.3 Анализ корреляции между уровнем мРНК гена SGMS1 и уровнем белка SMS1 в тканях человека
4.2 Анализ баз данных транскриптомных исследований гена SGMS1 62
4.3 RNA CaptureSeq-анализ экспрессии гена SGMS1 62
4.4 Анализ несплайсированных интронных РНК 64
4.5 Анализ РНК, подвергающихся альтернативному сплайсингу 68
4.6 Выявление циклических РНК в составе транскриптов гена SGMS1 человека
4.6.1 Анализ баз данных циклических РНК 71
4.6.2 Анализ циклических РНК в образцах РНК лобной коры человека 72
4.7 Анализ представленности циклических РНК в тканях человека 78
4.8 Анализ гомологичных циклических РНК гена Sgms1 у крысы и мыши.. 80
4.9 Анализ гомологичных циклических РНК гена SGMS2 человека 84
4.10 Анализ количественной представленности транскриптов генов сфингомиелинсинтазы 1 в тканях человека, крысы и мыши 87
4.11 Анализ содержания циклических РНК гена SGMS1 в ядерной и цитоплазматической фракциях РНК лобной коры человека 89
4.12 Анализ промоторов, которые могут участвовать в синтезе циклических РНК 90
4.13 Анализ Alu-повторов в структуре гена SGMS1 94
4.14 Анализ последовательностей циклических РНК гена SGMS1 человека на наличие сайтов связывания с микроРНК
5 Обсуждение результатов 98
6 Заключение 108
7 Выводы 110
8 Список основных сокращений 111
9 Список литературы 115
- Теоретическая и практическая значимость работы
- Особенности экспрессии линейных lncРНК
- Анализ транскриптов, кодируемых геном SGMS1, с помощью секвенирования RNA CaptureSeq
- Анализ корреляции между уровнем мРНК гена SGMS1 и уровнем белка SMS1 в тканях человека
Введение к работе
Актуальность темы исследования
Исследование структурно-функциональных особенностей генов,
играющих важную роль в обеспечении жизнедеятельности организма
человека, является фундаментальной проблемой, представляющей большой
интерес для научного познания. В связи с этим большое значение имеет
изучение транскрипционного разнообразия генов и поиск функционально
значимых транскриптов. Современные методы исследования транскриптома
человека показали, что многие РНК не кодируют белок, но способны
выполнять важные регуляторные функции. Особый интерес представляют
некодирующие РНК, длина которых составляет свыше 200 нуклеотидов. Они
могут транскрибироваться с межгенных областей, с антисмысловой цепи
ДНК, с интронов. Особый интерес представляют циклические РНК – новый и
относительно мало изученный класс некодирующих РНК, обнаруженный
преимущественно в клетках млекопитающих. Эти транскрипты были
выделены как фракция РНК, устойчивая к обработке РНКазой R,
избирательно разрушающей линейные формы молекул. Циклические РНК
кодируются ортологичными генами различных организмов, им свойственна
специфическая экспрессия по отношению к ткани и стадии развития
организма. На сегодняшний день все больше исследований указывают на то,
что циклические РНК играют важную роль в регуляции различных
биологических процессов. Транскрипты этого класса являются
перспективными объектами для исследований и активно изучаются.
Одним из генов, для которого исследование некодирующих РНК
представляет интерес, является жизненно важный ген сфингомиелинсинтазы
1 (SGMS1) человека, который участвует в функционировании липидного
обмена в клетке. Ген SGMS1 кодирует фермент сфингомиелинсинтазу 1
(SMS1), который участвует в регуляции внутриклеточного везикулярного
транспорта, метаболизма холестерина, пролиферации клеток, апоптоза и
других значимых процессов. Обнаружена вовлеченность
сфингомиелинсинтазы в патогенез атеросклероза, диабета, болезни Альцгеймера, воспалительных и опухолевых заболеваний. Мы предполагаем, что изучение некодирующих РНК в составе транскриптов гена SGMS1 и гомологичных ему генов приблизит нас к пониманию механизмов регуляции важных физиологических процессов в клетке.
Цель и задачи
Целью работы был поиск некодирующих РНК гена SGMS1 человека, анализ их структуры и особенностей экспрессии. Для этого были поставлены следующие задачи:
-
Исследовать экспрессию гена SGMS1 в тканях человека на транскрипционном и трансляционном уровнях;
-
Провести биоинформатический анализ последовательностей гена SGMS1 в базах данных транскриптома человека;
-
Исследовать структуру и содержание выявленных РНК, кодируемых геном SGMS1, в различных тканях человека, а также гомологичных некодирующих РНК в тканях крысы и мыши;
-
С помощью биоинформатического анализа провести поиск сайтов связывания микроРНК в нуклеотидной последовательности гена SGMS1.
Научная новизна, теоретическая и практическая значимость работы
В данной диссертационной работе впервые исследованы
некодирующие РНК в составе транскриптов гена SGMS1. Уточнена структура гена, обнаружены и исследованы транскрипты, картированные в интронах, и некодирующие РНК циклической природы. Исследованы гомологичные РНК, кодируемые генами Sgms1 крысы и мыши и SGMS2 человека. Предложены механизмы образования циклических РНК гена SGMS1, и выдвинута гипотеза об их функции в клетке.
Результаты, полученные в исследовании, представляют большой научно-практический интерес. Они существенно углубляют представления о структуре и особенностях экспрессии жизненно-важного гена SGMS1. В работе показано, что в составе транскриптов, кодируемых геном SGMS1 помимо РНК, направляющих синтез белка, содержится множество некодирующих РНК. В их числе обнаружены и исследованы представители малоизученного на сегодняшний день класса РНК циклической природы, что вносит вклад в изучение транскрипционного разнообразия и регуляции экспрессии генов млекопитающих.
Методология и методы исследования
Результаты были получены с использованием биоинформатических методов анализа, высокопроизводительного секвенирования с обогащением «RNA CaptureSeq», методов выделения РНК и белка, Нозерн-блот анализа, иммунодетекции, ОТ-ПЦР, секвенирования по Сенгеру, ПЦР в реальном
времени, а также ряда других стандартных молекулярно-биологических методов.
Личный вклад автора
Автор внес существенный личный вклад в получение изложенных в
диссертации новых научных данных. Автором выполнен основной объём
работ: выделение РНК из тканей человека и животных, анализ РНК с
помощью Нозерн-гибридизации и ОТ-ПЦР в реальном времени, подготовка
образцов для секвенирования по Сенгеру, анализ баз данных транскриптома
человека и животных, биоинформатический анализ последовательности гена
SGMS1 и обнаруженных транскриптов. Высокопроизводительное
секвенирование с обогащением «RNA CaptureSeq» и первичная обработка результатов проводились совместно с ЗАО «Геноаналитика», Россия. Выделение белка и анализ его содержания в тканях человека с помощью иммунодетекции проводились совместно с О.Ю. Сударкиной. Кроме того, соискатель принимал участие в разработке стратегии научного исследования и написании статей.
Положения, выносимые на защиту
-
По результатам сравнительного анализа экспрессии гена SGMS1 на транскрипционном и трансляционном уровнях в разных тканях человека выявлено отсутствие корреляции между содержанием кодирующих транскриптов гена SGMS1 и количеством кодируемого им белка. Это свидетельствует о наличии сложной системы тканеспецифической регуляции гена SGMS1.
-
Обнаружено большое количество новых транскриптов, которые включают участки интронов гена SGMS1. Они представляют собой как несплайсированные интронные транскрипты, так и РНК, подвергающиеся альтернативному сплайсингу. Выявлены новые транскрипты, содержащие сохранившиеся участки интронов (рекурсивные экзоны) 5’-нетранслируемой области (5’-НТО) гена SGMS1.
-
В составе транскриптов гена SGMS1 человека обнаружены циклические РНК, которые содержат последовательности мультиэкзонной 5’-НТО гена, а также участок кодирующей области гена и фрагменты интронов. Обнаружены гомологичные циклические РНК, кодируемые геном Sgms1 крысы и мыши.
-
Циклические РНК человека, крысы и мыши, содержащие последовательности 5’-НТО, демонстрируют мозгоспецифическую экспрессию.
-
Циклическим РНК, содержащим последовательности 5’-НТО гена SGMS1, свойственна преимущественная цитоплазматическая локализация.
-
Внутренние промоторы и инвертированные повторы, локализованные в интронах гена SGMS1 человека, могут принимать участие в образовании циклических РНК. Компьютерный анализ последовательностей циклических РНК позволил выявить большое число сайтов связывания микроРНК.
Степень достоверности и апробация результатов работы
Результаты работы докладывались и обсуждались на международных и отечественных научных конференциях: VI Международной школе молодых ученых по молекулярной генетике «Геномика и системная биология» (16–21 ноября 2014, Звенигород, Россия); European Human Genetics Conference 2015 (June 6–9, 2015, Glasgow, Scotland, United Kingdom); Третьей летней школе по биоинформатике (20–25 июля 2015, Москва, Россия); Международной конференции «Хромосома 2015» (24–28 августа 2015, Новосибирск, Россия); European Human Genetics Conference 2016 (May 21–24, 2016, Barcelona, Spain); V Cъезде биохимиков России (4–9 октября 2016, Дагомыс, Россия).
Цели, поставленные в работе, достигнуты, результаты приведенных в работе экспериментов грамотно интерпретированы и сделанные в работе выводы обоснованы, их достоверность не вызывает сомнений. Результаты работы были опубликованы в 4 статьях в рецензируемых научных журналах и представлены на 7 научных конференциях.
Структура и объем работы
Диссертационная работа состоит из введения, обзора литературы, материалов и методов исследования, результатов и их обсуждения, заключения, а также выводов, списка основных сокращений, списка литературы и благодарностей. Работа изложена на 138 страницах машинописного текста, включая 25 рисунков и 7 таблиц. Список цитируемых литературных источников включает 193 наименования.
Теоретическая и практическая значимость работы
Ген SGMS1 человека был идентифицирован в Отделе молекулярных основ генетики человека ИМГ РАН [1] параллельно с рядом зарубежных исследователей [2, 3]. По результатам исследований, проводимых коллективом Отдела, в разных тканях человека было выявлено множество альтернативных транскриптов гена, синтез которых достигается использованием различных механизмов и их сочетаний: альтернативное начало транскрипции, альтернативный сплайсинг, альтернативная терминация транскрипции [4, 5]. Ген присутствует в геномах животных и простейших [6]. Рядом зарубежных научных коллективов была исследована структура и экспрессия ортологичного гена сфингомиелинсинтазы 1 для мыши, свиньи и курицы [7–9], однако сведений относительно регуляции его функционирования на сегодняшний день недостаточно.
Современные методы исследования транскриптома показали, что многие РНК не кодируют белок, но способны участвовать в регуляции функционирования генов [10–13]. На сегодняшний день получены данные о том, что у человека и некоторых других млекопитающих, гены, кодирующие белок, могут быть источником различных типов некодирующих РНК [14, 15]. Показано, что длинные некодирующие РНК могут участвовать в регуляции транскрипции, альтернативного сплайсинга, трансляции и ряда других процессов [16–18]. На сегодняшний день появились данные о том, что значительная часть некодирующих РНК существует в виде циклической формы [19–22]. Функциональное значение циклических РНК изучено недостаточно. Однако известно, что некоторые из них способны выступать в качестве сорбентов микроРНК, связывать факторы транскрипции, а также взаимодействовать с РНК-полимеразой II и малыми ядерными РНК, что опосредует регуляцию экспрессии генов [21, 23–25]. Показано, что циклические РНК могут участвовать при патогенезе болезни Альцгеймера [26] и раке [27]. Эти качества циклических РНК могут быть в дальнейшем использованы в медицине для коррекции патологических процессов, обусловленных нарушением экспрессии генов.
Целью работы был поиск некодирующих РНК гена SGMS1 человека, анализ их структуры и особенностей экспрессии. Для этого были поставлены следующие задачи: 1. Исследовать экспрессию гена SGMS1 в тканях человека на транскрипционном и трансляционном уровнях; 2. Провести биоинформатический анализ последовательностей гена SGMS1 в базах данных транскриптома человека; 3. Исследовать структуру и содержание выявленных РНК, кодируемых геном SGMS1, в различных тканях человека, а также гомологичных некодирующих РНК в тканях крысы и мыши; 4. С помощью биоинформатического анализа провести поиск сайтов связывания микроРНК в нуклеотидной последовательности гена SGMS1.
В данной диссертационной работе впервые исследованы некодирующие РНК в составе транскриптов гена SGMS1. Уточнена структура гена, обнаружены и исследованы транскрипты, картированные в интронах, и некодирующие РНК циклической природы. Исследованы гомологичные РНК, кодируемые генами Sgms1 крысы и мыши и SGMS2 человека. Предложены механизмы образования циклических РНК гена SGMS1, и выдвинута гипотеза об их функции в клетке. 1.5 Теоретическая и практическая значимость работы
Результаты, полученные в исследовании, представляют большой научно-практический интерес. Они существенно углубляют представления о структуре и особенностях экспрессии жизненно-важного гена SGMS1. В работе показано, что в составе транскриптов, кодируемых геном SGMS1 помимо РНК, направляющих синтез белка, содержится множество некодирующих РНК. В их числе обнаружены и исследованы представители малоизученного на сегодняшний день класса РНК циклической природы, что вносит вклад в изучение транскрипционного разнообразия и регуляции экспрессии генов млекопитающих.
Результаты были получены с использованием биоинформатических методов анализа, высокопроизводительного секвенирования с обогащением RNA CaptureSeq, методов выделения РНК и белка, Нозерн-блот анализа, иммунодетекции, ОТ-ПЦР, секвенирования по Сенгеру, ПЦР в реальном времени, а также ряда других стандартных молекулярно-биологических методов.
1. По результатам сравнительного анализа экспрессии гена SGMS1 на транскрипционном и трансляционном уровнях в разных тканях человека выявлено отсутствие корреляции между содержанием кодирующих транскриптов гена SGMS1 и количеством кодируемого им белка. Это свидетельствует о наличии сложной системы тканеспецифической регуляции гена SGMS1.
2. Обнаружено большое количество новых транскриптов, которые включают участки интронов гена SGMS1. Они представляют собой как несплайсированные интронные транскрипты, так и РНК, подвергающиеся альтернативному сплайсингу. Выявлены новые транскрипты, содержащие сохранившиеся участки интронов (рекурсивные экзоны) 5 -нетранслируемой области (5 -НТО) гена SGMS1.
3. В составе транскриптов гена SGMS1 человека обнаружены циклические РНК, которые содержат последовательности мультиэкзонной 5 -НТО гена, а также участок кодирующей области гена и фрагменты интронов. Обнаружены гомологичные циклические РНК, кодируемые геном Sgms1 крысы и мыши.
4. Циклические РНК человека, крысы и мыши, содержащие последовательности 5 -НТО, демонстрируют мозгоспецифическую экспрессию.
5. Циклическим РНК, содержащим последовательности 5 -НТО гена SGMS1, свойственна преимущественная цитоплазматическая локализация.
6. Внутренние промоторы и инвертированные повторы, локализованные в интронах гена SGMS1 человека, могут принимать участие в образовании циклических РНК. Компьютерный анализ последовательностей циклических РНК позволил выявить большое число сайтов связывания микроРНК.
Особенности экспрессии линейных lncРНК
Многие lncРНК имеют широкую распространенность и низкий консерватизм. Эти обстоятельства послужили доводом тому, что lncРНК являются нефункциональным «транскрипционным шумом» [53]. Эта гипотеза не увенчалась успехом, так как ряд функционально значимых lncРНК (Air, Xist) не обладают консерватизмом. Некоторые функциональные lncРНК, напротив, транскрибируются с ультраконсервативных участков генома. Примером может служить механизм регуляции транскрипции генов сигнального пути Hedgehog, участвующих в развитии и росте позвоночных. Сигнальный белок Sonic Hedgehog индуцирует транскрипцию межгенной lncРНК EVF-2, которая содержит ультраконсервативный элемент, расположенный между генами DLX5 и DLX6. С помощью ультраконсервативного элемента lncРНК ассоциируется с гомеобокс-фактором транскрипции DLX2, посредствам чего он активирует транскрипцию в соседнем к EVF-2 гене DLX5, запуская процесс развития переднего мозга и нервных клеток [54]. Также РНК Uc.173 происходит из ультраконсервативного региона T-UCR человека, крысы и мыши и является одним из ключевых ингибиторов свинец-индуцированного апоптоза в нервных клетках [55]. Интронные lncРНК зачастую ассоциированы с консервативными участками в интронах [14, 15]. Одними из наиболее известных являются транскрипты SINE и в частности Alu-повторов (280–350 н.) Последовательности SINE (до 11% генома) обычно транскрибируются РНК полимеразой III и с помощью закодированной в LINE обратной транскриптазы способны встраиваться в геном, являясь ретротранспозонами. Однако ряд Alu-элементов может транскрибироваться и в составе пре-мРНК [56]. Известно, что Alu-элементы ассоциированы почти с третью всех генов приматов, и их транскрипты обнаружены среди некодирующих РНК интронов. Интронные Alu-элементы являются метаболически стабильными. Известны так называемые AluACAРНК (H/ACA scaРНК), пре-scAlu и scAlu. Они представляют собой шпилечные структуры с консервативными мотивами, отвечающими за локализацию данных Alu и ассоциацию с белками. Так H/ACA scaРНК транскрибируются в составе пре-мРНК, в структуре имеют две шпильки по соответствующим боксам и локализованы в тельцах Кахаля. Главной их функцией является репрессия транскрипции с участием РНК-полимеразы II в условиях стрессового воздействия на клетку. Общая длина этих Alu составляет около 200 нуклеотидов. пре-scAlu являются продуктами РНК-полимеразы III и по структуре представляют собой четыре шпилечные структуры с общей длиной 300–400 нуклеотидов. Процессинг пре-scAlu приводит к образованию scAlu около 160 нуклеотидов в длину из левого плеча димера-предшественника. В целом Alu-элементы представляют собой гетерогенную группу и могут иметь различные структуры, при этом их отличает высокий консерватизм и наличие повторяющихся элементов [56].
Множество lncРНК имеют специфическую экспрессию, наследуемую в эволюции. Так из 1898 межгенных lncРНК человека 80% имели схожую экспрессию у шимпанзе, 39% у коровы, 38% у мыши и 35% у крысы [57]. К тому же lncРНК демонстрируют экспрессию, специфичную ткани, полу, стадии развития и болезни [14, 58]. По данным Mercer и соавт. при анализе lncРНК мыши было выявлено, что 64% РНК ассоциированы с мозговыми тканями [59]. Cabili и соавт. установили, что lncРНК могут экспрессироваться в более выраженной тканеспецифической манере, чем белок-кодирующие гены [60].
Примером половой специфики в экспрессии lncРНК в зависимости от стадии развития служит Xist, обеспечивающая импринтинг генов хромосомы X у самок. У мышей процесс инактивации повторяется на разных этапах развития. Первая волна происходит во время стадии эмбрионального развития, а затем хромосома Х реактивируется в предимплантационной бластоцисте и затем снова инактивируется в постимплантационном эпибласте. В процессе дифференциации белок Rnf12 повышает экспрессию и взаимодействует с одним из факторов плюрипотентности – белком Rex1 для его подавления и дифференциации. Rex1 в свою очередь является репрессором Xist, которая инициирует генетический сайленсинг хромосомы Х. Репрессия Rex1 активирует специфическую для самок экспрессию Xist [61].
В качестве примера lncРНК, экспрессия которых ассоциирована с болезнями, может служить MALAT1 – маркер немелкоклеточного рака легкого. Она обладает экспрессией, сопоставимой с генами домашнего хозяйства (глицеральдегидфосфатдегидрогеназа, -актин) особенно на ранних стадиях, что связано с повышенным риском метастазирования [62].
lncРНК активно участвуют в регуляции экспрессии генов. Эта регуляция может осуществляться в цис- или транс- положении от гена [33]. Часто lncРНК участвует в регуляции с помощью белковых факторов. lncРНК часто направляет хроматин модифицирующие белки, которые могут в случае «триторекс» активировать или в случае «поликомб» подавлять экспрессию генов на уровне эпигенетической модификации гистонов или ДНК [16, 63, 64]. Подчас говорят о соотношении триторексной и поликомбной активности как о маркере хроматинового статуса. Под триторексной и поликомбной активностью подразумевают совместное действие белковых факторов и lncРНК. При поликомбно-триторексной конкуренции имеет место и бивалентный хроматин, преимущественно неактивный. Если репрессия снимается, то он резко начинает транскрибироваться, что важно для генов, участвующих в развитии организма [65]. В качестве примера можно привести модель регуляции гомеозисных генов в эмбриональных стволовых клетках мыши. lncРНК кодируется межгенной областью Mistral между генами Hoxa6 и Hoxa7. Mira ассоциирована с белком Mll – одной из лизинметилтрансфераз комплекса «триторекс» которая, способна метилировать промоторные области генов и активировать транскрипцию в них. Mira связывается со специальным SET-доменом на С-конце Mll через шпильку на своем 3 -конце, устанавливает активационные метки H3K4me3 и создает конформационные изменения, способствующие взаимодействию Mll с обоими генами Hoxa6 и Hoxa7 [63]. Показано, что из всех lncРНК, имеющих ассоциацию к хроматину, до 52% приходится на интронные и 29% – на долю межгенных РНК [66].
Анализ транскриптов, кодируемых геном SGMS1, с помощью секвенирования RNA CaptureSeq
Получение ядерной и цитоплазматической фракций РНК проводили по методу [156] в модификации [157]. Образец замороженной лобной коры (0,15 – 0,2 г) измельчали в жидком азоте и гомогенизировали на льду с 6 мл буфера (20 мМ трис-НСl, pH 7,5; 5 мМ MgCl2; 25 мМ KCl; 0,25 M сахароза; 20 мМ ванадил-рибонуклеозидный комплекс) в гомогенизаторе Даунса. Гомогенат фильтровали через шестислойную марлю и центрифугировали при 900 об/мин, 4C в течение 5 мин (центрифуга 5424R Eppendorf, Германия). Супернатант (цитоплазматическая фракция) отбирали, добавляли к осадку 2 мл буфера, содержащего 2,3 M сахарозу и суспендировали встряхиванием. Суспензию наслаивали на 2 мл буфера, содержащего 2 М сахарозу и центрифугировали при 15000 об/мин, 4C, 30 мин (центрифуга 5424R Eppendorf, Германия). Отбирали верхнюю фракцию, содержащую клеточные мембраны (мембранная фракция), нижнюю фракцию удаляли. Осадок (ядерная фракция) суспендировали в 1,5 мл TRIzol (Invitrogen, США).
Цитоплазматические фракции смешивали с равным объемом 6М гуанидина тиоцианата и двумя объемами изопропилового спирта, выдерживали не менее 1 ч при –20 C, центрифугировали при 12000 об/мин, 4C, 10 мин (центрифуга 5424R Eppendorf, Германия). Осадок растворяли в 2 мл TRIzol (Invitrogen, США).
Цельную кровь в объеме 8 мл смешивали с физиологическим раствором (9 г/л хлоридом натрия) в соотношении 3:5 и наслаивали на равный объем градиента фиколл/урографин с плотностью 1,12 г/мл (смесь 9% фиколла и 50% урографина в соотношении 2:1). Центрифугировали при 1700 об/мин (центрифуга Universal 320R, Hettich, Германия) в течение 35 мин при +22оС. Отбирали верхнюю фазу и добавляли к ней 2 объема физиологического раствора. Центрифугировали при 3500 об/мин (центрифуга Universal 320R, Hettich, Германия) в течение 3 мин при +4оС. Удаляли надосадочную жидкость, ресуспендировали осадок в 100 мкл 9 г/л хлорида натрия, а затем смешивали с 1 мл реагента TRIzol (Invitrogen, США).
Полученную смесь встряхивали 10 с, выдерживали 15 мин при +22оС и центрифугировали при 12000 об/мин (центрифуга 5424R Eppendorf, Германия) в течение 10 мин при +4С. Отбирали верхнюю фазу и добавляли к ней в объеме 1/5 части смесь хлороформа и изоамилового спирта в соотношении 49:1. Полученную эмульсию встряхивали 10 с, выдерживали 5 мин при +22оС и центрифугировали при 12000 об/мин (центрифуга 5424R Eppendorf, Германия) в течение 15 мин при +4С. Полученную суспензию встряхивали 10 с и выдерживали 5 мин при +4оС. Смесь центрифугировали при 12000 об/мин (центрифуга 5424R Eppendorf, Германия) в течение 10 мин при +4С. Удаляли надосадочную жидкость, ресуспендировали осадок в 300 мкл гуанидин-тиоционатного буфера (4М гуанидин тиоционат; 25 мМ цитрат натрия (рН 7,0); 0,5% саркозил; 0,1 М -меркаптоэтанол) [158] и добавляли 1 объем изопропилового спирта. Полученную суспензию встряхивали 10 с и выдерживали 5 мин при +4оС. Смесь центрифугировали при 12000 об/мин (центрифуга 5424R Eppendorf, Германия) в течение 10 мин при +4С. Удаляли надосадочную жидкость, промывали 75% этиловым спиртом для удаления остатков буфера и центрифугировали 5 мин в том же режиме.
Осадок растворяли в воде марки Milli-Q (Simplicity 185, Millipore, Германия), обработанной диэтилпирокарбонатом (DEPC). Водный раствор РНК обрабатывали ДНКазой I (Thermo Fisher Scientific, США) в присутствии ингибитора РНКаз RiboLock (Thermo Fisher Scientific, США) согласно рекомендациям производителя. Затем добавляли 0,5М ЭДТА до концентрации 10 мМ и проводили депротеинизацию смесью фенола и хлороформа-изоамилового спирта (24:1) в соотношении 1:1. Извлекали водную фазу и добавляли к ней 1/10 часть от объема полученного водного раствора РНК 3М ацетат натрия и 1,5 объема изопропилового спирта. Образовавшуюся суспензию РНК хранили при –70С. Полученную суспензию РНК центрифугировали при 12000 об/мин (центрифуга 5424R Eppendorf, Германия) в течение 10 мин при +4С, промывали 75% этиловым спиртом, высушивали 5 мин на воздухе и растворяли в воде марки Milli-Q (Simplicity 185, Millipore, Германия), обработанной DEPC. Для определения концентрации РНК 1 мкл пробы растворяли в 59 мкл ТЕ-буфера (10 мМ трис (рН 8,0); 1 мМ ЭДТА). Концентрацию РНК в смеси (мкг/мл) измеряли на спектрофотометре BioPhotometer (Eppendorf, Германия) согласно рекомендациям производителя. Количество полученной РНК [мкг] определяли по формуле: 60 V/1000, где V [мкл] – объем образца РНК в воде.
Анализ корреляции между уровнем мРНК гена SGMS1 и уровнем белка SMS1 в тканях человека
Исследование возможных некодирующих РНК в составе гена SGMS1 человека мы начали с анализа результатов транскриптомных исследований. В базах данных Национального центра биотехнологической информации США Expressed Sequence Tags (EST), Gene, Sequence Read Archive (SRA) было обнаружено большое количество участков внутри интронов, в которых наблюдалась транскрипционная активность.
Транскрипты, кодируемые геном SGMS1, содержащиеся в образцах РНК лобной коры и крови человека, были проанализированы с помощью метода RNA CaptureSeq. Метод позволил избирательно анализировать транскрипты, синтезированные только смысловой цепью ДНК.
Секвенирование препарата лобной коры и крови дало 3,5 х 106 и 3,9 х 106 прочтений длиной 100 н. соответственно, картируемых на смысловую цепь. RNA CaptureSeq-анализ выявил большое количество транскриптов, кодируемых интронами гена SGMS1 (Рисунок 7). С помощью программы Local Blast было показано, что в каждом образце основная часть собранных последовательностей картировалась на геном в виде непрерывной последовательности и покрывала области интронов гена SGMS1. Программа Tophat (2.0.13) позволила проанализировать последовательности, которые картировались на разные участки генома, что служило указанием на то, что соответствующие им РНК подвергаются сплайсингу. Из анализа были исключены последовательности, которые по данным UCSC Genome Browser Рисунок 7. Анализ экспрессии гена SGMS1 в образцах из лобной коры и крови человека методами RNA CaptureSeq и ОТ-ПЦР. Визуальное представление результатов RNA CaptureSeq-анализа получено с помощью UCSC Genome Browser. Профили экспрессии в лобной коре и крови размещены друг под другом. Вертикальными линиями отмечены позиции экзонов: снизу указаны позиции экзона от начала первого экзона гена SGMS1 (н.), сверху обозначены наименования экзонов. На электрофореграммах, в верхней части рисунка, показаны результаты разделение продуктов амплификации после 30 циклов амплификации. Стрелками показаны позиции праймеров, соответствующих последовательности интрона I (InI), интрона II (InII), интрона III (InIII) и кодирующего транскрипта (КТ) гена SGMS1. Для контроля отсутствия геномной ДНК в пробе (К) использовали смесь для ПЦР с праймерами FinIII/RinIII и эквивалентным количеством РНК, которая не подвергалась обратной транскрипции. содержали высокогомологичные повторяющие элементы в участках, прилегающих к сайтам сплайсинга. В Таблицах 3 и 4 представлена характеристика вариантов сплайсинга, обнаруженных при анализе результатов секвенирования образцов из лобной коры и крови с помощью программы Tophat (2.0.13). В Таблице 3 объединены результаты, которые подтверждают полученные ранее данные о структуре транскриптов гена SGMS1 [5]. Представлена характеристика вариантов сплайсинга экзонов 1– 11, участвующих в образовании основной мРНК; альтернативных экзонов 1а, 6а, 7b, входящих в состав минорных транскриптов; экзонов, очередность сплайсинга которых по сравнению с мРНК нарушена (связи экзонов 6 и 8; 6а и 8; 7 и 9). В Таблице 4 приводится характеристика новых вариантов сплайсинга в области гена SGMS1. Так, в крови обнаружены новые варианты сплайсинга экзонов 5 -НТО, очередность которых по сравнению с мРНК нарушена (связи экзонов 3 и 5; 5 и 7). Анализ обоих образцов выявил множество новых вариантов сплайсинга, затрагивающих область интронов гена SGMS1.
Анализ представленности РНК, картируемых в интронах гена SGMS1 человека, проводили с помощью ОТ-ПЦР на образцах кДНК лобной коры. Пары праймеров были подобраны к разным участкам интронов (FinI/RinI; FinII/RinII; FinIII/RinIII). В качестве контроля использовали праймеры F7/R8, соответствующие мРНК гена SGMS1 (Рисунок 7). В качестве отрицательного контроля, учитывающего возможность контаминации геномной ДНК, использовали смесь для ПЦР с праймерами FinIII/RinIII и эквивалентным количеством РНК, которая не подвергалась обратной транскрипции. Последовательности праймеров представлены в Таблице 1. Результат разделения продуктов амплификации показан на фореграмме в верхней части Рисунка 7. Видно, что продукты ПЦР детектировались во всех случаях, кроме отрицательного контроля.