Содержание к диссертации
Введение
ГЛАВА 1. Обзор литературы 11
1.1. Общие сведения о рецепторе CD150 (SLAMF1) 11
1.1.1. Рецептор CD150 (SLAMF1) 13
1.1.2. Внутриклеточные пути передачи сигнала рецептора CD150 13
1.1.3. Функции рецептора CD150 1.1.3.1. CD150 является регулятором синтеза IFN-, пролиферации Т- и В-клеток 18
1.1.3.2. Роль SLAMF1 в развитии NKT-клеток 20
1.1.3.3. Распознавание бактерий клеткой при участии CD150 20
1.1.4. Связь нарушения регуляции SLAMF1 и развития заболеваний 22
1.1.4.1. SLAMF1 и аутоиммунные заболевания 22
1.4.2. Полиморфизмы гена SLAMF1, ассоциированные с заболеваниями 23
1.4.3. Роль CD150 в развитии Х-сцепленного лимфопролиферативного синдрома и легочного саркоидоза 25
1.4.4. Уменьшение экспрессии SLAMF1 является плохим прогностическим признаком при лечении хронического лимфолейкоза 27
1.1.4.5. SLAMF1 и туберкулез 27
1.1.5. CD150 может выступать в качестве рецептора для представителей морбилливирусов, и вируса контагиозного моллюска 28
1.2. Общие механизмы регуляции экспрессии генов 31
1.2.1. Регуляция экспрессии белка на уровне транскрипции 31
1.2.1.1 Общие этапы регуляции инициации транскрипции РНК эукариот. 31
1.2.1.2. Эпигенетические изменения, происходящие на протяжении инициации транскрипции 33
1.2.1.3. Регуляторные элементы эукарического гена 34
1.2.1.4. Транскрипционные факторы и биоинформатическое предсказание их связывания 40
1.2.1.5. Транскрипционный фактор EBF1 42
2.2. Регуляция экспрессии белка на уровне трансляции 46
ГЛАВА 2. Материалы и методы 55
2.1. Методы работы с бактериями E.coli 55
2.1.1. Получение компетентных клеток 55
2.1.2. Трансформация компетентных клеток 56
2. Методы работы с ДНК 56
2.2.1. Выделение плазмидной ДНК (miniprep) 56
2.2.2. Выделение плазмидной ДНК (midiprep) 57
2.2.3. Секвенирование 58
2.2.4. Молекулярное клонирование 59
2.2.5. Выделение фрагментов ДНК из агарозного геля 59
2.2.6. Полимеразная цепная реакция (ПЦР) 60
2.2.7. Сайт-направленный мутагенез 62
2.2.8. Анализ экспрессии генов методом ПЦР с обратной транскрипцией в реальном времени 66
2.3. Методы работы с эукариотическими клетками 67
2.3.1. Культуры клеток, использованные в работе 67
2.3.2. Замораживание клеток 68
2.3.3. Размораживание клеток 68
2.3.4. Ведение культуры прикрепленных клеток 69
2.3.5. Ведение суспензионных клеточных культур 69
2.3.6. Трансфекция клеток методом капиллярной электропорации 69
2.3.7. Люциферазный тест 70
2.4. Методы работы с РНК 71
2.4.1. Выделение тотальной РНК из клеток 71
2.4.2. Синтез первой цепи кДНК (обратная транскрипция) 71
2.4.3. Метод быстрой амплификации концевых фрагментов кДНК (5 RACE PCR) 72
2.4.4. РНК-интерференция 73
2.4.5. Транскрипция мРНК in vitro 74
2.5. Преципитация хроматина 76
2.5.1. Иммунопреципитация хроматина (СhIP) 76
2.5.2. Тест на связывание белка с ДНК-матрицей (DNA pull-down assay) 78
2.6. Биоинформатические методы 79
2.6.1. Поиск предполагаемых промоторной и энхансерных областей, сайтов связывания факторов транскрипции, оценка влияния полиморфизмов на связывание
факторов транскрипции 79
2.6.2. Анализ дифференциальной экспрессии генов 79
ГЛАВА 3. Результаты и обсуждение 81
3.1. В В-клетках человека преимущественно экспрессируются мРНК SLAMF1 с короткой 5 -НТО 81
3.2. Эффективность трансляции коротких мРНК SLAMF1 в 6-8 раз выше, чем длинных мРНК 85
3.3. Длинные изоформы мРНК гена SLAMF1 содержат несколько кОРС в 5 -НТО 88
3.4. Трансляция мРНК SLAMF1, содержащих длинные и короткие варианты 5 -НТО, в равной степени угнетается при дефиците активных факторов eIF2 и eIF4E 90
3.5. Описание промоторной области гена SLAMF1 в В-лимфобластоидных клеточных линиях человека 92
3.6. Определение сайтов связывания транскрипционных факторов в промоторе гена SLAMF1 95
3.7. Активность EBF1 в В-клетках ассоциирована с диметилированием лизина 4 гистона 3 (H3K4Me2) 99
3.8. Транскрипционный фактор EBF1 играет значительную роль в регуляции экспрессии различных представителей семейства SLAM 101
3.9. Мутация сайтов связывания EBF1 также оказывает влияние на активность энхансеров локуса гена SLAMF1 1 3.10. Введение сайта связывания EBF1 в промотор Slamf1 мыши увеличивает его активность 105
3.11. Сайт связывания EBF1 разрушается минорным вариантом полиморфизма rs139767239 107
3.12. Полиморфизм rs3753381 увеличивает активность энхансера SLAMF1 более чем в два раза 109
3.13. Мутации сайтов связывания транскрипционных факторов RXR и FOX угнетают активность энхансера Е в случае минорного варианта полиморфизма rs3753381 112
Заключение 116
Выводы 117
Благодарности 117
- Рецептор CD150 (SLAMF1)
- Регуляция экспрессии белка на уровне транскрипции
- Ведение суспензионных клеточных культур
- Транскрипционный фактор EBF1 играет значительную роль в регуляции экспрессии различных представителей семейства SLAM
Введение к работе
Актуальность темы
Гены семейства SLAM играют важную роль в процессе созревания и активации лимфоцитов, присутствуя на поверхности большинства клеток иммунной системы. При нарушении передачи сигналов от этих молекул наблюдается агаммаглобулемия и повышается восприимчивость к ряду инфекций (к вирусу Эпштейна-Барр, лейшмании). С другой стороны, высокий уровень экспрессии этих генов защищает клетки В-лимфом от уничтожения CD8 лимфоцитами. Первым открытым представителем семейства SLAM является ген SLAMF1, уровень экспрессии которого увеличивается при созревании В-лимфоцитов, их активации и при хроническом лимфолейкозе. Также SLAMF1 подвержен гипермутации при диффузной крупноклеточной В-клеточной лимфоме, вовлечен в развитие туберкулеза и аутоиммунных заболеваний (миастения гравис, системная красная волчанка и т.д.). Именно поэтому в данный момент актуальна задача разобраться в регуляции экспрессии гена SLAMF1, играющего роль "переключателя" при проведении активирующих и ингибирующих сигналов от клетки к клетке.
Важными способами регуляции экспрессии гена в клетке являются регуляция на уровне инициации транскрипции мРНК и на уровне инициации трансляции белка. Инициация транскрипции может быть под контролем различных элементов генома и их комбинаций: промотора, энхансеров, сайленсеров и инсуляторов, влияющих на эпигенетические модификации хроматина в клетке и привлечение полимеразы. Активность этих элементов может изменяться в зависимости от аллельных вариантов полиморфизмов гена (SNP). Эффективность трансляции белка, в свою очередь, может зависеть от количества матриц для трансляции, и от структуры 5'-НТО и 3'-НТО транслируемой мРНК: наличие коротких открытых рамок считывания или аномальная зависимость от концентрации факторов трансляции в клетке может приводить к угнетению синтеза белка.
Настоящая работа посвящена качественному и количественному описанию изоформ мРНК SLAMF1 и эффективности их трансляции, а также функциональному анализу регуляторных элементов гена SLAMF1: промотора и энхансеров, и влиянию аллельных вариантов полиморфизмов, ассоциированных с аутоиммунными заболеваниями, на экспрессию гена SLAMF1.
Цель и задачи исследования
Целью данной работы было изучение регуляции экспрессии гена SLAMF1 на уровне транскрипции и на уровне трансляции. Для достижения поставленной цели были сформулированы следующие задачи:
1. Описать структуру изоформ мРНК SLAMF1, оценить их представленность в В-
клетках и эффективность их трансляции.
2. Изучить промоторную и энхансерные области гена SLAMF1, выявить сайты
связывания транскрипционных факторов, влияющих на активность регуляторных
элементов SLAMF1.
3. Выявить общие закономерности регуляции активности промотора у
представителей семейства SLAM и энхансера гена IL2RA в различных клеточных
линиях, а также выявить функциональное различия между промоторами генов
SLAMF1 человека и мыши.
4. Оценить влияние аллельных вариантов полиморфизмов локуса гена SLAMF1,
ассоциированных с аутоиммунными процессами, на активность энхансеров SLAMF1
за счет изменения сайтов связывания транскрипционных факторов, регулирующих
активность данных регуляторных элементов.
Научная новизна и практическая значимость работы
Исследованы закономерности регуляции в В-лимфоцитах человека гена SLAMF1, кодирующего трансмембранный рецептор CD150 (SLAMF1). В первой части работы была исследована регуляция трансляции мРНК гена SLAMF1 и представленность изоформ мРНК SLAMF1 в В-клетках. Было показано, что в В-клетках человека присутствует две основные группы изоформ мРНК SLAMF1, различающихся по длине 5'-нетранслируемых областей (5'-НТО), причем представленность изоформ мРНК с короткими 5'-НТО на два порядка выше, чем изоформ с длинными 5'-НТО. Впервые показано, что в модельной клеточной системе репортерная мРНК, содержащая 5'-НТО короткой изоформы мРНК SLAMF1 (лишенная кОРС), транслируется в 6–8 раз эффективнее, чем мРНК с 5'-НТО длинной изоформы мРНК этого гена. Это объясняется наличием в 5'-НТО длинной изоформы нескольких кОРС, снижающих эффективность трансляции.
Во второй части работы с помощью анализа эпигенетических данных, опубликованных в рамках проекта ENCODE (Consortium, 2012); (Gerstein et al., 2012); а также делеционного и мутационного анализа, была выявлена и охарактеризована промоторная область SLAMF1 и ряд транскрипционных факторов, играющих важную роль в активности промотора. Впервые прямо показана ключевая роль транскрипционного фактора EBF1 в регуляции активности промотора SLAMF1 человека. Впервые показано, что подавление экспрессии EBF1 приводит к выборочному снижению экспрессии мРНК большинства, но не всех, представителей семейства SLAM. Впервые охарактеризованы три энхансерных элемента гена SLAMF1; исследована роль EBF1 в функционировании энхансеров SLAMF1 в В-клетках и энхансера IL2RA в Т-клетках.
Впервые показано, что минорный вариант полиморфизма rs3753381, ассоциированного с миастенией гравис, коррелирует с возрастанием активности энхансера из третьего интрона гена SLAMF1. Полученные данные расширяют фундаментальные знания в области регуляции экспрессии гена SLAMF1 в лимфоцитах и позволяют предположить, что модуляция экспрессии SLAMF1 может быть важна в случае аутоиммунных заболеваний.
Степень достоверности и апробация результатов работы
Цели, поставленные в работе, достигнуты, результаты приведенных в работе экспериментов грамотно интерпретированы и сделанные в работе выводы обоснованы, их достоверность не вызывает сомнений. Результаты работы были опубликованы в рецензируемых научных журналах и представлены на российских и международных конференциях.
Публикации
Результаты работы были представлены на 7 научных конференциях и опубликованы в 3 статьях в рецензируемых научных журналах (см. перечень в разделе «Список работ, опубликованные по теме диссертации»).
Объем диссертации
Материал диссертации изложен на 138 страницах машинописного текста, включая 28 рисунков. Диссертационная работа состоит из введения, обзора литературы, материалов и методов исследования, результатов и их обсуждения, а также выводов и списка литературы. Список цитируемых литературных источников включает 222 наименования.
Рецептор CD150 (SLAMF1)
Промотор представляет собой последовательность ДНК, где происходит сборка общих факторов транскрипции и РНК-полимеразы II. Промотор разделяют на коровый промотор и проксимальные регуляторные участки [92]. Коровый промотор находится непосредственно вблизи старта транскрипции. Канонические коровые промоторы млекопитающих и дрозофилы включают так называемый ТАТА-бокс, в качестве которого может выступать почти любая АТ-богатая последовательность, и ряд других элементов, характеризующихся присутствием мотивов определенной нуклеотидной последовательности: BREu (upstream TFIIB recognition element, находящийся перед TATA-боксом участок связывания TFIIB), BREd (downstream TFIIB recognition element, находящийся после TATA-бокса участок связывания TFIIB), Inr (Initiator, участок, в котором начинается транскрипция), DPE (downstream promoter element, нижележащий элемент промотора), DRE (DNA replication-related element, связанный с репликацией ДНК элемент) (Рис. 7) [93]. Вышеописанные элементы, как правило, не присутствуют в промоторе одновременно, а комбинации элементов корового промотора зависят от функциональной активности промотора, что позволяет выделить три типа промоторов: I -"зрелые" (adult), направляющие транскрипцию тканеспецифичных генов, II -"повсеместные" (ubiquitous) - направляющие транскрипцию генов домашнего хозяйства, III - промоторы генов, экспрессия которых регулируется по ходу развития клетки [93]. Используя другие комбинации параметров, можно различить десять классов промоторов [94].
Проксимальные регуляторные участки располагаются вблизи корового промотора, обычно не более чем в 1 т.п.н. и могут быть представлены CpG-островками. Часто эукариотические промоторы, не имеющие выраженного ТАТА-бокса, располагаются в CpG-островках (такими, например, являются промоторы генов домашнего хозяйства). Для промоторов, ассоциированных с CpG-островками, характерно присутствие ряда близко расположенных альтернативных точек старта транскрипции [95], [96], что связано с отсутствием в них участка, связанного с нуклеосомой.
С ТАТА-боксом связывается TBP (TATA-binding protein, связывающийся с ТАТА боксом белок), вокруг которого собираются все остальные компоненты преинициаторного комплекса РНК-полимеразы II [97], [98]. Для привлечения ТВР к промоторам без ТАТА бокса требуются дополнительные факторы транскрипции, например, универсальный фактор SP1, связывающийся с GC-богатыми участками ДНК. Далее происходит плавление ДНК и формирование открытого комплекса РНК-полимеразы II в элементе Inr (Initiator) элементе на некотором расстоянии от промотора, представляющего собой последовательность TCAGTYKNNNTYNR в D. melanogaster, но варьирующего до динуклеотида пиримидин-пурин [99]. Промоторы имеют особую организацию в фибрилле и специфичный профиль модификации гистонов. Последовательность промотора может быть либо свободной от нуклеосом, либо иметь связывание с нестабильной нуклеосомой, в состав которой входят гистоны H2A.Z и H3.3 [100]. Модификации гистонов играют роль в регуляции инициации транскрипции на промоторе: промоторы активных генов характеризуются наличием триметилирования гистона H3 по лизину 4 (H3K4Me3), ацетилированию гистона H3 по лизину 27 и 9 (H3K27 и H3K9). Также отличительной чертой активных промоторов является их высокая чувствительность к обработке ДНКазой I [101].
Энхансеры Энхансер - это регуляторный элемент генома, способный активировать транскрипцию, направляемую одним или несколькими промоторами, расположенный на расстоянии от нескольких сотен нт до нескольких десятков тысяч нт относительно промотора. Энхансеры могут быть расположены в межгенных регионах, интронах генов и в кодирующей области генов, имеют размеры 200-3000 нт и служат площадкой для сборки регуляторного комплекса. Последовательность ДНК, находящаяся между энхансером и стартом транскрипции гена, служит в качестве "спейсера", которая не распознается регуляторные белки напрямую, но придает гибкость, необходимую для эффективного петлеобразования ДНК (Рис. 7А). Большинство эукариотических энхансеров обладают тканевой специфичностью, определяемой набором участков связывания, представленных в данном энхансере [102]. Существует предположение, что все энхансеры и контролируемые ими промоторы организованы в единый активаторный комплекс (active chromatin hub, активаторный хроматиновый блок) [103]. Существует много предположений о функциональной роли энхансеров в сборке преинициаторного комплекса РНК-полимеразы II: повышение концентрации тканеспецифичных транскрипционных факторов в области промотора; привлечение дополнительных компонентов (гистонацетилаз, факторов ремоделирования хроматина), способствующих реконфигурации хроматина; сборка преинициаторного комплекса на энхансере с последующим переносом его на промотор; стабилизация собранного на промоторе преинициаторного комплекса. Однако существуют предположения о регуляции энхансерами экспрессии гена посредством синтеза энхансерной РНК (эРНК) [104]. Последняя была обнаружена во многих типах клеток, и, видимо, участвует в поддержании «активного» хроматина и контактов между энхансером и промотором. Была отмечена корреляция между уровнем экспрессии эРНК и уровнем экспрессии ближайшей мРНК [105]. Недавно было обнаружено, что на промоторах большинства генов присутствует собранный преинициаторный комплекс, поэтому стадией, определяющей скорость транскрипции, скорее всего, является этап освобождения промотора (переход к элонгации) [106]. Было высказано предположение о том, что именно эта стадия транскрипционного цикла регулируется энхансерами [107].
Регуляция экспрессии белка на уровне транскрипции
Наличие одной или нескольких кОРС в мРНК может придавать её трансляции устойчивость к недостатку некоторых факторов инициации – тогда происходит повышение эффективности синтеза основного продукта в определённых условиях [160], [167]. Теоретически, от любой мРНК, содержащей несколько кОРС в 5 -НТО, можно ожидать необычной зависимости от доступности eIF2, приводящего к изменению эффективности инициации на кОРС [165], [166], [168]. Известно, что фосфорилирование eIF2, в норме оказывающее ингибирующий эффект на трансляцию, может оказывать избирательное воздействие и даже усиливать трансляцию специфических мРНК, содержащих кОРС - примером этого является усиление трансляции регуляторного белка дрожжей Gcn4 в ответ на вызванное аминокислотным голоданием фосфорилирование eIF2 [168], [169]. Увеличение трансляции кОРС-содержащих матриц на фоне фосфорилированного eIF2 объясняется тем, что при недостатке питательных веществ происходит глобальное понижение активности eIF2, эффективность распознавания стартов снижается, и предъинициаторный комплекс с большей вероятностью доходит до основной рамки, а не терминирует после инициации на кОРС (Рис. 11). Такая субчастица рибосомы может свободно инициировать трансляцию на Gcn4, и происходящее в результате увеличение количества этого регуляторного белка приводит к образованию набора белков, усиливающих синтез аминокислот внутри клетки. Подобное усиление трансляции для кОРС-содержащих матриц было показано для ATF4, ATF5, CHOP и GADD34, причем увеличение количества белка ATF4 в клетке происходит на в ответ на стрессовые стимулы, и последующее уменьшение общей эффективности трансляции в отсутствие eIF2 [153]. Наличие кОРС может также придавать мРНК способность к переключению синтеза между двумя изоформами белка в зависимости от концентраций активного eIF2 и eIF4E [166]. В ряде случаев изменение уровня экспрессии белка происходит в результате образования продукта альтернативного сплайсинга, не содержащего кОРС [170] или содержащего другой набор кОРС. 2) Наличие выраженной вторичной структуры в 5 НТО может влиять на эффективность трансляции матрицы. Наличие в этой области достаточно стабильных шпилек оказывает ингибирующее действие на зависимую от сканирования инициацию трансляции [171]. Преодолению подобных шпилек могут способствовать DEAD-бокс-АТФ-зависимые РНК хеликазы и оверэкспрессия eIF4E, чей уровень лимитирует трансляцию мРНК, содержащих вторичную структуру [171], [172]. Также было обнаружено, что человеческий белок DHX29 (у дрожжей - DDX3 (Ded1) также является необходимым для расплетания стабильных вторичных структур, расположенных рядом с кэпом и мешающих прохождению сканирования [173]. Еще одним механизмом контроля инициации трансляции, зависимым от вторичной структуры на 5 -конце РНК, является ингибирование трансляции генов, кодирующих ферритин и гены других участников метаболизма железа путем связывания белка-регулятора железа (iron regulatory protein, IRP) со стабильной шпилькой, находящейся рядом с кэпом, и формирование регуляторного элемента, зависимого от наличия железа в клетке (iron response element) [174]. Наличие вторичной структуры после инициаторного кодона может повышать эффективность его распознавания. Сканирующая 40S-субъединица рибосомы, встречая на свое пути шпильку, замедляет свое движение, что снижает вероятность реализации механизма "ослабленного сканирования" (leaky scanning) в отсутствии оптимального контекста [175], [176], [177]. Увеличение трансляции происходит, только если вышеупомянутая вторичная структура находится на определенном расстоянии от старта кодирующей области. 3) Механизм "ослабленного сканирования" (leaky scanning) реализовывается при наличии слабого участка распознавания старта транскрипции: предынициаторный комплекс "проскакивает" первый AUG, если тот находится в неоптимальном окружении, и инициирует синтез белковой цепи на втором или даже третьем AUG. Таким образом, клетка может регулировать относительное содержание изоформ белка, например, клеточно-специфичное увеличение содержания фактора инициации eIF4F способствует использованию кодона AUG, ближе всего расположенного к 5-концу мРНК. Эффективность реинициации на втором старт-кодоне может быть существенно снижена, если он находится внутри рамки, начинающейся с первого кодона [175]. Возможность реализации ослабленного сканирования может ингибироваться увеличением уровня eIF5, eIF2, например, для генов GADD34 [178] и IFRD [179]; и увеличением уровня полиаминов (контроль синтеза AMD1 и AZIN1) [180].
Инициация трансляции матриц в тех случаях, когда кэпзависимая инициация трансляции заингибирована (при стрессе, на определённой стадии клеточного цикла или при апоптозе), или инициация трансляции последовательностей, расположенных далеко от 5-конца мРНК, может осуществляться с помощью участка внутренней посадки рибосомы (internal ribosome entry site, IRES). В клетках IRES отвечают за посадку рибосом как на кэпированные, так и на некэпированные транскрипты и тем самым обеспечивают непрерывный синтез необходимых белков. мРНК вируса SV40 и герпесвирусов содержит две находящиеся вместе разные кодирующие белок последовательности, и трансляция первой последовательности происходит благодаря обычному механизму сканирования, а трансляция второй – посредством IRES [181], [182]. Последовательности IRES обычно имеют длину в несколько сотен нуклеотидов и сворачиваются в специфические структуры, которые связывают многие белки, используемые для инициации нормальной кэп-зависимой трансляции. В действительности для вирусных и клеточных IRES требуются различные подгруппы факторов инициации, однако общим является тот факт, что для IRES-зависимой инициации трансляции не требуется 5-кэп и фактор инициации трансляции eIF4E [152]. Примерами эукариотических генов, содержащих IRES, являются c-Myc, PUMA, XIAP [183], [184], [185].
Некоторые вирусы (вирус гриппа, хантавирус и др.) используют IRES как часть своей стратегии, чтобы осуществлять трансляцию своих молекул мРНК, при этом блокируя нормальную кэп-зависимую трансляцию мРНК хозяина. Энтеровирусы, ретровирусы и калицивирусы при заражении экспрессируют протеазу, которая расщепляет фактор трансляции eIF4G клетки хозяина, делая его не способным связываться с кэп-связывающим карбоксильным хвостом комплекса eIF4A-eIF3-рибосомы [186]. Это приводит к прекращению большей части трансляции в хозяйской клетке и эффективно привлекает аппарат трансляции на последовательности IRES, которые содержатся во многих вирусных мРНК. Избирательная активация IRES-зависимой трансляции также может происходить и на мРНК клетки хозяина: когда клетки млекопитающих вступают на путь апоптоза, фактор eIF4G расщепляется и происходит общее снижение скорости трансляции. Представители семейства белков-ингибиторов апоптоза XIAP и HIAP2 транслируются с мРНК, содержащих последовательности IRES, что позволяет осуществлять их непрерывный синтез. Таким образом, механизм IRES позволяет транслировать избранные мРНК с высокой скоростью, несмотря на общее снижение способности клетки инициировать синтез белка [187].
Ведение суспензионных клеточных культур
Структура 5 -НТО гена SLAMF1. А. Представленность SLAMF1 транскриптов в базе данных GenBank по данным анализа на сервере genome.ucsc.edu. В верхней части рисунка показана 5 -НТО гена SLAMF1 и начало кодирующей последовательности. В средней части рисунка показаны депонированные в GenBank мРНК SLAMF1, в нижней -сплайсированные EST. Б. Относительный уровень экспрессии различных изоформ мРНК гена SLAMF1 в различных В-клеточных линиях (FANTOM5 CAGE tag count).
Нами были проанализировали данные HeliScopeCAGE, опубликованные консорциумом FANTOM5 [203] для нескольких В-клеточных линий человека, для которых показан высокий уровень экспрессии SLAMF1 (Рис. 12Б). Во всех проанализированных клеточных линиях было обнаружено две группы стартов транскрипции мРНК: старты первой группы находятся между -366 и -308 нт от первого нуклеотида старта кодирующей области гена SLAMF1 и дают начало длинным изоформам мРНК; а старты второй группы - между -99 и -75 пн от старта трансляции SLAMF1, с которых синтезируются короткие мРНК SLAMF1. Таким образом, данные нашего анализа подтвердили наличие двух групп мРНК SLAMF1, отличающихся по длине 5 -НТО, что совпадает с данными GenBank. Данные обсчета CAGE для четырех проанализированных В-клеточных линий свидетельствуют о том, что преобладающими в зрелых В-клетках изоформами мРНК SLAMF1 являются короткие изоформы мРНК, имеющие длину 5 -НТО от -99 и -75 пн от первого нуклеотида старта трансляции (Рис. 12Б), чей уровень экспрессии превосходит на два порядка уровень экспрессии длинных изоформ SLAMF1. Согласно данным анализа CAGE всех опубликованных транскриптов мРНК человека, подобное соотношение коротких и длинных изоформ мРНК SLAMF1 не является типичным только для B-клеток, в которых уровень белка SLAMF1 один из самых высоких в организме человека: короткие мРНК являются наиболее представленными также в NK-клетках, дендритных клетках, легких и сердце, где белок SLAMF1 (CD150) экспрессируется на низком уровне. Однако, существуют данные о том, что в некоторых тканях относительная представленность длинных изоформ SLAMF1 больше, чем в зрелых В-клетках: например, количество длинных мРНК SLAMF1 в лимфобластах острого Т-клеточного лейкоза всего в 2 раза меньше, чем коротких, что коррелирует с низким уровнем экспрессии белка SLAMF1 на поверхности клеток (Cancer Cell Line Encyclopedia (Broad Institute совместно c Novartis)). Ввиду такой неоднородной представленности изоформ SLAMF1 в разных тканях организма с разным уровнем синтеза белка, можно предположить возможность существования весьма сложной системы тонкой регуляции экспрессии SLAMF1 в клетке.
На основании того, что наибольший уровень синтеза белка SLAMF1 был детектирован именно в зрелых В-клетках [202], [8], изучение регуляции экспрессии мРНК SLAMF1 далее проводилось на двух В-лимфобластоидных клеточных линиях: линии лимфомы Беркитта Raji и EBV-трансформированной В-лимфобластоидной клеточной линии MP-1, любезно предоставленной нам Др. Эдвардом Кларком (Университет Вашингтона, США).
Для подтверждения предположения о том, что преобладающими изоформами мРНК SLAMF1 в клеточной линии МР-1, не аннотированной в базе FANTOM5, также являются короткие изоформы мРНК, был проведен анализ экспрессии изоформ мРНК методом быстрой амплификации концевых фрагментов кДНК МР-1 (5 -RACE PCR, Rapid Amplification of cDNA Ends). Праймеры, подобранные для детекции изоформ, отображены на схеме Рис. 13А. Полученные фрагменты анализировали методом электрофореза в агарозном геле, результаты данного эксперимента представлены на Рис. 13Б. Рис. 13. Определение стартов транскрипции гена SLAMF1. А. Схематическое изображение 5 -НТО гена SLAMF1. Вертикальные стрелки обозначают возможные сайты старта транскрипции, светло-серые прямоугольники - короткие открытые рамки считывания (кОРС), темно-серый прямоугольник – кодирующая последовательность гена SLAMF1. Пунктирные горизонтальные стрелки соответствуют праймерам, использованным для 5 -RACE-PCR. Б. Анализ фрагментов 5 -НТО SLAMF1 в клеточной линии МР-1, полученных с помощью 5 -RACE-PCR с использованием праймеров RACE Step2 F + RACE Step2 R методом электрофореза в 1% агарозном геле в неденатурирующих условиях. Основная полоса отражает представленность коротких изоформ мРНК SLAMF1 в клетках МР-1, тонкая полоса – представленность длинных изоформ. Окраска EtBr. В. Относительный уровень экспрессии различных изоформ мРНК гена SLAMF1 согласно данным ПЦР в реальном времени. Представленные данные получены из трех и более независимых экспериментов со средними значениями с учетом стандартной ошибки. " " обозначено статистически достоверное различие между образцами (P 0.05, согласно t-критерию Стьюдента).
Как видно из Рис. 13Б, фракция мРНК с короткой 5 НТО, соответствующая описанной нами короткой мРНК SLAMF1, представлена на несколько порядков выше, чем мРНК с длинной 5 НТО. Также при детальном рассмотрении геля мы видим два обособленных продукта, что подтверждает наше предположение о наличии двух групп стартов транскрипции SLAMF1, и соответственно, двух групп мРНК, различающихся по длине 5 -НТО. Относительная представленность коротких и длинных изоформ мРНК в клетках MP-1 и Raji была проанализирована методом ПЦР в реальном времени; подобранные для детекции изоформ праймеры отражали представленность либо всех изоформ РНК, либо только длинных изоформ мРНК. Из Рис. 12В видно, что длинные изоформы мРНК составляют менее 10% от всех изоформ мРНК SLAMF1, из чего можно сделать вывод, что короткие изоформы являются наиболее представленными среди всех других мРНК SLAMF1 в клетках МР-1 и Raji.
Таким образом, данные биоинформатического анализа, представленные на Рис. 11Б, полностью подтвердились экспериментальными данными, полученными в результате проведения 5 -RACE PCR (Рис. 13Б) и данными ПЦР в реальном времени (Рис. 13В). Данные отражают единую картину наличия двух стартов транскрипции мРНК SLAMF1 и преимущественного функционирования старта коротких изоформ мРНК SLAMF1 в В-клетках человека.
Транскрипционный фактор EBF1 играет значительную роль в регуляции экспрессии различных представителей семейства SLAM
Важность фактора EBF1 в регуляции экспрессии различных рецепторов лимфоцитов была подтверждена на примере гена IL2RA. Также, как и SLAMF1, IL2RA является трансмембранным белком типа I и экспрессируется на поверхности активированных Т- и В-клеток, тимоцитов и миелоидных предшественников. IL2RA является рецептором интерлейкина-2 (IL-2), при связывании с которым происходит, с одной стороны, активация эффекторных Т-клеток, усиливающих воспалительные реакции, а с другой стороны – регуляторных Т-клеток, которые подавляют развитие воспалительных реакций [218].
Первые 15 Kb первого интрона IL2RA представляют собой суперэнхансер и содержат ряд полиморфизмов, предположительно ассоциированных с аутоиммунными заболеваниями [219], [220]. Согласно биоинформатическому анализу данных PERFECTOS-APE, энхансерная область E1 локуса гена IL2RA содержит два таких полиморфизма, причем изменение аллельного варианта одного из них, rs139767239, может изменить афинность транскрипционного фактора EBF1 к данной последовательности в пять раз (Рис. 24А).
А. Изменение эффективности связывания EBF1 при изменении аллельного варианта полиморфизма rs139767239. Б. Экспрессия фактора транскрипции EBF1 в клеточных линиях МТ-2 и Jurkat по данным ПЦР в реальном времени. В. Влияние аллельного варианта полиморфизма rs139767239 на активность энхансера Е1 локуса гена IL2RA. Столбики соответствуют нормализованной экспрессии гена-репортера в клеточных линиях МТ-2 и Jurkat. " " обозначено статистически достоверное различие образца относительно контрольной конструкции; "#" обозначено статистически достоверное различие конструкции, содержащей минорный вариант полиморфизма, относительно конструкции, содержащей последовательность с мажорным вариантом SNP. Г. Данные анализа связывания EBF1 методом pull-down в ядерных экстрактах клеточной линии МТ-2. Количество ампликонов, связавшихся с антителом анти-EBF1, нормализовано на пробу с неспецифическим фрагментом ДНК, не содержащем сайтов связывания EBF1 (негативный контроль). Представленные данные получены из трех и более независимых экспериментов со средними значениями с учетом стандартной ошибки (P 0.05, согласно t-критерию Стьюдента).
Для проверки предположения о влиянии альтернативного аллельного варианта rs139767239 на активность энхансера E1 в последовательность энхансерного элемента были введены единичные замены таким образом, чтобы изменить последовательность полиморфизма rs139767239 на альтернативный вариант, ассоциированный с аутоиммунными заболеваниями. Было показано, что в клеточной линии MT-2, являющейся моделью регуляторных Т-клеток, изменение аллельного варианта rs139767239 (GA) вызывает падение активности энхансера E1 на 30%, тогда как в клеточной линии Jurkat (модель Т-хелперов) не было детектировано ни активности энхансерного элемента, ни изменения аллельных вариантов полиморфизмов (Рис. 24Б). Полученная разница в активности энхансера между клеточными линиями может объясняться тем, что экспрессия транскрипционного фактора EBF1 наблюдается в МТ2 и отсутствует в Jurkat (Рис. 24Г). Тест на связывание белка с ДНК-матрицей (DNA pull-down assay) подтвердил данные мутационного анализа сайта связывания EBF1 с изучаемой областью и продемонстрировал уменьшение афинности матрицы с минорным вариантом полиморфизма к транскрипционному фактору EBF1 (Рис. 24В). Полученные данные свидетельствуют о том, что роль EBF1 в регуляции активности рецептора SLAMF1 не является уникальным случаем и осуществляется в различных по происхождению клетках крови (регуляция активности промотора SLAMF1 в В-клетках, регуляция активности энхансера IL2RA в Т-клетках).
В контексте изучения регуляции экспрессии гена SLAMF1 были обнаружены данные о двух полиморфизмах, находящихся в локусе гена SLAMF1, ассоциированные с рядом заболеваний: минорный вариант полиморфизма rs3753381 ассоциирован с повышенным риском развития миастении гравис, а мажорный вариант полиморфизма rs11265455 ассоциирован с сахарным диабетом 2 типа. Данные полиморфизмы расположены в областях, имеющих черты регуляторных (наличие областей гиперчувствительности к ДНКазе I и областей связывания транскрипционных факторов согласно данным ChIP-seq проекта ENCODE), одна из которых находится на расстоянии 1500 пн перед кодирующей областью гена (энхансер D), а другая - в третьем интроне гена SLAMF1 (Энхансер Е, Рис. 25А, показаны красными стрелками). Мы проанализировали активность энхансерных элементов D и E дикого типа и активность тех же энхансеров с внесенными альтернативными аллельными вариантами полиморфизмов rs11265455 и rs3753381, соответственно (Рис. 25Б).
Анализ предполагаемых энхансеров в локусе гена SLAMF1. А. Схематическая карта расположения регуляторных элементов локуса гена SLAMF1. Серыми стрелками показаны энхансеры A и B, описанные нами ранее, толстыми чёрными линиями - экзоны гена SLAMF1, тонкими линиями - интроны. Красным указан уровень ацетилирования H3K27, прямоугольниками отмечены области гиперчувствительности к ДНКазе I и области связывания транскрипционных факторов по данным анализа ChIP-Seq проекта ENCODE, синими линиями схематично обозначено расположение полиморфизмов rs3753381 и rs11265455 на карте локуса гена SLAMF1. Б. Влияние аллельных вариантов полиморфизмов rs3753381 и rs11265455 на активность энхансеров Е и D локуса гена по SLAMF1. Столбики соответствуют нормализованной экспрессии гена-репортера в клеточных линиях МР-1 и Raji. Представленные данные получены из трех и более независимых экспериментов со средними значениями с учетом стандартной ошибки. " " обозначено статистически достоверное различие образца относительно контрольной конструкции; "#" обозначает статистически достоверное отличие конструкции, содержащей минорный вариант полиморфизма rs3753381, от конструкции, содержащей последовательность с мажорным вариантом (P 0.05, согласно t-критерию Стьюдента).
Стоит отметить, что в энхансерах D и Е не было обнаружено "сильных" сайтов связывания EBF1, с чем может быть связана более низкая активность энхансеров D и Е по сравнению с остальными энхансерами. Согласно данным нормализованной люциферазной активности, представленным на Рис. 24Б, оба предполагаемых энхансерных элемента увеличивают активность промотора SLAMF1 по сравнению с контрольной последовательностью, имеющей длину, аналогичную тестируемым энхансерным элементам, но не имеющей большого скопления сайтов связывания транскрипционных факторов и ацетилирования H3K27. Примечательно, что энхансер D демонстрирует наибольшую активность в зрелых В-лимфобластах лимфомы Беркитта (клеточная линия Raji), а энхансер E активнее в линии MP-1. Для объяснения различия активности энхансеров между двумя изучаемыми В-клеточными линиями были проанализированы транскрипционные факторы, связывающиеся с областями энхансеров D и Е в В-лимфобластоидной клеточной линии GM12878 (см. "Биоинформатический анализ", Экспериментальная часть); затем экспрессия транскрипционных факторов была оценена с помощью метода дифференциальной экспрессии генов в клеточных линиях Raji и MP-1 (Рис. 26).
Согласно данным ChIP-Seq в клеточной линии GM12878 с областью энхансера D связываются белки Mafk и WRNIP1, с областью энхансера Е также связываются Mafk и WRNIP1, и еще дополнительно STAT3, USF2 и MafF. Из Рис. 26 видно, что оба белка, связывающихся с энхансером D, сильнее экспрессированы в клеточной линии Raji, что может объяснять большую активность энхансера D в клеточной линии Raji. В случае белков, связывающихся с энхансером Е, все они, за исключением вышеупомянутых Mafk и WRNIP1, выше экспрессированы в клеточной линии МР-1, причем особенно выделяется MafF, чей уровень экспрессии в МР-1 более чем в 2,5 раза выше, чем в Raji. MafF (bZip Maf transcription factor protein) может формировать гомодимеры и участвовать в активации транскрипции [221].