Содержание к диссертации
Введение
Глава 1. Обзор литературы 22
1.1.Менархе как этап пубертатного развития и его генетические детерминанты 22
1.2. Современные представления об этиопатогенезе, факторах риска и молекулярно-генетических основах лейомиомы матки 32
1.3.Этиопатогенетические механизмы, факторы риска и генетические детерминанты развития эндометриоза 49
1.4.Гиперпластические процессы эндометрия: этиопатогенез, факторы риска, полиморфизм генов-кандидатов 63
1.5.Коморбидность и синтропия доброкачественных пролиферативных заболеваний женской репродуктивной системы 71
Глава 2.Материал и методы исследования 78
2.1. Дизайн исследования, характеристика групп исследования 78
2.2. Характеристика методов клинического обследования женщин 83
2.3. Отбор полиморфных локусов для исследования 86
2.4. Молекулярно-генетические методы 89
2.5. Методы статистической обработки 91
Глава 3. Полиморфизм генов-кандидатов и возраст менархе 102
3.1. Исследование ассоциаций полиморфных локусов с возрастом менархе 102
3.2.Связь полиморфизма с ростом и индексом массы тела женщин 113
3.3. Оценка биологических механизмов реализации фенотипических эффектов менархе-ассоциированных локусов 116
3.4.Обсуждение 125
Глава 4. Изучение ассоциаций генов-кандидатов менархе с развитием лейомиомы матки 147
4.1.Клинические характеристики и факторы риска лейомиомы матки 147
4.2. Ассоциации полиморфных локусов с развитием лейомиомы матки 153
4.3.Функциональное значение полиморфных локусов, ассоциированных с развитием лейомиомой матки 177
4.4.Обсуждение 190
Глава 5. Анализ молекулярно-генетических факторов развития гиперплазии эндометрия 209
5.1. Изучение клинических особенностей и факторов риска развития гиперплазии эндометрия 209
5.2. Полиморфизм генов-кандидатов и развитие гиперплазии эндометрия 214
5.3. Анализ функциональной роли полиморфных локусов, ассоциированных с развитием гиперплазии эндометрия 235
5.4.Обсуждение 246
Глава 6. Исследование ассоциаций полиморфных локусов с развитием эндометриоза 257
6.1. Анализ клинических, клинико-анамнестических характеристик и факторов риска развития эндометриоза 257
6.2. Ассоциации полиморфных локусов с развитием эндометриоза 261
6.3. Изучение функционального значения полиморфных локусов, ассоциированных с развитием эндометриоза 278
6.4.Обсуждение 287
Глава 7. «Общие» и «специфические» генетические факторы лейомиомы матки, гиперплазии эндометрия и эндометриоза 302
Заключение 312
Выводы 329
Практические рекомендации 333
Список литературы 334
Приложение 376
- Современные представления об этиопатогенезе, факторах риска и молекулярно-генетических основах лейомиомы матки
- Оценка биологических механизмов реализации фенотипических эффектов менархе-ассоциированных локусов
- Анализ функциональной роли полиморфных локусов, ассоциированных с развитием гиперплазии эндометрия
- «Общие» и «специфические» генетические факторы лейомиомы матки, гиперплазии эндометрия и эндометриоза
Современные представления об этиопатогенезе, факторах риска и молекулярно-генетических основах лейомиомы матки
Лейомиома матки – это доброкачественная моноклональная опухоль из гладкомышечных клеток миометрия (Адамян Л.В. и др., 2015a). В настоящее время, несмотря на результаты многочисленных исследований, нет единого представления об этиопатогенетических механизмах развития и роста миоматозных узлов. Согласно данным литературы, выделяют три этиологические гипотезы инициации формирования лейомиомы матки: 1) генетические аномалии, 2) стероидные гормоны, 3) факторы роста и нарушение восстановления при инфекции и повреждении матки (Адамян Л.В. и др., 2015a, Ciavattini А. et. al., 2013; Sparic R. et. al., 2016; Wise L.A. et. al., 2016; McWilliams M.M. et. al., 2017). Общая схема патогенеза лейомиомы матки представлена на рис. 3.
Считается, что опухоль растёт из одной первичной (материнской) клетки, имеющей генетический дефект на хромосомном или генном уровне. Однако, механизмы, которые служат толчком к началу роста опухоли остаются неясными. Предполагается, что генетические и эпигенетические изменения, происходящие в клетках миометрия, обуславливают повышение их чувствительности к действию гормонов и факторов роста (Wise L.A. et. al., 2016).
Следует отметить, что клетки миоматозных узлов в сравнении с тканями нормального миометрия имеют значимые эпигенетические изменения. В работе Navarro A. et al. (2012) в миоматозных клетках установлены изменения в уровне метилирования промоторов и сопутствующие им изменения в экспрессии мРНК в 55 генах. В исследовании Maekawa R. et al. (2013) выявлены различия в уровне метилирования и экспрессии РНК в 120 генах между клетками лейомиомы и нормальными клетками миометрия.
Литературные данные свидетельствуют о важном значении в развитии лейомиомы матки микро-РНК (miRNAs) (Nothnick W.B. 2016). Установлены значительные различия в экспрессии микро-РНК и их таргетных белков в нормальном миометрии и клетках лейомиомы. В нормальном миометрии наблюдается повышенная экспрессия miR-200а, miR-200b, miR-200с, miR-141, miR-429 (определяют низкую продукцию таргетных белков ZEB1, ZEB2, STAT5b) и пониженная – miR-199а-3p, miR-214 (обуславливают повышенную продукцию COX2). В тканях лейомиомы зарегистрирована повышенная экспрессия let-7 (приводит к снижению продукции HMGA2), низкая экспрессия miR-200а, miR-200b (определяет повышение продукции TUBB, CYP1B1, CTBP2) и измененная экспрессия (как в сторону увеличения, так и уменьшения) miR-200с (влияет на продукцию ZEB1, ZEB2, CDH1, TIMP2, FBLN5, VEGFA).
По данным цитогенетического анализа образцов тканей опухоли около 40% миоматозных узлов имеют различные хромосомные абберации: транслокация t(12;14)(q14-15;q23-24), трисомия по 12 хромосоме, делеция в 7 хромосоме del(7)(q22-q32), хромосомные перестройки в локусах 6p21 и 10q22, делеции в локусах 1p и 3q (Eggert S.E. et. al., 2012; Sparic R. et. al., 2016; Manta L. et. al., 2016; Wise L.A. et. al., 2016). Эти хромосомные аномалии могут обуславливать нарушение экспрессии генов MED12, HGMA1, HGMA2, FH, BHD, TSC2, PCOLCE, ORC5L, LHFPL3, ESR2 и RAD5.1. в матке (McWilliams M.M. et. al., 2017). Следует отметить, что множественные миоматозные узлы в одной и той же матке могут иметь разные генетические дефекты, что свидетельствует о том, что каждый миоматозный узел развивается независимо (Стрижаков А.Н. и др., 2014; Sparic R. et. al., 2016). Таким образом, цитогенетическая гетерогенность лейомиомы матки лежит в основе фенотипических различий (размер, локализация миоматозного узла) и указывает на то, что генетические факторы играют фундаментальную роль в формировании данного заболевания.
Обращает на себя внимание, установленный в 2013 г. Mehine M. et al., факт наличия в клетках лейомиомы матки множественных разрывов хромосом, сопровождающийся в дальнейшем случайным объединением образовавшихся фрагментов (явление хромострипсиса).
Лейомиома матки является эстроген-зависимой опухолью и ведущую роль в фенотипическом проявлении цитогенетических и молекулярно-генетических нарушений в клетках миометрия принадлежит половым гормонам. Об этом свидетельствуют следующие факты: миоматозные узлы не возникают до полового созревания, имеют тенденцию к росту в течение репродуктивного периода и регрессируют после менопаузы (Адамян Л.В. и др., 2015a; Moravek M.B. et. al., 2015; Sparic R. et. al., 2016; McWilliams M.M. et. al., 2017). Согласно общепризнанным представлениям, основной причиной развития лейомиомы является гиперэстрогения – повышенная продукция эстрогенов и/или повышенная чувствительность миометрия к эстрогенам в том числе локальная; недостаточность лютеиновой фазы менструального цикла, прогестероновая недостаточность, хроническая ановуляция и повышенная продукция гонадотропных гормонов (Киселев В.И. и др. 2010).
Согласно литературным данным, эстрогены могут инициировать развитие лейомиомы и стимулировать ее рост через цитокины, факторы роста и апоптоз (Сидорова И.С. и др., 2012; Moravek M.B. et. al., 2015; Katz T.A. et. al., 2016). Показано, что в миоматозных клетках по сравнению с нормальным миометрием наблюдается повышенная экспрессия рецепторов стероидных гормонов, факторов роста и их рецепторов, опосредованная эстрогенами (Wise L.A. et. al., 2016). Также в миоматозном узле регистрируется повышенная экспрессия таких ферментов как ароматаза и 17-гидроксистероиддегидрогеназа (17-HSD), обуславливающих локальное преобразование циркулирующего андростендиона в эстрон (ароматаза), а затем и в эстрадиол (17- HSD) (Borahay M.A. et. al., 2015; Moravek M.B. et. al., 2015). Таким образом, в клетках лейомиомы матки формируется локальная гиперэстрогения. Эстрогены, в частности 17-эстрадиол, оказывают свое биологическое действие на клетки-мишени, включая клетки миометрия, через мембранные эстрогеновые рецепторы (ER- и ER-) и ядерно-ER-опосредованные сигнальные пути (Katz T.A. et. al., 2016), основными из которых являются сигнальные каскады рецептора к тирозинкиназе (RTKs), сигнал-регулируемых внеклеточных киназ (ERK), митоген-активированных протеинкиназ (MAPK), фосфатидилинозитид 3-киназы (PI3K), фосфолипазы C (PLC), протеинкиназы C (PKC), протеинкиназы А (PKA) и др. (Katz T.A. et. al., 2016). Таким образом, эстрогены стимулируют клеточную пролиферацию и образование большого количества внеклеточного матрикса, что обуславливает рост опухоли (Flake G.P. et al., 2013; Moravek M.B. et. al., 2015).
Наряду с эстрогенами значимая роль в формировании миоматозных узлов отводится прогестерону (Patel B. et. al., 2015). Об этом свидетельствует тот факт, что митотическая активность в миоматозных клетках значительно выше в лютеиновую фазу менструального цикла, когда уровень прогестерона является самым высоким. Также выявлено повышение экспрессии прогестероновых рецепторов в клетках лейомиомы по сравнению с нормальным миометрием. Прогестерон через свои рецепторы (PR-A и PR-B) влияет на экспрессию факторов роста (Тихомиров А.Л. 2013; Kim J.J. et al., 2013). Кроме этого, прогестерон, в миоматозных клетках, повышает антиапоптотическую активность прото-онкогена bcl-2, экспрессию ядерного антигена пролиферирующих клеток (PCNA) и фактора некроза опухоли (TNF ), которые являются известными регуляторами клеточной пролиферации (Borahay M.A. et. al., 2015; Manta L. et. al., 2016).
Литературные данные свидетельствуют о важной патогенетической роли при возникновении лейомиомы матки процессов гормон-независимой клеточной пролиферации и апоптоза (Киселев В.И. и др. 2010). Одним из центральных звеньев в реализации этих процессов являются факторы роста. К основным факторам роста, играющим важную роль в развитии лейомиомы матки, относятся трансформирующий фактор роста альфа и бета (TGF- , TGF-), эпидермальный фактор роста (EGF), тромбоцитарный фактор роста (PDGF), фактор роста эндотелия сосудов (VEGF), факторы роста фибробластов (FRF), инсулиноподобный фактор роста (IGF) и их рецепторы (Сидорова И.С. и др., 2012; Кондратович Л.М. 2014; Штох Е.А. и др., 2015; Borahay M.A. et. al., 2015; McWilliams M.M. et. al., 2017). Так, VEGF способствуют ангиогенезу в лейомиоме матки. EGF и PDGF регулируют скорость пролиферации клеток миометрия и миоматозных клеток. TGF- индуцирует повышенную экспрессию генов, связанных с внеклеточным матриксом и снижает экспрессию генов, связанных с деградацией внеклеточного матрикса. Кроме того, TGF- через активицию киназных путей (MAPK / ERK / Smad) может регулировать экспрессию различных типов генов, влияющих на рост и ремиссию лейомиомы матки. IGF контролирует экспрессию прото-онкогена Bcl-2 в клетках лейомиомы, а так же путем активации MAPK пути, может стимулировать клеточную пролиферацию в миоматозных клетках (Ciavattini A. et al., 2013). Экспрессия данных факторов роста в ткани опухоли значимо выше по сравнению с нормальным миометрием (Borahay M.A. et. al., 2015; McWilliams M.M. et. al., 2017).
Важное значение в развитии лейомиомы матки отводится инфекциям и повреждению миометрия при инвазивных внутриматочных вмешательствах (Кондратович Л.М., 2014; Sparic R. et. al., 2016; Wise L.A. et. al., 2016). Эти факторы вызывают воспалительный процесс в матке, который, в свою очередь, активируя факторы роста, интерлейкины, хемокины, приводит к увеличению пролиферации клеток, внеклеточного матрикса, подавлению апоптоза, нарушению иммунного ответа (Wise L.A. et. al., 2016). Цитокины, включая фактор некроза опухолей (TNF ), интерлейкины (IL-1, IL-6, IL-11, IL-13, IL-15), интерферон- (IFN-) и гранулоцитарно-макрофагальный колониестимулирующий фактор (GM-CSF) играют центральную роль в регуляции воспаления, ангиогенеза и ремоделирования тканей (Ciavattini A. et al., 2013). Хемокины и их рецепторы (MIP-1, MIP-1, RANTES, эотаксин, эотаксин-2, IL-8, CCR1, CCR3, CCR5, CXCR1 и CXCR2 мРНК) являются медиаторами клеточного роста. Кроме того, хемокины также принимают участие в регуляции ангиогенеза, гемопоэза, инфекционного ответа и фиброза (Ciavattini A. et al., 2013).
Оценка биологических механизмов реализации фенотипических эффектов менархе-ассоциированных локусов
Несинонимические замены (nsSNP). Из 14 менархе связанных SNP не выявлено полиморфных локусов, обусловливающих изменения аминокислот в кодируемом полипептиде. Однако, один SNP, ассоциированный с возрастом менархе, был сильно сцеплен (r20,8) с несинонимичным (ns) полиморфным вариантом: rs4633 (приводит к синонимичной замене аминокислоты в белковом продукте гена COMT, 22q11.21) имеет сильное сцепление (r2=0,99) с rs4680, который определяет замену Val/Met в полипептиде COMT. Данная аминокислотная замена имеет SIFT Score=0,02, что характеризует ее предикторное значение как «DELETERIOUS» (SIFT Score 0,05).
Регуляторные эффекты полиморфных локусов. Рассмотрен регуляторный потенциал 14 менархе связанных полиморфных локусов (приложение 2). Согласно базы данных HaploReg (v4.1) два SNPs находятся в эволюционно консервативных регионах, по три полиморфизма расположены в области гистонов, маркирующих промоторы и энхансеры, 4 SNPs - в регионе гиперчувствительности к ДНКазе, два полиморфизма - регионе, связывания с регуляторными белками и 11 - регионе регуляторных мотивов.
Наиболее значимый регуляторный потенциал имеет rs4633, который находится в эволюционно консервативном регионе, регионе гистонов, маркирующих промоторы в 2 тканях и энхансеры в 24 тканях, в регионе гиперчувствительности к ДНКазе-1 в 24 тканях, регионе, связывания с 7 регуляторными белками и в регионе 6 регуляторных мотивов. В базе данных RegulomeDB 8 SNPs имеют регуляторное значение. Наиболее выраженные регуляторные эффекты характерны для rs4633 и rs2252673 (regulatory scores 2b: TF binding + any motif + DNase Footprint + DNase peak), rs6438424 (regulatory scores 3a: TF binding + any motif + DNase peak). Регуляторное значение согласно базы данных SNP Function Prediction имеют 8 SNPs, в том числе у двух полиморфных локусов регуляторный потенциал наиболее значим - rs4633 (regulatory potential score 0,420) и rs2164808 (regulatory potential score 0,334). В базе данных rSNPBase 10 SNPs имеют значимые регуляторные эффекты, из них для двух полиморфных локусов они наиболее выражены: rs4633 (proximal и distal regulation, RNA binding protein mediated regulation effects) и rs2164808 (proximal regulation и RNA binding protein mediated regulation effects). Согласно базы данных rSNPs MAPPER 11 SNPs находятся в регионах сайтов связывания транскрипционных факторов (TFBS) и имеют важное предикторное значение (score changes 2). В состав наибольшего числа сайтов связывания транскрипционных факторов входят два SNPs - rs4633 (11 TFBSs) и rs10769908 (10 TFBSs). Таким образом, из 14 менархе связанных SNPs (априорно все 100% имеют регуляторное значение) наиболее выраженный регуляторный эффект имеет rs4633 COMT (во всех пяти рассмотренных базах данных), а также существенный регуляторный потенциал имеют rs2164808 POMC, rs2252673INSR, rs6438424 3q13.32 и rs10769908 STK33.
Изучено регуляторное значение 343 SNPs, включая 14 менархе связанных SNPs и 329 SNPs, находящихся с ними в сильном неравновесии по сцеплению (r20,8), с использованием базы данных HaploReg (v4.1) (электронное приложение 1). Нами идентифицировано три SNPs локализованных в экзонах изучаемых генов (в т.ч. 1 nsSNP и 2 полиморфизма, обусловливают синонимичные замены), 1 расположен в 5 UTR, 157 находится в интронных регионах и 182 – в межгенных участках.
Следует отметить, что 18 SNPs локализованы в эволюционно консервативных регионах. Среди полиморфных локусов, имеющих сильное сцепление (r20,8) с менархе связанными локусами, выявлены ряд SNPs, характеризующихся наиболее выраженными регуляторными эффектами. Во-первых, rs7766336 (находится в неравновесии по сцеплению с rs7759938 (r2=0,95) и rs314276 (r2=0,94) гена LIN28B) расположен в регионе гистонов, маркирующих промоторы в 19 тканях, регионе гиперчувствительности к ДНКазе-1 в 13 тканях, регионе, связывания с 4 регуляторными белками (POL2, TAF1, BHLHE40, SIN3AK20) и в регионе 19 регуляторных мотивов. Также, с этими двумя менархе связанными SNPs сцеплен rs5878829 (r2=0,98 и r2=0,95 соответственно), локализованный в регионе 30 регуляторных мотивов. С еще одним менархе связанным локусом гена LIN28B - rs4946651 находится в сильном сцеплении rs11754600 (r2=0,95), расположенный в регионе гистонов, маркирующих промоторы в 24 тканях, в регионе гиперчувствительности к ДНКазе-1 в 13 тканях, регионе, связывания с 2 регуляторными белками (POL2, TAF1) и в регионе 13 регуляторных мотивов. Во-вторых, с rs10769908 STK33 сильно сцеплены rs7934396 (r2=0,86) и rs4620720 (r2=0,85), локализованные в регионе гистонов, маркирующих промоторы в 24 тканях, регионе гиперчувствительности к ДНКазе-1 в 22 и 21 тканях соответственно, регионе, связывания с 1 (RFX5) и 8 регуляторными белками (USF1, USF2, POL2, POL24H8, ATF3, MAX, TAF1, AP2GAMMA) соответственно, и в регионе 11 и 8 регуляторных мотивов соответственно. В-третьих, все сцепленные с rs4633 COMT три полиморфизма (rs165722, rs165656 и rs4680) имеют выраженные регуляторные эффекты: находятся в регионе гистонов, маркирующих энхансеры в различных тканях (15, 15 и 19 тканей соответственно), регионе гиперчувствительности к ДНКазе-1 (9, 5, 5), регионе, связывания с регуляторными белками (4, 4, 2) и в регионе различных регуляторных мотивов (5 для rs165722 и 1 для rs165656). Следует отметить, что с rs6438424, проявляющего главный эффект при формировании возраста менархе, сильно сцеплены rs6804394 (r2=0,98) и rs7433864 (r2=0,98) расположенные в регионе гистонов, маркирующих энхансеры в 6 и 7 тканях соответственно, регионе гиперчувствительности к ДНКазе-1 в 8 и 5 тканях соответственно, регионе, связывания с 4 регуляторными белками (для rs6804394 - NRSF, GATA2, P300, RAD21) и в регионе 2 и 3 регуляторных мотивов соответственно. Обращает на себя внимание тот факт, что все вышеуказанные SNPs, сцепленные с менархе-ассоциированными локусами, демонстрируют свои выраженные регуляторные эффекты в патогенетически значимых для менархе органах и тканях: различные отделы головного мозга, яичники, жировая ткань, печень, надпочечники плода и др.
eQTL анализ. Три из 14 менархе-связанных локуса имеют значимые ассоциации (p 5 10-5, pFDR 0,05) с уровнем экспрессии mRNA (cis-eQTL) в периферической крови по данным онлайн программы Blood eQTL browser (http://genenetwork.nl/bloodeqtlbrowser/), основанных на eQTL анализе нетрансформированных образцов периферической крови 5311 индивидуумов (Westra H.J. et al., 2013). Эти SNP влияют на уровень транскрипции генов DNAJC27 (ассоциирован с rs2164808), MANBAL (rs1073768) и COMT (rs4633) (приложение 21). С двумя из трех этих полиморфных локусов находятся в неравновесии по сцеплению SNPs также ассоциированные с уровнем экспрессии mRNA (cis-eQTL) в периферической крови: rs2164808 имеет сильно сцепление с rs4665765 (r2=0,99), влияющего на уровень транскрипции гена DNAJC27 (p=4,5 10-5, pFDR=0,02), а rs4633 сильно сцеплен с rs4680 (r2=0,99), связанного с транскрипцией гена COMT (p=1,9 10-5, pFDR=0,01) (приложение 22). Статистически значимых trans-eQTL SNP не выявлено (pFDR 0,05).
С использованием данных проекта Genotypeissue Expression (GTEx), основанных на результатах анализа экспрессии генов в 1641 образце из 43 органов и тканей 175 индивидуумов (GTExConsortium, 2015) и представленных в онлайн программе GTExportal (http://www.gtexportal.org/), установлено, что 9 из 14 менархе связанных полиморфизмов значимо ассоциированы (p 8 10-5, pFDR0,05) с уровнем экспрессии mRNA (cis-eQTL) 12 различных генов в разных тканях и органах (приложение 23). Влияние на транскрипцию генов в патогенетически значимых для менархе органах и тканях оказывают: rs6438424 (ассоциирован с экспрессией гена RP11-384F7.2) и rs10769908 (STK33) – в висцеральной жировой ткани, rs6438424 (RP11-384F7.2 и LSAMP) – в надпочечниках, rs4946651 (LINC00577) -головном мозге (базальные ганглии), rs10769908 (TRIM66) - молочной железе, rs7579411 (STON1-GTF2A1L), rs10769908 (TRIM66) и rs4633 (ARVCF) - щитовидной железе, rs7759938 и rs314276 (HACE1) - EBV-трансформированных лимфоцитах. Следует отметить, что, во-первых, что аллель С rs6438424 (alt), ассоциированный с поздним менархе у женщин России, связан с повышенной экспрессией гена RP11-384F7.2 в висцеральной жировой ткани (=0,41, р=3,5 10-6, pFDR0,05) и генов RP11-384F7.2 (=0,70, р=1,5 10-11, pFDR0,05) и LSAMP (=0,74, р=6,3 10-13, pFDR0,05) в надпочечниках. Во-вторых, наибольшее cis-eQTL значение имеет rs10769908, ассоциированный с уровнем транскрипции гена STK33 в пяти тканях и гена TRIM66 в трех тканях, в том числе в жировой ткани (STK33), щитовидной (TRIM66) и молочной (TRIM66) железах. С 8 из 14 менархе связанных полиморфных локусов находятся в сильном неравновесии по сцеплению (r20,8) SNPs также ассоциированные (p 8,5 10-5, pFDR0,05) с уровнем экспрессии mRNA (cis-eQTL) в различных тканях (электронное приложение 2). Обращает на себя внимание факт того, что с rs10769908 находятся в сильном сцеплении (r20,8) более 120 SNPs, ассоциированные с уровнем транскрипции генов STK33 и TRIM66 в различных тканях: жировой (висцеральная и подкожная), молочной железе, головном мозге, щитовидной железе, крови и др. Также, следует отметить, что с rs6438424 сильно сцеплены (r20,8) 8 SNPs, ассоциированные с уровнем экспрессии генов RP11-384F7.2 (висцеральная жировая ткань и надпочечники) и LSAMP (надпочечники), с rs4946651 - 14 SNPs (LINC00577 в головном мозге), rs7759938 и rs314276– 12 SNPs (HACE1 в EBV- трансформированных лимфоцитах), rs2090409 TMEM38B – 25 SNPs (SLC44A1 – в толстом кишечнике).
Таким образом, 11 из 14 менархе-связанных локусов являются cis-eQTL значимыми (влияют на экспрессию 15 различных генов) – 3 SNPs самостоятельно ассоциированы с уровнем экспрессии mRNA, 7 SNPs как сами ассоциированы, так и сильно сцеплены с другими SNPs, связанными уровнем транскрипции генов, 1 SNP сцеплен с полиморфными локусами, имеющими cis-eQTL значение.
Анализ функциональной роли полиморфных локусов, ассоциированных с развитием гиперплазии эндометрия
Несинонимические замены (nsSNP). Из 21 SNPs, ассоциированных с развитием гиперплазии эндометрия, не выявлено полиморфных локусов, приводящих к изменению аминокислот в кодируемом полипептиде. Вместе с этим, 2 SNPs из них находятся в неравновесии по сцеплению (r20,8) с не синонимичными полиморфными локусами (nsSNP): rs7538038 (1q32.1) cильно сцеплен с rs4889 (r2=0,98), который обусловливает замену Pro81Arg в полипептиде KISS1, а rs4633 (приводит к синонимичной замене аминокислоты в белковом продукте гена COMT, 22q11.21) сильно сцеплен (r2=0,99) с rs4680, который определяет замену Val18Met в полипептиде COMT. По базе данных PolyPhen-2 (prediction of functional effects of human nsSNPs) аминокислотная замену Pro81Arg в полипептиде KISS1 имеет предикторный класс «POSSIBLY DAMAGING» с score=0,524 (чувствительность 0,88, специфичность – 0,90). Согласно данных базы SIFT (Sorting Tolerant From Intolerant) аминокислотная замена Val18Met в полипептиде COMT имеет SIFT Score=0,02, что характеризует ее предикторное значение как «DELETERIOUS» (SIFT Score 0,05).
Регуляторное значение полиморфных локусов. Проведено исследование регуляторных эффектов 21 SNPs, ассоциированных с развитием гиперплазии эндометрия (приложение 2). По данным базы HaploReg (v4.1) 1 полиморфный локус расположен в эволюционно консервативном регионе, в области гистонов, маркирующих промоторы и энхансеры находятся 5 и 7 SNPs соответственно, 5 SNPs локализуются в регионе гиперчувствительности к ДНКазе, 1 SNP - регионе, связывания с регуляторными белками и 18 SNPs - регионе регуляторных мотивов. Для полиморфных локусов rs4633 COMT и rs4986938 ESR2 выявлены наиболее значимые регуляторные эффекты: rs4633 COMT расположен в эволюционно консервативном регионе, регионе гистонов, маркирующих промоторы в 2 тканях и энхансеры в 24 тканях, регионе гиперчувствительности к ДНКазе-1 в 24 тканях, регионе, связывания с 7 регуляторными белками и регионе 6 регуляторных мотивов ДНК; полиморфизм rs4986938 ESR2 находится в регионе гистонов, маркирующих промоторы в 1 органе и энхансеры в 17 тканях, регионе гиперчувствительности к ДНКазе-1 в 6 тканях и регионе 5 регуляторных мотивов. Обращает на себя внимание факт того, что, во-первых, полиморфизм rs11031010 FSHB, ассоциированный с развитием гиперплазии эндометрия, находится в регионе мотивов ДНК, являющихся сайтами связывания с 4 транскрипционными факторами (TFs): Foxa_known2, Foxd1_1, Foxp3, TCF4_disc2. По этим TFs различия между LOD scores аллелей А (alt) и С (ref) составляют 1,7 (Foxa_known2), -1,0 (Foxd1_1), 3,2 (Foxp3), -12,0 (TCF4_disc2). Полученные данные позволяют заключить, что аллель А rs11031010 FSHB, ассоциированный с низким риском развития гиперплазии эндометрия (OR=0,62-0,67 для аддитивной и доминантной моделей и OR=0,66 для гаплотипа GAA rs555621-rs11031010-rs1782507 FSHB) повышает афинность к транскрипционным факторам Foxa_known2, Foxp3 и снижает сродство к транскрипционным факторам Foxd1_1, TCF4_disc2. При этом, афинность к TCF4_disc2 изменяется в наибольшей степени. Во-вторых, полиморфизм rs1782507 FSHB, также входящий в состав гаплотипа rs555621-rs11031010-rs1782507 FSHB, расположен в регионе мотивов ДНК, являющихся сайтами связывания с 5 TFs: HDAC2_disc5, HNF4_disc1, Lmo2-complex_1, TCF12_disc1, ZEB1_known3. Различия в LOD scores между аллелями С (alt) и А (ref) для этих транскрипционных факторов составляют 9,7 (HDAC2_disc5), 9,5 (HNF4_disc1), 11,9 (Lmo2-complex_1), 12,0 (TCF12_disc1), 11,9 (ZEB1_known3). Эти данные свидетельствуют о том, что, аллель С (alt) – повышает, а, соответственно, аллель А (ref) rs1782507 FSHB (в составе гаплотипа GAA rs555621-rs11031010-rs1782507 FSHB является протективным фактором развития гиперплазии эндометрия OR=0,66) - снижает афинность ко всем вышеуказанным транскрипционным факторам.
В базе данных RegulomeDB 12 SNPs имеют регуляторные эффекты, среди которых наиболее выраженное регуляторное значение имеют 3 полиморфизма - rs999460 NKX2-1, rs4633 COMT, rs4986938 ESR2 (regulatory scores 2b: TF binding + any motif + DNase Footprint + DNase peak). Согласно базы SNP Function Prediction 8 полиморфных локусов, характеризуются значимыми регуляторными эффектами, в т.ч. наиболее выраженный регуляторный потенциал характерен для rs4633 (regulatory potential score 0,420). Согласно материалов базы данных rSNPBase 14 SNPs имеют значимые регуляторные эффекты и среди них у 3 SNPs они наиболее выражены: rs4633 (proximal и distal regulation, RNA binding protein mediated regulation effects), rs4986938 ESR2 и rs12324955 FTO (proximal regulation и RNA binding protein mediated regulation effects). Данные базы rSNPs MAPPER свидетельствуют о том, что 19 SNPs расположены в регионах сайтов связывания транскрипционных факторов (TFBS) и имеют важное предикторное значение (score changes 2). В состав наибольшего числа сайтов связывания транскрипционных факторов входят два SNPs - rs4633 COMT (11 TFBSs) и rs10441737 ZNF483 (9 TFBSs).
С помощью онлайн программы HaploReg (v4.1) изучен регуляторный потенциал 418 SNPs, включая 21 SNPs, ассоциированных с развитием гиперплазии эндометрия, и 397 SNPs, находящихся с ними в сильном неравновесии по сцеплению (r20,8) (электронное приложение 1). Полученные результаты свидетельствуют о том, что 4 SNPs, локализованы в экзонах изучаемых генов (2 nsSNPs и 2 полиморфизма, обусловливающие синонимичные замены), 4 - в 3 UTR, 158 расположены в интронах и 252 – в межгенных участках. В эволюционно консервативных регионах находятся 16 SNPs.
Анализ регуляторного потенциала SNPs, сильно сцепленных (r20,8) с полиморфными локусами, ассоциированными с развитием гиперплазии эндометрия, выявил SNPs, имеющие наиболее выраженные регуляторные эффекты.
Во-первых, 3 изучаемых SNPs, ассоциированные с развитием гиперплазии эндометрия - rs555621, rs11031010, rs1782507 гена FSHB (в рассматриваемой выборке женщин они сильно сцеплены и образуют единый гаплоблок при D=1; LOD 2), находятся в неравновесии по сцеплению с 4 полиморфными локусами, имеющими существенный регуляторный потенциал: rs1222218 (r2=0,28, r2=0,21, r2=0,82 соответственно), rs58336049 (r2=0,28, r2=0,21, r2=0,82 соответственно), rs1222220 (r2=0,27, r2=0,20, r2=0,81 соответственно) и rs7941939 (r2=0,26, r2=0,20, r2=0,80 соответственно). Эти SNPs находятся в регионе гистонов, маркирующих промоторы (в 24, 24 и 17 тканях соответственно) и энхансеры (в 20 тканях для rs1222220) в различных органах и тканях, регионе гиперчувствительности к ДНКазе-1 (49, 47, 2 тканях соответственно), регионе, связывания с регуляторными белками (19 -для rs1222218 и 18 - для rs58336049) и регионе регуляторных мотивов ДНК (11, 2 и 2 соответственно), а rs7941939 расположен в регионе 32 регуляторных мотивов ДНК.
Во-вторых, с rs10441737 ZNF483 сильно сцеплен (r2=0,8) rs28441247, локализованный в регионе гистонов, маркирующих промоторы в 24 тканях, регионе гиперчувствительности к ДНКазе-1 в 34 тканях, регионе, связывания с регуляторным белком HAE2F1.
В-третьих, сильно сцепленные (r20,98) с rs4633 COMT три SNPs (rs165722, rs165656, rs4680) характеризуются существенным регуляторным потенциалом. Они находятся в регионе гистонов, маркирующих энхансеры в различных тканях (в 15, 15 и 19 тканях соответственно), регионе гиперчувствительности к ДНКазе-1 (9, 5, 5 тканях соответственно), регионе, связывания с регуляторными белками (4, 4, 2 соответственно) и в регионе различных регуляторных мотивов (5 - для rs165722 и 1 - для rs165656).
В-четвертых, полиморфные локусы rs7759938 и rs314276 гена LIN28B (сильно сцеплены между собой r2=0,93) находятся в неравновесии по сцеплению с rs7766336 (r2=0,95 и r2=0,94 соответственно) и rs5878829 (r2=0,98 и r2=0,95 соответственно), обладающими выраженными регуляторными эффектами. Полиморфизм rs7766336 находится в регионе гистонов, маркирующих промоторы в 19 тканях, регионе гиперчувствительности к ДНКазе-1 в 13 тканях, регионе, связывания с 4 регуляторными белками и регионе 19 регуляторных мотивов, а rs5878829 локализован в регионе 30 регуляторных мотивов.
В-пятых, rs4889, находящийся в сильном неравновесии по сцеплению (r2=0,98) с rs7538038 KISS1, расположен в регионе гистонов, маркирующих промоторы и энхансеры в 22 и 12 тканях соответственно, регионе гиперчувствительности к ДНКазе-1 в 7 тканях и регионе 14 регуляторных мотивов ДНК.
В-шестых, следует отметить важное регуляторное значение SNPs, сильно сцепленных (r20,8) с rs2090409 TMEM38B (rs78381117 - локализован в регионе 26 регуляторных мотивов), rs13111134 UGT2B4 (rs13104687 – находится в регионе гистонов, маркирующих промоторы в печени и регионе 15 регуляторных мотивов), rs6732220 и rs4953655 FSHR (5 SNPs расположены в регионе гистонов, маркирующих энхансеры в 7-13 тканях, регионе гиперчувствительности к ДНКазе-1 в 1-7 тканях и регионе 2-7 регуляторных мотивов).
«Общие» и «специфические» генетические факторы лейомиомы матки, гиперплазии эндометрия и эндометриоза
Полученные на предыдущих этапах настоящей работы с использованием единых методических подходов (выявление «значимых» средовых факторов риска развития заболеваний и использование их в качестве ковариат при исследовании ассоциаций; изучение трех доброкачественных пролиферативных заболеваний женской репродуктивной системы по единой панели полиморфных локусов; анализ не только главных эффектов полиморфных локусов, но и ген-генных и генно-средовых взаимодействий и др.) данные по ассоциациям полиморфных локусов генов кандидатов менархе с развитием лейомиомы матки, генитального эндометриоза, гиперплазии эндометрия позволяют нам провести сравнительный анализ этих материалов и выявить «общие» и «специфические» генетические факторы, вовлеченный в формирование рассматриваемых заболеваний. Следует отметить, что согласно данным литературы, изучаемые доброкачественные пролиферативных заболеваний женской репродуктивной системы являются синтропными - они имеют ряд общих патогенетических механизмов развития (гиперэстрогения, нарушение процессов пролиферации и апоптоза и др.) и априорно мы можем ожидать и наличие среди изученных генов-кандидатов менархе «общих» (синтропных) молекулярно-генетических факторов, определяющих предрасположенность к этим заболеваниям.
Анализ полиморфных локусов, ассоциированных с развитием рассматриваемых заболеваний, показал (рис. 35), что среди изученных 52 SNPs генов-кандидатов менархе с формированием доброкачественных пролиферативных заболеваний женской репродуктивной системы связаны 37 SNPs (71,15%). При этом синтропными для всех трех изучаемых заболеваний - лейомиомы матки, генитального эндометриоза и гиперплазии эндометрия, являются 7 SNPs (18,91% из всех SNPs, ассоциированных с заболеваниями), а «общими» для двух из этих трех заболеваний (например, для лейомиомы матки и генитального эндометриоза или лейомиомы матки и гиперплазии эндометрия) являются еще 9 SNPs (24,32%). Таким образом, 16 из 37 SNPs (43,24%) определяют предрасположенность к развитию доброкачественных пролиферативных заболеваний женской репродуктивной системы в целом. Наибольший процент «специфических» полиморфных локусов – 47,82% (11 SNPs), ассоциирован с развитием лейомиомы матки. Для гиперплазии эндометрия и генитального эндометриоза доля таких SNPs существенно ниже (практически в 2 раза) и составляет 28,57% и 25,00% соответственно. При этом, следует отметить, что количество SNPs, ассоциированных с развитием лейомиомы матки и гиперплазии эндометрия, примерно одинаково - 23 SNPs и 21 SNPs соответственно.
Выявлено, что формирование доброкачественных пролиферативных заболеваний женской репродуктивной системы связано с несинонимическими заменами в 4 генах - SKOR1, COMT, KISS1, ADCY3 (рис. 36). При этом, лишь замена аминокислоты в полипептиде COMT является «общей» для развития лейомиомы матки и гиперплазии эндометрия. Остальные несинонимические замены являются «специфичными»: в гене SKOR1 – характерна для лейомиомы матки, в гене KISS1 - для гиперплазии эндометрия и в гене ADCY3 - для генитального эндометриоза.
При рассмотрении «общих» и «специфических» генов, регуляторное значение для которых имеют ассоциированные с рассматриваемыми заболеваниями SNPs (данные полиморфные локусы находятся вблизи 5 UTR и 3 UTR концов генов, расположены в области гистонов, маркирующих промоторы и энхансеры, регионах гиперчувствительности к ДНКазе и регуляторных мотивов ДНК, области связывания с регуляторными белками и др.), получено, что при формировании доброкачественных пролиферативных заболеваний женской репродуктивной системы значимую роль имеют регуляторные эффекты 24 генов (regGenes) из 35 рассмотренных (68,57%) (рис. 37). Синтропными для трех рассматриваемых заболеваний являются 5 генов (20,83% из всех генов, ассоциированных с заболеваниями), а «общими» для двух из этих трех заболеваний являются еще 6 генов (25,20%). Итак, регуляторный потенциал 11 из 24 генов (45,83%) определяет предрасположенность к развитию доброкачественных пролиферативных заболеваний женской репродуктивной системы в целом. Максимальный удельный вес «специфических» regGenes – 40,00% (6 генов), характерен для лейомиомы матки, тогда как при гиперплазии эндометрия и генитальном эндометриозе доля таких regGenes в 1,4 раза ниже (28,57% и 27,27% соответственно), чем при лейомиоме матки. Обращает на себя внимание факт того, что количество regGenes, ассоциированных с развитием лейомиомы матки и гиперплазии эндометрия, примерно одинаково – 15 и 14 генов соответственно.
Установлено, что 37 SNPs вовлеченные в формирование доброкачественных пролиферативных заболеваний женской репродуктивной системы, ассоциированы с уровнем транскрипции 46 различных генов в разных органах и тканях организма (eGenes). Среди них синтропными для лейомиомы матки, генитального эндометриоза и гиперплазии эндометрия, являются лишь 6 генов (13,04% из всех eGenes, связанных с заболеваниями) (рис. 38). «Общими» для двух из этих трех заболеваний являются еще 10 eGenes (21,74%). Таким образом, уровень экспрессии 16 из 46 генов (34,78%) детерминирует предрасположенность к развитию доброкачественных пролиферативных заболеваний женской репродуктивной системы в целом. Наибольший процент «специфических» eGenes зарегистрирован для лейомиомы матки (53,57% - 15 генов). Для генитального эндометриоза удельный вес таких генов несколько меньше и равен 42,86% (21 ген), а для гиперплазии эндометрия доля «специфических» eGenes минимальна и составляет 31,58% (6 генов). Следует отметить, что в формирование лейомиомы матки вовлечено наибольшее число экспрессионно значимых генов – 28, тогда как количество таких генов для генитального эндометриоза составляет 21, а для гиперплазии эндометрия - лишь 19, что в 1,5 раза меньше по сравнению с лейомиомой матки.
Итак, 37 SNPs, ассоциированных с развитием доброкачественных пролиферативных заболеваний женской репродуктивной системы, определяют (через несинонимические замены, регуляторные эффекты, влияние на экспрессию генов) вовлеченность в подверженность к развитию этих заболеваний 58 генов (рис. 39). Общими биологическими путями реализации фенотипических эффектов этих генов (оценены с помощью онлайн программы Gene Ontology (http://geneontology.org) с использованием 7 баз данных Gene Ontology molecular function, Gene Ontology biological process, PANTHER protein class, PANTHER pathway, PANTHER molecular function, PANTHER biological process, Reactome pathway) являются: сигнальный путь фолликул-стимулирующего гормона (Fold Enrichment – 100, pFDR=6,96 10-7), процессы развития фолликулов в яичниках (Fold Enrichment – 32,37, 9,37 10-6) и развития яичников (Fold Enrichment – 18,91, pFDR=6,98 10-5), овуляторный цикл (Fold Enrichment – 20,83, pFDR=5,16 10-6), процессы с участием лиганд-связывающих рецепторов гормонов (Fold Enrichment – 100, pFDR=4,48 10-6) и G альфа сигнального пути (Fold Enrichment – 17,91, pFDR=1,28 10-6), сигнальный путь G-белок связывающего рецептора, активирующего аденилатциклазу (Fold Enrichment – 22,51, pFDR=2,28 10-5), ответы на эндогенные стимулы (Fold Enrichment – 11,53, pFDR=1,48 10-5), активность транскрипционного фактора лиганд активируемой РНК полимеразы II, связывающейся со специфической последовательностью ДНК (Fold Enrichment – 33,22, pFDR=1,25 10-4), ядерные рецепторы С4 цинковых пальцев (Fold Enrichment – 29,36, pFDR=1,77 10-4).