Содержание к диссертации
Введение
2. Обзор литературы
2.1. Влияние ретроэлементов на структуру генома 8
2.2. Функциональные последствия инсерции ретроэлементов 14
2.3. Транспозиционная активность мобильных элементов в соматических клетках 17
2.4. Ретроэлементы и мозг 29
3. Результаты и обсуждение 34
3.1. Выбор образцов для исследования 34
3.2. Использование метода супрессионной ПЦР для создания полногеномных библиотек фланкирующих последовательностей ретроэлементов 3 5
3.3. Биоинформатический анализ данных секвенирования фланкирующих последовательностей ретроэлементов 40
3.4. Общая характеристика полученных библиотек фланкирующих последовательностей ретроэлементов 45
3.5. Валидация потенциальных соматических инсерции ретроэлементов 47
3.6. Амплификация валидированных соматических инсерции с геномной ДНК в качестве матрицы 51
3.7. Оценка специфичности метода получения библиотек фланкирующих последовательностей ретроэлементов 53
3.8. Оценка эффективности метода получения библиотек фланкирующих последовательностей ретроэлементов 56
3.9. Анализ распределения соматических инсерции ретроэлементов в анализируемых образцах тканей 58
3.10. Анализ геномного распределения соматических инсерции 61
3.11. Анализ ориентации соматических инсерции ретроэлементов относительно расположенных рядом генов 65
4. Материалы и методы
4.1. Материалы
4.2. Методы выводы
Список литературы
- Функциональные последствия инсерции ретроэлементов
- Транспозиционная активность мобильных элементов в соматических клетках
- Общая характеристика полученных библиотек фланкирующих последовательностей ретроэлементов
- Анализ распределения соматических инсерции ретроэлементов в анализируемых образцах тканей
Введение к работе
Актуальность проблемы
Почти 50% генома человека состоит из ретроэлементов, которые на протяжении эволюционной истории постепенно увеличивали свое присутствие в геноме эукариотических организмов за счет используемого ими механизма ретротранспозиции. Активность ретроэлементов может быть причиной значительных изменений структуры генома, а появление новых инсерций может приводить к кардинальным изменениям в функционировании расположенных рядом генов. Это делает ретроэлементы одним из факторов, определяющих эволюцию и функционирование генома, регуляцию и экспрессию генов. С одной стороны, инсерций ретроэлементов часто приводят к нарушению работы генов и, как следствие, к появлению генетических заболеваний. С другой стороны, ретроэлементы являются источником, поставляющим геному новые регуляторные последовательности, а их активность может приводить к появлению новых экспрессионно активных копий генов.
Большинство инсерций ретроэлементов, изученных к настоящему времени, возникали вследствие активности ретроэлементов в гаметах, либо в терминальных клетках на ранних стадиях эмбриогенеза. Такие инсерций присутствуют в большинстве клеток организма, передаются по наследству и могут закрепиться в генофонде популяции. В то же время активность ретроэлементов в других клетках организма, как считалось, подавлена с помощью эпигенетических механизмов. Поиск соматических инсерций, присутствующих в небольшом числе клеток, затруднен тем, что концентрация таких инсерций в образцах ДНК крайне мала, а место интеграции в геноме предсказать невозможно.
В последние годы стали накапливаться данные, свидетельствующие о том, что количество копий ретроэлементов может увеличиваться в ДНК клеток некоторых областей человеческого мозга. Одновременно с этим, эксперименты на клеточных культурах показали, что ретротранспозиционная активность значительно повышается в момент дифференцировки клеток предшественников нейронов. Это может приводить к возникновению генетической вариабельности нервных клеток, в том числе участвующих в формировании памяти и обучении, а, следовательно, к функциональным различиям между ними . Определение вклада транспозиционной активности ретроэлементов в формирование генетической вариабельности клеток нейрональной ткани представляет актуальную проблему современной молекулярной
биологии, связанной с изучением молекулярно-генетических основ функциональной пластичности мозга человека.
Цель и задачи работы
Целью данной работы было сравнительное исследование транспозиционной активности ретроэлементов в геномной ДНК различных отделов головного мозга человека. Для выполнения поставленной цели были сформулированы следующие задачи:
-
Разработка метода полногеномной идентификации соматических инсерций ретроэлементов, относящихся к подсемействам LIHs и AluYa5, основанного на технологиях секвенирования нового поколения.
-
Полногеномная идентификация соматических инсерций ретроэлементов в ДНК, выделенной из образцов тканей четырех отделов мозга (мозжечка, фронтальной коры, субвентрикулярной зоны и зубчатой извилины) и контрольной не-нейрональной ткани (миокарда).
-
Анализ распределения идентифицированных соматических инсерций в исследуемых отделах головного мозга человека..
-
Сравнительный анализ распределения идентифицированных соматических инсерций в геномной ДНК исследуемых образцов тканей.
Научная новизна и практическая ценность работы
Полномасштабное картирование соматических инсерций ретроэлементов путем полного секвенирования генома каждой клетки является слишком дорогой и трудозатратной задачей. В данной работе был создан оригинальный экспериментальный подход к поиску соматических инсерций ретроэлементов, который включает методику приготовления библиотек, обогащенных последовательностями ретроэлементов, и специализированный алгоритм анализа данных секвенирования нового поколения. Разработанный алгоритм анализа данных позволяет среди миллионов последовательностей, которые представляют присутствующие во всех клетках организма копии ретроэлементов, выделять последовательности, представляющие соматические инсерций. Таким образом, в ходе выполнения данной работы создан инструмент, позволяющий получать максимально полную информацию об активности ретроэлементов в ДНК соматических клеток, обходясь относительно небольшими затратами. Данный инструмент может быть использован для
исследований активности ретроэлементов в других тканях и других видах организмов в норме и при изучении онкологических заболеваний.
Разработанный экспериментальный подход был использован для идентификации нескольких тысяч соматических инсерций ретроэлементов в ДНК, выделенной из образцов тканей нескольких отделов мозга человека. Данные о распределении этих инсерций являются первым прямым доказательством повышенной ретротранспозиционной активности в зубчатой извилине гиппокампа - единственном отделе мозга, для которого достоверно показано наличие нейрогенеза у взрослых людей. Это позволяет предположить, что в зубчатой извилине происходит формирование популяций нервных клеток, генетически не идентичных другим нейронам, а потому обладающих отличиями на физиологическом уровне, что может влиять на их участие в процессах формирования памяти и обучения. Исследование распределения соматических инсерций в геноме показало, что гены обогащены инсерциями LIHs по сравнению с межгенными участками. В то же время, инсерций AluYa5 равномерно распределены в геномах клеток всех исследованных областей мозга, кроме зубчатой извилины.
Публикации и апробация работы
По материалам работы опубликовано 2 статьи в рецензируемых научных журналах. Отдельные части диссертации были доложены на конференциях: Structural and Functional Diversity of Genomes, 2012, Брно, Чехия; XXV Международная зимняя молодежная научная школа «Перспективные направления Физико-химической биологии и биотехнологии», 2013 Москва, Россия; 38th FEBS Congress "Mechanisms in Biology", 2013, Санкт-Петербург, Россия.
Объем и структура диссертации
Функциональные последствия инсерции ретроэлементов
Ретроэлементы являются одним из основных компонентов генома, обеспечивающих генетическое разнообразие вида. В геноме человека сотни локусов являются полиморфными по присутствию в них копий ретроэлементов [16, 22-24]. Такие локусы представлены двумя аллелями: вариантом, содержащим инсерцию, и пустым аллелем. Транспозиционная активность является основным источником полиморфизмов, ассоциированных с мобильными элементами, однако в геноме также присутствуют дупликации и делеции, возникшие вследствие рекомбинации между ретроэлементами [25, 26].
Сравнение количества инсерций ретроэлементов в двух референсных геномах huRef и HGP позволило, с учетом времени существования наиболее близкого общего предка, оценить частоту возникновения новых инсерций ретроэлементов. Согласно этим расчетам новая инсерция Alu появляется у одного из 21 новорожденных, L1 у одного из 212 и SVA у одного из 916 [27]. Согласно другим оценкам, частота возникновения инсерций LI de novo составляет одну инсерцию на 108 [28] или 140 [24] рождений. Количество полиморфных инсерций L1, частота встречаемости которых в современной человеческой популяции превышает 0.05, составляет, согласно существующей оценке, от 3000 до 10000 [24].
Прямым следствием ретротранспозиционнои активности является увеличение размеров генома. Так с момента расхождения человека и шимпанзе в геноме человека появилось около 7000 новых копий Alu элементов, 1800 L1 и 1000 SVA, общая длина которых превышает 8 миллионов п. о. [29].
Увеличение размера генома одного вида, по сравнению с размерами геномов других видов, происходит, в основном, не за счет присутствия в нем большего числа генов, а за счет присутствия в нем большего количества мобильных элементов [30]. Так инсерций ретроэлементов привели к 14-18% увеличению генома человека за 50 миллионов лет эволюции приматов [31]. Возможно, увеличение размера генома необходимо как механизм защиты кодирующих участков ДНК от мутационного давления. Нуклеотиды, входящие в состав ретроэлементов, служат в этом случае ловушками, принимающими на себя атаку свободных радикалов или других мутагенов, способных повредить входящие в кодирующие последовательности нуклеотиды [32].
Наиболее очевидным следствием активности ретроэлементов является появление новых копий за счет классического механизма ретротранспозиции. Показано, что частоты возникновения мутаций, вызванных инсерциями Alu и L1 составляют у человека, примерно, одну из тысячи мутаций [17, 33]. Наиболее хорошо изучены инсерции ретроэлементов в белок-кодирующие и регуляторные области генома, поскольку такие инсерционные события могут проявляться фенотипически и способны приводить к различным наследственным заболеваниям, включая гемофилию, нейрофиброматоз I типа, Р-талассемию, гиперхолестеролемию и различные виды рака [17, 21]. На сегодняшний день известно более 50 таких случаев, наибольшее количество инсерции, приводящих к наследственным заболеваниям, выявлено на Х-хромосоме, особенно эта тенденция ярко выражена для инсерции L1 [21, 34] (таблица 1). Наблюдаемое «обогащение» X хромосомы «вредоносными» инсерциями может быть связано как с предположительной вовлеченностью L1 в инактивацию Х-хромосомы [35], так и тем, что эффект аутосомных инсерции маскирован присутствием немутировавшего предкового аллеля. Некоторые геномные локусы становились мишенями нескольких независимых ретротранспозиционных событий. Так, например, у гена АРС, нарушения в структуре которого ассоциированы с развитием рака толстой кишки, детектирован как аллель, содержащий инсерцию L1, так и аллель, содержащий инсерцию Alu [36], а нейрофиброматоз вызывается, по меньшей мере, 14 разными инсерциями L1 и Alu элементов в ген нейрофибромина [37]. Таблица 1. Генетические заболевания, ассоциированные с инсерциями ретроэлементов
Эволюционно молодые инсерции ретроэлементов L1 и Alu распределены по геному не равномерно. Области генома, в которые ретроэлементы встраиваются с повышенной вероятностью, характеризуются наличием сайта, распознаваемого интегразой L1, и доступного для интегразы геномного окружения, каким являются деметилированные и активно транскрибируемые районы [2, 52]. Присутствие в последовательности ДНК более ранних инсерции ретроэлементов само по себе является фактором, увеличивающим вероятность возникновения новых инсерции, что может объясняться как присутствием внутри polyA хвоста ретроэлементов несовершенного сайта, распознаваемого эндонуклеазои, так и тем, что акт ретротранспозиции сопровождается дупликацией сайта интеграции [53]. 2.1.4. Делеций, опосредованные инсерциями ретроэлементов
Эксперименты на клеточных линиях человека с использованием экспрессионного конструкта, содержащего кассету-индикатор ретротранспозиции, показали, что интеграции ретроэлементов иногда сопровождаются делециями областей, прилегающих к сайту интеграции [25, 54]. Существование таких делеций in vivo было показано для Alu и L1 в геномах человека и шимпанзе [26, 55]. Большинство таких инсерций возникают по механизмам, задействующим эндонуклеазу L1. Короткие делеций предположительно возникают вследствие внесения эндонуклеазой одноцепочечного разрыва слева от исходного разрыва в цепь, комплементарную цепи, в которую был внесен исходный разрыв (рис. 1) [25]. Более длинные делеций могут возникать при интеграции ретроэлемента рядом с двухцепочечным разрывом [25]. 3 5 ,
Рекомбинация между диспергированными в геноме неаллельными копиями L1 и Alu может приводить к геномным перестройкам: делециям, инсерциям, инверсиям и транслокациям [56-59]. Таким образом, постинсерционные события, в которые вовлечены ретроэлементы, могут приводить к еще более масштабным геномным перестройкам, чем сами акты ретротранспозиции.
Сравнение геномов человека и шимпанзе выявило в геноме человека 492 делеции, вызванные неаллельной рекомбинацией Alu [56] и 73 делеции, вызванные рекомбинацией L1 [55]. Однако, делеции, возникающие за счет рекомбинации L1 являются существенно более протяженными (в среднем, 6132 п. о.), чем делеции, вызванные рекомбинацией Alu (в среднем, 806 п.о.) [56, 57].
Роль неаллельной гомологичной рекомбинации Alu в возникновении в геноме протяженных дупликаций подтверждается повышенной концентрацией Alu ретроэлементов на границах таких дупликаций (порядка 27% граничных областей хромосомных дупликаций содержат Alu, по сравнению с 10,3% последовательностей в среднем в геноме) [60].
Неаллельная гомологичная рекомбинация между ретроэлементами может приводить к нарушению функций генов и возникновению предрасположенности к генетическим заболеваниям и раку [61, 62].
Транспозиционная активность мобильных элементов в соматических клетках
Полноразмерный L1 содержит сайты связывания разнообразных транскрипционных факторов: Sox2 [105], RUNX3 [106], YY1 [107], а также TCF и LEF [75] - факторов, участвующих в сигнальном пути WNT.
Возможность активации ретротранспозиционной активности в ходе нейрональной дифференцировки с помощью транскрипционных факторов, регулирующих нейрогенез, была показана в работе Kuwabara et al. [75]. Нейрогенез в тканях взрослого мозга происходит за счет повышения экспрессии белка NeuroDl [108], в промоторе гена которого находятся перекрывающиеся сайты связывания SOX2 и TCF/LEF [75]. В мультипотентных стволовых клетках головного мозга повышена экспрессия Sox2, который связывается с промотором NeuroDl и подавляет его экспрессию. При дифференцировке по нейрональному пути экспрессия Sox2 резко падает, за счет чего происходит дерепрессирование промотора NeuroDl. Одновременно с этим происходит повышение экспрессии белка Р-катенина, который, очевидно, в свою очередь повышает активность промотора NeuroDl с помощью других участников канонического пути Wnt-сигнализации: TCF HLEF.
Анализ последовательности ретроэлементов L1 выявил в ее составе множество перекрывающихся сайтов связывания Sox/LEF, аналогичных тем, которые присутствуют в промоторах NeuroDl [75]. Два таких сайта находятся в 5 - UTR L1 и еще девять сайтов в ORF2. После трансфецирования клеток, проходящих нейрональную дифференцировку, экспрессионным конструктом, содержащим ген люциферазы и ORF2, динамика изменения экспрессии люциферазы полностью идентична динамике изменения экспрессии гена NeuroDl, отвечающего за специализацию стволовых клеток по нейрональному пути. Также замечательно, что изменение транскрипционной активности L1 практически не происходило в клетках, в которых была подавлена экспрессия Р-катенина с помощью генного нокдауна. Таким образом, можно сделать вывод, что ретротранспозиционная активность, наблюдаемая в ходе нейрональной дифференцировки, является не просто следствием дерепрессирования промоторов L1, но активно стимулируется белками сигнального пути Wnt.
Еще один механизм подавления активности L1 в геноме - связывание с метилированными последовательностями промотора L1 метил-СрО-связывающего белка 2 (МеСР2) [109] -является причиной более низкой ретротранспозиционной активности в клетках, в которых промотор L1 имеет более высокую степень метилирования. Анализ профиля метилирования геномной ДНК человека, выделенной из тканей мозга, с помощью бисульфитного секвенирования показал более низкую степень метилирования последовательностей L1 по сравнению с L1 в клетках эпителиальных тканей, взятых в качестве контроля [87]. Одновременно с этим, как в стволовых клетках, так и в NPC детектируется более низкий уровень экспрессии МеСР2, чем в зрелых нейронах [87]. Иммунопреципитация хроматина в свою очередь показала значимо более высокий уровень взаимодействия между МеСР2 и промоторами L1 в нейрональных стволовых клетках, чем в NPC [87]. В клеточных линиях и мышиных моделях, в которых был проведен нокаут гена теср2, транскрипция L1 и количество ретротранспозиций значительно возрастают по сравнению с контролями [110]. Данные количественной ПЦР также указывают на повышенное число копий L1 ORF2 в постмортальных образцах ДНК, выделенных из тканей головного мозга больных синдромом Ретта - наследственного психоневрологического заболевания, вызываемого мутацией в гене теср2 [110].
Использование ПНР в реальном времени с флуоресцентными олигонуклеотидными пробами Taqman комплементарными последовательности LI ORF2 выявило статистически значимое повышение количества копий L1 в геномной ДНК, выделенной из головного мозга, в сравнении с не-нейрональными тканями: печенью и сердцем [87]. Содержание L1 в различных нейрональных тканях также варьирует, с помощью данного метода наибольшее их количество в головном мозге было детектировано в зубчатой извилине и фронтальной коре. По оценке, приведенной в данной работе, количество соматических инсерций в гиппокампе составляет около 80 штук на клетку.
В работе Baillie et al. [98] ПЦР в реальном времени также была применена для первичной оценки количества копий ретроэлементов. Данные, полученные в этом исследовании, в целом совпадают с данными предыдущей работы, и указывают на повышенное количество копий L1 в гиппокампе. При этом разброс данных для разных индивидов, образцы тканей которых использовались для исследования, достаточно велик. Для дальнейшего анализа Baillie et al. было выбрано только две области мозга: гиппокамп и хвостатое ядро, а потому прямого доказательства того, что гиппокамп является «горячей точкой» ретротранспозиционной активности в сравнении с другими зонами мозга, не было приведено и в данном случае.
Секвенирование геномов индивидуальных нейронов, выделенных из хвостатого ядра и гиппокампа, впрочем, дало значительно более низкую оценку количества соматических инсерций L1 на уровне 0.6 инсерций на клетку [103].
В настоящее время уже получен положительный ответ на вопрос о том, возникают ли новые инсерций ретроэлементов в соматических тканях человека и животных. Однако данные о количестве и локализации de novo ретротранспозиций недостаточны, зачастую они противоречат друг другу и требуют уточнения. Также остается невыясненной роль соматических транспозиционных событий в развитии организма и функционировании его клеток. С одной стороны, повышенная частота ретротранспозиционных событий может быть лишь побочным эффектом деметилирования ДНК и изменения паттерна экспрессии транскрипционных факторов в ходе дифференцировки. С другой стороны, возникающие соматические мутации могут приводить к появлению генетического мозаицизма и функционально различающихся популяций нейронов.
В дальнейшем необходимо более тщательное изучение частоты и тканеспецифичности ретротранспозиционных событий, механизмов их подавления и возникновения. Такие исследования позволят расширить наши знания как о биологическом значении ретротранспозонов, так и о функционировании и развитии организма в целом.
Общая характеристика полученных библиотек фланкирующих последовательностей ретроэлементов
Наиболее высокий процент сиквенсов (0.0231%), представляющих соматические инсерции Alu, также как в случае с L1, наблюдался в зубчатой извилине (таблица 3, рис. 21). Однако, достаточно большое количество соматических инсерции было также детектировано во фронтальной коре (0.0185%). Значительно более низкий процент соматических инсерции Alu был детектирован в остальных тканях: мозжечке, субвентрикулярной зоне латерального желудочка и миокарде (0.0115, 0.0124 и 0.0098% соответственно). Тем не менее, попарное сравнение всех образцов с помощью теста на принадлежность к распределению Пуассона с одинаковым значением А, показало, что статистически значимы различия не только между зубчатой извилиной и фронтальной корой и другими тканями, но и между всеми остальными образцами. Значимого различия не наблюдалось только в паре мозжечок - субвентрикулярная зона (р=0.0506).
Из представленных данных следует, что соматические инсерции Alu не были равномерно распределены между образцами, в отличие от L1, которые были представлены в примерно равном количестве во всех библиотеках, кроме зубчатой извилины. Возможным объяснением этого служит различие между механизмами, регулирующими экспрессию А1ииЫ [75, 123, 124].
Теоретически, ретротранспозиции могут привести к встраиванию новой копии ретроэлемента в любое место генома клетки. На практике можно ожидать, что для данного типа клеток в некоторых локусах вероятность появления новой инсерции выше, чем в других, в силу неоднородности компактизации разных участков хроматина. Более того, можно предположить, что клетки после возникновения в них ретротранспозиции подвергаются отбору, и часть носителей новых инсерции может исчезуть из популяции, если эти инсерции мешают экспрессии или регуляции генов, важных для нормального функционирования данного типа клеток. Эти два фактора могут приводить к тому, что распределение соматических инсерции ретроэлементов в геноме может отличаться от ожидаемого случайного распределения.
Для того, чтобы выяснить, отличается ли распределение в геноме детектированных соматических инсерции ретроэлементов от случайного, для каждого из экспериментально полученных наборов координат соматических инсерции были сгенерированы по методу Монте-Карло искусственные наборы координат такого же размера, в которых координаты и ориентация инсерции определялись случайно. Компьютерные симуляции были повторены 1000 раз для каждой библиотеки, что позволило оценить разброс данных, который мог бы наблюдаться для инсерции, не характеризующихся предпочтительной локализацией в тех или иных типах геномных последовательностей.
Всего в ходе данного исследования было найдено 7497 потенциальных соматических инсерции L1. Из них 3798 инсерции (842 для мозжечка, 236 для фронтальной коры, 584 для субвентрикулярной зоны латерального желудочка, 1558 для зубчатой извилины и 578 для миокарда) детектировались внутри генов (подавляющее большинство в интронных участках) (таблица 2). Сравнение с данными компьютерных симуляций показало, что во всех исследованных образцах это количество выше предсказанного на основании нуль-гипотезы о случайном распределении инсерции в геноме (р 0.001; = 0.02; = 0.001; 0.001; = 0.01 для мозжечка, фронтальной коры, субвентрикулярной зоны, зубчатой извилины и мокарда соответственно; метод Монте-Карло, 1000 симуляций) (рис. 22). I предсказанное количество L1 в генах детектированное количество L1 в генах
Еще 436 соматических инсерции L1 (92 для мозжечка, 31 для фронтальной коры, 74 для субвентрикулярной зоны латерального желудочка, 177 для зубчатой извилины и 62 для миокарда) были детекированы внутри промоторных участков (областей длиной 5000 п. о., прилегающих к сайту начала транскрипции генов) (таблица 2). Эти значения также оказались значимо выше предсказанных с помощью компьютерных симуляций (р = 0.004; = 0.002; = 0.002; 0.001; = 0.032 для мозжечка, фронтальной коры, субвентрикулярной зоны, зубчатой извилины и мокарда соответственно; метод Монте-Карло, 1000 симуляций) (рис. 23).
Вывод о том, что соматические инсерции L1 встраиваются с повышенной частотой в гены и промоторные участки на первый взгляд противоречит сделанным ранее другими исследователями наблюдениям, согласно которым L1 элементы, напротив, менее представлены в этих участках генома [24]. Это несовпадение может объясняться различиями в механизмах селекции, действующими против взрослых соматических клеток, в которых происходят ретротранспозиции, и клеток зародышевой линии. Если первые, скорее всего, могут быть элиминированы в случае нарушения функционирования экспрессирующихся именно в этих клетках генов, то вторые могут находиться под селектирующим давлением, действующим против всего организма, в чьем генотипе присутствует новая инсерция.
Во всех библиотеках было найдено всего 8990 потенциальных соматических инсерций Alu, из которых 4314 (623 для мозжечка, 1028 для фронтальной коры, 609 для субвентрикулярной зоны латерального желудочка, 1465 для зубчатой извилины и 589 для миокарда) были детектированы в генах (таблица 3). Количество этих инсерций не отличалось от предсказанного с помощью компьютерных симуляций для всех образцов, кроме зубчатой извилины, в которой число соматических Alu внутри генов значимо превышало ожидаемое значение (р = 0.013; метод Монте-Карло, 1000 симуляций) (рис. 24).
Анализ распределения соматических инсерции ретроэлементов в анализируемых образцах тканей
Замороженный образец ткани (100-200 мг) гомогенизировался с помощью ступки и пестика в жидком азоте. Гомогенат помещался в 3 мл лизирующего буфера, в который добавлялось 0.4 мг РНКазы А, и помещался на 1 час в термостатируемый ротационный шейкер на 37С. Затем в раствор добавляли 1.5 мг протеиназы К и инкубировали в термостатируемом ротационном шейкере в течение ночи на 50С.
Экстракция ДНК из раствора осуществлялась фенол-хлороформным методом. К лизату добавляли равный объем фенола (рН 8.0), аккуратно перемешивали в течение 30 мин и центрифугировали в течение 15 мин на 4 500 g. Водную фазу отбирали в чистую пробирку, добавляли к ней равный объем смеси фенол-хлороформ (1:1) и центрифугировали в течение 15 мин на 4 500 g. Водную фазу отбирали в чистую пробирку, добавляли к ней равный объем хлороформа и центрифугировали в течение 15 мин на 4 500 g. Водную фазу отбирали в заранее подготовленную пробирку, содержащую 3 объема охлажденного этанола (96%) и центрифугировали в течение 15 мин при 4 500 g. Супернатант удаляли, а осадок промывали одним объёмом охлажденного этанола (70%) и центрифугировали в течение 10 мин при 4 500 g. После удаление супернатанта осадок промывали повторно одним объёмом охлажденного этанола (70%) и центрифугировали в течение 10 мин при 4 500 g. Супернатант удаляли, осадок высушивали при 50С в течение 5 мин и растворяли в 200 мкл буфера ТЕ.
Геномная ДНК фрагментировалась с помощью эндонуклеаз рестрикции. Для создания библиотек фланкирующих последовательностей L1 использовались эндонуклеазы Alul и НаеШ. Для создания библиотек фланкирующих последовательностей Alu использовались эндонуклеазы Alul и Rsal. Рестрикция проводилась ступенчато с 25-кратной суммарной нагрузкой. Состав реакиционной смеси:
Реакционная смесь инкубировалась в течение 2 часов на 37С. Затем в нее добавляли ещё 40 и эндонуклеазы рестрикции в 50 мкл 1х буферного раствора и инкубировали в течение ночи. Рестриктазу инактивировали нагреванием при 65С в течение 15 мин.
После рестрикции ДНК осаждали из раствора этанольным методом. Для этого добавляли в реакционную смесь 1 мкл соосадителя Satellite Red, 1/10 объема ЗМ ацетата натрия и 3 объема 96% этанола, перемешивали, затем помещали на -70С на 1 час. Центрифугировали при 16 100 g в центрифуге, охлажденной до 4 С, в течение 15 мин. Затем удаляли супернатант, промывали осадок холодным 70% этанолом и центрифугировали повторно. Супернатант удаляли, осадок высушивали при 55С в течение 5 мин и разводили в 7 мкл H20 (mQ).
Лигирование проводилось в течение ночи при 16С. Для инактивации ДНК-лигазы реакционную смесь прогревали при 65С в течение 15 мин. После проведения реакции проводилось выделение ДНК из реакционной смеси с помощью колонок QIAquick PCR purification system.
В реакционную смесь в качестве матрицы добавляли 1/25 продуктов лигирования. Для приготовления библиотек фланкирующих последовательностей L1 использовали ретроэлемент-специфический праймер 3-L1HS, а для библиотек фланкирующих последовательностей Alu использовали праймер AY107. Реакционная смесь содержала:
Количество циклов амплификации составляло 16 для библиотек фланкирующих последовательностей L1 и 13 для библиотек фланкирующих последовательностей Alu. Одновременно для приготовления каждой библиотеки проводилось 50 идентичных ПЦР-реакций. После проведения амплификации продукты ПЦР объединялись, подвергались очистке с помощью колонок QIAquick PCR purification system и концентрировались до объема 120 мкл.
В реакционную смесь в качестве матрицы добавляли 1/1200 продуктов первого этапа супрессионной ПЦР. Для приготовления библиотек фланкирующих последовательностей L1 использовали ретроэлемент-специфический праймер З-end-Ll, а для библиотек фланкирующих последовательностей Alu использовали праймер AY24, либо праймер AY18. Реакционная смесь содержала:
Количество циклов амплификации составляло 12 для библиотек фланкирующих последовательностей L1 и 10 для библиотек фланкирующих последовательностей Alu. Одновременно для приготовления каждой библиотеки проводилось 30 идентичных ПЦР-реакций. После проведения амплификации продукты ПЦР объединялись, подвергались очистке с помощью колонок QIAquick PCR purification system и концентрировались до объема 60 мкл. Измерение концентрации ДНК в полученных библиотеках проводилось с помощью флуориметра Qubit 2.0 и набора для измерения концентрации ДНК в растворе Qubit dsDNA HS Assay Kit.
Пары файлов, содержащие парные сиквенсы фланкирующих последовательностей L1, разделялись на файлы трех типов. В том случае, когда один из пары сиквенсов, прилегающий к L1, содержал информативный фрагмент нуклеотидной последовательности (не poly А участок длиной не менее 25 и.о.), такие пары сиквенсов помещались в первую пару файлов (сиквенсы типа 1). В случае, когда первый сиквенс не содержал информативной нуклеотидной последовательности, а второй сиквенс содержал не менее 4 тиминов на 3 -конце (которые могут относиться к 3 -концу poly А хвоста), такая пара сиквенсов помещалась во вторую пару файлов (сиквенсы типа 2). В случае, если первый сиквенс не содержал информативного фрагмента, а второй poly А хвоста L1 на 3 -конце, такие сиквенсы не использовались для дальнейшего анализа.
Картирование сиквенсов на референсный геном человека hgl9 осуществлялось с помощью программы Bowtie 2 [120, 127]. Настройки для парного картирования сиквенсов типа 1, отличные от настроек по умолчанию: -р 8 -X 600 -к 2 —no-mixed --no-discordant. С 3 -конца сиквенсов типа 2 предварительно отрезали нуклеотиды, принадлежащие poly А хвосту. Настройки для одиночного картирования сиквенсов типа 2, отличные от настроек по умолчанию: -р 8 —тр 12,8.
Фильтрация потенциально химерных последовательностей: удаление координат инсерций, для которых в референсном геноме внутри отрезка 50 н.о. в сторону фланкирующей последовательности от координаты инсерций, детектируется рестриктный сайт эндонуклеазы, с помощью которой была получена анализируемая библиотека. 9. Пересечение полученных таблиц координат с таблицами координат ранее известных инсерций L1, присутствующих в референсном геноме hgl9 и базах данных полиморфных ретроэлементов dbRIP и PRED, с помощью инструмента "Join" пакета программ Galaxy [128-130].