Содержание к диссертации
Введение
Глава 1. Обзор литературы 17
1. Вирус гепатита В 17
1.1. Строение вируса гепатита В и структура генома 17
1.2. Цикл ВГВ 19
1.3. Регуляция репликации вируса 20
1.4. Особенности хронической инфекции и современные подходы к терапии 21
1.5. КкзДНК ВГВ как основная причина персистенции вируса 22
2. Системы сайт-специфических нуклеаз CRISPR/Cas9 25
2.1. Системы сайт-специфических нуклеаз CRISPR/Cas9: классификация и принципы действия 25
2.2. Целевая и внецелевая активность CRISPR/Cas9 29
3. Описание ортологичных систем CRISPR/Cas9 32
4. Системы CRISPR/Cas9 и ВГВ 33
5. Системы CRISPR/Cas9 как основа для создания противовирусных препаратов препаратов 34
Глава 2 Материалы и методы исследований 36
1. Культуры клеток 36
2. Трансфекция линий клеток 36
3.Синтез рекомбинантной ккзДНК ВГВ 37
4. Дизайн и получение компонентов систем CRISPR/Cas9 37
5. Выделение нуклеиновых кислот 38
6. ПЦР-анализ 39
7. Определение HBsAg 39
8. Иммуноцитохимическое окрашивание 39
9. Флуоресцентная микроскопия и проточная цитофлуориметрия 40
10. Анализ целевого и внецелевого действия методом секвенирования нового поколения 40
11. Статистическая обработка данных 41
Глава 3. Анализ противовирусного действия ортологичных систем CRISPR/Cas9 43
3.1. Дизайн и синтез РНК-проводников 43
3.2. Поиск консервативных регионов-мишеней для CRISPR/Cas9 в геноме вируса гепатита В разных генотипов 48
3.3. Влияние ортологичных систем CRISPR/Cas9 на жизненный цикл вируса гепатита В 51
3.4. Деградация рекомбинантной ккзДНК под действием ортологичных систем CRISPR/Cas9. 61
3.5. Системы CRISPR/Cas9 эффективно подавляют репликацию ВГВ на стабильных клеточных линиях 63
3.6. Нуклеолитическое разрезание ккзДНК системами CRISPR/Cas9 68
Глава 4. Специфичность действия ортологичных систем CRISPR/Cas9 72
4.1. Сравнение внецелевой активности классической системы S. pyogenes CRISPR/Cas9 и ортологичной системы S.thermophilus CRISPR/Cas9 72
4.2. Влияние несовпадений нуклеотидов между последовательностями РНК-проводника и ДНК-мишенью системы S.thermophilus CRISPR/Cas9 76
Обсуждение 81
Заключение 86
Выводы 87
Перспективы дальнейшей разработки темы 88
Список литературы 91
- Системы сайт-специфических нуклеаз CRISPR/Cas9: классификация и принципы действия
- Дизайн и синтез РНК-проводников
- Нуклеолитическое разрезание ккзДНК системами CRISPR/Cas9
- Влияние несовпадений нуклеотидов между последовательностями РНК-проводника и ДНК-мишенью системы S.thermophilus CRISPR/Cas9
Системы сайт-специфических нуклеаз CRISPR/Cas9: классификация и принципы действия
CRISPR/Cas9 представляет из себя комплекс из РНК и белков Cas9, обладающих нуклеазной активностью. Элементами CRISPR-систем являются РНК-проводники и белок Cas9. Узнавание происходит за счет взаимодействия РНК-проводника с комплементарным участком ДНК. Впервые система CRISPR/Cas9 была описана при изучении бактерий. В бактериальном геноме были обнаружены следующие последовательности: участки ДНК-спейсеров, разделенные короткими палиндромными повторами (локусы CRISPR). Рядом с такими кассетами находятся cas-гены, белковые продукты которых обладают нуклеазной и хеликазной активностью [27]. Чужеродный фрагмент, проникший в клетку бактерии, может встроиться в CRISPR локус, образуя новый спейсер. В вирусном геноме этот фрагмент представлен в качестве протоспейсера, который комплементарен спейсеру и фланкированного последовательностью PAM [77]. Далее весь локус CRISPR транскрибируется в pre-crRNA, которая после процессирования формирует короткие crRNA (около 40 нт) [10]. crRNA взаимодействует с Cas белками, узнает последовательность протоспейсера в мишени, а Cas белки разрушают разрушают мишень [52].
Системы CRISPR/Cas подразделяются на два класса в зависимости от строения эффекторного комплекса. Системы 1 класса представляют собой мультисубъединичный комплекс, направляющей crRNA с белковыми субъединицами, а системы класса 2 реализуют стадию интерференции посредством одного белка, например, Cas9. Класс 1 составляют типы I, III и IV; в класс 2 входят CRISPR/Cas типов II и V. Из-за простоты дизайна эффекторного комплекса и удобства в использовании наибольшую практическую значимость в генной технологии имеют системы II класса от микроорганизмов Streptococcus pyogenes, Streptococcus thermophilus, Neisseria meningitidis (вносят разрыв в двуцепочечную ДНК), а также Cas9 от микроорганизма Francisella novicida (генерирует разрывы в двуцепочечных ДНК и одноцепочечных РНК) [19, 40, 49]. Вместо crRNA и tracrRNA сейчас используется химерная молекула РНК-проводника (gRNA), в которой tracrRNA, участвующая в процессировании pre-crRNA, соединена с crRNA специальной структурой [34].
Белки кластера Cas после сборки комплексов реализуют свою функцию в ходе трх последовательных стадий: приобретение спейсеров, транскрипция спейсеров, их процессинг и интерференция [34]. Обязательным условием для распознавания целевой последовательности и интерференции с участием системы CRISPR/Cas является наличие последовательности РАМ (protospacer-adjacent motif) на 3 -конце цепи, комплементарной целевой.
РАМ представляет собой последовательность, способствующую распознаванию целевых областей комплексом CRISPR/Cas. Каждый тип CRISPR/Cas систем распознат свою собственную последовательность РАМ. В случае отсутствия РАМ-последовательности, но совпадения с мишенью РНК проводника распознавание спейсера и интерференция невозможны [4]. При успешном распознавании РАМ двуцепочечная ДНК в целевой области дестабилизируется и происходит денатурация цепи на протяжении нескольких нуклеотидов, следующих за PAM (Рис. 2) [133]. Таким образом создаются необходимые условия для посадки РНК-проводника на целевую последовательность.
Cas9 является основным эффекторным белком систем II типа. Данный белок состоит из двух доменов: распознающего (REC) и нуклеазного (NUC) [103, 140]; нуклеазная доля, в свою очередь, состоит из двух доменов – HNH и RuvC, каждый из которых обладает собственной нуклеазной активностью (Рис. 3) [34, 35]. Нуклеазный домен Cas9 проявляет активность только в присутствии ионов Mg2+ [34].
Активный эффекторный комплекс состоит из целевой молекулы ДНК, Cas9 белка и РНК-проводника, представляющего гибрид спейсерной последовательности со вспомогательной молекулой – транс-активационной РНК (tracrRNA) [14]. Биотехнологическим аналогом данной пары является РНК проводник - химерная молекула, длиной около 100-120 пн. Первые 20 нуклеотидов обеспечивают распознавание целевой последовательности, следующие 42 необходимы для связывания Cas9 белка, и последние 40 участвуют в терминации транскрипции, катализируемой РНК-полимеразой III. При распознавании целевого сайта происходит сборка комплекса, активация нуклеазных доменов эффекторного белка и формирование двуцепочечного разрыва [34].
В ходе интерференции осуществляется распознавание целевой последовательности с участием РНК-проводника, сборка активного комплекса, активация нуклеазных доменов Cas9 и генерация двухцепочечного разрыва в целевом сайте. Распознавание комлементарного фрагмента осуществляется в поэтапной манере. Взаимодействие с РНК-проводником вызывает изменения в конформации белка, в результате которых формируется центральная полость, необходимая для связывания целевой ДНК. Далее, комплекс Cas9 с РНК проводником «сканирует» ДНК на наличие РАМ-последовательностей. В распознавание РАМ-последовательностей вовлекаются две триптофан содержащих петли С-концевого домена нуклеазной доли Cas9. Мутации данных аминокислот подавляют связывание и разрезание целевой ДНК. При успешном распознавании РАМ-последовательностей двуцепочечная ДНК в целевой области дестабилизируется и денатурирует на протяжении нескольких нуклеотидов, следующих за PAM [4, 133], таким образом создаются необходимые условия для отжига РНК-проводника на целевую последовательность. Наиболее важным при распознавании целевой последовательности является спаривание оснований между нитью целевой нуклеиновой кислоты и РНК-проводником на протяжении 12 нуклеотидов от PAM, эта область известна как seed-регион. Показано, что гибридизации на уровне PAM+Seed достаточно для связывания и активации Cas9 in vivo и in vitro, а несовпадение seed-региона с целевой ДНК блокирует генерацию двухцепочечного разрыва [32, 74, 88]. Однако, в РАМ-дистальной области одно-два несовпадения между нуклеотидами может снизить эффективность генного редактирования, но не блокировать его. Несовпадения в количестве трх и более нуклеотидов данной области сводит вероятность формирования разрыва ДНК практически к нулю [11]. На финальной стадии интерференции Cas9, перешедший в активное состояние, разрезает целевую ДНК за счет внутренней активности нуклеазной доли, при этом HNH-подобный нуклеазный домен разрезает ту цепь, основания которой связались с РНК-проводником, а RuvC-подобный нуклеазный домен вносит разрыв в комплементарную цепь ДНК [32]. Двухцепочечный разрыв, который генерируется Cas9, имеет слепые концы и локализуется за 3 нуклеотида от 3 -конца протоспейсера [34].
Дизайн и синтез РНК-проводников
В ходе первого этапа работы был проведен дизайн РНК-проводников, направленных на мишени в геноме ВГВ. Дизайн РНК-проводников осуществляли методами in silico в программах, находящихся в открытом доступе BroadInstitute (https://portals.broadinstitute.org/gpp/public/analysisools/sgrna-design) и Center for Organismal Studies, Heidelberg (http://crispr.cos.uni-heidelberg.de/). По результатам анализа in silico был создан перечень участков в геноме ВГВ с теоретически рассчитанной вероятностью их расщепления системами CRISPR/Cas9. Дизайн РНК-проводников проводили с учетом поиска наиболее консервативных областей-мишеней в геноме ВГВ среди всех генотипов вируса, при этом важным параметром была гомология с участками ДНК в геноме человека и вероятность внесения внецелевых разрывов. В работе были исследованы 4 системы CRISPR/Cas9, полученных от 4 видов организмов: Cas9 Streptococcus pyogenes (SpCas9), Cas9 Streptococcus thermophilus (StCas9), Cas9 Neisseria meningitidis (NmCas9) и Cas9 Francicella novicida (FnCas9). Отличие этих систем состоит в разных консенсусах участка PAM: у систем SpCas9 и FnCas9 последовательность PAM состоит из 3 нуклеотидов (5 -NGG-3 ), что облегчает поиск мишеней в целевой последовательности, однако повышает число потенциальных мишеней в геноме человека. Системы SpCas9 могут расщеплять только ДНК, тогда как для системы FnCas9 была описана активность в отношении РНК. Системы NmCas9 и StCas9 характеризуются более длинным участком PAM – 5 -NNNNGATT-3 для NmCas9 и 5 -NNAGAAW-3 для StCas9, что ограничивает число потенциальных мишеней в коротком геноме вируса, однако резко снижает число внецелевых мишеней в геноме человека. Всего было создано 50 РНК-проводников для системы SpCas9 (Sp1-Sp50), 10 для StCas9 (St1-St10), 6 РНК-проводников для системы NmCas9 (Nm1-Nm6) и 5 РНК-проводников для системы FnCas9 (Fn1-Fn5). На рисунках 4-7 представлены карты генома ВГВ с отмеченными на них мишенями для всех использованных в работе РНК-проводников. Следует отметить, что для систем NmCas9 и StCas9 был изучен полный спектр всех возможных РНК-проводников в консервативных регионах вируса, более того, обе эти системы впервые изучены на модели вируса гепатита В. В Табл. 1 приведены характеристики систем CRISPR/Cas9, использованных в работе.
С целью анализа противовирусного действия большого спектра РНК-проводников, в данной работы впервые для этих целей был использован метод транскрипции РНК-проводников с ПЦР-продуктов, содержащих U6-промотор. Простота получения и использования кодирующих ПЦР-продуктов позволила провести массовый скрининг противовирусной активности РНК-проводников на большом спектре мишеней. РНК-проводники получали в виде ПЦР-продукта, короткой последовательности двуцепочечной ДНК c промотором U6 для синтеза коротких РНК [14].
Нуклеолитическое разрезание ккзДНК системами CRISPR/Cas9
Для подтверждения нуклеолитической активности систем CRISPR/Cas9, остаточные матрицы ккзДНК в экспериментальных образцах использовали для амплификации сайта нуклеолитического разрезания и секвенирования продуктов амплификации методом NGS (MiSeq). Частоту мутаций подсчитывали в программе Geneious 6.1.8. Методом секвенирования было продемонстрировано, что оставшиеся матрицы ккзДНК содержат вставки и делеции в сайтах мишеней РНК-проводников. Частота мутаций и количество вставок/делеций после действия РНК-проводника Sp20 представлена на Рис. 21. В контрольных образцах наблюдается некоторое количество вставок и делеций нуклеотидов, однако при использовании SpCas9 с РНК-проводником Sp20 наблюдается значительное редактирование мишени в ккзДНК в области в 3-4 нуклеотидов от последовательности PAM, типичной для действия нуклеаз CRISPR/Cas9. Помимо этого, на Рис. 21, Б представлено распределение делеций, в котором учитывается не только количество делеций, но и их длина. Наблюдается характерный профиль разрезания системами CRISPR/Cas9.
Секвенирование целевых участков РНК-проводников St3, St4 и St10 также подтвердило наличие многочисленных вставок и делеций в точке разрезания белком Cas9 (Рис.22, А-В). Наиболее выраженное редактирование ккзДНК детектировалось при использовании РНК-проводника St10 (21 мутация на 1000 прочтений). Белок StCas9 вызывает образование многочисленных вставок и делеций нуклеотидов на модели ВГВ. График распределения делеций (Рис. 23, А-В) точно соответствует стандартному профилю разрезания системами CRISPR/Cas9.
Таким образом, большинство матриц ккзДНК разрушается (снижение числа матриц до 90%), а в оставшихся 10% детектируются многочисленные целевые мутации, которые приводят к сдвигам рамки считывания и снижению транскрипции вируса. В Табл. 2 представлена частота мутаций на 1000 прочтений и общее число прочтений каждого образца для системы StCas9.
Влияние несовпадений нуклеотидов между последовательностями РНК-проводника и ДНК-мишенью системы S.thermophilus CRISPR/Cas9
В данной работе был создан ряд высокоэффективных РНК-проводников для систем SpCas9 и StCas9, нацеленных на консервативные участки генома ВГВ. Несмотря на это, обратная транскрипция ВГВ [107], высокий уровень репликации вируса и мутации [95], возникающие в геноме ВГВ под действием факторов внутриклеточного иммунитета [110, 123, 134], приводят к образованию близких, но отличающихся по генетической последовательности вариантов ВГВ, названных квазивид [94, 118, 120]. Нуклеотидные отличия в последовательности квазивида и РНК-проводника могут препятствовать разрушению ккзДНК [136]. Хотя система SpCas9 демонстрирует высокую толерантность к несовпадениям между РНК-проводником и мишенью, для некоторых систем это может стать непреодолимым препятствием. Например, система NmCas9 является высокоспецифичной и не узнает ДНК, если в мишени имеется несколько несовпадений нуклеотидов.
Для системы StCas9 ранее влияние несовпадений нуклеотидов между последовательностями РНК-проводника и ДНК-мишенью изучено не было. В рамках данной работы были созданы РНК-проводники на основе последовательности РНК-проводника St4 c несовпадением 1 нуклеотида (M1-M20), двух нуклеотидов (M1M2-M19M20) и трех нуклеотидов (M1M2M3-M18M19M20) (Рис. 25, А) в указанных позициях. РНК-проводник М1 содержит замену в самом дистальном участке, РНК-проводник M20 имеет мутацию проксимально последовательности PAM. Помимо этого, были созданы РНК-проводники с 2 несовпадениями нуклеотидов, соответствующих наиболее часто встречаемым заменам в геноме ВГВ (M11M17 и M8M20).
В результате, РНК-проводники с однонуклеотидной заменой не оказывали влияния на противовирусную активность StCas9 (Рис.25, Б-Д). Снижение транскрипции вируса, уровней ДНК ВГВ и ккзДНК было на том же уровне, что и с РНК-проводником St4 без мутаций нуклеотидов. Мутации в РНК-проводниках в некоторых позициях (M2, M4, M10, M14) снижали уровни ДНК ВГВ сильнее, чем РНК-проводник без мутаций, тогда как отдельные РНК-проводники M12, M16 и M19 менее эффективно действовали на ккзДНК. По результатам секвенирования, для всех РНК-проводников с одной заменой наблюдается образование вставок нуклеотидов и делеций, хотя и с разной эффективностью, за исключением РНК проводника М20, для которого не наблюдалось типичного для CRISPR/Cas9 паттерна распределения делеций.
Напротив, все РНК проводники с 2-х и 3-х нуклеотидными заменами практически полностью блокировали противовирусный эффект по всем измеренным параметрам (Рис 26, Б-Д). NGS-секвенирование подтвердило эти результаты для некоторых РНК-проводников M1-2, M3-4, M5-6, M6-7, M8-9, M18-19, M19-20, M1-2-3, M4-5-6, M8-9-10, M11-12-13, M14-15-16), тогда как отдельные РНК-проводники все же вносили мутации в ккзДНК M8-20, M10-11, M11-17, M12-13, M14-15, M16-17, M5-6-7, M8-9-10, M11-12-13, M14-15-16, M18-19-20) (Рис.27-28). В Прил. 2 представлены данные секвенирования с числом мутаций в целевых регионах на 1000 прочтений и общее число прочтений мишеней всех РНК-проводников с заменами.
Следовательно, однонуклеотидные замены не влияют на эффективность системы StCas9, 2-х и 3х нуклеотидные замены блокируют противовирусное действие. Тем не менее, мутации в отдельных позициях не полностью блокируют нуклеолитическую активность системы CRISPR/Cas9.