Содержание к диссертации
Введение
ГЛАВА 1. Обзор литературы 18
1.1. Современные представления о микрофлоре кишечника человека 18
1.2. Технологии в основе сравнительной геномики 20
1.3. Концепции сравнительной геномики прокариот 24
1.4. Молекулярно-генетические механизмы горизонтального переноса генов 26
1.5. Бифидобактерии, колонизирующие кишечник человека 30
1.6. Таксономическое положение, метаболизм и генетика B. longum 34
1.7. Заключение 36
Результаты собственных исследований 38
Глава 2. Определение видовой и внутривидовой принадлежности исследуемых представителей рода bifidobacterium 38
2.1. Исследование разнообразия представителей рода Bifidobacterium в кишечной микрофлоре людей различного возраста 38
2.2. Выбор штаммов для анализа полных геномных последовательностей 41
2.3. Внутривидовая филогения B. longum 45
ГЛАВА 3. Анализ основных характеристик геномных последовательностей B. Longum 54
3.1. Общее сравнение геномов B. longum 54
3.2. Генный состав штаммов B. longum 57
3.3. Пан-геном B. longum subsp. longum 60
ГЛАВА 4. Компоненты изменчивой части геномных последовательностей B. Longum 70
4.1. Гены гликозил-гидролаз B. longum 70
4.2. Плазмиды исследуемых штаммов B. longum 73
4.3. Мобильные генетические элементы и профаги в геномных последовательностях B. longum 78
4.4. Системы CRISPR-Cas и рестрикции-модификации B. longum 81
4.5. Гены, принимающие участие в колонизации кишечника человека 86
Заключение 91
Выводы 98
Практические рекомендации 99
Перспективные направления дальнейшей разработки темы 99
Cписок используемых сокращений 100
Список литературы 100
- Концепции сравнительной геномики прокариот
- Выбор штаммов для анализа полных геномных последовательностей
- Генный состав штаммов B. longum
- Мобильные генетические элементы и профаги в геномных последовательностях B. longum
Введение к работе
Актуальность исследования:
Микробное сообщество кишечника человека является сложной системой, включающей сотни видов микроорганизмов, которая участвует во множестве взаимодействий с человеческим организмом, в том числе, в формировании колонизационной резистентности и модулировании местного иммунитета. Микрофлора характеризуется чрезвычайным разнообразием, находясь в зависимости от возраста, стиля жизни и индивидуальных особенностей. Знания о ней длительное время оставались неполными и оценочными вследствие естественных ограничений методов культивирования и биохимической идентификации. В настоящее время, благодаря появлению технологий высокопроизводительного секвенирования и развитию метагеномики и сравнительной геномики, стал возможен значительный прогресс в исследовании видового и внутривидового разнообразия бактерий интестинальной микробиоты (Blaser M.J., 2014).
Бифидобактерии являются неотъемлемым компонентом микрофлоры кишечника человека. В детском возрасте род Bifidobacterium является одним из численно доминирующих в кишечном микробиоценозе (Turroni F. и др., 2012; Ringel-Kulka T. и др., 2013). Среди основных групп облигатных анаэробов интестинальной микрофлоры бифидобак-терии наиболее легко культивируются, что определяет большое количество информации, накопленной о данной группе микроорганизмов. Также значительную роль играет практически отсутствующая патогенность кишечных бифидобактерий, вследствие чего они активно используются в составе пробиотических препаратов. Наибольшее внимание при этом привлекают виды, характерные для нормальной микрофлоры человека. В связи с этим необходимо отметить вид B. longum, которому свойственна широкая распространенность среди как детей, так и взрослых (Шкопоров А.Н. и др., 2006; Джиоев Ю.П. и др., 2011; Turroni F. и др., 2012). Ряд исследований постулировал высокий уровень генетической изменчивости данного вида бактерий, затрагивающий как общие характеристики их генома, так и присутствие отдельных генов, играющих роль в колонизации и персистенции в микрофлоре кишечника человека (Lee J.-H. и др., 2008; Sela D.A. и др., 2008). Однако систематического анализа изменчивости B. longum, основанного на большом числе полных геномных последовательностей, до настоящего времени не проводилось.
Остается неохарактеризованной долговременная персистенция штаммов бифидо-бактерий в кишечнике человека. Сопровождается ли изменение видового состава и численности бифидобактерий в кишечнике человека при переходе от детского типа микрофлоры к взрослому также и сменой штаммового состава? В настоящее время стало возможно получение данных об этом уровне вариабельности микрофлоры благодаря появлению методов высокопроизводительного секвенирования.
Таким образом, появление новых технологий, подходов и концепций в области
получения и анализа генетической информации позволяет проводить более глубокое изучение бактерий нормальной микрофлоры, что делает данную работу, посвященную исследованию представителей вида B. longum, актуальной в свете современного развития микробиологии.
Степень разработанности темы исследования
Видовой состав бифидофлоры детей и взрослых описан в большом числе исследований, однако, результаты в значительной степени варьируются в зависимости от используемых методов (Шкопоров А.Н. и др., 2006; Turroni F. и др., 2009; Джиоев Ю.П. и др., 2011; Жиленкова О.Г. и др., 2014), ставя необходимость проведения крупных унифицированных исследований на больших выборках.
Опубликовано значительное количество последовательностей геномов штаммов B. longum (Schell M.A. и др., 2002; Hao Y. и др., 2011; Ham J.-S. и др., 2011). Охарактеризованы различные генные островки, кодирующие свойства, предположительно способствующие колонизации интестинального тракта: адгезию к кишечному эпителию, синтез бактериоцинов, катаболизм олигосахаридов человеческого молока, производство экзо-полисахаридов (Lee J.-H., O’Sullivan D.J., 2010). Однако оценка размера пан-генома и исследование представленности различных функциональных категорий генов проводились только для рода в целом, без учета особенностей отдельных видов (Bottacini F. и др., 2010; Lukjancenko O. и др., 2012). Значительная роль горизонтального переноса генов у представителей данного вида постулировалась лишь на анализе последовательности только одного генома, при отсутствии сравнительного подхода (Schell M.A. и др., 2002).
Наблюдения отдельных случаев долговременной персистенции бифидобактерий в ходе взросления проводились только на уровне ДНК-типирования без привлечения геномных данных (Shkoporov A.N. и др., 2008).
Цель исследования:
Провести анализ внутривидовой геномной изменчивости и способности к долговременной персистенции штаммов Bifidobacterium longum микрофлоры кишечника здоровых людей.
Задачи исследования:
-
Исследовать видовое разнообразие представителей рода Bifidobacterium в микрофлоре кишечника здоровых людей, провести полногеномное секвенирование и сборку геномов отдельных представителей вида B. longum.
-
Провести реконструкцию внутривидовой филогении B. longum с использованием различных биоинформатических подходов.
-
Оценить вклад механизмов формирования геномной изменчивости B. longum и провести исследование структуры пан-генома наиболее генетически охарактеризованно-
го подвида B. longum subsp. longum.
-
Исследовать набор генов гликозил-гидролаз, обеспечивающих утилизацию углеводов, среди представителей вида B. longum.
-
Провести сравнение штаммов B. longum, выделенных от одних и тех же обследуемых лиц через длительные интервалы времени.
Научная новизна
Проведенное исследование видового разнообразия бифидобактерий микрофлоры кишечника с использованием комплекса молекулярных методов, включающего MALDI-TOF MS и анализ нуклеотидной последовательности гена 16S рРНК, показало статистически значимое снижение встречаемости видов B. bifidum и B. breve, повышение встречаемости вида B. adolescentis с возрастом, и высокую частоту обнаружения B. longum вне зависимости от возраста.
Впервые были охарактеризованы открытая структура пан-генома и высокая активность внутривидового и межвидового горизонтального переноса генов у представителей подвида B. longum subsp. longum. Филогенетический анализ, проведенный на основании нуклеотидных последовательностей консервативных генов, полного набора генов и средней нуклеотидной идентичности, подтвердил монофилетичность подвидов longum, infantis и suis, и позволил уточнить таксономическую принадлежность ранее описанных штаммов B. longum. Впервые был проведен анализ полного набора генов гликозил-гидролаз, который раскрыл метаболические особенности подвидов longum, suis и infantis вида B. longum, отражающие различные экологические ниши, занимаемые подвидами.
В штаммах, геномные последовательности которых были просеквенированы в рамках данного исследования, были выявлены два ранее не описанных семейства плаз-мид размером 3,9 тыс. п. о. и 7 тыс. п. о., а также системы CRISPR-Cas с нетипичной структурой: 2 локуса CRISPR, функционирующих за счёт одного набора генов сas.
Сравнительный анализ генетических последовательностей штаммов бифидобакте-рий, выделенных от одних и тех же обследуемых лиц через длинные периоды времени, впервые показал возможность долговременной персистенции близкородственных внутривидовых групп B. longum.
Теоретическая значимость работы
В ходе исследования сформированы представления о масштабах внутривидового генетического разнообразия B. longum и доказана важная роль горизонтального переноса генов в его формировании.
Определены подходы к выявлению внутривидовой таксономической принадлежности штаммов B. longum с использованием генетических последовательностей и обнаружены тенденции генетических различий их углеводного метаболизма.
Расширены знания о неконсервативных генетических элементах генома B. longum и встречаемости генов, кодирующих белки c предположительными пробиотическими свойствами.
Практическая значимость работы
В результате исследования создана и поддерживается библиотека штаммов бифи-добактерий, включая штаммы с просеквенированными генетическими последовательностями, которая может быть использована для исследования молекулярно-генетических механизмов колонизации желудочно-кишечного тракта человека.
Нуклеотидные последовательности геномов, собранные до уровня контигов, и полные последовательности плазмид депонированы в международной базе данных GenBank (идентификаторы доступа JNWC00000000, JNVX00000000, JNVZ00000000, JNWA00000000, JNVY00000000, JNWC00000000, JNWD00000000, JRWN00000000, KP691640, KP691636, KP691641, KP691639, KP691635, KP691633, KP691637, KP691638). Разработана компьютерная база данных, характеризующая представленность различных групп ортологов в геномах B. longum.
Описанные новые генетические элементы и данные о встречаемости локусов, кодирующие белки с известными пробиотическими свойствами, могут быть применены в генетической инженерии бифидобактерий с целью повышения их пробиотического потенциала и использованы при отборе перспективных штаммов бифидобактерий.
Полученные в работе последовательности геномов, выложенные в открытом доступе, на данный момент уже используются для проведения отечественных и зарубежных научных исследований (Zakharevich N.V. и др., 2014; Bottacini F. и др., 2014; Zakharevich N.V. и др., 2015). Результаты исследования включены в материалы лекций кафедры микробиологии и вирусологии ГБОУ ВПО РНИМУ им. Н. И. Пирогова для студентов лечебного и педиатрического факультетов, аспирантов, ординаторов хирургического профиля, врачей-специалистов перинатальной медицины и педиатров, разработанная база данных используется для филогенетических исследований бактерий нормальной микрофлоры кишечника человека в научной работе кафедры микробиологии и вирусологии ГБОУ ВПО РНИМУ им. Н. И. Пирогова (акт внедрения от 07.12.15). Биоинформатиче-ские подходы применяются для сравнительно-геномного исследования молекулярно-генетических особенностей возбудителей дифтерии и коклюша в референс-центре по мониторингу за возбудителями дифтерии и коклюша ФБУН МНИИЭМ им Г.Н. Габричевского Роспотребнадзора (акт внедрения от 03.12.15).
Методология исследования
Методологической основой исследования послужили работы отечественных и зарубежных учёных в области классической микробиологии, генетики бактерий и биоинформатики. Предметом работы стало изучение бифидофлоры кишечника клинически
здоровых людей в возрасте от 1 месяца до 57 лет, полногеномное секвенирование набора штаммов B. longum и сравнительный анализ геномных последовательностей. Протокол исследования одобрен Этическим Комитетом РНИМУ им. Н. И. Пирогова (протокол заседания №122 от 17 декабря 2012 года).
Научная литература, посвящённая изучению микрофлоры человека, генетических характеристик бифидобактерий и применению сравнительно-геномных методов, была проанализирована формально-логическими методами. В работе использованы микробиологические, масс-спектрометрические, молекулярно-генетические, биоинформатиче-ские и статистические методы исследования.
Материалы и методы исследования
Культивирование и видовая идентификация бифидобактерий. Материалом для исследования служили фекалии здоровых людей, которые собирались стерильным шпателем и помещались в транспортный контейнер. В бактериологической лаборатории НИЛ микробиологии и биологической безопасности ГБОУ ВПО РНИМУ им. Н. И. Пирогова из исследуемого материала готовились серийные разведения в физиологическом растворе и высевались в объеме 0,1 мл из 105 и 107разведений исследуемого материала раз на среду Bifidobacterium agar (Himedia Labs Inc., Индия). Чашки с посевами инкубировались в микроанаэростатах (Oxoid, Великобритания), заполненных газовой смесью (85% N2, 10% H2, 5% CO2) при 37C в течение 48 часов. Первичный скрининг штаммов осуществлялся бактериоскопическим методом с использованием окраски по Граму. Штаммы, характеризовавшиеся типичной морфологией бифидобактерий, лиофилизиро-вались в растворе сахарозы (10%) и желатина (1%) в лиофильной сушилке SB1 (Chemlab, Бельгия), последующие исследования чистых культур бифидобактерий проводились после выделения культур из лиофилизированных образцов. Идентификация бифидобакте-рий осуществлялась с использованием MALDI-TOF MS (Салгина А.В. и др., 2014) с использованием прибора Microflex LT (Bruker Daltonics, Германия). Анализ спектров выполнялся с использованием программного обеспечения MALDI Biotyper 3.0 (Bruker Daltonics, Германия). Для внутривидового типирования штаммов B. longum использовался анализ длин локусов VNTR 12, 23 и 25 (Matamoros S. и др., 2011). Штаммы бифидо-бактерий, видовую принадлежность которых не удавалось установить при помощи метода MALDI-TOF масс-спектрометрии, идентифицировались путем секвенирования фрагмента гена 16S рРНК. Амплификация проводилась с использованием праймеров UF1 (5’-AGAGTTTGATCCTGGCTCAG-3’) и UR1 (5’-GCTGGCACGTAGTTAGCC-3’), cеквенирование по Сэнгеру осуществлялось в ООО «Евроген», Москва.
Полногеномное секвенирование. Выделение ДНК для полногеномного секвени-рования осуществлялось по модифицированному методу Stahl и соавторов (Shkoporov A.N. и др., 2008; Stahl M. и др., 1990). Секвенирование геномов штаммов 44B, 1-6B, 35B и 2-2B осуществлялось на платформе 454 FLX (Roche, Швейцария) в Институте Дж.
Крейга Вентера (JCVI), США, сборка проводилась с помощью программного обеспечения GS De Novo Assembler2.6 (). Секвени-рование геномов остальных штаммов производилось на платформе Illumina HiSeq (Illumina, США) в ООО «Генотек», Москва, сборка осуществлялась с использованием CLC Genomics Workbench ().
Первичный биоинформатический анализ. Геномы бактерий аннотировались
при помощи RAST (). Полногеномное выравнивание последователь
ностей геномов проводилось с использованием progressiveMauve
(). Подсчет средней нуклеотидной идентичности
осуществлялся с помощью JSpecies ().
Реконструкция филогении. Для построения филогенетических деревьев из ис
следуемых геномов были взяты последовательности 43 генов, предположительно отве
чающих за необходимые для жизнедеятельности клетки функции. Нуклеотидные после
довательности генов выравнивались с помощью MUSCLE
(). Филогенетическое дерево без учета рекомбинаций было
построено на базе конкатенированных последовательностей генов по алгоритму
Neighbor Joining с использованием модели замен Tamura-Nei в программном обеспече
нии MEGA (). Уровень достоверности был вычислен с по
мощью подхода bootstrap. Филогенетическое дерево с учетом рекомбинаций строилось в
программе ClonalFrame ().
Анализ групп ортологов. Кластеризация белок-кодирующих генов в группы
ортологов выполнялась при помощи программного обеспечения OrthoMCL 2.0
() с использованием значений
параметров, рекомендованых разработчиками: порог e-value 10-5 и индекс расширения
I=1,5 (Li L. и др., 2003). Функциональная группировка групп ортологов осуществлялась с
использованием RPS-BLAST на базе данных COG (-
lab.ucsd.edu/metagenomic-analysis/server/cog/). Результаты кластеризации и функциональной группировки объединялись в базе данных, созданной на платформе MySQL (). Динамика изменения размера кор-генома и пан-генома B. longum subsp. longum вычислялась с помощью 10000 случайных перестановок порядка включения штаммов в анализ. Тип пан-генома описывался с помощью модели степенного закона (Tettelin H. и др., 2008).
Исследование неконсервативных элементов генома. IS-элементы были анноти
рованы путём поиска по базе данных ISFinder с помощью ISSaga ().
Поиск плазмид производился на основе сходства последовательности с известными
плазмидами B. longum, а также анализа покрытия контигов. Аннотация генов гликозил-
гидролаз проводилась с использованием CAZymes Annotation Toolkit
(). Системы рестрикции-модификации выявлялись
путём поиска по базе данных REBASE (-
lmb.cam.ac.uk/genomes/madanm/pres/rebase1.htm). Поиск локусов CRISPR проводился с
использованием CRISPRFinder (), фланкирующие области
найденных регионов исследовались в поисках генов cas. Ортологичные локусы CRISPR
системы CRISPR-Cas №1 амплифицировались с использованием праймеров 5’-
CCCTATGGATGGTGGAAATCAG-3’ и 5’-CAATTAGTGCCGGTCTATGGAG-3’. Для
амплификации локусов CRISPR системы CRISPR-Cas №2 применялся метод вложенной
ПЦР. Последовательности внешних праймеров были GTTGCTCGACATGGGATATGG-3'
и 5'-TGGATCTGGTACAGGGTGAC-3', последовательности внутренних праймеров - 5'-
GTATACGCCTACGCAATCGG-3' и 5'-AACATCCGCCGATAAACAGTC-3. Подтвержде
ние интеграции мобильного генетического элемента в геном B. longum subsp. longum
EK3 проводилось с использованием ПЦР с праймерами 5’-
CCACTTCTCCAGCGGATGTT-3’ и 5’-TGACCGCAAGAAGGTGTCTC-3.
Статистическая обработка данных. Статистическая обработка осуществлялась с использованием программного пакета R (). Во всех случаях различия считались достоверными при корректированном p<0,05. Для анализа встречаемости видов использовался критерий Манна-Уитни как эквивалент теста на нулевую ранговую бисериальную корреляцию (Willson V.L., 1976) с поправкой Холма-Бонферрони. Анализ численности бифидобактерий проводился с использованием регрессионного анализа, при этом проверки на нормальность распределения остатков и гомоскедастичность проводились с помощью визуальной оценки квантиль-квантильных графиков и графиков остаток-предсказание, соответственно. Сравнение частоты функциональных классов в разных частях пан-генома осуществлялось с использованием точного теста Фишера с контролирующей процедурой Бенджамини-Хохберга. Для снижения размерности данных о численностях представителей семейств гликозил-гидролаз в штаммах B. longum использовался метод главных компонент. Неравномерность распределения числа представителей семейств гликозил-гидролаз между подвидами выявлялась с использованием критерия Краскела-Уоллиса с поправкой Холма-Бонферрони.
Степень достоверности и апробация результатов исследования
О достоверности результатов свидетельствует достаточный объем выборки при анализе штаммов бифидобактерий (220 штаммов, выделенных от 93 лиц) и при анализе геномных последовательностей (28 штаммов). Все количественные данные обрабатывались с использованием общепринятых статистических подходов. Достоверность результатов реконструкции филогении на уровнях разделения вида на подвиды и близкородственные группы подтверждается совпадением результатов, полученных с использованием методов, основанных на последовательностях консервативных генов, на общем наборе генов и на средней нуклеотидной идентичности. Депонированные генетические последовательности прошли проверку специалистами NCBI.
Диссертация апробирована на научно-практической конференции кафедры микробиологии и вирусологии ГБОУ ВПО РНИМУ им. Н.И. Пирогова Минздрава России, протокол №12 от 24.06.2015 г. Основные результаты диссертационной работы представлены, доложены и обсуждены на VIII Международной Пироговской научной медицинской конференции студентов и молодых ученых в Москве, 2013 г. и XXI Международной научной конференции студентов, аспирантов и молодых ученых «Ломоносов-2014» в Москве, 2014 г.
Личное участие автора в получении результатов
Автором выполнены все этапы молекулярно-генетических исследований, биоин-форматического анализа полученных данных, статистической обработки и теоретического обобщения полученных результатов. Бактериологическое исследование, а также выделение ДНК проводились совместно с сотрудниками НИЛ микробиологии и биологической безопасности ГБОУ ВПО РНИМУ им. Н. И. Пирогова: старшим научным сотрудником Шкопоровым А. Н. и лаборантом Бржозовским А. Г, а также с сотрудниками лаборатории молекулярной генетики микроорганизмов ФГБУН НИИ ФХМ ФМБА России Парфёновой Т. В. и Ильиной Е. Н.
Основные положения, выносимые на защиту
-
Подвиды longum, infantis и suis вида B. longum являются монофилетическими группами, различимыми при анализе полных геномных последовательностей.
-
Внутривидовой и межвидовой горизонтальный перенос генов вносят значительный вклад в формирование генетического разнообразия представителей вида B. longum на уровне как последовательностей генов, так и общего их набора.
-
Набор генов гликозил-гидролаз в геномных последовательностях B. longum обладает высокой вариабельностью и отражает различные экологические ниши, занимаемые подвидами.
Публикации
Основное содержание диссертации отражено в 5 печатных работах, в том числе, 3 статьи опубликовано в рецензируемых изданиях, 2 – в материалах конференций.
Структура и объем диссертации.
Основной текст диссертации изложен на 123 страницах машинописного текста, состоит из введения, одной главы с обзором литературы, трех глав собственных исследований, обсуждения полученных результатов, выводов, практических рекомендаций, перспективы дальнейшей разработки, списка сокращений и списка литературы. Диссертация иллюстрирована 5 таблицами и 23 рисунками. Список литературы содержит 205 источников, в том числе, 13 - отечественных и 192 – зарубежных.
Концепции сравнительной геномики прокариот
Секвенирование ДНК (англ. «sequencing», от слова «sequence» – «последовательность») – это определение первичной структуры молекулы ДНК, то есть прочтение последовательности азотистых оснований. Эта технология является ключевой в современных биомедицинских исследованиях, а также активно внедряется в клиническую практику. На сегодняшний день разработано множество методов секвенирования ДНК, часто разделяемых на три поколения [135, 196].
Самые первые методы секвенирования ДНК были разработаны в начале 70-х годов XX века [155]. В 1975 году был разработан «плюс-минус метод» основанный на работе ДНК-полимеразы в условиях нехватки тех или иных дезоксирибо-нуклеотидов [156]. Затем в 1977 году был опубликован метод Максама-Гилберта, в основе которого лежало специфическое расщепление ДНК высокоактивными химическими агентами [123]. Чуть позже в том же году группой Сэнгера был представлен метод «обрыва цепи», основанный на включении в нити ДНК ферментом ДНК-полимеразой дидезоксирибонуклеотидов (нуклеотидов с отсутствующей OH-группой в 3 положении молекулы дезоксирибозы), после чего данная нить ДНК не способна достраиваться дальше [157]. Именно метод «обрыва цепи» получил в последующие годы наибольшее распространение, так как он был достаточно простым, эффективным и предоставлял возможность автоматизации.
Перечисленные методы, называемые технологиями секвенирования первого поколения, могут быть объединены некоторыми важными аспектами. Во-первых, читаемый фрагмент ДНК необходимо заранее выделить путем молекулярного клонирования или полимеразной цепной реакции. Затем проводится сама реакция, после чего продукты реакции разделяются в геле под действием электрического поля. Длина прочтения при этом обычно не превышает 1000 пар нуклеотидов даже на современном уровне развития технологий [203]. Таким образом, секвениро-вание полных геномов с помощью методов первого поколения является трудоемким и дорогостоящим процессом.
Методы секвенирования второго поколения в большинстве случаев обозначаются как «Next-Generation Sequencing» (NGS). Первый из них стал доступен для широкого использования в 2005 году [25]. Идея данных методов состоит в одновременном прочтении огромного количества (от сотен тысяч до миллиардов) коротких фрагментов ДНК. Несмотря на разнообразие технологий, возможно выявить ряд общих ключевых принципов [25, 148]. На первом этапе идёт подготовка молекул ДНК для последующего чтения – фрагментация (при необходимости) и прикрепление на концы коротких последовательностей-адапторов. Затем происходит второй этап, клональная амплификация – модификация полимеразной цепной реакции либо другого метода репликации ДНК in vitro, при которой копии каждой отдельной молекулы остаются пространственно разделенными. Для этого она проводится в эмульсии либо на твердом носителе. Третий этап секвенирова-ния – одновременное чтение последовательностей всех получившихся клонов молекул ДНК. В некоторых случаях через реакционную смесь последовательно пропускаются различные дезоксинуклеотидтрифосфаты и регистрируются клоны, в которых происходит присоединение (в платформе 454 за счёт цепи ферментативных реакций высвобождение пирофосфата приводит к хемилюминесценции, в платформе Ion Torrent детектируется локальное изменение pH). В других случаях имеет место «обратимый обрыв цепи» - присоединяемый объект (дезоксинуклео-тидтрифосфат в платформе Illumina либо олигонуклеотид в платформах SOLiD и Complete Genomics) несет на себе флуоресцентную метку и блокатор следующего присоединения, при этом на каждом шаге реакции после считывания флуоресцентного сигнала идёт их отщепление. Заключительным этапом является анализ полученных данных, требующий значительных вычислительных мощностей [148].
Чтение большого числа последовательностей методами секвенирования второго поколения открывает большие возможности – значительно упрощается и удешевляется секвенирование полных геномов, транскриптомов и метагеномов. Однако у методов секвенирования второго поколения есть и свои недостатки. В частности, это очень небольшая длина каждого прочтения, от 50 до 1000 нуклео-тидных пар, что затрудняет практически все применения этой технологии, в частности, сборку геномов из прочтенных фрагментов [77]. Высокая стоимость (хотя и значительно ниже, чем при секвенировании такого же числа последовательностей ДНК методами первого поколения) также пока препятствует повсеместному распространению этих методов [135] .
В данный момент времени активно идёт разработка методов секвенирования ДНК третьего поколения, способных к прочтению единичных молекул. Такая возможность достигается за счёт новых разработок в области реактивов и оптических систем сверхвысокой чувствительности, улавливающих единичные испускаемые фотоны при флюоресценции. В данной группе методов устраняется этап клональной амплификации, что приводит к устранению связанных с ним погрешностей и делает пробоподготовку более простой и быстрой, а также есть возможности увеличения длины прочтения [96]. Соответствующие приборы уже выпускаются (платформа PacBio) но они пока что проигрывают по ряду характеристик аналогам, основанным на методах второго поколения [196]. Чрезвычайно перспективным на сегодняшний день представляется подход с использованием нано-пор. Через них пропускаются одиночные цепи ДНК, и изменение напряжения, ионного или туннелирующего тока сквозь неё будет отражать нуклеотидную последовательность. Нанопоры могут быть сконструированы как из биологических молекул, так и из кремния или других неорганических материалов. При этом не будут требоваться оптические системы или модификации исходной ДНК, и длина прочтений будет теоретически не ограничена. Такие идеи секвенирования ДНК, пока ещё не нашедшие воплощения в практике из-за больших технологических сложностей, иногда называют четвертым поколением методов секвенирования [96, 135].
Выбор штаммов для анализа полных геномных последовательностей
Представители рода Bifidobacterium – это грамположительные, неспорооб-разующие, неподвижные палочки с высоким содержанием GC-пар в геноме, которые в стационарной фазе роста либо при определенных условиях культивирования могут иметь характерную форму с разветвлениями на концах [2, 92, 103]. По современной систематике данный род входит в семейство Bifidobacteriaceae, порядок Bifidobacteriales, подкласс Actinobacteridae, класс Actinobacteria, тип Actinobacteria. Ближайшими родственниками бифидобактерий являются представители родов Scardovia, Parascardovia, Aeroscardovia и Gardnerella [152].
Представители рода Bifidobacterium составляют в среднем около 3% микрофлоры кишечника взрослого человека [146]. Однако существует значительная межпопуляционная и внутрипопуляционная вариабельность данного показателя. Например, по данным масштабного исследования микрофлоры населения России, в одной из популяций процентное содержание бифидобактерий составило в среднем 9,4% и доходило в одном случае до 32,9% [181]. Значительный вклад в вариабельность популяции бифидобактерий кишечника между индивидуумами может вносить генетический фактор, в частности, показано различие количества и состава бифидобактерий у носителей разных генотипов гена фукозилтрансферазы 2 [191]. У грудных детей род Bifidobacterium является численно преобладающим по сравнению с другими бактериями [180], максимум относительной численности бифидобактерий наблюдается в 3 месяца [83]. У детей, находящихся на искусственном вскармливании, количество бифидобактерий в микрофлоре кишечника значительно снижено по сравнению с детьми на грудном вскармливании [55].
Сейчас к роду Bifidobacterium принадлежит более 35 видов, различающихся по фенотипическим и генетическим особенностям и населяющих различные экологические ниши. Из них в состав микрофлоры кишечника человека могут входить: B. adolescentis, B. angulatum, B. breve, B. bifidum, B. catenulatum, B. longum, B. pseudocatenulatum, B. gallicum, B. ruminantium и B. kashiwanohense [5, 91, 124, 131]. Видовой состав бифидобактерий в кишечной микрофлоре обладает значительной внутрипопуляционной изменчивостью, а также меняется в зависимости от возраста. Наиболее численно представленным в микрофлоре детей и взрослых является вид B. longum [4, 13, 120, 179, 180]. В одном из исследований было обнаружено, что значительная часть бифидобактерий в микрофлоре грудных детей представлена бактериями видов B. pseudocatenulatum и B. adolescentis [179], но другие работы не подтверждают этих наблюдений [13, 180], также значительно варьируют представленности видов B. bifidum, B. catenulatum, B. pseudolongum, и B. ruminantium [5, 179]. Причинами таких расхождений могут являться межпопу-ляционные различия и различия в наборе групп, малые выборки, использование описательной статистики без установления значимости различий, а также варьирующиеся методы исследования микрофлоры.
Для метаболизма представителей рода Bifidobacterium характерна специализация на сбраживании широкого разнообразия углеводов, включающего фрукто-олигосахариды, ксило-олигосахариды, пектин, а также муцин; при этом спектр расщепляемых углеводов варьирует как между видами, так и внутри видов [141]. Высокомолекулярные углеводы адгезируется на поверхности клеток бифидобак-терий и расщепляются поверхностными ферментами до олигосахаридов, которые транспортируются внутрь клетки с помощью ABC-транспортеров, пермеаз или H+ симпортеров, и затем расщепляются обширным набором внутриклеточных глико-зил-гидролаз [185]. У Bifidobacterium longum показано явление «обратной диаук-сии»: при наличии лактозы в среде происходит подавление транспорта глюкозы в клетку, что ведет к преимущественному использовании лактозы как источника энергии [137]. В последние годы значительное внимание привлекает путь расщепления -1,3-галактозил-N-ацетилгексозаминов, в ходе которого энергия глико-зидной связи не теряется, а используется для присоединения фосфат-иона с образованием галактозо-1-фосфата [32, 64]. Последующие стадии катаболизма углеводов у бифидобактерий достаточно необычны: расщепление моносахаридов осуществляется с помощью фосфокетолазного пути (также известного как «би-фид-шунт») [190]. В результате его функционирования из углеводов образуются уксусная и молочная кислоты; энергетический выход данного пути метаболизма составляет 2,5 моля АТФ из 1 моля глюкозы, что больше, чем в случае гомофер-ментативного молочнокислого брожениия [124].
Процессы взаимодействия бифидобактерий, входящих в состав интести-нальной микрофлоры, с другими микроорганизмами и клетками человека имеют важное клиническое значение и вследствие этого являются объектом активного изучения. Антагонистическая активность бифидобактерий обеспечивается как неспецифическими механизмами, такими как продукция короткоцепочечных жирных кислот и конкуренция за питательные вещества и сайты прикрепления к кишечному эпителию, так и синтезом бактериоцинов различных классов [117]. В частности, в штамме B. longum DJO10A описано строение и функционирование генетического региона, отвечающего за синтез лантибиотика бизина [101]. Ланти-биотики – это циклические пептиды, содержащие специфические модифицированные аминокислоты: лантионин и метиллантионин. Они характеризуются широким спектром действия, обусловленным высокой консервативностью их мишени: лантибиотики связываются с липидом II, что приводит к образованию пор или деполяризации мембран [176]. В других исследованиях определены аминокислотные последовательности двух бактериоцинов класса IIa из B. bifidum: бифидина I и бифидоцина B; они также реализуют эффект через нарушение целостности бактериальных мембран и показывают широкий спектр активности [36, 199].
Показано, что продуцируемая бифидобактериями уксусная кислота снижает трансэпителиальный транспорт токсина Stx2, повышая выжиываемость мышей при инфекции, вызванной энтерогеморрагическими кишечными палочками [63], а синтезируемая бифидобактериальной линолеатизомеразой конъюгированная ли-нолевая кислота, являющаяся агонистом рецепторов PPAR, обладает противоопухолевым эффектом и нормализует нарушенную толерантность к глюкозе [152]. Значительное внимание уделяется иммуномодулирующим свойтсвам данных бактерий. Представители рода Bifidobacterium способны подавлять синтез провоспалительных цитокинов в условиях in vitro и in vivo [71, 87]. Синтезируемый Bifidobacterium longum белок серпин способен эффективно ингибировать се-риновые протеазы, в том числе нейтрофильную эластазу человека [82]. Колонизирующие кишечник бифидобактерии способны влиять на функционирование нейронов энтеральной нервной системы [88], также описано их опосредованное влияние на центральную нервную систему [24, 44].
В связи с указанными свойствами широко распространено использование бифидобактерий в составе пробиотических препаратов. Значительное число проведенных исследований описывает их безопасность для здоровья человека и эффективность при коррекции ряда патологических состояний. Препараты, содержащие бифидобактерии, способствуют стабилизации микрофлоры недоношенных детей, улучшают моторику кишечника и защищают от диареи, вызванной ротави-русной инфекцией [49, 133]. В ряде исследований на лабораторных животных показано предотвращение развития канцероген-индуцированных опухолей при употреблении данных препаратов [35, 169].
Генный состав штаммов B. longum
Анализируемые данные подтверждают ранее полученную информацию, что последовательность гена 16S рРНК является достаточно информативной для разделения свойственных микрофлоре человека подвидов longum и infantis [120], при этом наиболее информативным участком является регион V6. Однако, добавление в выборку представителей не свойственного человеку подвида suis создает значительные затруднения. В двух из трех геномных последовательностей штаммов данного подвида успешно собраны последовательности гена 16S рРНК: ген штамма LMG 21814T является схожим с 16S подвида longum, а ген штамма JDM301 идентичен с геном, характерным для подвида infantis. Филогенетический анализ подтвердил кластеризацию B. longum subsp. suis JDM301 с B. longum subsp. infantis (Рисунок 7). Данный результат невозможно объяснить филогенетическим шумом, так как случайная замена 7 нуклеотидов, приводящая к полной идентичности между последовательностями, является крайне маловероятным событием.
Филогенетическое дерево последовательностей гена 16S рРНК. Анализ включал полностью собранные гены из исследуемых геномов, а также 5 дополнительных последовательностей из базы данных Genbank. Числа в узлах отображают уровень поддержки, полученный по методу бутстрэппинга. (Б) Последовательности региона V6 гена 16S рРНК. Другим возможным объяснением может быть парафилия B. longum subsp. suis, однако, эта гипотеза противоречит филогенетическому дереву, реконструированному на основе консервативных генов. Вследствие этого наиболее правдоподобным объяснением наблюдаемых данных является внутривидовой горизонтальный перенос гена рибосомальной РНК – редкое, но потенциально возможное событие.
Как было предсказано с помощью VNTR-анализа, штаммы 1-6B и 44B, выделенные от ребенка 1, сформировали тесный кластер, также схожая степень сходства была обнаружена между штаммами 2-2B, 35B и 7-1B, выделенными от ребенка 2. Однако ни одна пара штаммов не была полностью идентичной между собой. В то время как штаммы 2-2B и 35B обладали очень высокой степенью сходства последовательностей консервативных генов (только 6 из 65310 п. н., использованных для выравнивания, отличались), дистанции между остальными штаммами, выделенными из одних и тех же детей в разные моменты времени, были значительно больше. Например, наблюдались значительные отличия между последовательностями генов, кодирующих аспартил-тРНК синтазу (aspS), UDP-N-ацетилмурамоилаланил-D-глутамат 2,6-диаминопимелат лигазу (murE), пролил-тРНК синтазу (proS), аденилосукцинат лиазу (purB) и главную сигма-субъединицу РНК-полимеразы (rpoD), между штаммами 1-6B и 44B, что указывает на события горизонтального переноса генов, произошедшие после расхождения филогенетических линий, ведущим к данным штаммам.
Также было произведено вычисление средней нуклеотидной идентичности (ANI) между всеми парами штаммов B. longum, чтобы осуществить кластеризацию штаммов на основании альтернативного подхода (Рисунок 8). Для измерения данного параметра использовалось программное обеспечение JSpecies [145], воплощающее подход, предложенный Goris и соавторами: геномная последовательность одного из штаммов делилась на фрагменты длиной 1020 п. о., которые подвергались поиску в геноме другого штамма с помощью blastn. Средняя нуклеотидная идентичность между двумя штаммами вычислялась как среднее сходство всех совпадающий фрагментов, которые были сходны более чем на 30% (в пересчете на сходство по всей последовательности) вдоль как минимум 70% длины [68]. Таким образом, для подсчета использовались локусы, измененные мутациями или перенесенные с участием механизма гомологичной рекомбинации, но не других вариантов горизонтального переноса генов.
Примечание: Для каждой пары штаммов значение закодировано цветом, расшифровка представлена на диаграмме в верхнем левом углу. Дерево построено с использованием иерархической кластеризации по методу дальнего соседа. В результате кластеризации по средней нуклеотидной идентичности были получены точно такие же результаты по поводу разделения штаммов на три подвида, и штаммы с высоким сходством по последовательностям консервативных генов также оказались кластеризованными вместе. ANI между двумя штаммами подвида infantis составила 98,28%, средняя ANI между штаммами подвида suis составила 98.35%, и средняя ANI между штаммами подвида longum была 98,89% (98,88% после исключения схожих штаммов 1-6B, 44B, 2-2B, 35B и 7-1B). Был обнаружен любопытный факт, что ANI между подвидами longum и infantis варьировала между 95% и 96% (в среднем 95,66%), рядом с порогом, определяющим отнесение штаммов к одному виду или к разным.
Таким образов, в данной части исследования был проведен анализ видового состава представителей рода Bifidobacterium в кишечной микрофлоре людей различного возраста и внутривидовой филогении B. longum. Было показано, что B. longum является наиболее распространенным видом интестинальных бифидобак-терий независимо от возраста. Также было выявлено, что с возрастом происходит снижение общей концентрации бифидобактерий (p =1,410-7), уменьшается встречаемость видов Bifidobacterium bifidum (p=0,020) и Bifidobacterium breve (p=0,0005), а встречаемость вида Bifidobacterium adolescentis увеличивается (p=0,0003). Геномные последовательности 12 штаммов B. longum были просекве-нированы и собраны до уровня контигов. Также для анализа были выбраны геномы 16 штаммов B. longum из других исследований. Филогенетический анализ показал, что подвиды infantis, longum и suis вида B. longum являются монофилетическими группами, различимыми по последовательностям жизненно важных генов, а также с использованием средней нуклеотидной идентичности. Однако, показана возможность недостоверной идентификации с использованием последовательности гена 16S рРНК. Было выявлено, что внутривидовой горизонтальный перенос генов вносит значительный вклад в формирование последовательностей жизненно важных генов B. longum (p 10-5). Описаны случаи долговременной персистенции близкородственных внутривидовых групп штамов в периоде взросления продолжительностью до десяти лет.
Мобильные генетические элементы и профаги в геномных последовательностях B. longum
Первая из них (обозначаемая в данной работе как №1) , присутствует на ме-гаплазмиде в штаммах 44B, 1-6B и 2-2B. Она имеет необычную структуру, включая в себя один набор генов cas и два локуса CRISPR с последовательностями, отличающимися на один повтор. Правило «спейсеры, ближайшие к генам cas, консервативны, а далекие от них вариабельны» применимо к обоим локусам CRISPR в данной системе – консервативные спейсеры расположены на 3 -конце (если рассматривать направление транскрипции генов cas), что показывает, что оба локуса могут приобретать новые фрагменты чужеродной ДНК. Система №1 содержит гены, кодирующие белки комплекса Cascade, описанные в системах CRISPR-Cas I класса, однако отсутствует консервативный для данного класса ген белка Сas3. Штаммы 44B и 1-6B, выделенные от ребенка 1, обладают идентичным набором спейсеров, что подтверждает высокое родство этих штаммов. Однако, как было выявлено при исследовании последовательностей генома и подтверждено при помощи ПЦР, система №1 присутствует в штамме 2-2B и отсутствует в близкородственных штаммах 35B и 7-1B.
Другие системы CRISPR-Cas бактерий вида B. longum, принадлежат к уже описанным классам, и их белки cas имеют множество близких среди других видов бифидобактерий, а также других представителей типа Actinobacteria. Система №2, относящаяся к широко изученным и широко применяющимся в генной инженерии системам CRISPR-Cas II класса, широко распространена среди B. longum (среди штаммов, исследованных в данной работе, она обнаруживается в штаммах 44B, 35B, 7-1B, DJO10A, 12_1_47BFAA, KACC 91563 и CECT 7347). Локусы CRISPR штаммов 2-2B, 35B и 7-1B, выделенных от ребенка 2, идентичны за исключением одного спейсера (третьего с 3 -конца, отсутствующего в штамме 2-2B). Штаммы 44B и 1-6B также имели одинаковые спейсеры в просеквенирован-ных и собранных регионах CRISPR данной системы, однако, не увенчались успехом попытки получить полноразмерный ПЦР-продукт на матрице ДНК штамма 1-6B. Можно предположить, что целостность данного локуса нарушена в данном штамме. Данная система также повреждена транслокацией 3 -конца локуса в штамме 12_1_47BFAA (также нельзя исключить ошибку при сборке) и инсерцией IS-элемента семейства IS256 в последовательность перед локусом CRISPR в штамме KACC 91563.
Система №3 принадлежит к системам CRISPR-Cas типа Dpsyc. Она была обнаружена только в штамме 17-1B. Система №4 имеет типичную структуру систем CRISPR-Cas I класса. Она присутствует в штаммах BBMN68 и EK3, однако, последовательность повторов в данных бактериях отличается на один нуклеотид. Локус CRISPR в штамме BBMN68 также является поврежденным за счет инсер-ций IS-элементов, принадлежащих к семействам IS21 и IS3.
Большой вклад в защиту бактериальных клеток от плазмид и бактериофагов также вносят системы рестрикции-модификации. Они производят метилирование специфических участков в ДНК бактериальной клетки, и элиминацию молекул ДНК, содержащих неметилированные участки. С использованием поиска против базы данных REBASE и ручной курации результатов было найдено 12 ортологич ных групп предположительных эндонуклеаз в геномных последовательностях штаммов B. longum, при этом в 8 из 12 случаев они были расположены рядом с генами ДНК-метилаз (и генами белков специфичности в случае систем I типа). Ни одной системы рестрикции-модификации не содержалось в кор-геноме вида. Наиболее распространенными являлись одна из систем I типа (BLD_1959 BLD_1962 в штамме DJO10A), гены которой были часто расположены рядом с геном эндонуклеазы рестрикции IV типа Mrr (BLD_1958), а также EcoRII подобная система II типа (BLD_0355 - BLD_0356). Эти две системы присутство вали в 20 и 18 штаммах соответственно. Несколько штаммов также содержали предположительную систему рестрикции III типа (BL171B_01860 BL171B_01865 в штамме 17-1B). Общее число эндонуклеаз рестрикции в геномах B. longum варьировало от 1 до 6 (с медианным значением 3). Штаммы подвида infantis имели только один ген предположительной эндонуклеазы рестрикции (BLIJ_0294 в штамме ATCC 15697T), который содержал сдвиг рамки считывания в штамме ATCC 15697T, но был, по-видимому, неповрежденным в штамме EK3. Кодируемый белок обладал 79% идентичности с эндонуклеазой рестрикции BbrUIIIR из B. breve (Bbr_1118 в штамме UCC2003). Однако регион вокруг данного гена в штаммах B. longum subsp. infantis не содержал ДНК-метилазы, что указывает на то, что этот ген неактивен или сменил свою функцию.
Важной задачей в геномике бифидобактерий является поиск генов, влияющих на основные процессы их взаимодействия с макроорганизмом, а также с другими, в том числе патогенными, микроорганизмами. Исследование распространенности и разнообразия этих генов может иметь большое значение для понимания структуры микробного сообщества толстого кишечника, поиска потенциально пробиотических штаммов, и, возможно, для генетической инженерии с целью усиления пробиотических свойств. Результаты поиска представлены в Таблице 5.
Синтез лантионин-содержащих бактериоцинов (лантибиотиков), известных своим широким спектром активности [101], может играть важную роль в антагонистической активности бифидобактерий против различных патогенов. Кластеры генов синтеза лантибиотиков были ранее описаны в B. longum DJO10A и ATCC 15697T [101, 103], и данное исследование показывает их присутствие ещё в двух штаммах. Так, были отмечены оба подхода к посттрансляционной модификации: в штаммах B. longum subsp. infantis ATCC 15697 и EK3 дегидратация аминокислотных остатков и циклизация пептида могут осуществляться белками LanB и LanC, а в B. longum subsp. longum DJO10A и KACC 91563 эти функции совмещены в одном белке LanM. В силу этого можно предположить, что и конечные продукты синтеза также могут иметь различные структуру и свойства, и нуждаются в отдельном экспериментальном изучении для каждого исследуемого штамма.