Содержание к диссертации
Введение
Глава I. SOS-ответ у гамма-протеобактерий и грам положительных бактерий- 23
Исследование SOS-регулона методами сравнительной геномики 23
Филогенетический анализ днк-полимераз IV и V 24
Характеристика особенностей распространения и регуляции оперона umuDC, кодирующего Pol V
Обсуждение 28
Таблицы и иллюстрации 29
Глава II. Регулоны теплового шока у протеобактерий и грам положительных бактерий - 41
Анализ распространения и структуры регулонов теплового шока Таблицы и иллюстрации 45
Глава III. Регулон SigB; общий стресс в группе Bacillus/Staphylococcus/Listeria. 57
Исследование регулона общего стресса методом сравнительной генетики 57
Сравнение результатов, полученных методом сравнительной 57
геномики, с данными анализа экспрессии на микрочипах Обсуждение 59
Таблицы и иллюстрации 59
Глава IV. Регулоны устойчивости к тяжелым металлам у эубактерий. семейство MerR/COG0789 61
Анализ регулонов семейства MerR/COG0789 65
Обсуждение 71
Таблицы и иллюстрации 73
Выводы 88
Благодарности 90
Список литературы 91
- Исследование SOS-регулона методами сравнительной геномики
- Анализ распространения и структуры регулонов теплового шока Таблицы и иллюстрации
- Исследование регулона общего стресса методом сравнительной генетики
- Анализ регулонов семейства MerR/COG0789
Введение к работе
Одним из важнейших процессов, который обеспечивает многообразие функциональных возможностей живых организмов, является транскрипционная регуляция. Большое количество отсеквенированных и аннотированных в последние годы геномов позволяет эффективно использовать методы компьютерной биологии для предсказания новых и детального изучения уже известных регуляторных систем.
Ключевым моментом транскрипционной регуляции является связывание одного или нескольких транскрипционных факторов со специфическими участками (ДНК-сайтами) в регуляторных областях гена. Как правило, участки связывания одного и того же транскрипционного фактора имеют схожую структуру, при этом несколько различаясь от одного регулируемого гена к другому. Наряду с тем фактом, что в ходе эволюции близкородственные организмы сохранили многие гены и регуляторные механизмы в малоизмененном виде, это дает возможность предсказывать потенциальные регуляторные сайты в новых геномах, а также исследовать механизмы транскрипционной регуляции в уже известных геномах.
Анализ регуляции экспрессии генов является важным разделом компьютерной генетики и системной биологии. Это связано с тем, что, с одной стороны, в настоящее время сравнительно легко осуществляется секвенирование геномов и эксперименты по анализу экспрессии на микрочипах, а с другой - использование этой информации для описания возможного фенотипа встречает трудности, обусловленные отставанием экспериментальной науки от темпов секвенирования.
Несмотря на значительный накопленный материал, многие детали регуляции не ясны до сих пор. В свете того, что экспериментальная проверка гипотез сложна и требует значительного количества времени и ресурсов, представляется целесообразным разработка и использование методов, которые позволяют перенести часть исследований в область комьютерной биологии. Подобные исследования дают возможность определять наиболее перспективные направления для дальнейшей экспериментальной проверки, а в некоторых случаях делать утверждения, практически равносильные результатам биологического эксперимента.
Изучение регуляции ответа на стресс тем более важно, что позволит координировать микробиологические исследования в области поиска новых антибактериальных агентов и техник дезинфекции. Изменчивость и лабильность бактериального генома позволяет патогенным организмам быстро приспосабливаться к уже разработанным антибиотикам и техникам дезинфекции, и исследования в этой области сохраняют актуальность в течение всего периода развития микробиологии и медицины. В частности, рассмотренные в данной работе регуляторные каскады общего стресса в группе Bacillus показывают связь нескольких бактериальных стрессовых регулонов с множественной лекарственной устойчивостью.
Быстрое развитие методов индустриальной биоинженерии также требует всестороннего изучения изменения клеточных процессов в необычных для клетки условиях биотехнологического процесса. Новое направление в микробиологии ставит своей задачей разработать методики восстановления окружающей среды от загрязнений ионами тяжелых металлов и других биологически опасных веществ. Изучение микроорганизмов, способных осаждать соли тяжелых металлов из раствора, является одной из ключевых задач в этой области.
Исследование SOS-регулона методами сравнительной геномики
МПВ (матрица позиционных весов) строилась по экспериментально подтвержденным сайтам перед генами lexA, гесА, recN и ruvAB Е. соИ. Был выбран порог 3.75, так как таким весом обладал наихудший сайт из обучающей выборки. Рабочая выборка в Е. coli при данном пороге составляет 134 генов.
Построение МПВ для сайтов связывания DinR
Матрица позиционных весов строилась по экспериментально показанным сайтам, взятым из (Yasbin, 1991). Матрица представлена в Таблице 1, а на рисунке графически отображена значимость позиций в сигнале. Рабочая выборка для В. sublilis составляла 142 гена.
Анализ распространения и структуры SOS-регулонов
Методами сравнительной геномики было выявлено консервативное ядро регулона в гамма-протеобактериях (гены lexA, гесА, recN) и предположены возможные составы регулона в родственных E.coli геномах, в частности, в Salmonella lyphimurium, Yersinia pestis, Pseudomonas aeruginosae, родах Haemophilus и Xylella. Было описано распространение оперона umuDC (mucAB) в геномах гамма-протеобактерий и феномен сопряжения оперона umuDC с плазмидами.
Распространение ключевых генов SOS-ответа в гамма-протеобактериях и Грам-положительных бактериях
Был проведен анализ представленности генов, кодирующих ключевые белки системы в геномах группы гамма-протеобактерий и Грам-положительных бактерий.
Гены recA, recN, ruvAB и dinP были встречены во всех изученных геномах, кроме того, практически во всех геномах встречены гены uvr-системы и тисАВ. Практически везде, где эти гены были найдены, в их 5 -некодирующей области был обнаружен потенциальный сайт связывания LexA, однако, абсолютно консервативным ядром регулона все же являются только гены ІехА и гесА (Таблица 5).
Для нескольких таксономических групп гамма-протеобактерий {Enterobacteriaceae, Vibrionales, Alteromonadales, Pasterellaceae) были изучены таксон-специфические особенности организации SOS-регулона. Были показаны такие таксон-специфические черты, как консервативность потенциального сигнала в 5 -некодирующих областях ортологов otsB, sbmC, yfiK, yg/ F, и ydjM в группе Vibrionales, консервативность регуляции гена topB в группе Alteromonadales (Таблицы 6, 7, %).
В группе Грам-положительных бактерий также были охарактеризованы потенциальные регулоны ответа на повреждение ДНК. Так как регуляторная последовательность, с которой связывается регулятор DinR (ортолог LexA в В, subtulis), отличается от SOS-бокса Е. coli, для Грам-положительных бактерий была построена своя матрица позиционных весов на основе выборки экспериментальных сайтов из В. subtilis. Консервативное ядро регулона DinR в группе Bacillus представлено генами dinR, recA, uvrB. В В. subtilis также найдены потенциальные сайты связывания перед dinB, tagC, и в локусах, содержащих гомологи uvrX.
Анализ распространения и структуры регулонов теплового шока Таблицы и иллюстрации
Геномы A. xylosoxidans и В. pertussis, в которых были встречены потенциальные сайты CIRCE-перед генами гроН, принадлежат к одной подгруппе р-протеобактерий, Alcaligenaceae; N europaea является представителем подгруппы аммоний-окисляющих бактерий; R. eutropha, В. pseudomallei и В. cepacia принадлежат к подруппе Burkholderia/Oxalobacter/Ralstonia; Methylovorus sp и М. flagellatus относятся к подгруппе Methylophillus; Neisseriaceae также составляют отдельную подгруппу. Отсутствие системы HrcA/CIRCE отличает группу Neisseriaceae от других Р-протеобактерий. В данном исследовании регуляция гена гроН системой CIRCE кореллирует с таксономией. Однако, два близкородственных организма, В. cepacia и В. pseudomallei в этом отношении отличаются. В геноме В. pseudomallei, ген гроН имеет потенциальный сайт CIRCE, тогда как в геноме В. cepacia элемента CIRCE в 5 -некодирующей области гроН нет (Таблицы 18 и 19).
В случаях В. pertussis, В. parapertussis и М. flagellatus, содержащих потенциальный промотор ст2 перед геном hrcA (Таблица 18), возникает возможность предсказать обратную связи, так как позитивный и негативный регуляторы регулируют друг друга. Общая схема регуляции генов теплового стресса в р-протеобактериях показана на Рис 13. На ней также отображены экспериментально показанные и предполагаемые белок-белковые взаимодействия: взаимодействие шаперонов с а и HrcA, а также протеаз (HflB) с a . Сам факт, что потенциальный CIRCE-элемент найден перед генами гроН в геномах разных Р-проте о бактерий, представляется тем более значительным, что изначально предполагалось, что HrcA/CIRCE регулирует только шапероны, (регуляция протеаз была предсказана позже - в работах (Narberhaus, 1999) и (Gelfand, 1999) были показаны потенциальные элементы CIRCE перед генами dp и Ion в геномах Mycoplasmas, Spiroplasma kinkelii, и Lactobacillus gassed). В данной работе приведены также потенциальные сайты перед генами протеаз и геном, кодирующим шаперон HtpG). Известные механизмы регуляции гроН - это авторегуляция, как в геноме С. crescentus (Reisenauer, 1996), и регуляция при помощи другого сигма-фактора, с24 в Е. coli (Gross, 1996). Единственная известная на момент исследования система транскрипционной регуляции hrcA — это система авторегуляции, как в Грам-положительных бактериях {Bacillus subtilis, Narberhaus, 1999; Gelfand, 1999).
Хотя потенциальный сайт CIRCE перед геном гроН для некоторых р-протеобактерий был отмечен в обзоре (Narberhaus, 1999), эти случаи не были изучены систематически. Таким образом, регуляторная петля о32-НгсА представляется нам новым механизмом регуляции генов теплового шока.
Другим новым результатом этого исследования является идентификация двух семейств тиоредоксин-подобных белков, у гамма-протео бактерий iybbN) и р-протеобактерий (trxA). Оба они регулируются а32 (кроме ybbN из X. fastidiosa, перед которым найден CIRCE-элемент). Тиоредоксины могут играть важную роль в поддержании окислительно-восстановительного баланса в клетке при стрессовых условиях (Arrigo и др., 1999; Guzzo и др., 2000; Jobin и др., 1999). Поддержание правильной конформации белков, имеющих цистеиновые мостики, также может объяснять повышение уровня экспрессии тиоредоксинов при тепловом шоке.
Анализ регулонов семейства MerR/COG0789
Поскольку регулоны семейства MerR очень невелики, при поиске потенциальных сайтов связывания регулятора было важно учесть сложную структуру этих сайтов и соблюдать оба условия: наличие соответствующего палиндрома и промотора с заданным субоптимальным спейсером. МПВ для палиндромов были построены с использованием сайтов, взятых из (Brown, 2003), матрица для промотора была построена с использованием выборки промоторов из базы DPInteract (Таблица 25 - сайты связывания регуляторов MerR-семейства, Таблицы 26-33 - матрицы позиционных весов для сайтов связывания MerR, CueR, HmrR, CadR, PbrR и ZntR, Таблица 34 - МПВ для промоторов). На момент исследования нам было известно семь экспериментально подтвержденных сайтов связывания CueR, HmrR, CadR and ZntR (по два сайта на регулятор, кроме ZntR, для которого был известен только один сайт) (Brown и др., 2003, Brocklehurst и др., 2003).
Несмотря на небольшое количество сайтов в обучающей выборке, полученные в результате распознающие правила были достаточно избирательными. Поскольку на требование встречаемости апалиндрома было наложено требование правильного расположения внутри промоторного спейсера соответствующей длины, вероятность перепредсказания была значительно снижена. Например, в геноме N. еигораеа было найдено всего три палиндрома со значительным весом, и только палиндром, найденный в З -некодирующей области гена тегТ, был расположен в спейсере подходящего промотора. Нами не было встречено случаев, когда комбинация палиндром+промотор была встречена в З -некодирующей области гена с функцией, очевидно не связанной с устойчивостью к тяжелым металлам.
Почти все рассмотренные локусы из семейства MerR/COG0789 содержали потенциальные сайты связывания типа палиндром+промотор. (Таблицы 35-40).
Анализ регулонов семейства MerR/COG0789
При помощи программы BLAST были найдены и описаны все секвенированные на момент исследования локусы, содержащие регуляторы семейства MerR (503 локуса). Из них были отобраны те, у которых были обнаружены консервативные цистеины в по крайней мере двух из трех позиций, ответственных за связывание с ионом металла (Рис. 15). Было построено филогенетическое дерево регуляторов (Рис 16). На дереве ясно различаются ветви регуляторов CadR, ZntR, CueR, HmrR, и MerR. Несколько ветвей содержат только регуляторы с неизвестной специфичностью. Регуляторы CueR кластеризуются на дереве с HmrR, a PbrR (YP_145623) лежит на одной ветви с CadR. Ветвь регуляторов MerR делится на две подветки: белки из Грам-положительных бактерий и из протеобактерий.
По результатам анализа филогенетического дерева и описанных сайтов связывания был сделан вывод об ортологичности регуляторов в парах CueR-HmrR и CadR-PbrR. (Рис 17 и 19).
В спорных случаях потенциальная специфичность регулятора, определялась, исходя из его позиции на дереве и наличия в его З -некодирующей области соответствующего специфичного палиндромного сайта внутри промоторного спейсера.