Содержание к диссертации
Введение
2. Обзор литературы 11
2.1. Особенности строения бактериальной РНК-полимеразы и образования транскрипционного комплекса 11
2.2. Этапы инициации транскрипции 14
2.3. Белковые факторы регуляции транскрипции и их комбинации как инструмент индивидуального и генерализованного контроля экспрессии генов 18
2.4. Белки нуклеоида как глобальные регуляторы транскрипции 25
2.5. Катионные пептиды – связывание с ДНК и антибактериальная активность 30
2.6. Роль альтернативных сигма-факторов и малых РНК в транскрипции 32
2.7. Особенности организации и регуляции экспрессии оперона oppABCDF ABC транспортера олигопептидов E. coli 35
3. Материалы и методы 40
3.1. Компьютерные программы и алгоритмы 40
3.2. Анализ генетической организации генов oppA, oppB, oppC оперона oppABCDF 41
3.3. Бактериальные штаммы и условия культивирования 41
3.4. Используемые праймеры 42
3.5. Выделение тотальной клеточной РНК 44
3.6. Синтез кДНК 44
3.7. Количественная ОТ-ПЦР в реальном времени 45
3.8. Фракционирование и очистка фрагментов ДНК 45
3.9. Мечение праймеров и фрагментов ДНК 45
3.10. Локализация неспаренных тиминов в области локального плавления ДНК в транскрипционных комплексах 46
3.11. Определение нуклеотидной последовательности фрагментов ДНК по Максаму-Гилберту 47
3.12. Локализация сайтов взаимодействия белка нуклеоида H-NS с исследуемыми участками генома 48
3.13. Определение транскрипционной активности промоторов in vitro 49
3.14. Клонирование промотор-содержащих фрагментов в вектор pET28b-EGFP (создание конструкции трансляционного слияния) 49
3.15. Электрофоретическое разделение белков в денатурирующих условиях 50
3.16. Суперпродукция белка H-NS в клетках E. coli 51
3.17. Очистка рекомбинантного белка H-NS 51
3.18. Индукция полноразмерного и укороченного белка OppB 52
3.19. Сайт-направленный мутагенез в плазмиде 53
3.20. Western-Blot 53
3.21. Задержка комплексов фрагментов ДНК с очищенным белком H-NS в ПААГ 54
4. Результаты и их обсуждение 55
4.1. Исследование структурно-функциональной организации регуляторной области гена oppB оперона oppABCDF 55
4.2. Оценка функциональной активности предсказанных промоторов in vitro и in vivo 60
4.3. Характеристика стартов транскрипции для oppC 65
4.4. Влияние регуляторных белков H-NS и Dps на экспрессию генов оперона oppABCDF 68
4.5. Синтез OppB под контролем собственной регуляторной области. Возможность образования укороченной с N-конца изоформы OppB 79
4.6. Функциональность аннотированного инициирующего кодона oppB. Мутационный анализ 86
Заключение 90
Выводы 92
Список публикаций по теме диссертации 93
Список литературы 95
Приложение 113
- Особенности строения бактериальной РНК-полимеразы и образования транскрипционного комплекса
- Особенности организации и регуляции экспрессии оперона oppABCDF ABC транспортера олигопептидов E. coli
- Исследование структурно-функциональной организации регуляторной области гена oppB оперона oppABCDF
- Функциональность аннотированного инициирующего кодона oppB. Мутационный анализ
Особенности строения бактериальной РНК-полимеразы и образования транскрипционного комплекса
Транскрипция является первым этапом экспрессии генов, следовательно, одним из самых фундаментальных процессов, свойственных живым системам. Для всех трех отделов: эукариот, архей и прокариот транскрипция генов осуществляется с помощью сложной, многофункциональной молекулярной машины — многосубъединичной РНК-полимеразы (РНКП) [Haugen et al., 2008; Werner, Grohmann, 2011; Alhadid et al., 2017]. В процессе транскрипции РНКП способна осуществлять несколько различных реакций: синтез РНК, а также экзо- и эндонуклеазное расщепление РНК-транскрипта [Пупов, Кульбачинский, 2010]. Общая структура бактериальной РНКП [Murakami et al., 2002a; Vassylyev et al., 2002, 2007] напоминает «клешню краба», и аналогична РНКП архей и эукариот [Hirata et al., 2008; Murakami, 2013; Borukhov, Nudler, 2008; Lee, Borukhov, 2016].
Прокариотическая РНКП представляет собой комплекс из пяти постоянных субъединиц (2 ) с общей молекулярной массой около 400 кДа и вариабельного -фактора [Ghosh et al., 2010; Glyde et al., 2017; Werner, Grohman, 2011].
Субъединицы и `( 150 и 155 кДа, E. coli) образуют главный канал РНКП, в котором происходит связывание ДНК и РНК в процессе транскрипции. Две -субъединицы (37 кДа) располагаются со стороны фермента, противоположной главному каналу. Каждая -субъединица состоит из двух доменов: N-терминального домена 26 кДа (-NTD), который отвечает за сборку больших субъединиц и ` и C-концевого домена 9 кДа (-CTD), который может взаимодействовать с различными активаторами транскрипции и с промоторными участками ДНК [Ozoline et al., 2001; Haugen et al., 2008; Ruff et al., 2015; Feng et al., 2016; Gruber, Gross, 2003; Ghosh et al, 2010].
Внутри главного канала находится активный центр фермента, содержащий два иона Mg2+, которые необходимы для осуществления ферментативной реакции. С противоположной стороны от главного канала расположен вторичный канал, который соединяется с главным в области активного центра. Вторичный канал является местом связывания многих регуляторных факторов и, возможно, основным путем поступления нуклеотидов в активный центр РНКП [Пупов, Кульбачинский, 2010; Werner, Grohman, 2011].
РНКП бактерий содержит все структурные элементы, способные распознавать и селективно связывать последовательности ДНК, называемые промоторами и расположенные перед кодирующими областями генов. Для инициации транскрипции необходима одна из специфических -субъединиц, которая вместе с кор-ферментом образует функциональный холофермент РНКП (E) и распознает "сигнальные" элементы в промоторной последовательности ДНК, с которыми образует специфические контакты [Borukhov, Nudler, 2008; Paget, Helmann, 2003]. Модули 70 РНКП ( 4.2, 3.0 и 2.2-2.4) взаимодействуют с консервативными "сигнальными" элементами, расположенными относительно стартовой точки в положениях –35, в «расширенной» области –10 и –10. Исторически первым был обнаружен элемент –10 с экспериментально подтвержденной консенсусной последовательностью из 6 нуклеотидов TATAAT, расположенных на расстоянии 2-11 нп слева от стартовой точки транскрипции. Согласно биохимическим и структурным исследованиям, элемент –10 распознается консервативной областью 2.4 -субъединицы [Северинов, 2007; Murakami, Darst, 2003].
Второй консенсусный элемент –35 соответствует последовательности TTGACA и расположен на расстоянии 14-21 нп от элемента –10 [Hawley, McClure, 1983]. По данным генетических и биохимических исследований, этот элемент связывается с областью -субъединицы 4.2 [Campbell et al., 2002; Северинов, 2007].
Для формирования промоторного комплекса важно, чтобы элементы –35 и –10 находились на определенном расстоянии друг от друга. Расстояние между данными областями влияет на активность промотора (с точки зрения кинетики инициации транскрипции и структуры открытого комплекса) и узнавание промоторных элементов –35 и –10. Консенсусная последовательность спейсера для большинства промоторов отсутствует, но оптимальная длина между элементами –35 и –10 составляет 16-18 нп и определяется расстоянием между доменами -субъединицы 4.2 и 2.3 [Murakami et al., 2002a]. Наиболее распространенная длина спейсера для 70-зависимых промоторов составляет 17 нп [Mitchell et al., 2003; Shimada et al, 2017] (рис.1)
В отличие от элемента –10, элемент –35 вносит менее существенный вклад в активность промотора. Например, galP1 является сильным промотором, несмотря на отсутствие функционального элемента –35. Эффективность образования комплекса с РНКП в этом случае зависит от дополнительного мотива TGn (где n - любое основание), непосредственно примыкающего к элементу –10 [Minakhin, Severinov, 2003]. Такие промоторы известны как промоторы с «расширенным» –10-элементом, который может взаимодействовать со специализированной областью 70, а именно областью 2.3.
Еще один дополнительный элемент, играющий определенную роль в полимераза-промоторном узнавании, был описан А.В. Кульбачинским с соавторами [Feklistov et al., 2006]. На некодирующей нити ДНК ниже элемента –10 был обнаружен мотив GGGA. Взаимодействие с данным мотивом области 1.2 -субъединицы позволяет РНКП Thermus aquaticus формировать транскрипционно активный комплекс на промоторе dnaK в отсутствие –35-элемента. Участие мотивов TGn и GGGA в образовании промоторного комплекса опосредовано разными механизмами: мотив TGn способствует инициированию плавления ДНК во время образования открытого промоторного комплекса, в то время как GGGA элемент стабилизирует открытый комплекс после его формирования [Северинов, 2007].
Не менее важную роль в полимераза-промоторном узнавании играет область дискриминатора (DSR) [Travers, 1980; Haugen et al., 2006]. Дискриминатор характерен для промоторов, у которых отсутствует «расширенный» –10-элемент, а также для промоторов, активность которых фазы роста и концентрации питательных веществ. Консенусная последовательность дискриминатора состоит из GC-пар (GCGC). Область DSR расположена ниже –10-элемента и взаимодействует с областью 1.2 -субъединицы. Согласно последним данным DSR может влиять на выбор стартовой точки транскрипции [Winkelman et al., 2016].
Помимо базовых элементов (–10-элемент, расширенный –10-элемент, –35-элемент, дискриминатор) некоторые промоторы содержат дополнительные элементы, которые при определенных условиях могут стимулировать инициацию транскрипции. Например, UP-элементы были впервые обнаружены как дополнительные элементы промотора, необходимые для максимальной экспрессии гена рибосомальной РНК (rrn) [Estrem et al, 1998]. UP-элемент состоит из A/T-богатой последовательности и расположен на расстоянии 40-60 нп выше стартовой точки транскрипции. С ним взаимодействуют C-терминальные домены -субъединиц РНКП (-CTD) [Gourse et al., 2000].
На некоторых промоторах -CTD, связанная с малой бороздкой ДНК вблизи позиции –41, непосредственно взаимодействует с доменом 4.2 -субъединицы РНКП [Lee et al., 2012]. Регуляторные белки оказывают существенное влияние на конформацию комплекса ДНК:РНКП. Большинство из них также связываются в области UP-элемента и изгибают двойную спираль, способствуя или, наоборот, препятствуя взаимодействию промотора с РНКП [Craig et al., 1995; Rivetti et al., 1999]. Согласно последним данным, основанным на анализе кристаллической структуры, в образовании открытого комплекса, немаловажную роль играет "core recognition element" (CRE), с которым взаимодействует -субъединица РНКП в области от -4 до +2 нп от стартовой точки по кодирующей нити ДНК [Zhang et al., 2012]. CRE может определять выбор стартовой точки и явление «проскальзывания» транскрипции при инициации синтеза РНК [Vvedenskaya et al., 2016; Winkelman et al., 2016], а также влиять на этапы транскрипции, например, абортивный синтез, покидание промотора и переход в стадию элонгации транскрипта.
Таким образом, промоторная область ДНК является базой для инициации транскрипции, имеет сложную структурную организацию и достаточно вариабельна по своей нуклеотидной последовательности. Для оптимального функционирования промотора важны как консервативные последовательности, так и дополнительные элементы, необходимые для образования промоторного комплекса.
Особенности организации и регуляции экспрессии оперона oppABCDF ABC транспортера олигопептидов E. coli
ABC-транспортеры являются АТФ-зависимыми транспортными системами, которые встречаются во всех царствах живых организмов, от архей и бактерий до высших эукариот. Функциональная роль ABC-транспортеров разнообразна, т.к. они участвуют в транспорте различных соединений как внутрь клетки, так и наружу. У микроорганизмов аналогичными транспортными системами опосредован импорт сахаров и аминокислот [Gilson et al., 1982], неорганических катионов [Navarro et al., 1993], витаминов [Koster, 2001]. CydDC транспортер E. coli экспортирует цистеин и глутатион [Cruz-Ramos et al., 2004]. Поступление в бактериальную клетку соединений и поддержание сбалансированного метаболизма с участием АВС-транспортеров во многом обуславливает значение этих систем для патогенности микроорганизмов и множественной лекарственной устойчивости [Henderson, Payne, 1994; Zheng et al., 2018]. Так, например, оперон drrAB отвечает за устойчивость бактерии Streptomyces peucetius к антибиотикам, синтезируемым самой же бактерией [Gandlur et al., 2004].
В эукариотической клетке АВС-транспортеры также вовлечены в формирование лекарственной устойчивости к действию противоопухолевых препаратов, а нарушения в их функционировании ассоциированы с генетическими заболеваниями [Choi et al., 2014].
Каноническая архитектура ABC-транспортеров представлена двумя трансмембранными (TMD) и двумя нуклеотид-связывающими доменами (NBD) [Pearce et al., 1992] (рис. 7, 8). Трансмембранные домены образуют транспортный канал и состоят из нескольких мембранных альфа-спиралей, количество которых может различаться в зависимости от вида ABC-транспортера. Нуклеотид-связывающие домены являются высококонсервативными белками, и характеризуются присутствием мотивов Уокера А и В, которые были найдены во всех АТФ-связывающих белках, входящих в состав АВС-транспортеров [ter Beek et al., 2014].
Одной из важных групп суперсемейства АВС-транспортеров у микроорганизмов являются две системы, специализированые на транспорте олигопептидов, гены которых экспрессируются в составе оперонов dppABCDF и oppABCDF. Функционирование этих транспортных систем, которые лучше всего были охарактеризованы у E. coli и Salmonella typhimurium, может обеспечивать как импорт, так и экспорт пептидов в клетку и из клетки. Так, благодаря работе транспортера OppABCDF в бактериальную клетку поступают олигопептиды в качестве источников азота и углерода, помимо этого транспортер вносит вклад в чувствительность микроорганизмов к антибиотикам и в патогенность [Andrews et al., 1986]. Экспериментально с помощью методов in vitro на примере молочнокислой бактерии Lactococcus lactis было продемонстрировано, что OppABCD связывает и транспортирует пептиды длиной от 5 до 35 аминокислот [Doeven et al., 2004]. Однако у Helicobacter pylori, для которой характерно наличие как DppABCD-, так и OppABCDF-систем, транспортер OppABCDF более избирателен к тетрапептидам, а DppABCD демонстрирует способность транспортировать в клетку олигопептиды длиной шесть и более аминокислот [Weinberg, Maier, 2007].
Для мультисубъединичного транспортера Opp характерна общая структурная организация семейства ABC-траспортеров, где OppA – периплазматический субстрат связывающий белок, OppD и OppF – АТФ-связывающие компоненты, OppB и OppC – высокогидрофобные трансмембранные белки, состоящие из шести доменов и 5 петель, пересекающих цитоплазматическую мембрану (три периплазматические и две цитоплазматические петли) (рис. 9) [Pearce et al., 1992; Higgins et al., 1983; Higgins, 1990; Bishop et al., 1989; Mimmack et al., 1989; Gallagner et al., 1989; Hyde et al., 1990]. Для белков OppB и OppC, а также других трансмембранных компонентов ABC-транспортеров, N- и C-концы обращены в цитоплазму клетки.
По современной классификации мембранных транспортных систем оперон oppABCDF и его ортологи относятся к семейству PepT 3.A.1.5 (Peptide/Opine/Nickel Uptake Transporter) [Saier et al., 2014]. Ортологи генов данного олигопептидного транспортера представлены как у грамположительных, так и у грамотрицательных бактерий, что говорит, вероятно, о раннем эволюционном происхождении олигопептид-транспортирующих систем и их важном значении в физиологии бактериальной клетки. Поэтому для генов, кодирующих компоненты олигопептид-пермеаз, можно предполагать наличие консервативного порядка расположения на хромосоме. Действительно, в большинстве случаев для оперона характерно последовательное расположение генов: oppAoppBoppCoppDoppF. Тем не менее, у грамположительных микроорганизмов, в том числе у стафилококков, были обнаружены множественные вариации в порядке расположения генов, возникающие при дупликации оперона oppABCDF в геноме [Yu et al., 2014]. Также возможна дупликация только первого гена оперона — oppA, что приводит к образованию нескольких паралогов, как это показано для Borrelia burgdorferi [Medrano et al., 2007] и Pseudomonas aeruginosa [Pletzer et al., 2014], хотя гены трансмембранных и АТФ-связывающих белков представлены у этих микроорганизмов единичными копиями. В геноме бактерии Moraxella catarrhalis консервативный порядок генов ABCDF инвертируется в BCDFA [Jones, Murphy, 2015], а у Clostridium difficile порядок генов транспортера начинается с oppB, тогда как oppA расположен между oppBC и oppDF [Edwards et al., 2014].
Можно ожидать, что оперон oppABCDF E. coli, для которого характерна последовательность генов A-B-C-D-F, транскрибируется в виде единой полицистронной мРНК. Однако на основании компьютерных предсказаний стартовых точек и результатов картирования 5 -концов РНК в базе данных RegulonDB (http://regulondb.ccg.unam.mx) на участке oppA-oppB указаны множественные старты инициации транскрипции, включающие 5 кластеров близкорасположенных точек, 5 одиночных стартов для РНК-полимеразы с неизвестным сигма-фактором и одиночный промотор, узнаваемый 28-РНК-полимеразой [Santos-Zavaleta et al., 2019]. На уровне транскрипции оперон oppABCDF регулируется двумя репрессорами (глобальными регуляторами) Fur-Fe2+ и Lrp [Fraenkel et al., 1995; Chen et al., 2007], в то время как малая регуляторная РНК GcvB влияет на биосинтез белка [Urbanowski et al., 2000; Sharma et al., 2007]. В 3 -нетранслируемой области гена oppA предсказывается Rho-независимый терминатор транскрипции, который может останавливать синтез РНК, начатый на промоторе, расположенном перед геном oppA (RegulonDB).
Если исходить из того, что мРНК для синтеза компонентов олигопептид-транспортера OppABCDF синтезируется как единый полицистронный траскрипт, то следует ожидать эквимолярного присутствия матриц для всех пяти генов оперона и синтеза сравнимых количеств соответствующих белков. Однако известно, что синтез сенсорного белка OppA может составлять до 80% тотального белка периплазмы [Hiles, Higgins, 1986], тогда как трансмембранные субъединицы присутствуют в следовых количествах и могут быть обнаружены только с использованием иммуноблоттинга [Hiles et al., 1987]. Современные данные масс-спектрометрического анализа тотального протеома E. coli и фракции мембранных белков в сопоставлении с уровнем синтеза РНК для индивидуальных генов транспортера указывают на наличие сильной диспропорции в представленности периплазматического белка OppA и остальных компонентов. Так, в клеточном лизате индексы представленности белков (emPAI) для OppA, OppB и OppC составляли соответственно 11,12; 2,73 и 0,58, что коррелирует с уровнем экспрессии мРНК (13,15; 3,28 и 0,58 условных единиц) [Masuda et al., 2009]. Эти факты позволяют предполагать, что, несмотря на сгуппированность в составе единого оперона, гены мембранных и АТФ-гидролизующих субъединиц транспортера могут экспрессироваться независимо от первого гена оперона и контролироваться другими регуляторными механизмами. Основанием для такого предположения является наличие межгенной области oppA-oppB длиной 85 нп, достаточной для размещения промоторного участка. Соответственно, анализ транскрипционного потенциала генетического локуса, содержащего межгенный участок oppA-oppB и кодирующую область oppB в связи с изучением регуляции синтеза мембранного белка OppB и составил основное содержание данной работы.
Исследование структурно-функциональной организации регуляторной области гена oppB оперона oppABCDF
В результате сканирования нуклеотидной последовательности генома E. coli с целью обнаружения потенциальных точек инициации транскрипции с помощью алгоритма PlatPromU [Киселев, Озолинь, 2011; Панюков и др., 2013], учитывающего структурные особенности бактериальных промоторов, но игнорирующего контекст элементов –35 и –10, был предсказан набор стартовых точек транскрипции в межгенной области oppA-oppB оперона oppABCDF E. coli и в ранней кодирующей части гена oppB. Наиболее высокие показатели подобия идеальному промотору имеют старты в позиции –64 на кодирующей нити и два старта для антисмысловых РНК в позициях –35 и +6 относительно стартового кодона oppB (рис. 11А). То есть, в рассматриваемом участке возможно наличие промотора, способного вносить дополнительный вклад в экспрессию генов oppBCDF и промоторов для антисмысловых РНК с потенциальной регуляторной функцией. В свою очередь алгоритм PlatProm, адаптированный для поиска промоторов, распознаваемых 70-РНК-полимеразой в геноме кишечной палочки, не находит потенциальных стартов транскрипции на кодирующей нити между генами oppA и oppB (рис. 11Б) [Shavkunov et al., 2009].
Тем не менее, в начале гена oppB PlatProm предсказывает стартовые точки транскрипции в положениях +64, +87 относительно стартового кодона oppB (рис. 11Б). Полученные данные свидетельствуют о возможности синтеза РНК как из межгенной области oppA-oppB, так и из кодирующей части гена oppB.
Обращает на себя внимание, что гены oppA и oppB разделяет достаточно протяженная межгенная область (86 нп). Более того, в RegulonDB в конце гена oppA и в межгенном участке аннотированы терминаторные (аттеньюаторные) последовательности, содержащие инвертированные повторы. Следовательно, не исключена возможность терминации синтеза мРНК, инициированной перед первым геном оперона, oppA, и транскрипции гена oppB под контролем собственного промотора, локализованного между генами oppA и oppB. Для того чтобы проверить, насколько такая организация оперона, допускающая независимую регуляцию экспрессии второго и последующих генов, распространена у бактерий, был проведен сравнительный анализ относительного расположения генов oppA-oppB и oppB-oppC оперона oppABCDF для 60 видов бактерий (приложение 1), относящихся к разным родам. Оказалось, что в паре oppA-oppB гены дистанцированы друг от друга на расстояние в среднем 75 нп (рис. 12), хотя в ряде случаев длина данного участка составляет более 100 нп (тёмные столбики на рис. 12). В то же время для всех рассмотренных геномов бактерий гены oppB и oppC располагаются ближе друг к другу или перекрываются, что соответствует отрицательным расстояниям на рис. 12 (светлые столбики).
Наличие протяженного интервала между oppA и oppB достаточно для размещения промотора, обеспечивающего экспрессию oppB. Известно, что РНК-полимераза при связывании с промоторной областью ДНК, как правило, защищает от действия ДНК-гидролизующих агентов участок, расположенный между позициями –65+20 относительно стартовой точки транскрипции [Ozoline, Tsyganov, 1995]. Данные сравнительного анализа оперона oppABCDF указывают на эволюционно закрепленную схему его генетической организации, предусматривающую возможность асинхронной экспрессии первого гена, кодирующего периплазматический сенсорный белок транспортера, и последующих генов трансмембранных и внутриклеточных субъединиц.
Для 13 геномов с аналогичным порядком расположения генов в опероне, у которых некодирующий участок между oppA и oppB составляет 70–350 нп (выделены жирным шрифтом в приложении 1) с помощью алгоритма PlatPromU были предсказаны потенциальные промоторы (рис. 13А–М). Так, у близкородственных к E. сoli энтеробактерий Sh. flexneri (рис. 13B) и Y. pseudotuberculosis (рис. 13I), так же как у S. enterica (рис. 13D), в межгенной области oppA-oppB обнаружено схожее распределение сигналов инициации смысловой и антисмысловой транскрипции.
Промоторы для синтеза смысловой и антисмысловой РНК также были идентифицированы в межгенной области oppA-oppB у Chl. felis (рис. 13E), B. subtilis (рис. 13F) и P. acnes (рис. 13G), которые относятся к разным семействам. Тем не менее, у C. glutamicum (рис. 13H), C. pseudotuberculosis (рис. 13I) и G. thermodenitrificans (рис. 13J), транскрипция в направлении oppB не перекрывается с синтезом потенциального антисмыслового продукта, а у Cl. botulinum (рис. 13K) и Rh. etli (рис. 13L) есть потенциальные промоторы только для одного направления. При этом у Bifidobacterium dentium (B. dentium) (рис. 13M) в межгенном участке была выявлена область с высокой плотностью распределения промотор-подобных сигналов, так называемый «промоторный островок» [Панюков и др., 2013, Shavkunov et al., 2009].
С использованием доступных данных анализа транскриптомов ранее было показано, что промоторные островки обладают низким уровнем транскрипционной активности [Панюков и др., 2013; Panyukov, Ozoline, 2013]. На основании этого факта было высказано предположение, что они способны сдерживать продукцию мРНК чужеродных генов, появившихся в геноме посредством горизонтального переноса, именно поэтому их появление в процессе эволюции ожидается рядом с горизонтально перенесёнными генами [Panyukov, Ozoline, 2013]. Участок, гомологичный межгенной области B. dentium, содержащей промоторный островок, был обнаружен только в геноме Geobacillus thermodenitrificans. Возможно, что ген oppB появился в геноме B. dentium посредством горизонтального переноса. Для проверки этой гипотезы было выполнено попарное выравнивание с помощью алгоритма Нидлмана и Вунша [Needleman, Wunsch, 1970] нуклеотидных последовательностей генов oppA и oppB, включая межгенную область, с их ортологами для четырех микроорганизмов B. dentium, C. glutamicum, P. acnes, C. pseudotuberculosis (EMBOSS Needle, http://www.ebi.ac.uk/Tools/psa/emboss_needle/nucleotide.html).
Указанные виды были выбраны на основе их филогенетической сближенности (пара C. glutamicum и C. pseudotuberculosis и пара B. dentium и P. acnes располагаются на соседних ветвях одной клады), которая плохо согласуется с сильно отличающимися паттернами распределения предсказанных сигналов. Поэтому можно было ожидать, что либо oppA, либо oppB B. dentium будет сильно отличаться по степени гомологии от соответсвующего гена других трех родственных видов, если он действительно появился в результате ассимиляции своего гомолога из отдаленного вида. Полученные результаты указывают на то, что oppB является более консервативным, чем oppA, в том числе в паре B. dentium – P. acnes (рис. 14) (наиболее близких видов). С одной стороны, эти данные указывают на коэволюцию генов oppA и oppB у этих бактерий, с другой против идеи о горизонтальном переносе какого-либо из генов (oppB или oppA) в геном B. dentium. Таким образом, наличие промоторного островка перед ним не является прямым следствием адаптивных процессов, обусловленных необходимостью ассимилировать чужой ген. В то же время, не обнаруживается прямой корреляции между сходством нуклеотидных последовательностей кодирующих участков (oppA и oppB) и разделяющих их межгенных областей
Так как дистанция между генами oppA и oppB у B. dentium значительно длиннее (324 нп) чем для большинства opp-оперонов других рассмотренных микроорганизмов (рис. 13М), было высказано предположение об интеграции в её структуру чужеродного генетического материала безотносительно к переносу кодирующих белки последовательностей. Поэтому, с использованием BLASTn (NCBI) (Microbial Nucleotide BLAST, https://blast.ncbi.nlm.nih.gov/Blast.cgi?PAGE_TYPE=BlastSearch&BLAST_SPEC=MicrobialGenomes) был сделан отбор гомологичных последовательностей в бактериальных геномах из GenBank, кроме представителей семейства Bifidobacteriaceae. Данный поиск привел к обнаружению участка, гомологичного 5 -концевой кодирующей последовательности гена олигопептидпермеазы (GNTG_2042) G. thermodenitrificans, белковый продукт которого может быть функциональным аналогом OppB (рис. 15). Это значит, что сама межгенная область oppA-oppB с фрагментом, кодирующим 5`-концевой области пермеазы, могла быть перенесена в геном B. dentium из G. thermodenitrificans, назависимо от соседних генов.
Таким образом, анализ взаимного расположения генов oppA, oppB и oppC в генах широкого круга микроорганизмов и наличия сигналов транскрипции в межгенном участке oppA-oppB позволяет предполагать, что экспрессия белков OppB и OppC может происходить независимо от активации первого гена оперона, кодирующего периплазматический акцептор пептидов, OppA. Данные компьютерного предсказания стартов инициации транскрипции также свидетельствуют о возможности синтеза РНК как из межгенной области oppA-oppB, так и из кодирующей части гена oppB. При этом эволюционно консервативной является не нуклеотидная последовательность межгенной области, а скорее ее протяженность. Характер распределения потенциальных стартов транскрипции в межгенной области у микроорганизмов разных систематических групп свидетельствует о ее изменчивости с точки зрения генерации новых промоторов, в том числе за счет ассимиляции чужого генетического материала.
Функциональность аннотированного инициирующего кодона oppB. Мутационный анализ
В условиях индукции в экспрессионной плазмиде pGEMEX-I с сохранением собственного сайта связывания рибосомы, но под контролем индуцируемого промотора было показано, что преимущественно синтезируется белковый продукт размером 28 кДа, причем более продолжительная индукция оказывается менее эффективной для накопления белка, что косвенно свидетельствует о его токсичных для клетки свойствах. Индукция РНК, в которой отсутствовал участок, соответствующий первым 8 аминокислотным остаткам OppB, показала, что других продуктов, транслируемых в одной рамке считывания с полноразмерным белком OppB, не образуется (рис. 35 В и Г). Это означает, что либо трансляция укороченной с 5 -конца РНК принципиально невозможна, либо для нее необходимо сохранение нативной 5 -нетранслируемой области, включая межгенный участок от стартовой точки транскрипции в положении –93 от ATG до основного инициирующего кодона. Чтобы ответить на этот вопрос, в плазмиду pGEMEX-1 был клонирован участок генома E. coli от положения –235 относительно ATG, включая полноразмерный ген oppB. Так же, как и на предыдущем этапе, до терминирующего кодона было введено 6 гистидинов (6Hisag). С использованием ПЦР-мутагенеза в плазмиде был мутирован основной инициирующий кодон (триплет ATG заменен на CTG) и сайт связывания с рибосомой (AGAAG заменен на ACAAC) (рис. 36Б). Синтезируемый продукт детектировали как при различной продолжительности индукции, так и без индукции (дорожка «К» на рис. 37), когда синтез мРНК может контролироваться собственными регуляторными элементами, локализованными в области выше ATG-кодона oppB, а трансляция – соответствующей нативной 5 -нетранслируемой области. Оказалось, что произведенные замены полностью исключают синтез белка массой 28 кДа, причем для исходной последовательности соответствующий продукт наблюдается даже в отсутствие индукции.
Это свидетельствует скорее всего в пользу инициации соответствующей мРНК из регуляторной области, локализованной в пределах 235 нп перед ATG-кодоном, хотя нельзя исключить и «утечку» транскрипции с промотора фага Т7 на плазмиде. Накопление белка в отсутствие индукции лучше выражено при более продолжительном культивировании (3 часа по сравнению с точкой 2 часа), что соответствует данным количественной ПЦР, о том, что на экспоненциальной фазе роста уровень OppB мРНК возрастает в несколько раз (рис. 24). В любом случае, очевидно, что именно аннотированный ATG кодон с соответствующим участком связывания рибосомы отвечает за синтез белкового продукта 28 кДа. Причиной заниженного молекулярного веса белка OppB может быть, как особенность его пространственной структуры, приводящая к ускоренной миграции в SDS-ПААГ, так и результат отщепления N-концевой последовательности в результате посттрансляционной модификации. Последнее требует отдельного исследования с использованием бактериальных штаммов, дефицитных по компонентам системы транслокации мембранных белков
Однако протеолитическое отщепление N-конца с участием сигнальных пептидаз представляется маловероятным. Так, в аминокислотной последовательности трансмембранных субъединиц ABC-транспортеров, как oppABCDF, так и dppABCD, исходя из результатов анализа с использованием SignalP (cbs.dtu.dk/services/SignalP/), предсказывающего мотивы, распознаваемые сигнальной пептидазой I, не выявлено консервативных паттернов, указывающих на возможность посттрансляционного протеолиза [Zalucki, Jennings, 2017]. При этом периплазматические белки OppA и DppA содержат сигнальные пептиды длиной 26 и 28 аминокислотных остатков соответственно. Для интегральных мембранных белков (IMP) характерно взаимодействие с рибонуклеопротеидными комплексами (signal recognition particles, SRP), обеспечивающими ко-трансляционный транспорт вновь синтезируемого пептида к мембране и встраивание в нее. Известно, что область взаимодействия лежит в пределах 50-100 аминокислотных остатков с N-конца и 87% трансмембранных белков в составе комплекса «мРНК-рибосома-синтезируемый пептид» способны к взаимодействию с SRP во время трансляции [Schibich et al., 2016]. В то же время SRP, взаимодействуя с N-концом, может защищать его от модификаций, в том числе и от протеолиза, по аналогии с тем, как это происходит с защитой от действия ферментов пептид-деформилазы и метионин-аминопептидазы [Ranjan et al., 2017]. Удивительно, что oppB входит в число тех 13% трансмембранных белков, для которых в трансляционных комплексах методом масштабного профилирования не обнаружено связывание SRP, в то время как для oppC участие SRP достоверно детектируется. Это указывает, либо на крайне низкий и строго контролируемый уровень экспрессии мРНК, либо на быстрый процессинг N-конца в синтезируемом полипептиде за счет неустановленных пока механизмов, что затрудняет связывание с SRP. С учетом продемонстрированной в данной работе однозначности инициирующего ATG-кодона, необходимого для синтеза OppB, в пользу последнего предположения говорит тот факт, что в наборе пептидных фрагментов OppB, выявляемых масс-спектрометрическим анализом во фракции мембранных белков E. coli, полностью отсутствуют пептиды, соответствующие N-концевой области [Masuda et al., 2009].