Содержание к диссертации
Введение
Обзор литературы 7
Новые подходы в изучении механизмов узнавания промоторной ДНК РНК-полимеразой
Е.со1іГЕст7(П 7
функциональная значимость тгуклеотидной последовательноспт промоторной ДНК 8
Канонические гексануклеотиды в-10 и -35 областях промоторной ДНК 8
Спейсерный участок промоторной ДНК 10
Динуклеотид TG — характеристический сигнальный элемент промоторов «extended—
10» 12
UP-элемент промоторной ДИК 13
Роль физико-химических свойств промоторной ДНК в функциональной активности промоторов 18
Легкоплавкие участки в промоторной ДНК 19
Формирование устойчивого изгиба в промоторной ДНК 22
Электростатические свойства промоторной ДНК 24
Материалы и методы 29
Нуклеотидные последовательности и элементы геномов PI ИХ аннотации 29
Таксономический раздел 29
Генерация случайных и регулярных последовательностей ДНК 29
Расчет электростатических свойств ДНК 30
Программное обеспечение СУБД, публикации данных и инструментов обработки и
анализа 31
Хранение данных 31
Доступ к данным и инструменты анализа: веб-публикация 31
Представление данных в работе 32
Результаты и обсуждение 33
Глава 1. База данных свойств электростатического потенциала геномной ДНК DEPPDB
33
Общее описание данных 33
Общая характеристика генома 33
Элементы генома 34
Таксономия 35
Пользовательский интерфейс 35
Стандартные элементы интерфейса 36
Главная страница 37
Таксономический раздел 37
Раздел описания геномов 37
Инструменты анализа данных 37
Инструмент визуализации и анализа множественных электростатических профилей 37
Инструмент визуализации электростатических профилей (Упрошенный вариант). 38
Инструмент визуализации и анализа отношений среднего потенциала генома к со
держанию GC пар для множественных геномов 38
Основная статистика 38
Глава 2. Зависимость электростатических свойств последовательности ДНК от ее состава 40
Случайные последовательности ДНК 40
Регулярные последовательности ДНК 41
ДНК природных геномов 42
Электростатический потенциал пар А. Т. G и С 43
Зависимость от контекста в природных геномах и случайных последовательностях. 46
Глава 3. Особенности электростатических свойств промоторов ряда Т7-подобных фагов и рибосомальных промоторов E.coli 48
Ранние промоторы Т7-подобных фагов и рибосомальиые промоторы E.coli 48
Промоторы Т7-подобных фагов, взаимодействующие с фаговой РНК-полимеразой..52
Общая характеристика ЭП промоторов фагов Т7. ТЗ. phiYe03-12 и VP4 52
Промоторы мутантного штамма бактериофага Т7. приспособленного к РНК-поли-
меразе бактериофага ТЗ 54
Заключение. Примеры использования базы DEPPDB 61
Выводы 65
Список литературы
- Канонические гексануклеотиды в-10 и -35 областях промоторной ДНК
- Нуклеотидные последовательности и элементы геномов PI ИХ аннотации
- Пользовательский интерфейс
- Общая характеристика ЭП промоторов фагов Т7. ТЗ. phiYe03-12 и VP4
Введение к работе
На данный момент существует дисбаланс между большим и постоянно растущим количеством секвенированных геномов и недостатком их биологического описания. Невозможность эффективного биохимического и генетического изучения такого количества геномов, лишь отчасти компенсируемая современными высокопроизводительными методами исследований, диктует необходимость развития методов анализа и интерпретации текстов первичной последовательности ДНК. Одним из направлений такого анализа является предсказание функций по первичной структуре специфических участков ДНК. Было разработано много инструментов, основанных на текстовом анализе последовательности ДНК, для предсказания некоторых ключевых свойств, таких как распределение и функции открытых рамок считывания, промоторов и других регуляторных элементов.
Однако, несмотря на накопленную информацию о структуре последовательностей, до сих пор представляется затруднительным выделить исключительно на ее основе регуляторные элементы, такие как промоторы, или предсказать их функциональные характеристики. Множество алгоритмов поиска промоторов, основанных на текстовом анализе последовательностей, неудовлетворительно справляются с этой задачей.
Известно, что дополнительная информация для распознавания и модуляции активности промоторов может заключаться в физических свойствах ДНК, таких как общая геометрия двойной спирали, ее деформируемость, температурная стабильность и динамические свойства. В нашей лаборатории был предложен новый подход к этой проблеме на основе анализа электростатических свойств промоторной ДНК [147, 152], для чего был разработан упрощенный метод вычисления распределения электростатического потенциала вокруг молекул ДНК величиной до целых геномов [146]. С его помощью были проведены исследования электростатических свойств некоторых геномов, которые показали важность электростатических взаимодействий промоторной ДНК и РНК-полимеразы для регуляции функций промоторов. Электростатические свойства промоторной ДНК характеризуются выраженными паттернами, специфичными для различных групп промоторов, которые
могут играть роль сигнальных элементов в дифференциальном распознавании соответствующих промоторов РНК-полимеразой.
Другим важным результатом было открытие нелинейной зависимости профиля потенциала от последовательности ДНК, означающей, что данное свойство обусловлено всей последовательностью целиком, в том числе фланкирующими регионами, нежели ее текстом в непосредственной точке рассмотрения, и для некоторых систем было показано, что биохимические свойства промоторов имеют гораздо лучшую корреляцию с их электростатикой, чем с текстом последовательностей.
Таким образом, электростатические свойства геномной ДНК весьма важны для ее биологических функций, и информация о них имеет большое значение для функциональной, сравнительной и эволюционной геномики, будучи представлена для значительного количества геномов, особенно интегрированной с возможно более полной аннотацией уже известных для них биохимических функций.
Цель и задачи исследования
В соответствии с обозначенной проблемой были установлены следующие цели:
создать инструмент, предоставляющий доступ к биологическим и электростатическим свойствам ДНК, и набор инструментов для анализа этих свойств
исследовать закономерности формирования электростатических свойств ДНК и общие электростатические свойства природных геномов
исследовать электростатические свойства промоторной ДНК Т7-подоб-ных бактериофагов
Для достижения этих целей были сформулированы конкретные задачи:
разработать базу данных, содержащую последовательности геномов с биологической аннотацией и систематическим положением, и их электростатические свойства
разработать инструменты для визуализации электростатических свойств последовательностей геномов, сопоставления с аннотацией, проведения анализа и представления результатов
оценить взаимосвязь нуклеотидного состава последовательности ДНК и ее электростатических свойств и влияние на них окружения последовательности
провести исследование общих электростатических свойств природных геномов
провести исследование связи биологической функции и электростатических свойств последовательности на примере промоторов TV-подобных бактериофагов, взаимодействующих с РНК-полимеразой бактерии-хозяина и с нативной фаговой РНК-полимеразой
провести исследование роли электростатических свойств в дифференциальном распознавании промоторов РНК-полимеразами фагов Т7 и ТЗ на примере описанного в литературе эксперимента с мутантом Т7, приспособившимся к росту на РНК-полимеразе фага ТЗ
Обзор литературы
Новые подходы в изучении механизмов узнавания про-моторной ДНК РНК-полимеразой E.coli (Ео70)
Избирательное использование генетического потенциала, адекватное моменту времени и условиям внешней среды, лежит в основе жизнедеятельности любой клетки. Регуляция экспрессии клеточной генома осуществляется на всех этапах синтеза макромолекул, однако в случае прокариот основные регуляторные механизмы действуют на стадии дифференцированной транскрипции разных генов [1]. Бактериальные клетки используют для этой цели сложную сеть различных систем индивидуального контроля эффективности синтеза РНК с определенных генов или оперонов и системами глобального переключения спектра синтезируемых в клетке мРНК вместе с системами координированной регуляции эффективности транскрибируемых генов. Несмотря на многообразие регуляторных систем и различие в молекулярных механизмах их действия, общим для них является то, что в конечном итоге все они оказывают влияние на характер взаимодействия РНК-полимеразы с промоторной ДНК на конкретных промоторах. Поэтому понятен многолетний интерес исследователей к выяснению принципов кодирования промотор-но-полимеразного узнавания и механизмов их реализации в процессах специфического комплексообразования РНК-полимеразы с промоторной ДНК для конкретных промоторов.
Согласно современным оценкам, количество промоторов, с которыми in vitro взаимодействует РНК-полимераза E.coli (Еа70), составляет более 3000, включая промоторы геномов E.coli и родственных колифагов. В настоящее время из них выделено и охарактеризовано более 400 промоторов [2]. Отличительной особенностью охарактеризованных промоторов является большая вариабельность их нуклеотидных последовательностей. Таким образом, наиболее необычным свойством РНК-полимеразы E.coli (Ес70) является ее способность к узнаванию многочисленных сильно варьирующих по структуре промоторных участков. Эта особенность РНК-полимеразы (Ео~70) отличает ее как от других сайт-специфических ДНК-связывающих белков, таких как рестриктазы, белки-активаторы, репрессоры и др., так и от некоторых просто организованных РНК-полимераз, таких как фаговые РНК-полимеразы. Возможность узнавания разнообразных промоторов одним и тем же
белком — РНК-полимеразой (Еа70) — указывает на сложность механизмов, вовлеченных в процесс белково-нуклеинового узнавания в этом случае. Можно предположить, что не только нуклеотидная последовательность, но и физико-химические характеристики промоторной ДНК, задаваемые этой последовательностью, вносят вклад в обеспечение специфичности взаимодействия РНК-полимеразы с разными промоторами.
Выяснению роли нуклеотидной последовательности промоторной ДНК в промоторно-полимеразном узнавании посвящено большое количество исследований, проводимых в течение более 30 лет, и несколько обзоров, написанных в разные годы [3-19]. Также имеется множество работ, связанных с изучением некоторых физико-химических свойств ДНК и особенностей ее геометрии [13, 55, 80, 96-145] и их влияния на функциональную активность промоторов, в том числе — роль электростатических характеристик промоторной ДНК в обеспечении дифференцированного кодирования промоторных свойств [20-25, 146-152].
Функциональная значимость нуклеотидной последовательности промоторной ДНК
Канонические гексануклеотиды в-10 и -35 областях промоторной ДНК
При специфическом взаимодействии с промотором РНК-полимераза образует контакты одновременно с -35 и -10 областями промоторной ДНК [26-33]. В этих областях при статистической обработке нуклеотидных последовательностей всех известных промоторов было выявлено два консенсусных гексануклеотида TTGACA и ТАТААТ, расположенных на расстоянии 35 и 10 оснований от стартовой точки транскрипции [2]. Последовательность реальных промоторов, однако, сильно варьирует даже в этих консенсусных областях, большинство индивидуальных промоторов (~80%) содержит только 6-8 канонических нуклеотидов из 12. Степень консервативности отдельных нуклеотидов -10 и -35 областей и их функциональная значимость различаются для 12 консенсусных нуклеотидов [2, 11]. Наиболее консервативными в -12-ТАТААТ-7 блоке являются Т-12, Т-7 и А-11, а наименее консервативными Т-10 и А8. Для -35-TTGACA-30 блока наиболее часто встречается Т-34, а наименее консервативны С-31 и А-30.
Анализ нескольких сотен генетических мутаций, оказывающих влияние на активность промоторов, выполненный на нескольких десятках разных промоторов во многих лабораториях, несомненно подтверждает функциональную значимость консенсусных гексануклеотидов [9, 11, 15, 19, 34-35]. Для многих промоторов было показано, что мутации, приближающие последовательность -10 и -35 гексануклеотидов к их консенсусу, приводят к усилению мутантного промотора и, наоборот, мутации, которые вызывают уменьшение промоторной силы, как правило, удаляют нуклеотидную последовательность промоторов от канонической [10, 11, 19, 40]. Однако известно немало примеров отклонения от этого правила [8, 11, 41-43]. Например, замена канонического А-32 на неканонический G в TTGACA блоке оказывает акти-ваторное действие для промоторов araBAD [41] и lacUV [11]. Для промоторов А.Р2 [8], 1рр [42] и lacPl [43] мутации, приводящие к формированию канонических гексануклеотидов, не оказывали максимального стимулирующего эффекта на промоторную функцию, и некоторые мутантные варианты этих промоторов, содержащие 1 или 2 неканонические пары, были более активны, чем их консенсусные аналоги. Интересно отметить, что «неправильное» поведение в большинстве случаев наблюдалось у менее консервативных канонических нуклеотидов. С некоторой осторожностью, по-видимому, можно заключить, что наиболее функционально значимыми являются высококонсервативные канонические Т-12, А-11 и Т-7 нуклеотиды в -10 блоке и Т-34 в -35 блоке; замена их на неканонические нуклеотиды приводила к существенному ингибированию активности многих промоторов [11].
В настоящее время известно, что две канонические области промоторной ДНК узнаются двумя разными доменами а-субъединицы РНК-полимера-зы [26-33]. Во взаимодействии с -10 блоком участвует домен 2.4 [27-29, 32, 33]. Имеющиеся данные указывают на то, что с этим доменом взаимодействуют наиболее консервативные нуклеотиды -10 блока Т-12 и А7, а со стороны белка в формирование специфических связей с функциональными группами канонических нуклеотидов вовлечены Gin 437 и Thr 440 [27-29], входящие в состав а-спирали 2.4 домена [44]. Во взаимодействии с -35 каноническим элементом участвует домен 4.2 а-субъединицы, содержащий классический для комплексообразования с ДНК мотив «спираль-поворот-спираль» [26, 30, 31, 33]. Из 20 аминокислот, образующих данный мотив (ак
570-590), существенными для узнавания канонических нуклеотидов этого промоторного участка являются Arg 584 и Arg 588.
Спейсерный участок промоторной ДНК
Поскольку положение доменов 2.4 и 4.2 в а-субъединице нативной РНК-полимеразы фиксировано, следует ожидать, что и взаимное положение двух консенсусных блоков, с которыми взаимодействуют эти домены, должно быть также достаточно сильно детерминировано. Действительно, для 80% промоторов длина спеисерного участка, находящегося между консенсусными гексануклеотидами, составляет 16-18 нуклеотидных пар, при этом оптимальной для активности промотора является длина 17 п.о. Мутации, изменяющие длину спейсера до 17 п.о, как правило, увеличивают активность промотора, а любые отклонения от этого значения ослабляют промотор [45, 46]. Более того, при неидеальной длине спейсера в его нуклеотидной последовательности обнаруживаются некоторые закономерности, не наблюдающиеся в спей-серных участках длиной 17 п.о. [47]. В частности, при длине спейсера менее 17 п.о в области, примыкающей к - 35 гексамеру, преобладают пурин-пури-новые и пиримидин-пиримидиновые гомодинуклеотиды, а в более длинных спейсерах в этой области преобладают пурин-пиримидиновые гетеродину-клеотиды [47]. Назначение этих особенностей в структурной организации спеисерного участка состоит в том, чтобы компенсировать неблагоприятную разницу в относительном расположении канонических блоков при неидеальной длине спейсера за счет изменения конформационной подвижности спейсерной ДНК, обусловленной её физическими свойствами, такими как торсионная жесткость, гибкость или способность к образованию кинков, которые отличаются у разных динуклиотидов [47-50]. Считается, что спейсерная ДНК не образует прямых контактов с РНК-полимеразой и не содержит никаких характеристических нуклеотидов, существенных для промоторной активности (исключение составляет особая группа промоторов, которая будет рассмотрена ниже). Важными для функциональной активности промоторов являются длина спейсерной ДНК и её физические свойства, определяющие подвижность спеисерного участка. Основная роль спейсера заключается в правильной ориентации —10 и —35 консенсусных областей, чтобы их канонические нуклеотиды в комплексе с РНК-полимеразой могли образовать специфический набор контактов с основными функциональными группами аминокислот двух активных участков промоторсвязывающего центра фермента.
Таким образом, канонические нуклеотиды промоторной ДНК и их фиксированное взаимное расположение являются важными промоторными детерминантами. Они были первыми сигнальными элементами, обнаруженными в промоторах, и в течение многих лет считались единственными функционально значимыми компонентами промоторной ДНК. Это привело к формированию концепции универсального кодирования полимеразного узнавания для всех промоторов. Согласно концепции универсального кода предполагалось, что существует корреляция между активностью промоторов и их структурной близостью к каноническим элементам [11, 14, 16]. При этом многочисленные усилия исследователей были направлены на выяснение вклада каждого из канонических нуклеотидов и их неканонических замен в промоторную силу [9, 11, 15, 16].
Однако по мере исследования всё большего числа промоторов появлялись факты, не согласующиеся с концепцией универсального кода: 1) было показано, что по сравнению со многими нативными промоторами консенсус-ный промотор не является максимально активным [51, 52]; 2) для ряда промоторов не наблюдалось прямой корреляции между активностью и соответствием структуры их гомологичных областей консенсусному промотору [11, 52-54]; 3) было показано, что функционально значимые участки различались у разных промоторов и их групп [55-61]; 4) были обнаружены промоторы, у которых отсутствовали или были крайне слабо выражены консенсусные гек-сануклеотиды [62, 63]; 5) были найдены новые активные сайты в а- и а-субъ-единицах РНК-полимеразы, которые участвовали в образовании контактов с нуклеотидами промоторной ДНК, не входящими в состав —10 и —35 консен-сусных областей [58, 64].
Все эти данные свидетельствуют о том, что промоторная ДНК должна содержать какие-то дополнительные сигнальные элементы, которые, возможно, присутствуют не во всех промоторах. Это привело к формулированию новой концепции, основанной на принципе дифференцированного кодирования промоторно-полимеразного узнавания для разных групп промоторов.
Принцип дифференцированного кодирования предполагает, с одной стороны, существование альтернативных сигнальных элементов у разных промоторов и их групп, а с другой стороны — возможность формирования в РНК-полимеразах альтернативных промоторсвязывающих центров, содержащих разные наборы активных доменов [5, 51, 53, 56, 58, 63-66].
Ряд литературных данных подтверждает оба эти предположения. В настоящее время в промоторной ДНК найдены новые функционально значимые участки, нуклеотиды которых способны формировать дополнительные связи с РНК-полимеразой при взаимодействии фермента с некоторыми определенными группами промоторов.
Динуклеотид TG - характеристический сигнальный элемент промоторов «extended-10»
Одним из примеров неканонических нуклеотидов промоторной ДНК, которые важны для функционирования целой группы промоторов, является динуклеотид TG (Т—15, G-14), расположенный в спейсерной области через один нуклеотид от -10 канонического блока [64]. Функциональная значимость этого динуклеотида была обнаружена у промоторов (~10), которые имели низкую степень гомологии с каноническими нуклеотидами в -35 области или вообще не содержали этого сигнального элемента [53, 54, 60, 62, 63]. Несмотря на отсутствие -35 промоторной детерминанты, все эти промоторы были достаточно активны. Биохимический и генетический анализ выявил несколько необычных структурных и функциональных особенностей этих промоторов [53, 54, 56, 60, 63, 67-69]. Все они имели достаточно высокую степень гомологии с каноническим элементом в -10 области, рядом с которой в строго фиксированном положении находилась дополнительная консервативная последовательность TGN. Таким образом, эта группа промоторов характеризуется протяженной консенсусной последовательностью TGNTATAAT в -10 области («extended-10»).
Замена TG динуклеотида на любые другие сочетания нуклеотидов имела явно выраженный ингибиторный эффект на промоторную активность, что указывает на функциональную значимость этого элемента. Об этом свидетельствует также анализ структуры комплексов РНК-полимеразы с промоторами этой группы. Было найдено, что фермент образует прямые контакты с основаниями TG динуклеотидов [63, 64, 70]. Участок РНК-полимеразы, контактирующий с этим динуклеотидом, расположен в домене 2.5 с-субъедини-цы и отличается от участков, взаимодействующих с —10 и —35 промоторными элементами [64, 70]. Во взаимодействии с данным промоторным элементом, вероятно, принимает участие глутаминовая кислота, расположенная в 458 положении 2.5 домена [70]. Замена этой аминокислоты на глицин влияет на активность промоторов «extended-10» и способна компенсировать ингибитор-
ный эффект мутационных замен гуанинового компонента динуклеотида (TG ->ТТ или TG^TC).
Таким образом, TG динуклеотид, расположенный в спейсерной области через 1 нуклеотид от -10 блока, является новой промоторспецифичной детер-минантой промоторной ДНК, для узнавания которой в РНК-полимеразе есть специальный активный сайт.
Интересно отметить, что введение в область —35 одного из «extended— 10» промоторов (galPl) последовательности, близкой к канонической, приводило к образованию контактов РНК-полимеразы с этой промоторной детер-минантой, не влияя при этом на взаимодействие фермента с TG динуклеоти-дом [59]. Таким образом, два этих сигнальных элемента промоторной ДНК являются независимыми промоторными детерминантами, которые могут использоваться ферментом по отдельности или аддитивно в зависимости от их наличия в структуре промотора.
UP-элемент промоторной ДНК
Почти через 20 лет после выявления функциональной роли а-субъединицы как фактора, отвечающего за специфичность взаимодействия РНК-полимеразы с промоторной ДНК, и обнаружения канонических —10 и —35 элементов и неканонического TG динуклеотида, узнаваемых этой субъединицей, было найдено, что в прямом взаимодействии с некоторыми промоторами участвует также а-субъединица [58]. Показано, что это взаимодействие осуществляется с «upstream» областью промоторной ДНК, расположенной левее
—35 элемента (район -35 60), вследствие чего участок получил название
UP- элемента [58, 71, 72]. Типичным представителем промоторов этой группы является промотор rrnBPl, контролирующий синтез рибосомальных РНК [58]. Делеция участка промоторной ДНК, содержащей последовательности — 36 —58, приводила к 30-кратному ингибированию активности rrnBPl [58]. С другой стороны, при сохранении интактной структуры rrnBPl, аналогичное ингибирование его активности вызывало использование мутантной РНК-полимеразы, содержащей делецию С-концевого домена в а-субъединице [58]. Таким образом, высокая активность рибосомальных промоторов, которые являются одними из наиболее сильных в геноме E.coli, обеспечивается в значительной степени за счет взаимодействия С-концевого домена а-субъединицы (а CTD) с UP-элементом промоторной ДІЖ. К настоящему времени этот тип
промоторно-полимеразного взаимодействия обнаружен и изучен для ~ 10
промоторов [52, 72]. UP—элементы могут функционировать независимо от других сигнальных элементов промоторов, стимулируя транскрипцию с оли-гонуклеотидов, содержащих неспаренный участок, в отсутствие а-субъеди-ницы [75].
Трехмерная структура С-концевого домена а-субъединицы установлена [74, 75], и найдены аминокислоты, участвующие в узнавании UP-элементов промоторной ДНК [75, 76]. Семь аминокислот в a CTD являются наиболее критичными для взаимодействия с ДНК и функционирования UP-элемента: Leu262, Arg265, Asp268, Cys269, Gly296, Lys298, Ser299 [75, 77]. Замена любой из этих аминокислот на аланин приводила к существенному ингибирова-нию активности rrnBPl промотора [75]. Пространственное расположение этих аминокислот формирует узкую, слегка удлиненную компактную площадку, удобную для взаимодействия как с короткими, так и с достаточно протяженными участками ДНК [74]. Важной структурной особенностью а CTD является то, что в белковую глобулу он встроен с помощью другого домена а-субъединицы а NTD, с которым соединяется через гибкий линкер величиной в 15 аминокислот [74]. Это позволяет варьировать положение a CTD в upstream области ДНК промоторно-полимеразного комплекса в достаточно широких пределах (до 44 А).
В последние годы были предприняты попытки определить конкретные функционально значимые нуклеотиды UP-элементов, взаимодействующие с контактной площадкой a CTD [77, 78]. Трудность состояла в том, что промоторы, во взаимодействии с которыми участвует a CTD, не проявляют никакой гомологии в нуклеотидной последовательности промоторной ДНК в «upstream» области [58]. Единственной общей структурной особенностью всех известных UP-элементов является обогащённость их АТ-парами.
При исследовании синтетических промоторов, полученных методом случайного мутагенеза «upstream» области rrnBPl, оказалось, что существует множество активирующих последовательностей (> 30), большинство из кото-рык являются более активными, чем UP—элемент естественного промотора [78]. Анализ этих последовательностей выявил консенсус —59-(А/Т)—38, который был предложен авторами в качестве консенсусного UP—элемента [77, 78]. По мнению авторов, консенсусный UP—элемент состоит из двух участков, каждый из которых взаимодействует с одной из двух а-субъединиц нативной РНК-полимеразы. Первый участок (-46--38) содержит консерва-
тивный олиго А — трек (- 44—41, АААА); второй участок (-59 - - 46) содержит 11-членный блок, состоящий исключительно из AT (ТА) пар: —57-ААА(АЯ) (АУТ)Т(А/Т)ТТТТ-47.
Следует, однако, отметить, что из 10 известных к настоящему времени естественных UP- промоторов только rrnBPl и rrnDPl имели в upstream области относительно высокую степень гомологии с UP—элементом, описанным как консенсусный [58, 77, 78]. Остальные UP—элементы не проявляли текстуальной гомологии ни между собой , ни с консенсусной последовательностью. Это означает, что функционально значимая площадка а-субъедини-цы может взаимодействовать с разными нуклеотидными последовательностями. Это заставило исследователей рассмотреть возможность, что в роли сигнальных элементов различающихся UP-последовательностей могут быть какие-то их общие физические свойства или сходные особенности пространственной структуры (гибкость двойной спирали, наличие изломов, локальные термодинамические параметры и т.д.).
Эксперименты по депуринизации оснований, входящих в состав UP— элементов, показали, что увеличение гибкости ДНК за счет удаления некоторых оснований приводит к увеличению активности соответствующих промоторов, причем контакты а-субъединицы с UP-элементом при этом сохраняются [79]. Таким образом, локальная подвижность ДНК UP-элемента может быть одним из факторов, существенных для взаимодействия с а-субъедини-цей.
Наличие олигоадениновых-олиготимидиновых треков в составе UP-элементов может способствовать формированию устойчивого изгиба оси двойной спирали, который, как будет рассмотрено дальше, считается важным элементом промоторно-полимеразного узнавания [80, 81]. Кроме того, такие треки характеризуются относительно узкой малой бороздкой, с которой, по-видимому, связывается a CTD [58, 77, 78]. Известно, что от ширины малой бороздки зависит гидратация её оснований [82], которая играет важную роль в узнавании нуклеотидных последовательностей ДНК-связывающими белками. Возможно, что эта особенность малой борозды олигоА- олигоТ треков или еще какие-то необычные свойства двойной спирали этих участков UP-последовательностей также являются сигнальными элементами, узнаваемыми a CTD [77, 78].
Таким образом, по крайней мере несколько физических факторов, возможно участвуют во взаимодействии UP-элементов с a CTD. Однако все они не могут объяснить исключительной прочности связей, формируемых a CTD с промоторной ДНК, на что указывает высокая стабильность комплексов UP— содержащих промоторов с а-субъединицей, находящейся как в составе на-тивной РНК-полимеразы, так и в индивидуальной форме [77, 83, 87]. Очевидно, что важным элементом этих комплексов является взаимодействие а-субъ-единицы с некоторой последовательностью нуклеотидов, функциональные группы которых образуют контакты с боковыми цепями аминокислот, однако, конкретные молекулярные механизмы такого взаимодействия пока неизвестны. Учитывая отсутствие гомологии в нуклеотидных последовательностях UP—элементов, вступающих в контакт с а-субъединицей, можно предположить дифференцированный характер её взаимодействия с альтернативными наборами функционально значимых оснований для различных UP—содержащих промоторов. Здесь нужно отметить, что большой размер UP—элементов и их повышенная локальная подвижность с одной стороны, а с другой стороны, большое число различных реакционноспособных аминокислот, входящих в состав активного центра а-субъединицы, и её способность варьировать расположение a CTD на промоторной ДНК в широких пределах, являются хорошей основой для формирования разнообразных альтернативных взаимодействий РНК-полимеразы с различными UP—содержащими промоторами.
Таким образом, в промоторной ДНК к настоящему времени найдено 4 сигнальных элемента, нуклеотидная последовательность которых узнается специальными активными участками РНК-полимеразы: -10 и -35 канонические гексануклеотиды считаются универсальными промоторными детерминантами, присущими в той или иной степени большинству промоторов; неканонические TG динуклеотид и UP-элемент являются специфическими промоторными детерминантами, характерными для отдельных промоторных групп.
Было высказано предположение, что слабая выраженность канонических -10 и -35 гексамеров в промоторной ДНК может быть скомпенсирована присутствием альтернативных сигнальных элементов, специфических для соответствующих промоторов. Предполагается, что кроме двух уже обнару-
женных неканонических промоторных детерминант, существуют и другие, пока еще неизвестные.
Статистическая обработка нуклеотидных последовательностей всех известных промоторов с использованием математических методов, таких как Фурье-анализ, кластерный анализ, метод нейронных сетей и др., выявила возможность классификации промоторов — разделения их на группы, отличающиеся друг от друга консенсусными участками, и обнаружила большое количество новых неканонических последовательностей с преобладающим содержанием их в промоторной ДНК отдельных промоторных групп [85-88]. Кроме того, разделение общей промоторной подборки на функционально однородные группы в соответствии со специально подобранными признаками привело к обнаружению дополнительных неканонических элементов, характерных для этих групп [89-92].
Таким образом, к настоящему времени известна большая серия неканонических консенсусных последовательностей, выявленных в различных промоторных группах. Однако остаётся неизвестным, являются ли эти последовательности (или какие-то из них) сигнальными элементами промоторной ДНК, участвующими во взаимодействии с РНК-полимеразой. В литературе нет никаких биохимических или генетических данных, подтверждающих их функциональную значимость. Повышенная частота их присутствия в определенных местах промоторной ДНК тех или иных промоторных групп, косвенно может свидетельствовать об их функциональной значимости. Однако при этом нужно учитывать зависимость полученных результатов от способа деления промоторов на группы. При использовании одной и той же исходной подборки промоторов результаты их классификационного анализа сильно отличались у разных авторов и зависели от используемых методов [85-91]. В разных работах одни и те же промоторы оказались в разных группах, отличающихся своими неканоническими консенсусными последовательностями. Неоднозначность в отнесении индивидуальных промоторов к классам затрудняет выбор предполагаемых характеристических неканонических последовательностей для конкретных промоторов с целью дальнейшей экспериментальной проверки их в качестве возможных промоторных детерминант, чем, вероятно, и объясняется отсутствие таких исследований в литературе.
Ранее нами был проведен анализ нуклеотидной последовательности полного генома Е. coli на содержание всех возможных пента—, гекса— и гепта-
нуклеотидов в промоторах и целом геноме [151]. Оказалось, что олигоиу-клиотидный состав промоторных областей E.coli значительно отличается от состава как хромосомы в целом, так и её кодирующих участков. Так, например, около 500 различных гексануклеотидов (25 % от их полного набора) встречается в промоторах в два раза чаще, чем в целом по хромосоме. Совершенно очевидно, что этот набор является излишним с точки зрения функциональной значимости всех выявленных олигонуклеотидов в качестве возможных олигонуклеотидспецифичных детерминант. Интересно, что канонические гексануклеотиды -10 и -35 блоков промоторной ДНК не стоят первыми в этом списке. Ясно, что в этом списке могут оказаться элементы, чья функциональная роль основана на физических свойствах, задаваемых последовательностями (легкоплавкость, изгибность, величина электростатического потенциала и др.).
Роль физико-химических свойств промоторной ДНК в функциональной активности промоторов
Знание нуклеотидной последовательности нескольких сотен промоторов, учет всех канонических и неканонических нуклеотидных детерминант промоторной ДНК не привели к разработке эффективного алгоритма корректной идентификации известных и поиска новых промоторов в нуклеотидной последовательности ДНК генома. А все попытки сформулировать общие правила, связывающие нуклеотидную последовательность промотора с его функциональными характеристиками, такими как «промоторная сила» или температура образования открытого промоторного комплекса, оказались безуспешными. Стало очевидным, что не только первичная структура промоторов ответственна за их взаимодействие с РНК-полимеразой.
Наиболее наглядно это было продемонстрировано на примере промоторов «ранних генов» ДНК фага Т4. Расшифровка нуклеотидной последовательности более 30 промоторов «ранних генов» Т4 показала, что все они обладают высокой степенью гомологии на протяженных участках и могут быть разбиты на 4 группы с коэффициентом подобия внутри группы > 75 % [92]. Однако было показано, что промоторы, относящиеся к одной и той же группе по нуклеотидной последовательности, отличались по функциональному поведению: по своей силе [93], а также по ответу на АДФ-рибозилирование а-субъединицы [94] и мутационные изменения Р-субъединицы гроЕИОЗ и
rpoB409 [5, 95]. В то же время промоторы фага Т4, более далекие по нуклео-тидной последовательности, обладают сходными функциональными характеристиками. Эти данные свидетельствуют о том, что какие-то другие детерминанты, помимо первичной структуры промоторов, вносят вклад в обеспечение их функциональной активности.
В настоящее время известно, что существенное влияние на силу промоторов и характер их взаимодействия с РНК-полимеразой оказывают такие физико-химические характеристики промоторной ДНК, как геометрия двойной спирали, её изгибность или наличие изломов [96-100], наличие легкоплавких участков [101-104], электростатические свойства промоторов и окружающих участков, а также динамические свойства как промоторных участков ДНК, так и макромолекулы в целом [105,106].
Легкоплавкие участки в промоторной ДНК
Исследование роли легкоплавких участков ДНК во взаимодействии с РНК-полимеразой началось ещё до того, как была сформулирована сама концепция промотора [107-112]. Основанием для этих исследований послужили экспериментальные данные, свидетельствующие о большем сродстве РНК-полимеразы к денатурированной ДНК и однонитевым полинуклеотидам по сравнению с нативной ДНК. Кроме того, с помощью электронной микроскопии было показано, что 10-20-членные олиго-АТ последовательности, содержащиеся в ДНК Т-четных фагов и являющиеся наиболее легкоплавкими участками этих матриц, могут использоваться РНК-полимеразой для инициации синтеза РНК [107, 108, 112]. Было также известно, что поли-ё(АТ) является более эффективной матрицей по сравнению с естественными ДНК, что в свою очередь, объяснялось большей лёгкостью раскрытия AT пар по сравнению с GC парами [110, 111].
Исследования нуклеотидной последовательности многих промоторов выявили две АТ-обогащенных области в промоторной ДНК.
К ним относится рассмотренный выше -10 канонический гексануклео-тид. Предполагалось, что эти участки по своему составу могли бы обладать пониженной стабильностью. Однако этот вопрос требовал специального исследования.
Стабильность двойной спирали ДНК была оценена для 168 индивидуальных промоторов, находящихся в естественном окружении во фрагментах
величиной в 500 п.о. [113]. Было найдено, что -10 участок промоторной ДНК является, как правило, менее стабильным, чем соседние области.
Известно, что для инициации синтеза РНК необходима транзиция первоначально образованного закрытого промоторно-полимеразного комплекса в открытый, сопровождающаяся локальным плавлением промоторной ДНК с появлением однонитевых участков около точки старта транскрипции. Сейчас показано, что плавление ДНК начинается с -11 положения и распространяется в сторону точки старта [114, 115], причем расплавленная область составляет 12-18 п.о. и включает практически полностью -10 участок промоторной ДНК. Очевидно, что нестабильность этого участка важна для эффективной транзиции закрытого промоторного комплекса в открытый, таким образом обеспечивая вклад этого фактора в активность промотора через влияние на данную стадию промоторно-полимеразного взаимодействия.
Поскольку -10 участок промоторной ДНК является также сигнальным элементом, идентифицируемым РНК-полимеразой по его нуклеотидной последовательности, встает вопрос о корреляции этих двух факторов (нуклеотидной последовательности и локальной стабильности) для функциональной активности промоторов. Для установления этого было изучено влияние 68 известных функционально значимых точечных мутационных замен в —10 области у 22 индивидуальных промоторов на стабильность ДНК этого участка [113]. Оказалось, что для 13% мутаций характер функционального ответа промоторов имеет прямую корреляцию между активностью промоторов и соответствием их нуклеотидной последовательности -10 консенсусному гекса-нуклеотиду. В некоторых случаях фактором, определяющим характер функционального ответа мутантных промоторов, было соответствие мутационной замены консенсусному нуклеотиду, не коррелирующее строго с характером изменения стабильности ДНК -10 участка; в ряде других случаев определяющим фактором в изменении активности промоторов было изменение в локальной стабильности ДНК.
Полученные данные подтверждают функциональную значимость не только самой нуклеотидной последовательности -10 участка, но и локальной стабильности двойной спирали ДНК, определяемой этой последовательностью. Роль этих факторов во взаимодействии с РНК-полимеразой различна. Если нуклеотидная последовательность в -10 области промотора является промоторной детерминантой, т.е. элементом, узнаваемым РНК-полимеразой
при идентификации промотора в геноме, то пониженная стабильность ДНК этого участка является фактором, облегчающем локальное плавление двухце-почечной ДНК в комплексе с ферментом при образовании открытого промо-торного комплекса.
Известно, что около 70% охарактеризованных промоторов имеют повышенное содержание АТ-пар в upstream области. Однако только для промоторов ранних генов Т-четных фагов показано, что существует корреляция между AT- богатым составом, наличием легкоплавких участков этих областях генома и их значимостью для промоторной функции [101, 103, 107-109]. В частности, это было подтверждено с помощью спиновой метки, взаимодействующей с основаниями легкоплавких участков нативной ДНК. Модификация данной меткой Т2-ДНК приводила к нарушению взаимодействия спин-меченой ДНК с РНК-полимеразой и существенному ингибированию синтеза РНК [103, 106]. Модифицируемые спиновой меткой легкоплавкие участки Т2-ДНК, которые принимают участие во взаимодействии с РНК-полимеразой, располагаются в upstream области промоторов ранних генов Т-четных фагов (-40 — -10 п.о.) и состоят более чем на 80% из АТ-пар [93]. Интересно отметить, что промоторы Т-четных фагов являются одними из самых сильных промоторов, утилизируемых РНК-полимеразой E.coli [94], несмотря на то, что их последовательность в — 35 области достаточно далека от консен-сусной. По-видимому, легкоплавкие АТ-богатые участки в upstream области этих промоторов являются дополнительным узнаваемым элементом, присутствие которого может компенсировать слабую выраженность —35 промоторной детерминанты.
Разработка новых методов для оценки термодинамической стабильности двойной спирали ДНК [118-120] позволила проанализировать термодинамические характеристики ДНК целых небольших геномов и плазмид [120-123]. Оказалось, что наименее стабильные участки на плазмиде pBR322, которая является эффективной матрицей для РНК-полимеразы E.coli, находятся непосредственно в районе расположения функциональных сигналов, таких как промоторы и точки старта транскрипции [121, 122]. Для некоторых исследованных геномов, также найдена хорошая корреляция между термодинамической стабильностью ДНК и её функционально значимыми участками, на что указывало наличие легкоплавких доменов в межгенных областях и отсутствие термодинамически нестабильных участков в кодирующих генах
[120, 123]. Однако такая корреляция характерна не для всех организмов [120].
В целом, все эти данные свидетельствуют о том, что легкоплавкие участки ДНК могут играть важную роль в формировании промоторов, выступая в качестве дополнительного сигнального элемента, идентифицируемого РНК-полимеразой в термодинамическом профиле ДІЖ. Очевидно, что такой сигнал не является общим для всех промоторов. Он характерен для промоторов, ДНК которых содержит легкоплавкий участок. Следует отметить, что термодинамический профиль ДНК определяется в большей степени последовательностью оснований, а не их составом, при этом участки с одинаковой стабильностью могут задаваться разными нуклеотидными последовательностями [113, 119]. Таким образом, функционально значимые легкоплавкие участки могут отличаться по первичной структуре в разных промоторах. Это означает, что термодинамический профиль промоторной ДНК может служить дополнительной характеристикой, описывающей активность промотора, выявляющей свойства, которые не могут быть непосредственно обнаружены при анализе нуклеотидной последовательности.
Формирование устойчивого изгиба в промоторной ДНК
Еще одной характеристикой, считающейся важной для описания функционально значимых свойств ДНК, является геометрия двойной спирали [124-128]. В ранних работах рассматривали «фазировку» сигналов, размещая функционально значимые нуклеотиды на спиральной проекции идеальной В-формы ДНК [127, 128]. Даже при таком упрощенном подходе была выявлена одна важная особенность промоторно-полимеразного взаимодействия, свидетельствующая о том, что в закрытом промоторном комплексе РНК-полимера-за образует контакты только с одной стороной двойной спирали ДНК [127]. Позже, после описания номенклатуры геометрических свойств ДНК [129] и появления различных геометрических шкал [125, 130-132], стал возможным детальный, с количественными характеристиками, анализ пространственной конфигурации двойной спирали ДНК, а геометрические параметры ДНК стали использоваться для количественного предсказания функциональных свойств фрагментов ДНК [124-126, 100]. Для очень многих промоторов такой анализ выявил наличие в их «upstream» области последовательностей, способных формировать устойчивый изгиб, а в ряде случаев образование этого изгиба было подтверждено экспериментально [13, 133, 135, 55, 80]. В этой
связи следует отметить, что поиски потенциально изогнутых фрагментов ДНК в банке нуклеотидных последовательностей бактерий показали, что в 50 % случаев они находятся в промоторных участках в районе -50 п.о. [136]. Интересно, что большинство случайно клонированных изогнутых сегментов ДНК также оказывались в «upstream» области промоторов [137]. Таким образом, стабильный изгиб ДНК является, по-видимому, существенным элементом в структурной организации бактериальных промоторов. При этом возникают два вопроса, один из которых относится к механизмам возникновения изгибов в двойной спирали ДНК, а второй связан с выявлением их роли в функционировании промоторов.
В настоящее время известно, что стабильный изгиб двойной спирали может возникнуть при наличии в структуре ДНК некоторых последовательностей оснований, список которых еще нельзя считать завершенным. Повышенной анизотропной гибкостью обладают отдельные динуклеотиды, такие, например, как ТрА [138, 139], или СрА [140], и некоторые другие , которые вследствие низкой энергии стэкинга азотистых оснований являются наиболее легко деформируемыми звеньями в структуре двойной спирали. Хотя сами динуклеотиды вызывают очень небольшой изгиб, присутствие таких гибких звеньев в двойной спирали ДНК может способствовать адаптивным конфор-мационным изменениям промоторной ДНК при взаимодействии с РНК-поли-меразой.
При подгонке структурно-конформационного соответствия между —10 элементом промоторов и 2.4 доменом а-субъединицы важную роль могут играть первые четыре нуклеотида этого элемента, содержащие два легко деформируемых динуклеотида ТрА (ТАТААТ). Хотя данные о трехмерной структуре ДНК в комплексах с РНК-полимеразой E.coli отсутствуют, однако некоторое представление по этому вопросу, по-видимому, можно получить из данных рентгеноструктурного анализа комплексов ДНК с одним из главных эукариотических факторов транскрипции - ТАТА-связывающим белком, ТВР [141]. Оказалось, что при связывании ТВР с ТАТА-боксом белок индуцирует изгиб ДНК, а также частично разворачивает ДНК в этой области, вызывая расширение малой бороздки, причем характер конформационных изменений ДНК определяется особенностями структуры и динамики ТрА последовательности [138, 139]. Особенности структуры и динамики -35 области изучены меньше. Высказано предположение, что —35 область либо содержит
уже изогнутую ДЬЖ, либо её ДНК может изгибаться в одном направлении, способствуя формированию изгиба под действием РНК-полимеразы [116, 117]. Как было указано выше, домен 4.2 а-субъединицы, взаимодействующий с -35 элементом, гомологичен мотиву helix-turn-helix других ДНК-связы-вающих белков. Имеются многочисленные данные о том, что многие ДНК-связывающие белки индуцируют в ДНК изгиб величиной до 40 [142]. Механизм образования изгиба в -35 области, по-видимому, может быть аналогичен образованию изгиба при связывании ДНК с другими ДНК-связывающи-ми белками [142]. Следует подчеркнуть, что в этом случае важным фактором может быть присутствие легко деформируемого динуклеотида СрА, обладающим повышенной анизотропной гибкостью.
Активную роль при образовании изгибов в промоторной ДНК, вероятно, играет сама РНК-полимераза, что связано с особенностями её трёхмерной структуры. Принято считать, что ДНК-связывающая поверхность РНК-полимеразы формируется 2 основными доменами, расположенными под углом 60 друг относительно друга [143], вследствие чего при взаимодействии с промотором они могут деформировать ДНК, внося в нее устойчивый изгиб [144]. При этом РНК-полимераза может индуцировать изгиб или трансформировать уже имеющийся изгиб как в —10 и —35 участках, так и в области спейсера. Согласно одной из моделей, характер изгибов, формируемых в этих участках, и динамика их изменений, индуцируемых РНК-полимеразой, являются причиной создания значительного напряжения в двойной спирали в районе спейсера, достаточного для того, чтобы инициировать разделение цепей ДНК в -10 области с образованием одноцепочечных участков, которые фиксируются с-субъединицей [117]. Некоторые экспериментальные данные подтверждают, что локальное плавление ДНК при формировании открытого промоторного комплекса энергетически связано с образованием изгиба в ДНК [145].
Электростатические свойства промоторной ДНК
В последнее время стало известно, что регуляция активности промоторной ДНК может осуществляться также через электростатические взаимодействия с РНК-полимеразой [20-25, 146-155].
В частности, в электростатическом профиле дальней upstream области промоторных ДНК ранних генов генома Т4 фага были обнаружены специфические элементы, которые могут выступать в роли новых промоторных де-
терминант, внося свой вклад в промоторно-полимеразное узнавание через электростатические взаимодействия с а-субъединицей РНК-полимеразы [22-24, 148]. Установлено, что характер этих взаимодействий определяет функциональное поведение ранних Т4 промоторов и контролируемых ими генов в ответ на физиологический сигнал, связанный с АДФ-рибозилирова-нием а-субъединицы РНК-полимеразы [22, 24], который действует путем изменения заряда на ней. Показательно, что наблюдается непосредственная корреляция как между исходной силой этих промоторов и соответствием выраженности up-элемента в виде повышения электростатического потенциала и исходным зарядом а-субъединицы, так и скоординированное изменение их силы в ответ на изменение знака заряда при АДФ-рибозилировании. При этом указанная корреляция не соответствует описанному выше распределению промоторов по классам сходства нуклеотидной последовательности, что в явном виде указывает на роль физических (электростатических) свойств в функционировании этих промоторов в противовес взаимодействию полиме-разы с индивидуальными консервативными нуклеотидами.
Интересно, что аналогичные электростатические элементы были найдены в рибосомальных промоторах Е. coli [149, 150] и некоторых о"70-специ-фичных синтетических промоторах, содержащих олиго-А треки в upstream области [22]. И в этих случаях была найдена корреляция между типом специфических электростатических элементов и характером функционального по-ведения промоторов.
При анализе ранних промоторов бактериофага Т7, взаимодействующих с хозяйской РНК-полимеразой E.coli, было показано, что наличие в дальней upstream области электростатических профилей сильных промоторов Al, А2 и A3 специфических электростатических элементов, сходных с вышеописанными, позволяет предположить их функциональную роль в формировании промоторной активности через участие в электростатических взаимодействиях с а-субъединицей. Важно отметить, что Al, А2 и A3 содержат разные специфические электростатические элементы, что указывает на разный характер их взаимодействия с а-субъединицей, объясняя тем самым различия в их функциональном поведении. Al, А2 и A3 расположены тандемно в начале одного и того же оперона Т7 ДНК. Предполагается, что наличие дублирующих сильных промоторов необходимо не столько для увеличения суммарной скорости синтеза соответствующей мРНК, сколько для обеспечения эффек-
тивной транскрипции этого оперона в разных условиях, что в свою очередь предполагает различие в механизмах взаимодействия РНК-полимеразы с данными промоторами [154]. Аналогичная картина электростатических свойств наблюдается у тандемных рибосомальных промоторов E.coli, перед которыми также стоит задача максимизации надежности узнавания в разных условиях [149, 150].
Анализ распределения электростатического потенциала минорных промоторов свидетельствует о том, что их профили в дальней upstream области существенно отличаются от тех, которые обнаружены у основных промоторов, как по наличию самих характеристических элементов, так и их величине и локализации. Так, у промотора D(A0) в этой области потенциал колеблется в пределах средней величины, не формируя никаких специфических элементов. Профиль В промотора имеет хорошо сформированный электростатический элемент с максимумом в районе -60 п.о. Данный элемент гораздо меньше по размерам положительно заряженного участка и величине его потенциала по сравнению с аналогичными элементам у А2 и A3. Кроме того, они отличаются и по их локализации в дальней upstream области промоторной ДНК. Положительно заряженные элементы с двумя максимумами в исследуемой области промоторов С и Е отличаются по форме (положению максимумов), по величине потенциала и размеров положительно заряженного участка, как между собой, так и от положительно заряженных специфических элементов А1 и А2. Все это демонстрирует существенные различия электростатических характеристик основных и минорных промоторов Т7-ДНК в той области ДНК, которая может участвовать в формировании электростатических сигнальных элементов, вносящих вклад в определение промоторной активности через электростатические взаимодействия с а-субъеди-ницей. Предполагается, что различия электростатических элементов, выявленных у минорных и основных промоторов Т7-ДНК, определяют разный характер взаимодействия этих промоторов с РНК-полимеразой и ответственны (во всяком случае, частично) за разницу в их активности и поведении [154].
Анализ промоторов, взаимодействующих с фаговой Т7 РНК-полимеразой, позволяет сгруппировать их в классы в зависимости от характера и времени экспрессии генов, которые они контролируют. Все эти промоторы демонстрируют принципиальное отличие распределения электростатического потенциала по сравнению с «бактериальными» промоторами. Оно выража-
ется в значительно более короткой области постоянства проявлений характеристических свойств потенциала, что близко соответствует различию размеров бактериальной и фаговой РНК-полимераз [155].
Сравнительный анализ электростатических свойств промоторов, относящихся к разным подклассам и внутри классов, свидетельствует о существенных различиях электростатических характеристик промоторов разных классов. Промоторы, относящиеся к одному и тому же классу, характеризуются сходными, хотя и неидентичными, профилями распределения электростатического потенциала.
Несмотря на то, что нуклеотидная последовательность всех ранних промоторов Т7 бактериофага высокогомологична с консенсусной последовательностью для Т7 РНК-полимеразы и отличается от нее в такой же степени, как и у большинства промоторов II класса, электростатические свойства этих групп весьма различны. Кроме того, последовательности консенсусной области промоторов III класса полностью идентичны друг другу, однако профиль электростатического потенциала в этой области заметно различается у разных промоторов, что подтверждает выявленную ранее неоднозначность соотношения электростатических свойств и текста последовательности ДНК [24, 146]. Как неоднократно было показано нами ранее, сильно различающиеся по своему составу последовательности могут иметь сходные профили электростатического потенциала, и, наоборот, небольшие различия нуклео-тидного состава, в том числе в окружающих фланкирующих областях, могут вызывать значительное изменение профиля. Все это может указывать на разный характер узнавания РНК-полимеразой этих промоторов и быть одной из причин различий в их временном и функциональном поведении во время инфекции Е. coli Т7 бактериофагом.
Это подтверждает роль электростатических свойств промоторной ДНК в определении характера функционального поведения промотора и указывает на возможный вклад электростатической компоненты в формирование промоторной активности нативных промоторов Т7 бактериофага [155].
Все это указывает на широкое распространение и большое значение в промоторах сигнальных элементов, формируемых на основе электростатических характеристик ДНК. Полученные недавно результаты, показывающие, что в процессе эволюции в промоторах отбирались фрагменты последовательности с пониженным электростатическим потенциалом, подтверждают предположение о важности той роли, которую играет электростатический потенциал ДНК в формировании промоторной функции [151].
Таким образом, исследование электростатических свойств промоторной ДНК является перспективным подходом для поиска новых сигнальных элементов, вносящих вклад в формирование промоторной активности, что служит хорошим примером нового направления изучения биологической роли физических свойств геномной ДНК.
Материалы и методы
Для разработки базы данных электростатических свойств геномной ДНК DEPPDB и анализа данных использовались следующие материалы и методы.
Нуклеотидные последовательности и элементы геномов и их аннотации
Последовательности всех полных секвенированных бактериальных и вирусных геномов и их аннотации взяты из базы данных NCBI RefSeq () и частично из ВіоСус (). Данные в форме текстовых файлов взяты с ftp сайта и разбирались специально написанным набором программ на языке Perl. Ряд данных был получен из литературных источников и внесен в базу через интерфейс ее управления, также написанный на Perl.
Таксономический раздел
Описания таксонов и идентификаторы, позволяющие сформировать иерархическую древовидную структуру раздела и приписать геномы таксонам, взяты из базы данных NCBI Taxonomy (taxonomy/) в виде текстовых файлов и разбирались специально написанным набором программ на языке Perl.
Генерация случайных и регулярных последовательностей ДНК
С помощью специально написанной программы было рассчитано по 10 случайных последовательностей с содержанием каждого нуклеотида с шагом в 10% и длиной последовательности от 1000 до 100000 с шагом в порядок, результат статистических расчетов сохранен в базе, а также по одной последовательности длиной 1000000 с сохранением текста последовательностей для дальнейшего изучения, и набор последовательностей с равным содержанием всех 4 нуклеотидов.
С помощью специально написанной программы на языке Perl был рассчитан набор регулярных (периодических) последовательностей следующего вида: полинуклеотиды с периодом в 1 и 2 пары каждого вида, и все перестановки из 4, 8 и 12 пар с равным количеством нуклеотидов А, Т, G и С. Из анализа исключались циклические перестановки (дающие при повторении
одинаковые последовательности), из поли-12 нуклеотидов брались по 100 вариантов, имеющих максимальные и минимальные значения среднего потенциала.
Расчет электростатических свойств ДНК
Электростатический потенциал вокруг молекул геномной ДНК рассчитывался с помощью оригинального метода [146], использующего расчет по закону Кулона полноатомной модели ДНК с использованием подгоночных параметров зарядов и диэлектрической проницаемости для согласования с расчетами, полученными решением уравнения Пуассона-Больцмана.
Потенциал вокруг молекулы ДНК вычисляли по кулоновской формуле:
v(n = х
я,
е(г) \F — И
где qi — заряд i-того атома молекулы ДНК; г — радиус-вектор 1-того
атома; ' — радиус-вектор точки наблюдения; GOz> — диэлектрическая проницаемость как функция расстояния.
Вычислялось значение электростатического потенциала на поверхности соосного двойной спирали молекулы ДНК цилиндра, радиусом 15 ангстрем, что составляет около 5 ангстрем от ее поверхности, то есть примерно соответствует расстоянию, на котором, предположительно, белки неспецифически взаимодействуют с ДНК. Далее значение потенциала усреднялось по угловой переменной для получения одномерного распределения потенциала вдоль молекулы ДНК, т.е. профиля ЭП, который и использовался для заполнения базы и дальнейшего анализа.
Для получения линейных координат пар оснований вдоль молекулы ДНК генома и усредненных по углу значений электростатического потенциала вокруг молекулы ДНК в линейных координатах вдоль молекулы (т.е. профиля ЭП), использовалась программа А. Сорокина [147], модифицированная для пакетной обработки целых геномов и вычисления ряда дополнительных параметров распределения электростатического потенциала.
Также вычислялись следующие показатели распределения усредненного потенциала вдоль целой последовательности геномной ДНК: минимум, максимум, среднее арифметическое, геометрическое и гармоническое, ме-
диана, дисперсия и стандартное отклонение, коэффициент асимметрии и эксцесс распределения.
Программное обеспечение СУБД, публикации данных и инструментов обработки и анализа
Хранение данных
Большая часть данных хранится в реляционной базе под управлением СУБД MySQL v5.0 в таблицах типа MylSAM.
Заголовочные части записей БД NCBI RefSeq, относящиеся к геному, хранятся в текстовых файлах операционной системы в формате ASCII, по одной записи на файл.
Тексты последовательностей хранятся в текстовых файлах в формате ASCII, непрерывной строкой с переводом строки в конце, по одной последовательности на файл.
Линейные координаты (в ангстремах) пар оснований вдоль молекулы ДНК генома хранятся в бинарных файлах форматом 4 байта на основание.
Усредненные по углу значения электростатического потенциала вокруг молекулы ДНК в линейных координатах вдоль молекулы хранятся в нормализованном виде в бинарных файлах форматом 2 байта на 1 ангстрем.
Доступ к данным и инструменты анализа: веб-публикация
Пользовательский доступ к данным и инструментам анализа осуществляется через веб-интерфейс по протоколу http с помощью динамической системы публикаций, основанной на веб-сервере Apache v.2.2, СУБД MySQL v5.0 и программах, написанных на языке Perl. Система включает стандартную поставку ActiveState Perl v. 5.8 с рядом дополнительных модулей, один из которых модифицирован, и набор скриптов, написанных для БД DEPPDB.
Динамически генерируемые страницы в формате html содержат ряд интерактивных элементов, написанных на языке Javascript v. 1.2 и тестировались в браузерах MS IE w. 6,7, Mozilla Firefox w. 2,3, Opera v. 9 и Google Chrome v. 1.0.154.36. Графики строятся «на лету» в формате PNG с помощью модулей Perl GD и GD::Graph.
Кроме того, часть инструментов анализа используют расширение языка Perl PDL (Perl Data Language) v. 2.4.3 с графическим модулем PGPLOT v.2.19.
База данных доступна для академического использования через веб-интерфейс по адресу . Язык интерфейса английский.
Следует отметить, что некоторые намеченные оптимизации программного и аппаратного обеспечения позволят кардинально улучшить возможности обработки данных.
Представление данных в работе
На всех рисунках, представляющих профили ЭП, по вертикальной оси отложена величина ЭП в единицах заряда электрона на ангстрем (ё/А), по горизонтальной — расстояние вдоль оси молекулы ДНК в ангстремах. Вертикальной линией по центру отмечена точка, по которой выравнивались последовательности.
Все графики, в т.ч. и содержания GC пар, строились в реальном физическом пространстве. Выравнивание по номеру нуклеотида не соответствует выравниванию в физическом пространстве из-за разницы расстояния между парами оснований. Из-за этого также возникают ошибки усреднения по краям графиков, которые исключались из визуального анализа.
В случае, когда на графике присутствуют 3 панели, на верхней дан электростатический потенциал, горизонтальные линии — среднее значение потенциала всего генома(ов); на средней — стандартные отклонения для каждой группы, горизонтальные линии — среднее значение для каждого генома (группы); на нижней - содержание GC пар в процентах для каждой группы. Для отображения GC состава делалось усреднение окном в несколько пар вокруг каждой точки.
Результаты и обсуждение
Канонические гексануклеотиды в-10 и -35 областях промоторной ДНК
При специфическом взаимодействии с промотором РНК-полимераза образует контакты одновременно с -35 и -10 областями промоторной ДНК [26-33]. В этих областях при статистической обработке нуклеотидных последовательностей всех известных промоторов было выявлено два консенсусных гексануклеотида TTGACA и ТАТААТ, расположенных на расстоянии 35 и 10 оснований от стартовой точки транскрипции [2]. Последовательность реальных промоторов, однако, сильно варьирует даже в этих консенсусных областях, большинство индивидуальных промоторов ( 80%) содержит только 6-8 канонических нуклеотидов из 12. Степень консервативности отдельных нуклеотидов -10 и -35 областей и их функциональная значимость различаются для 12 консенсусных нуклеотидов [2, 11]. Наиболее консервативными в -12-ТАТААТ-7 блоке являются Т-12, Т-7 и А-11, а наименее консервативными Т-10 и А8. Для -35TGACA-30 блока наиболее часто встречается Т-34, а наименее консервативны С-31 и А-30. Анализ нескольких сотен генетических мутаций, оказывающих влияние на активность промоторов, выполненный на нескольких десятках разных промоторов во многих лабораториях, несомненно подтверждает функциональную значимость консенсусных гексануклеотидов [9, 11, 15, 19, 34-35]. Для многих промоторов было показано, что мутации, приближающие последовательность -10 и -35 гексануклеотидов к их консенсусу, приводят к усилению мутантного промотора и, наоборот, мутации, которые вызывают уменьшение промоторной силы, как правило, удаляют нуклеотидную последовательность промоторов от канонической [10, 11, 19, 40]. Однако известно немало примеров отклонения от этого правила [8, 11, 41-43]. Например, замена канонического А-32 на неканонический G в TTGACA блоке оказывает акти-ваторное действие для промоторов araBAD [41] и lacUV [11]. Для промоторов А.Р2 [8], 1рр [42] и lacPl [43] мутации, приводящие к формированию канонических гексануклеотидов, не оказывали максимального стимулирующего эффекта на промоторную функцию, и некоторые мутантные варианты этих промоторов, содержащие 1 или 2 неканонические пары, были более активны, чем их консенсусные аналоги. Интересно отметить, что «неправильное» поведение в большинстве случаев наблюдалось у менее консервативных канонических нуклеотидов. С некоторой осторожностью, по-видимому, можно заключить, что наиболее функционально значимыми являются высококонсервативные канонические Т-12, А-11 и Т-7 нуклеотиды в -10 блоке и Т-34 в -35 блоке; замена их на неканонические нуклеотиды приводила к существенному ингибированию активности многих промоторов [11].
В настоящее время известно, что две канонические области промоторной ДНК узнаются двумя разными доменами а-субъединицы РНК-полимера-зы [26-33]. Во взаимодействии с -10 блоком участвует домен 2.4 [27-29, 32, 33]. Имеющиеся данные указывают на то, что с этим доменом взаимодействуют наиболее консервативные нуклеотиды -10 блока Т-12 и А7, а со стороны белка в формирование специфических связей с функциональными группами канонических нуклеотидов вовлечены Gin 437 и Thr 440 [27-29], входящие в состав а-спирали 2.4 домена [44]. Во взаимодействии с -35 каноническим элементом участвует домен 4.2 а-субъединицы, содержащий классический для комплексообразования с ДНК мотив «спираль-поворот-спираль» [26, 30, 31, 33]. Из 20 аминокислот, образующих данный мотив (ак 570-590), существенными для узнавания канонических нуклеотидов этого промоторного участка являются Arg 584 и Arg 588. Спейсерный участок промоторной ДНК
Поскольку положение доменов 2.4 и 4.2 в а-субъединице нативной РНК-полимеразы фиксировано, следует ожидать, что и взаимное положение двух консенсусных блоков, с которыми взаимодействуют эти домены, должно быть также достаточно сильно детерминировано. Действительно, для 80% промоторов длина спеисерного участка, находящегося между консенсусными гексануклеотидами, составляет 16-18 нуклеотидных пар, при этом оптимальной для активности промотора является длина 17 п.о. Мутации, изменяющие длину спейсера до 17 п.о, как правило, увеличивают активность промотора, а любые отклонения от этого значения ослабляют промотор [45, 46]. Более того, при неидеальной длине спейсера в его нуклеотидной последовательности обнаруживаются некоторые закономерности, не наблюдающиеся в спей-серных участках длиной 17 п.о. [47]. В частности, при длине спейсера менее 17 п.о в области, примыкающей к - 35 гексамеру, преобладают пурин-пури-новые и пиримидин-пиримидиновые гомодинуклеотиды, а в более длинных спейсерах в этой области преобладают пурин-пиримидиновые гетеродину-клеотиды [47]. Назначение этих особенностей в структурной организации спеисерного участка состоит в том, чтобы компенсировать неблагоприятную разницу в относительном расположении канонических блоков при неидеальной длине спейсера за счет изменения конформационной подвижности спейсерной ДНК, обусловленной её физическими свойствами, такими как торсионная жесткость, гибкость или способность к образованию кинков, которые отличаются у разных динуклиотидов [47-50]. Считается, что спейсерная ДНК не образует прямых контактов с РНК-полимеразой и не содержит никаких характеристических нуклеотидов, существенных для промоторной активности (исключение составляет особая группа промоторов, которая будет рассмотрена ниже). Важными для функциональной активности промоторов являются длина спейсерной ДНК и её физические свойства, определяющие подвижность спеисерного участка.
Нуклеотидные последовательности и элементы геномов PI ИХ аннотации
С помощью специально написанной программы было рассчитано по 10 случайных последовательностей с содержанием каждого нуклеотида с шагом в 10% и длиной последовательности от 1000 до 100000 с шагом в порядок, результат статистических расчетов сохранен в базе, а также по одной последовательности длиной 1000000 с сохранением текста последовательностей для дальнейшего изучения, и набор последовательностей с равным содержанием всех 4 нуклеотидов.
С помощью специально написанной программы на языке Perl был рассчитан набор регулярных (периодических) последовательностей следующего вида: полинуклеотиды с периодом в 1 и 2 пары каждого вида, и все перестановки из 4, 8 и 12 пар с равным количеством нуклеотидов А, Т, G и С. Из анализа исключались циклические перестановки (дающие при повторении одинаковые последовательности), из поли-12 нуклеотидов брались по 100 вариантов, имеющих максимальные и минимальные значения среднего потенциала.
Расчет электростатических свойств ДНК
Электростатический потенциал вокруг молекул геномной ДНК рассчитывался с помощью оригинального метода [146], использующего расчет по закону Кулона полноатомной модели ДНК с использованием подгоночных параметров зарядов и диэлектрической проницаемости для согласования с расчетами, полученными решением уравнения Пуассона-Больцмана.
Потенциал вокруг молекулы ДНК вычисляли по кулоновской формуле: v(n = х я, е(г) \F — И где qi — заряд i-того атома молекулы ДНК; г — радиус-вектор 1-того атома; — радиус-вектор точки наблюдения; GOz — диэлектрическая проницаемость как функция расстояния.
Вычислялось значение электростатического потенциала на поверхности соосного двойной спирали молекулы ДНК цилиндра, радиусом 15 ангстрем, что составляет около 5 ангстрем от ее поверхности, то есть примерно соответствует расстоянию, на котором, предположительно, белки неспецифически взаимодействуют с ДНК. Далее значение потенциала усреднялось по угловой переменной для получения одномерного распределения потенциала вдоль молекулы ДНК, т.е. профиля ЭП, который и использовался для заполнения базы и дальнейшего анализа.
Для получения линейных координат пар оснований вдоль молекулы ДНК генома и усредненных по углу значений электростатического потенциала вокруг молекулы ДНК в линейных координатах вдоль молекулы (т.е. профиля ЭП), использовалась программа А. Сорокина [147], модифицированная для пакетной обработки целых геномов и вычисления ряда дополнительных параметров распределения электростатического потенциала.
Также вычислялись следующие показатели распределения усредненного потенциала вдоль целой последовательности геномной ДНК: минимум, максимум, среднее арифметическое, геометрическое и гармоническое, ме диана, дисперсия и стандартное отклонение, коэффициент асимметрии и эксцесс распределения.
Программное обеспечение СУБД, публикации данных и инструментов обработки и анализа Хранение данных Большая часть данных хранится в реляционной базе под управлением СУБД MySQL v5.0 в таблицах типа MylSAM. Заголовочные части записей БД NCBI RefSeq, относящиеся к геному, хранятся в текстовых файлах операционной системы в формате ASCII, по одной записи на файл. Тексты последовательностей хранятся в текстовых файлах в формате ASCII, непрерывной строкой с переводом строки в конце, по одной последовательности на файл. Линейные координаты (в ангстремах) пар оснований вдоль молекулы ДНК генома хранятся в бинарных файлах форматом 4 байта на основание.
Усредненные по углу значения электростатического потенциала вокруг молекулы ДНК в линейных координатах вдоль молекулы хранятся в нормализованном виде в бинарных файлах форматом 2 байта на 1 ангстрем. Доступ к данным и инструменты анализа: веб-публикация
Пользовательский доступ к данным и инструментам анализа осуществляется через веб-интерфейс по протоколу http с помощью динамической системы публикаций, основанной на веб-сервере Apache v.2.2, СУБД MySQL v5.0 и программах, написанных на языке Perl. Система включает стандартную поставку ActiveState Perl v. 5.8 с рядом дополнительных модулей, один из которых модифицирован, и набор скриптов, написанных для БД DEPPDB.
Динамически генерируемые страницы в формате html содержат ряд интерактивных элементов, написанных на языке Javascript v. 1.2 и тестировались в браузерах MS IE w. 6,7, Mozilla Firefox w. 2,3, Opera v. 9 и Google Chrome v. 1.0.154.36. Графики строятся «на лету» в формате PNG с помощью модулей Perl GD и GD::Graph.
Пользовательский интерфейс
Для изучения влияния окружения на формирование электростатического потенциала последовательности, была исследована зависимость от длины фрагмента разброса потенциала в центре разных экземпляров одинаковых фрагментов ДНК. Анализировался электростатический потенциал в центрах фрагментов ДНК длиной от 1 до 40 п.о. для первых 100000 п.о. генома Е. coli и случайной последовательности с соотношением A/T/G/C = 1/1/1/1, а также целого генома бактериофага Т7. Для анализа отбирались фрагменты, представленные не менее чем в трех экземплярах. Данные представлены на рис.3.
Абсолютные значения разницы между максимумами и минимумами для всех экземпляров каждого вида фрагментов и их среднее стандартное отклонение плавно уменьшаются с ростом длины фрагмента. Следует отметить, что в природных последовательностях эти показатели для длинных фрагментов маскируются их включением в участки больших повторов или дупликаций, что заметно при сравнении величин их размахов.
Показательно, что максимальные разбросы сохраняют величину, достаточную для формирования электростатических элементов, по выраженности равных известным природным регуляторным структурам, вплоть до максимальной исследованной длины в 40 п.о., а до длины 8 п.о. — превосходящих большинство из них.
Анализ консенсусного промотора бактериофага ТЗ (23 п.о.), помещенного в контекст ряда различных регулярных последовательностей, показал, что средний разброс в его центре составил около 0.2 ё/А, а максимальный — около 1.1 ё/А, притом что величина между максимумом и минимумом усредненного профиля реальных промоторов ТЗ в контексте его генома составляет около 1 ё/А, средний разброс в центре — 0.15, а максимальный — 0.5, то есть в два раза меньше, несмотря на имеющиеся отличия этих промоторов от консенсуса. Хотя в среднем промотор сохраняет свою характерную картину распределения электростатического потенциала, в ряде случаев она меняется кардинально, гораздо более, чем необходимо для потери узнавания нативнои РНК-полимеразой ( . 0.5 ё/А от среднего). Показательно, что в данном случае средний и максимальный разброс не уменьшаются равномерно к центру, а имеют минимум в точке старта (6 п.о. от края), и небольшой локальный мак при малой частоте, с наиболее ярко выраженной первой волной, где каждая волна соответствует сильному промотору (рис. 4.а.). Такой характер электростатического профиля промоторной зоны, по-видимому, служит для повышения надежности узнавания промоторов хозяйской полимеразой, что, в свою очередь, повышает шансы успешности фаговой инфекции. Изменения потенциала находятся в одном масштабе с контактной площадкой молекулы бактериальной РНК-по-лимеразы (-500 ангстрем).
Анализ ранних областей геномов группы Т7-подобных фагов ТЗ, phiA1122, phiYe03-12 (рис. 4.а.), К1-5 и SP6 (рис. 4.6.) показал у них наличие точно такой же картины, причем для фагов Т7 и ТЗ в базе данных NCBI RefSeq, откуда бралась исходно биологическая аннотация, указано наличие промоторов бактерии-хозяина, для фага phiYe03-12 оно указывалось как предположительное, а для фагов Kl-5, SP6 и рЫА1122 такой информации не было вовсе. Тем не менее, для них для всех было обнаружено поразительное сходство картины распределения электростатического потенциала, что позволяет предположить, что данные промоторы там присутствуют и выполняют свою биологическую функцию.
Интересно сравнить профиль этих областей с районами рибосомальных промоторов Е.соИ, для которых характерно наличие тандема из двух сильных промоторов и перед которыми также стоит задача максимизации надежности их узнавания. Хорошо видно, что профили этих областей имеют между собой определенное сходство (рис. 4.В.). Это может отражать общность их биологических функций.
Следует отметить, что нуклеотидные последовательности всех этих районов значительно различаются между собой, что указывает на важность анализа физических свойств в дополнении к традиционному текстовому анализу нуклеотидной последовательности.
При анализе распределения электростатического потенциала вокруг промоторов, взаимодействующих с нативными фаговыми РНК-полимераза-ми, выявляется общая картина сходства, выражающегося в наличие синхронизированных неоднородностей (подъемов и спадов) одного масштаба с молекулой полимеразы и, в частности, в переходе графика потенциала от спада непосредственно перед точкой старта к его подъему сразу за ней, а для фагов ТЗ, phiYe03-12, VP4 - двух волн таких переходов (рис. 5).
Наряду со сходством, видно различие однородности характеристической картины для разных фагов, от наиболее однородного фага ТЗ до наиболее изменчивого Т7.
На примере фагов ТЗ и phiYe03-12 (рис. 6) хорошо видно различие в устойчивости картины электростатического профиля к нуклеотидным заменам на разных его участках. В районе точки старта профиль устойчив к присутствующим там единичным и двойным заменам, в районе первого upstream пика (-30 ангстрем от точки старта) - гиперчувствителен даже к единичной замене С на А, которая совершенно элиминируют этот пик (рис. 6, линия 2). Это указывают на необходимость дополнения тестового анализа нуклеотид-ных последовательностей анализом физических свойств ДНК.
Общая характеристика ЭП промоторов фагов Т7. ТЗ. phiYe03-12 и VP4
Общеизвестно, что развитие науки зачастую определяется появлением и совершенствованием новых методов исследований. В данной работе предпринята попытка решения ряда биологических задач с использованием одного из таких методов, разработанного в нашей лаборатории, а именно метода расчета электростатического профиля вокруг протяженных фрагментов ДНК, достигающих величины полных геномов. Наличие инструмента, разработанного с применением данного метода, позволяет проводить исследования, недоступные ранее, и выявлять новые закономерности функционирования биологических систем.
Кроме приведенных выше примеров таких исследований, составляющих содержательную часть диссертации, можно отметить возможности применения разработанной базы данных для массового анализа электростатического потенциала вокруг различных элементов генома. Это может позволить выявить некоторые закономерности его распределения и послужить отправной точкой для более содержательного анализа биологических функций физических свойств геномной ДНК.
В качестве примера можно привести графики распределения электростатического потенциала вокруг промоторной (рис. 12) и терминаторной (рис. 13) областей всех бактериальных, плазмидных и вирусных геномов, на которых видны особенности среднего распределения потенциала в этих регионах. В частности, хорошо виден район повышенного отрицательного потенциала вокруг промоторов, что значительно (для 862 промоторов из 81 генома) расширяет область проведенного ранее наблюдения [147, 151] над промоторами E.coli, показавшего более электроотрицательный в среднем потенциал в этих областях. Также виден характерный всплеск графика потенциала, усредненного по 3333 бактериальным, 68 плазмидным и 174 вирусным терминаторам, что может отражать палиндромную структуру этого функционального элемента генома.
В свете выявленной корреляции AT состава, особенно в сочетании с трековостью, и величины электростатического потенциала, перспективными представляются исследования промоторов с up-элементом. Также кажется обоснованной постановка задачи исследования возможной роли электростатических взаимодействий при позиционировании нуклеосом. -21.5
Верхняя панель - график усредненного электростатического потенциала вокруг (сверху вниз) бактериальных, плазмидных и вирусных промоторов. Прямые показывают среднее значение потенциала для этих групп геномов. Средняя панель - соответствующие графики стандартного отклонения для этих групп.
Нижняя панель - графики GC-состава, окно усреднения - 7 п.о. По вертикали - электростатический потенциал в ё/А, по горизонтали — расстояние вдоль молекулы ДНК в А, вертикальная линия — конец промоторов. -21
Верхняя панель - график усредненного электростатического потенциала вокруг (сверху вниз) вирусных, плазмидных и бактериальных терминаторов. Прямые показывают среднее значение потенциала для этих групп геномов. Средняя панель - соответствующие графики стандартного отклонения для этих групп.
Нижняя панель - графики GC-состава, окно усреднения - 1 п.о. По вертикали - электростатический потенциал в ё/А, по горизонтали — расстояние вдоль молекулы ДНК в А, вертикальная линия - середина терминаторов. Еще одним примером использования базы может служить анализ электростатического потенциала вокруг полного генома бактериофага X, выявивший корреляцию между абсолютной величиной потенциала и частотой и продолжительностью связывания РНК-полимеразы с разными областями ДНК этого генома. Эксперимент по прямой визуализации этого процесса был описан в работе [156]. Следует отметить, что молекула ДНК в эксперименте была растянута на световых ловушках, что обеспечило ее линейность и, таким образом, исключило влияние изгибов на связывание РНК-полимеразы.
Электростатический потенциал, абсолютное значение (сверху) и частота связывания РНК-полимеразы с геномной ДНК фага X (снизу).
Полученное в эксперименте распределение частоты связывания РНК-полимеразы неоднородно вдоль молекулы геномной ДНК и соответствует распределению абсолютного значения электростатического потенциала, что может свидетельствовать о его роли в данном процессе