Введение к работе
Актуальность проблемы. Сейчас, когда закончено определение нуклеотидных последовательностей нескольких геномов млекопитающих (Lander et al. 2001; Venter et al. 2001; Waterston et al. 2002), главной задачей геномики становится изучение регуляторных механизмов, определяющих фенотипическое разнообразие живых организмов. Считается, что в геноме млекопитающих имеется 20000-30000 генов, кодирующих белки; однако последние данные указывают на то, что транскрибируется существенно большая часть генома (Carninci 2006). Не кодирующие белки транскрипты играют важную роль в регуляции генома, что существенно увеличивает сложность строения геномной машины. Вся совокупность генов и транскрибируемых областей генома многоклеточных организмов связана в сложнейшую регулируемую сеть, определяющую существование многочисленных типов специализированных клеток. Транскрипция генов и некодирующих последовательностей регулируется на нескольких уровнях: линейной архитектуры генома, представленной цис-регуляторными элементами ДНК, модификации ДНК, структуры хроматина, структурной компартментализации ядра и др.
Следует признать, что, несмотря на серьезные достижения в изучении организации отдельных регуляторных систем (Maston et al. 2006), мы все еще далеки от полного понимания механизмов, управляющих геномом как целым. Даже в относительно простых случаях идентификации геномных элементов, играющих роль цис-регуляторов, мы встречаем серьезные затруднения, требующие для их преодоления длительных усилий большого числа исследователей. Согласно теоретическим предсказаниям геном человека может содержать до 100000 энхансеров и сайленсеров, однако к настоящему времени охарактеризована лишь небольшая их часть (Pennisi 2004).
Понятно, что для полной функциональной характеристики организма необходимо знать положение и функциональное состояние всех регуляторных последовательностей его генома во всех типах клеток на всех этапах его жизни. Хотя эта грандиозная задача пока далека от решения, разработка подходов для этого уже началась, в частности, в рамках предлагаемого исследования.
Регуляторные элементы генома даже одного и того же типа (например, энхансеры) в общем случае не обладают заметной гомологией первичных структур. Это связано в первую очередь со специфичностью их действия. Определенный цис-элемент должен оказывать свое действие (связывать регуляторные белки) в определенном месте и в определенное время, и поэтому не может быть близок по первичной структуре к подобному по активности элементу, действующему в другом типе клеток и на другой стадии развития организма. Эта особенность цис-регуляторных элементов не позволяет идентифицировать их по сходству первичных структур методами биоинформатики, и приводит к необходимости разработки экспериментальных методов их идентификации, причем эти методы должны быть различны для различных типов регуляторов.
За последнее время было предложено большое число различных экспериментальных подходов для идентификации регуляторных последовательностей внутри генома. Во всех этих подходах используется один и тот же ключевой элемент - получение высокообогащенных клонотек фрагментов ДНК, содержащих соответствующие
регуляторные элементы. После конструирования таких клонотек нахождение их места в геноме становится чисто технической задачей и может быть осуществлено при помощи различных технологий, таких как гибридизация с геномными микрочипами, массированное секвенирование, технологии, сходные с SAGE (Serial Analysis of Gene Expression) и др. Эти подходы можно разделить на две группы. В первую входят методы, которые можно назвать структурными, т.е. методы, основанные на взаимодействии ДНК с белками или субклеточными структурами, а также на структурных особенностях ДНК. Вторую группу составляют функциональные подходы, обычно использующие "метод репортерного гена".
Построение функциональных карт генома можно вести по двум основным направлениям. Во-первых, можно картировать один или небольшое число элементов внутри полного генома или достаточно большой его части (полногеномный подход). Такого рода технологии в основном применяются в последние несколько лет. Во-вторых, можно определить положение достаточно большого числа (в перспективе - всех) регуляторных элементов внутри относительно небольшой области генома, с перспективой объединения этих областей в полногеномную функциональную карту.
В нашей работе были использованы оба упомянутых выше подхода. На ранних этапах работы (1995-2000 г.), когда последовательность генома человека не была еще известна, мы использовали полнохромосомный (на примере хромосомы 19) подход. Полученный опыт показал, что технические ограничения такого подхода не позволяют построить функциональные карты, содержащие все или основную часть регуляторных элементов, и, по мере накопления экспериментальных данных, мы перешли к детальному картированию относительно небольшого (1 млн. п.о.) фрагмента хромосомы 19 человека, расположенного между генами FXYD5 и СОХ7А1, который и стал основной моделью для отработки методов идентификации различных регуляторных элементов.
Цели и задачи исследования. Цель настоящей работы заключалась в разработке подходов, идентификации и функциональном картировании ряда цис-регуляторных элементов внутри протяженных областей генома человека.
В ходе работы были решены следующие задачи:
-
Предложен метод идентификации и картирования участков прикрепления ДНК к ядерному матриксу. С помощью этого подхода реконструирована доменная структура областей хромосом 19 и 16 человека длиной соответственно 1 млн.п.о. и 2.9 млн.п.о.
-
Разработан метод двумерного EMS А, при помощи которого составлена карта расположения участков связывания ядерных белков и фактора транскрипции CTCF в протяженной области хромосомы 19 человека.
-
Предложен метод EMSA-дисплея и продемонстрирована его пригодность для идентификации и картирования тканеспецифичных сайтов связывания белков в геномных последовательностях.
-
Предложен метод идентификации сайтов связывания факторов транскрипции на основе иммуномагнитной сепарации, который позволил идентифицировать, картировать и охарактеризовать ряд участков связывания фактора с-Мус в последовательности хромосомы 19 человека.
5. Предложен метод идентификации и картирования потенциальных инсуляторов. Внутри области хромосомы 19 человека длиной 1 млн.п.о. идентифицировано, картировано и охарактеризовано 8 таких последовательностей.
Научная новизна, теоретическая и практическая значимость работы. В
настоящей работе сформулирован подход к функциональному картированию геномов, заключающийся в построении подробных карт, включающих все или большую часть цис-регуляторных элементов, для относительно небольших (несколько млн. п.о.) областей генома. В дальнейшем подобные частичные карты могут быть объединены в функциональные карты целых хромосом и полных геномов. Для осуществления предложенной концепции разработан ряд оригинальных методов, позволяющих экспериментально идентифицировать ряд цис-регуляторных элементов, получить клонотеки этих элементов, и определить их положение относительно друг друга и относительно генов внутри протяженных областей генома.
На основании полученных нами в данной работе и имеющихся литературных данных мы построили первый вариант интегрированной карты регуляторных последовательностей для области хромосомы 19 человека длиной 500 т.п.о. Полученная карта, хотя и является наиболее полной из имеющихся в настоящее время карт геномных областей высших эукариот, пока далека от завершения, особенно в части тканеспецифичности действия приведенных регуляторных последовательностей. Тем не менее, она дает представление о сложности регуляторнои системы генома и о трудности их исследования. Мы надеемся, что предложенные в настоящей работе методы позволят в обозримом будущем создать более исчерпывающие функциональные карты как отдельных областей, так и полных геномов.
Апробация результатов работы. Основные результаты работы были представлены на научных конференциях и симпозиумах, в том числе: 5-й (1996 г.), 6-й (1997 г.) и 9-й (1999 г.) конференциях российской программы "Геном человека"; 4-й международной Энгельгардтовской конференции по молекулярной биологии (1999 г.); III (1996 г.), IV (1998 г.), VI (2002 г.), VIII (2006 г.) чтениях, посвященных памяти академика Ю. А. Овчинникова, конгрессах HUGO Human Genome Meeting (Гейдельберг 1996 г., Эдинбург 2001 г., Хельсинки 2006 г.).
Работа выполнена при финансовой поддержке российской программы "Геном человека", Программы Президиума РАН "Молекулярная и клеточная биология", Программы "Ведущие научные школы РФ", Российского фонда фундаментальных исследований, программы INTAS и грантов НАТО и министерства энергетики США.
Структура и объем диссертации. Диссертационная работа состоит из введения, обзора литературы, описания материалов и методов исследования, изложения результатов работы и их обсуждения, заключения, выводов и списка литературы. Работа изложена на 191 странице, содержит 46 рисунков и 16 таблиц. Список литературы включает 347 источников.