Введение к работе
Актуальность работы. Последнее десятилетие в развитии молекулярной биологии и молекулярной генетики ознаменовалось расшифровкой генома человека и более десятка геномов других животных. В настоящее время есть все основания говорить о вступлении этих разделов биологии в постгеномную эру, которая ставит перед ними ряд новых фундаментальных задач. Центральное место среди этих задач принадлежит расшифровке регуляторного кода ДНК и выяснению принципов организации регуляторного аппарата эукариотической клетки, слаженная работа всех компонентов которого обеспечивает нужный уровень экспрессии каждого гена с надлежащей эффективностью в надлежащее время и в надлежащем месте.
Основу транскрипционного регуляторного кода ДНК составляют короткие (5-20 п.н.) последовательности - сайты связывания регуляторных белков - транскрипционных факторов (ССТФ). Набор таких сайтов в регуляторных районах гена программирует его судьбу в процессе индивидуального развития, определяет тканеспецифичность экспрессии гена, а также его способность отвечать на различные сигналы внешней и внутренней среды. К настоящему времени достипгуты большие успехи как в изучении организации регуляторных районов эукариотических генов, так и в идентификации и анализе компонентов надгеномной регуляторной системы. Открыты сотни факторов транскрипции (ТФ) [Wingender, 2008], идентифицированы десятки тысяч сайтов связывания этих белков во многих генах [Kolchanov et al, 2002; Matys et al, 2006], сложились представления о регуляторных районах генов - промоторах, энхансерах, сайленсерах. Тем не менее, расшифровка регуляторного транскрипционного кода ДНК еще очень далека от завершения. Активно развиваемые во всем мире биоинформатические подходы к решению этой задачи, основанные на использовании компьютерных методов распознавания ССТФ на ДНК, пока дают довольно скромные результаты. Очевидно, что эффективность этих подходов может существенно возрасти при сочетании их с экспериментальными методами, однако такие работы до сих пор исчисляются единицами [Tronche et al, 1997; Kel et al, 2001; Kel era/., 2008].
Ввиду ключевой роли в регуляции жизненно важных физиологических процессов, актуальными моделями для создания экспериментально-компьютерных подходов по поиску сайтов связывания представляются транскрипционные факторы: SF-1 (steroidogenic factor 1) - один из основных регуляторов экспрессии генов системы стероидогенеза, и играющий важную роль в поддержании гомеостаза холестерина и метаболизме жирных кислот SREBP (sterol regulatory element binding protein).
Цель и задачи исследования. Целью данной работы являлось выявление новых сайтов связывания транскрипционных факторов SF-1 и SREBP в генах позвоночных животных с помощью комплекса экспериментальных и теоретических методов, а также идентификация новых генов-мишеней SF-1 в геноме человека. В ходе работы были поставлены следующие задачи:
-
Экспериментальная верификация компьютерных методов распознавания сайтов связывания SF-1 (SiteGA, SITECON, SiteGA+PWM): выявление новых сайтов связывания этого фактора в генах системы стероидогенеза млекопитающих.
-
Подбор параметров работы метода SITECON для распознавания сайтов связывания SREBP SRE-типа: обнаружение новых SREBP сайтов в регуляторных районах генов системы липидного метаболизма позвоночных.
-
Разработка на основе метода SiteGA критерия для идентификации неизвестных ранее генов-мишеней SF-1, поиск таких генов в геноме человека и экспериментальная проверка выдвинутого на основе компьютерного анализа генома предположения об экспрессии SF-1 в органах экспериментальных животных, где экспрессия этого фактора до сих пор не изучалась.
Научная новизна. С помощью сочетания компьютерных и экспериментальных методов в генах системы стероидогенеза и липидного метаболизма выявлены ранее неизвестные сайты связывания транскрипционных факторов (ССТФ) SF-1 и SREBP. Для трёх обнаруженных in vitro в промоторах генов системы стероидогенеза млекопитающих сайтов впервые доказано их связывание с SF-1 в условиях in vivo, что является аргументом в пользу функциональности исследованных сайтов связывания. Результаты экспериментов по верификации предсказанных потенциальных сайтов показали высокую точность использованных биоинформатических методов распознавания ССТФ при выбранных нами параметрах их работы и реалистичность предсказаний с помощью данных методов.
Впервые показано, что пулы сайтов SF-1, распознанные методами SiteGA, SITECON, SiteGA+PWM, перекрываются лишь частично. Объединение подмножеств потенциальных ССТФ, обнаруженных каждым из компьютерных методов, значительно увеличивает суммарное число предсказаний новых сайтов, что существенно расширяет наши знания о механизмах регуляции экспрессии ранее неизвестных генов-мишеней. Таким образом, сочетание нескольких биоинформатических методов распознавания, основанных на разных принципах анализа исходных последовательностей, представляется более эффективным подходом для распознавания потенциальных ССТФ, чем использование каждого из них в отдельности.
На основе анализа распределения выявленных методом SiteGA потенциальных SF-1 сайтов в промоторных районах генов разработан новый метод для выявления вероятных генов-мишеней SF-1 в геномах млекопитающих. С его помощью в геноме человека обнаружено несколько перспективных для дальнейшего изучения групп, включающих гены рецепторов цитокинов и рецепторов факторов роста; гены, кодирующие регуляторные белки, а также гены, экспрессирующиеся в некоторых органах мужской репродуктивной системы, где экспрессия SF-1 ранее не изучалась. Исходя из полученных данных, было сделано предположение об экспрессии SF-1 в придатке семенника. На модели экспериментальных животных впервые показана экспрессия SF-1 в этом органе.
Положения, выносимые на защиту.
-
Выявление с помощью экспериментально-компьютерного подхода в 15 генах липидного метаболизма позвоночных животных 23 неизвестных ранее сайтов связывания транскрипционного фактора SREBP, а в 19 генах системы стероидогенеза млекопитающих 41 нового сайта связывания транскрипционного фактора SF-1, подтверждает высокую эффективность использования комбинированного подхода к исследованию регуляторных районов генов.
-
Разработанный нами на основе экспериментально верифицированного компьютерного метода SiteGA комбинированный подход пригоден для полномасштабного поиска в геномах млекопитающих потенциальных генов — мишеней SF-1, а также позволяет успешно предсказывать новые ткани и органы, в которых можно ожидать экспрессию этого фактора.
-
С помощью этого подхода в геноме человека выделено несколько новых групп генов, регулируемых транскрипционным фактором SF-1, в том числе гены рецепторов цитокинов и факторов роста, гены других регуляторных белков и транскрипционных факторов.
Практическая значимость. Полученные в диссертации результаты могут быть использованы для создания комбинированных подходов по выявлению в геномах эукариот сайтов связывания транскрипционных факторов и поиска их генов-мишеней. Точное распознавание сайтов связывания транскрипционных факторов в регуляторных районах генов с помощью предложенного в диссертации экспериментально-компьютерного подхода может быть использовано для предсказания специфичности экспрессии этих генов в органах и тканях, и для выявления новых процессов, в которых транскрипционные факторы также могут участвовать.
Материалы данной диссертации используются при чтении лекций по спецкурсу «Новейшие молекулярно-генетические технологии» на кафедре информационной биологии ФЕН НГУ.
Апробация работы. Результаты работы представлены на 6 конференциях, среди которых четвертая, пятая и шестая международные конференции по биоинформатике, структуре и регуляции генома (г. Новосибирск, август 2004 г., июль 2006г., июнь 2008г.); международная конференция по компьютерной молекулярной биологии (Москва, 22-25 июля 2005 г.); III Съезд ВОГиС (Москва, 6-12 июня 2004 г.); III Съезд биофизиков России (Воронеж, 24-29 июня 2004 г.).
Публикации по теме диссертации. По материалам диссертации опубликовано 9 работ, из них 7 статей в рецензируемых журналах, входящих в список ВАК, и 2 главы в монографиях.
Структура и объем работы. Диссертация состоит из введения, обзора литературы, описания использованных материалов и методов, изложения и обсуждения собственных экспериментальных данных, выводов и списка литературы (279 наименований). Работа изложена на 155 страницах машинописного текста, и содержит 6 таблиц и 17 рисунков.
Работа выполнена на 10-ти дневных и взрослых самцах крыс Wistar, а также 7-10-ти дневных самцах мышей линии CC57BR/Mv разведения вивария ИЦиГ СО РАН. Экстракты ядер получали согласно методу Горски-Шапиро (Gorsky-Shapiro) [Климова и др., 2006]. Рекомбинантный SREBP-la был получен при помощи системы экспрессии белков в E.coli. Связывание белков экстракта ядер и рекомбинантного SREBP-la с различными олигонуклеотидами изучали методом задержки ДНК-пробы в геле. Для определения связывания ТФ SF-1 в условиях in vivo с его потенциальными сайтами в генах использовали метод иммунопреципитации хроматина. Содержание ТФ SF-1 в ядерном экстракте и лизатах оценивали методом Вестерн-блот гибридизации. Для визуализации результатов использовали ECL-систему "Amersham".