Введение к работе
Актуальность темы исследования
В настоящее время большое значение придается изучению эпигенетических механизмов, влияющих на реализацию генетической информации. Развитие экспериментальных методов молекулярной биологии позволило получить не только нуклеотидные последовательности геномов различных организмов, но и их эпигенетические профили на различных стадиях развития и в различных тканях организма. Вследствие этого становится особенно важным понять взаимосвязь между генетическими и эпигенетическим механизмами хранения, реализации и передачи наследственной информации. Одним из связующих звеньев между генетическими и эпигенетическими механизмами наследственности, по-видимому, являются особые сегменты ДНК, называемые CpG островами. Эти участки ДНК обладают специфическим составом нуклео-тидов и динуклеотидов, и часто отличаются тем, что присутствующий в них цитозин в положении перед гуанином подвергается метилированию существенно реже, чем в среднем по геному.
Как это ни удивительно, несмотря на многочисленные работы, доказывающие участие CpG островов во множестве процессов в клетке, до сих пор не существует общепризнанного классифицирующего определения этих участков. Чаще всего для определения CpG островов используются алгоритмы in silico, которые можно разделить на две категории: алгоритмы «скользящего окна» и алгоритмы кластеризации. В алгоритмах обоих типов используются пороги, не имеющие достаточного биологического обоснования. Верификация результатов работы алгоритмов затруднена в связи с множеством процессов, имеющих отношение к образованию, поддержанию и функционированию CpG островов. В частности, все попытки создать алгоритм, который бы определял CpG острова на основании некоторой единственной функции (CpG острова в 5' обла-
сти генов, участки, с неметилированными CpG динуклеотидами и т.д.), приводили к высокому проценту ложно-положительных предсказаний. Вполне вероятно, что каждое из имеющихся на данный момент определений CpG островов выделяет «химерный» класс ДНК сегментов, для которых не существует общей молекулярной структуры или функции.
Выделение функционально однородных CpG островов должно облегчить дальнейшее исследование эпигенетических механизмов. Данная работа направлена на изучение механизмов, ответственных за формирование CpG островов, что в перспективе должно дать возможность построения алгоритма определения функционально однородных CpG островов in silico.
Объект и метод исследования
Объектом исследования являются CpG острова в геноме человека и структурные элементы внутри них, особое внимание уделяется CpG островам, расположенным на относительном удалении от точки инициации транскрипции известных белок-кодирующих генов.
Основным методом, применяемым в диссертационном исследовании, является теоретический анализ публично доступных экспериментальных данных.
Цель и задачи исследования
Основной целью данного исследования является определение молекулярных свойств CpG островов, расположенных вдали от стартов транскрипции известных генов, выявление их внутренней структуры, факторов стабилизирующего отбора, поддерживающего наличие CpG островов, и описание особенностей мутационного процесса внутри CpG островов в геноме человека.
Достижение поставленных целей предполагает решение следующих задач.
Проверка гипотезы о том, что CpG острова вдали от точек инициа
ции транскрипции известных белок-кодирующих генов не являются
артефактом метода теоретического определения CpG островов.
Определение величины давления отбора внутри CpG островов разных локализаций.
Описание особенностей мутационного процесса внутри CpG островов.
Выявление общих и отличительных структурных свойств CpG островов, расположенных вблизи и вдали от стартов известных генов.
Определение особенностей первичной структуры ДНК вблизи точек инициации транскрипции.
Научная новизна диссертационного исследования
В данной работе было впервые в масштабе полного генома показано, что CpG острова в значительной степени пересекаются с белок-коди-рующими экзонами, что не удается объяснить аминокислотным составом кодируемого белка. Показано, что в пределах CpG островов, перекрывающиеся с экзонами, и расположенных в любой области гена наблюдается снижение уровня синонимичных замен в CpG-содержащих кодонах, что указывает на наличие давления отбора. Кроме того, CpG острова, расположенные в любой области генома, содержат точки инициации транскрипции, определенные методом анализа экспрессии генов путем захвата за модифицированный 5'-конец РНК (Cap-analysis gene expression, CAGE), а также участки связывания фактора инициации транскрипции Spl.
Показано, что участки ДНК, содержащие большое число точек инициации транскрипции на данной цепи, обладают повышенным содержанием гуанина на кодирующей цепи. При этом цитозин, присутствующий на данной цепи в меньшем количестве, имеет тенденцию кластеризоваться в полинуклеотидные тракты и мотивы, подобные участкам спе-
цифического связывания фактора инициации транскрипции Spl.
Также в работе было продемонстрировано, что мутационный процесс в CpG острове имеет существенные характерные особенности. Замены CpG > TpG (СрА) в CpG острове встречаются реже, чем вне CpG острова. Данный эффект не объясняется исключительно меньшим уровнем метилирования цитозина в CpG острове и сохраняется, если исследовать только цитозины, метилированные в клетках, близких к зародышевой линии. Уровень замен СС, CG, GC, GG в любых направлениях, не снижающих общего GC содержания, значимо выше в CpG островах в сравнении с остальным геномом.
Практическая значимость исследования
Полученные в работе свидетельства транскрипционной активности CpG остовов, удаленных от точек инициации транскрипции известных белок-кодирующих генов, указывает на необходимость пересмотра концепции полногеномной транскрипции как явления, происходящего крайне редко. Под контролем перекрывающихся CpG островами промоторов мгут синтезироваться неизвестные ранее типы молекул некодирующей РНК. В последнее время идет активное накопление данных о полиморфизмах, ассоциированных с различными наследственными заболеваниями, и не затрагивающих никаких известных белок-кодирующих генов. Можно предположить, что подобные полиморфизмы влияют на промоторы, контролирующие синтез нкРНК. Таким образом, результаты нашей работы позволяют выявить участки ДНК, не участвующие в синтезе мРНК, но важные с точки зрения молекулярной биологаи и молекулярной медицины. Кроме того, полученные результаты о взаимодействии метилирования и мутационного процесса внутри CpG островов могут быть использованы при изучении механизмов возникновения болезней, связанных с изменением эпигенома, таких как рак, диабет, болезнь Альцгеймера и др.
Полученные в работе сведения о структурно-функциональных элементах, связанных с точками инициации транскрипции, могут бьпь использованы для построения алгоритма определения функционально-однородных CpG островов.
Апробация диссертационного исследования
Основные результаты работы были представлены на Московской Конференции по Вычислительной и Молекулярной Биологии в 2005, 2007 и
-
гг., на Международной школе «Биоинформатика, геномика, протео-мика» в Алматы в 2006 г., на Российско-Германской школе им. Гельм-гольца по Системной Биологии в Москве в 2008 г., на Международной Конференции по Исследованиям в Области Вычислительной Молекулярной Биологии в Сингапуре в 2008 г., на конференции «Биоинформатика, Геномной Регуляции и Структуры» в Новосибирске в 2008 г., на Конференциях Европейского Научного Фонда «Функциональная геномика и заболевания» в Инсбруке, Австрия, в 2008 г. и в Дрездене, Германия, в
-
г.
По материалам диссертации опубликовано 12 печатных работ, включая 3 статьи в реферируемых научных журналах, а также материалы докладов на научных конференций.
Апробация диссертационного исследования проведена на заседании секции «Молекулярная биология» Ученого Совета ФГУП «ГосНИИгене-тика».
Структура и объем диссертационного исследования
Диссертационное исследование, изложенное на 153 листах машинописного текста, включает в себя введение, обзор литературы, четыре главы, содержащие результаты и обсуждение, заключение, выводы и библиографический список из 255 наименований. Работа содержит 10 рисунков и 13 таблиц.
Основное содержание диссертационного исследования
Введение и обзор литературы
Раздел содержит аналитический обзор литературы, посвященный сравнению современных подходов к определению CpG островов в эксперименте и in silico, а также описанию биологических функций, которые ассоциированы с CpG островами. Кроме того, в разделе излагается мотивация постановки задач.