Введение к работе
Актуальность работы. Достижения последних десятилетий в сфере молекулярной биологии, произошедших одновременно с технологическим прорывом, обеспечили взрывной рост объема информации о биологических системах и их компонентах. Это выразилось в возникновении технологий крупномасштабного скрининга, с помощью которых стало возможным изучать клетку и механизмы ее функционирования на всех уровнях организации живой материи (РНК, белки, каскады белковых взаимодействий). Кроме того, появились методы, позволяющие оценивать состояние клетки по составу метаболитов, паттернам метилирования промоторных областей генов или определять сайты связывания белков с ДНК.
Главное преимущество вышеперечисленных методов состоит в том, что они способны дать исследователю всеобъемлющую картину изменений, происходящих на каждом из уровней клеточной организации. Но это достоинство крупномасштабных методов: всецело и полноценно охватывать состояние клетки на каком-то одном из уровней клеточной организации, - является одновременно и недостатком; например, по полной картине одномоментного изменения экспрессии генов в клетке очень трудно понять, что же именно стало причиной этого изменения и какова доля и состав тех генов, которые отвечают за патологию относительно массива остальных генов, которые отвечают за гомеостаз, базовые биологические процессы (репликация ДНК, синтез белка и т.д.). Еще труднее соотнести их с определенными фенотипическими проявлениями изучаемого состояния.
По мере накопления массивов крупномасштабных (постгеномных) данных все острее становится необходимость их корректной обработки и интерпретации. Поскольку эти массивы данных содержат информацию о десятках тысяч генов или белков, традиционные методы анализа данных, рассчитанные на обработку информации об одном или нескольких объектах, в данном случае работают плохо. Другая сложность состоит в том, что, даже имея информацию о состоянии всех компонентов клетки и их функциях, невозможно установить причинно-следственные связи между их изменениями и патологическими изменениями клетки.
С точки зрения изучения биологических процессов необходимо рассматривать сразу несколько уровней клеточной организации: ДНК-РНК-белок-сигнальный
путь, на каждом из которых могут происходить изменения, обуславливающие возникновение и развитие патологии. Эта общепринятая концепция вплотную подводит нас к необходимости интеграции и совместного анализа различных типов крупномасштабных, или постгеномных данных.
Один из актуальных на данный момент подходов к решению этой задачи предполагает конструирование глобальной биологической сети - схемы взаимодействующих белков, метаболитов и нуклеиновых кислот клетки. На эту глобальную сеть в дальнейшем можно картировать все множества объектов из различных типов анализируемых данных, связанных с патологией. Возможность анализа характеристик сетей, которые образуют различные типы данных, позволит строить гипотезы об относительном вкладе каждого уровня организации в фенотип патологии, и помимо этого проследить причинно-следственные связи между ними.
Цели и задачи исследования. Целью данной работы была попытка продемонстрировать универсальность и эффективность совместного применения интерактомного и функционального анализа. А именно использовать методы интерактомного анализа, которые включают в себя анализ топологии сети и ее компонентный состав, распределение вершин по белковым классам и оценка взаимосвязей как внутри самих, так и относительно других данных, и сопоставить с результатами функционального анализа. Для этого были использованы различные типы крупномасштабных данных, как экспрессионные, так и геномные, находящиеся на разных стадиях статистической обработки.
Для достижения данной цели были поставлены следующие задачи:
-
Идентифицировать списки конститутивных и тканеспецифичных генов для 31 ткани, используя необработанные данные по экспрессии.
-
Проанализировать полученные списки методами интерактомного и функционального анализа
-
Идентифицировать ампликоны, характерные для рака молочной железы, используя статистически обработанные данные SNP-чипов.
-
Определить причинно-следственные связи между ампликомом и мутомом в раке молочной железы используя интерактомный анализ
-
Произвести анализ 262 моделей, построенных 33 различными лабораториями в рамках международного проекта MAQC II с целью поиска корреляций между точностью модели и ее топологическими характеристиками и функциональными свойствами
-
Сделать заключение об эффективности и информативности интерактомного анализа и перспективе его применения в будущем.
Научная новизна. 1) Впервые был применен интерактомный анализ -совокупность методов оценки топологических характеристик, белкового состава и взаимосвязанности сетей. 2) Впервые было продемонстрировано, что характеристики сетей согласуются с результатами функционального анализа и отражают биологическую сущность каждого фенотипа. 3) Впервые была высказана гипотеза, что соматические мутации играют ведущую роль относительно амплификации в раке молочной железы. 4) Впервые было показано, что экспрессионные классификаторы для одного и того же фенотипического признака, созданные с помощью различных математических моделей, образуют сети со сходными характеристиками.
Практическое значение. Изучение комплексных полигенных заболеваний, таких как рак молочной железы, сопряжено с рядом трудностей. Особенно стоит отметить проблему оценки значимости относительного вклада изменений на каждом из уровней организации информации в клетке. Помимо этого существует проблема выявления взаимосвязи между изменениями на разных уровнях: ДНК-РНК-белок-сигнальный путь. Методы интерактомного анализа позволяют выявить скрытые топологические особенности биологической сети, которую образуют анализируемые данные, которые нельзя определить, используя только методы функционального анализа. В ходе данной работы была дана характеристика взаимосвязи между амплификациями и мутациями рака молочной железы, что является существенным шагом к пониманию этиологии данного заболевания. Исследование механизмов возникновения и развития заболевания позволит разработать наиболее эффективные методы профилактики, диагностики и лечения. Совершенствование существующих и разработка новых инструментов интерактомного анализа совместно с увеличением и уточнением глобальной сети белок-белковых взаимодействий является перспективным направлением в плане изучения различных генетических заболеваний.
Апробация результатов работы. Результаты данной диссертационной работы были представлены на межлабораторном научном семинаре Отдела геномики Института общей генетики им. Н. И. Вавилова РАН от «22» октября 2010 г.
Декларация участия автора. Функциональный анализ данных по экспрессии генов из 31 образца тканей, а также геномных данных по соматических мутациям и амплификациям рака молочной железы проводился автором совместно с Евгением Свиридовым. Статистическая обработка и получение первичных значений амплификации была выполнена Яо Джуном. Функциональный анализ экспрессионных классификаторов проводился автором совместно с Мариной Бессарабовой, Вей-Веем Ши и Золтаном Дезсо. Идентификация ампликонов на основании первичных значений по амплификации была произведена автором самостоятельно. Интерактомный анализа для всех использованных в работе данных был произведен автором самостоятельно. Семьдесят процентов материала было получено лично автором.
Публикации. По материалам диссертации опубликовано 3 статьи в журналах, включенных в перечень научных журналов и изданий, рекомендованных ВАК Минобрнауки России (ВМС Biology, 2008; Cancer Research, 2008; Pharmacogenomics Journal, 2010 г.).
Структура и объем диссертации. Диссертационная работа состоит из введения, списка сокращений, списка терминов, обзора литературы, материалов и методов, результатов, обсуждений, выводов, приложений и списка цитируемой литературы. Работа изложена на -/У^ страницах машинописного текста, включает %3 таблиц и / рисунков. Список цитируемых литературных источников включает i%3 наименований.
Благодарности. Автор считает приятным долгом выразить признательность своему руководителю Никольской Т.А за всестороннюю помощь в работе над диссертацией. Автор благодарен за помощь в сборе и анализе материала и продуктивные обсуждения коллегам: Бессарабовой М.О, Ишкину А.А., Никольскому Ю.В., Свиридову Е.А., Ши В., Дезсо 3., а также все сотрудникам лаборатории системной биологии. Особую признательность автор выражает ФББ МГУ им М.В. Ломоносова, всем преподавателям и учащимся за одни из лучших лет в жизни автора, которые определили его цели в жизни.