Содержание к диссертации
Введение
Глава 1. Обзор литературы 9
1.1. Механизм убиквитилирования 9
1.2. Общая характеристика ЕЗ убиквитин-протеин лигаз. НЕСТ-доменные убиквитин-протеин лигазы
1.2.1. Структурно-функциональная характеристика группы С2- WW-HECT убиквитин-протеин лигаз
1.2.2. Структурно-функциональная характеристика подгруппы HERC белков
1.3. Роль НЕСТ-доменных убиквитин-протеин лигаз в развитии патологических состояний
1.4. Биоинформатика как самостоятельная область исследований
Глава 2. Материалы и методы 34
2.1. Общая часть 3 4
2.2. Формирование выборки белков 36
2.3. Алгоритм поиска гомологов 48
2.4. Парное выравнивание аминокислотных последовательностей
2.5. Множественное выравнивание аминокислотных последовательностей
2.6. Филогенетический анализ 49
2.7. Доменный анализ белков 49
2.8. Анализ профилей экспрессии белков 50
Глава 3. Результаты и их обсуждение 51
3.1. Филогенетический анализ НЕСТ-доменных убиквитин- протеин лигаз
3.2. Анализ доменной организации НЕСТ-доменных убиквитин-протеин лигаз
3. Формирование классификации НЕСТ-доменных убиквитин-протеин лигаз
4. Анализ профилей экспрессии НЕСТ-доменных убиквитин- протеин лигаз
Выводы 106
Список литературы 107
Приложение 129
- Общая характеристика ЕЗ убиквитин-протеин лигаз. НЕСТ-доменные убиквитин-протеин лигазы
- Роль НЕСТ-доменных убиквитин-протеин лигаз в развитии патологических состояний
- Множественное выравнивание аминокислотных последовательностей
- Анализ доменной организации НЕСТ-доменных убиквитин-протеин лигаз
Введение к работе
Одним из вариантов посттрансляционного процессинга белков является ковалентная модификация аминокислотных остатков, что ведет к изменению физико-химических белков. Сюда можно отнести такие широко распространенные механизмы регуляции метаболических процессов в живой клетке, как фосфорилирование, ацелирование, гликозилирование и др. В последние годы выявлен и активно исследуется еще один механизм регуляции данного типа, который реализуется за счет связывания белка-мишени и регуляторного белка убиквитина. Убиквитин (ubiquitin, Ubi) -термостабильный высококонсервативный белок, состоящий из 76-ти аминокислот и имеющий молекулярную массу 8,5 кДа - был впервые выделен в 1977г. При конъюгации убиквитина с белком-мишенью происходит образование изопептидной связи между аС - терминальным глицином (Gly 76) молекулы Ubi и є-аминогруппой остатка лизина полипептидной цепи белка-мишени, либо Lys 48 следующей молекулы Ubi с образованием "разветвленной" цепи Ubi-мультимера (Hershko and Heller, 1985).
Убиквитилирование - многоступенчатый АТФ-зависимый процесс, который катализируется сложно организованной мультиферментной системой - убиквитин-протеин лигазным комплексом, состоящим из компонентов Е1 (убиквитин-активирующий фермент), Е2 (убиквитин-конъюгирующий фермент) и ЕЗ - собственно убиквитин-протеин лигазы, которая катализирует финальное присоединение молекулы убиквитина к субстрату, а также наращивание мультиубиквитиновой цепи (GlicJkman and Ciechanover, 2002; Mann and Jensen, 2003). ЕЗ лигазы являются центральными детерминантами процесса убиквитилирования, поскольку именно они распознают и убиквитилируют субстрат, что определяет молекулярные и/или клеточные эффекты убиквитилирования. Описанный выше трехступенчатый механизм инициирует все известные реакции убиквитилирования, независимо от того, предназначен ли субстрат для протеасомальной
деградации или убиквитилирование играет регуляторную роль, не связанную напрямую с протеолизом (Lee and Myung, 2008; Daulny and Tansey, 2009). Bo многих случаях субстрат, убиквитин и убиквитин-конъюгирующий фермент Е2 должны присутствовать вместе в реакционном центре ЕЗ. Поэтому, в дополнение к функции передачи убиквитина на лизин белка-мишени, ЕЗ должен также скоординировать взаимодействие большого количества белковых компонентов системы в своем реакционном центре (Pickart, 2001; Pickart and Eddins, 2004; Petroski and Deshaies, 2005).
Полифункциональность убиквитин-протеин лигаз опосредуется их структурными особенностями. В настоящее время известны 2 основные разновидности ЕЗ лигаз: ферменты ЕЗ, содержащие каталитический1 RING домен (Really Interesting New Gene), и НЕСТ-доменные ЕЗ лигазы (Homologous to E6-associated protein C-Terminus, гомологичный С-концевой последовательности белка Е6).
RING-доменные убиквитин-протеин лигазы координируют , белок-мишень и Е2-убиквитин-тиоэфирный комплекс таким образом, чтобьг обеспечить прямую передачу убиквитина от Е2 к белку-мишени. В данную группу, помимо мономерных RING-доменных белков, входят многокомпонентные белковые комплексы, например, куллин-содержащие убиквитин-протеин лигазные комплексы (SCF-комплексы), для< которых каждая из молекулярных функций обеспечивается' специфической субъединицей (Robinson and Ardley, 2004). Такая неоднородность состава группы существенно усложняет их структурно-функциональный анализ.
Напротив, все НЕСТ-доменные ЕЗ лигазы - мономерные белки, сами распознающие субстрат и сами же его убиквитилирующие. В отличие от RING-доменных убиквитин-протеин лигаз, при взаимодействии между Е2 и НЕСТ-доменной ЕЗ происходит перенос молекулы убиквитина сначала на остаток цистеина активного центра НЕСТ домена. После этого НЕСТ ЕЗ взаимодействует с белком-мишенью, и передает на него убиквитин (Kee and Huibregtse, 2007). Не смотря на относительную простоту структурной
организации НЕСТ-доменных лигаз, для многих белков показана полифункциональность. Она, в свою очередь, определяется наличием в структуре ЕЗ лигазы, помимо каталитического НЕСТ домена, других доменов.
Убиквитилирование — один из важнейших механизмов посттрансляционной регуляции свойств и функций белков. Регуляторный потенциал убиквитилирования превосходит все известные посттрансляционные модификации, а по разнообразию контролируемых функций сопоставим с фосфорилированием. В частности, система убиквитина вовлечена в регуляцию клеточного цикла, передачу внутриклеточного сигнала, апоптоз, репарацию ДНК и др. (Haglund and Dikic, 2005; Belgareh-Touzer et al., 2008, Leung et al., 2008). В свою очередь, дефекты системы убиквитина приводят к развитию различных патологических процессов, а сами компоненты системы убиквитина рассматриваются в качестве потенциальных мишеней новых лекарственных средств (Scheffner and Staub, 2007; Petroski, 2008; Bemassola et al., 2009). Разнообразие биологических эффектов убиквитилирования в норме и вовлечение системы убиквитина в патогенез заболеваний подчеркивают актуальность исследований системы убиквитина, как в рамках фундаментальной науки, так и ее прикладных аспектов.
После завершения проектов по расшифровке геномов ряда эукариот, стало накапливаться большое количество данных о новых белках. При этом соотношение ^охарактеризованных белков к экспериментально охарактеризованным белкам растет экспоненциально. Именно поэтому одним из актуальных вопросов является расшифровка функций ^охарактеризованных белков.
По данным базы данных белков UniProt протеомного сервера ExPASy (), НЕСТ-домен присутствует в структуре 1246 белков из различных организмов. Однако 90 из них экспериментально охарактеризованы как белки, обладающие убиквитин-протеин лигазной активностью. Структурно-функциональные взаимосвязи изучены лишь для
белка RSP5 (и его гомологов) и белка HERC (и его гомологов). Остальные аминокислотные последовательности, содержащие домен НЕСТ, являются функционально ^охарактеризованными, и представлены в базе данных транслянтов с нуклеотидных последовательностей EMBL (TrEMBL). На сегодня отсутствует единая номенклатура НЕСТ-доменных убиквити-протеин лигаз. Таким образом, актуальной является задача инвентаризации данного семейства белков с использованием различных инструментов компьютерного анализа.
Цель работы: Разработать классификацию НЕСТ-доменных убиквитин-протеин лигаз на основании комплексного анализа их структурных и функциональных особенностей.
Задачи исследования:
Провести филогенетический анализ каталитического домена НЕСТ НЕСТ-доменных убиквитин-протеин лигаз;
Провести анализ доменного состава полной аминокислотной последовательности НЕСТ-доменных убиквитин-протеин лигаз;
На основании совокупности филогенетических и структурно-функциональных данных создать классификацию НЕСТ-доменных убиквитин-протеин лигаз;
Установить наличие корреляции между профилями экспрессии НЕСТ-доменных убиквитин-протеин лигаз из организма Homo sapiens и предлагаемой классификацией.
Общая характеристика ЕЗ убиквитин-протеин лигаз. НЕСТ-доменные убиквитин-протеин лигазы
Выделяют 2 основных семейства ЕЗ лигаз: убиквитин-протеин лигазы, содержащие домен RING и НЕЄТ-доменные убиквитин-протеин/ лигазы (рис.2) (Kee and Huibregtse, 2007). Рис. 2. Описание механизмов работы ЕЗ убиквитин-протеин лигаз - (А) НЕСТ-доменной Nedd4 и (Б) RING-доменного SCF комплекса.
RING-доменные убиквитин-протеин лигазы координируют белок-мишень и Е2-убиквитин-тиоэфирный комплекс таким образом, чтобы обеспечить прямую передачу убиквитина от Е2 к белку-мишени (Jackson et al., 2000). Ряд авторов выделяет еще одну группу ЕЗ-белков: U-box -доменные, обозначаемые иногда Е4. Они служат стыковочным модулем при передаче убиквитина с Е2 на ранее присоединенный к мишени убиквитин (эффект элонгации полиубиквитиновой цепи) (Hatakeyama and Nakayama, 2003). U-box убиквитин лигазы содержат консервативную область в 70 аминокислот. Трехмерная структура U-box подобна RING доменным лигазам, за исключением металлсвязывающей области и самого металла. Белки U-box содержат участок для связывания с шаперонами (Xia et al., 2007).
НЕСТ-доменные белки условно можно разделить на малые НЕСТ убиквитин-протеин лигазы (молекулярной массой приблизительно в 90 кДа), и большие - более чем 500 кДа. N-концевая область НЕСТ-доменных белков содержит детерминанты субстратной специфичности, их внутриклеточной локализации, и, в некоторых случаях, регуляции работы самой убиквитин-лигазы, когда как С-концевой участок (домен НЕСТ) обеспечивает непосредственно процесс убиквитилирования белков-мишеней (Kee and Huibregtse, 2007).
НЕСТ-доменные убиквитин лигазы в процессе убиквитилирования взаимодействуют одновременно с ферментом Е2 и белком мишенью. Убиквитин передается от Е2 к цистеину активного центра убиквитин лигазы в пределах НЕСТ домена, формируя ЕЗ-убиквитин-тиоэфирный комплекс (Scheffner et al., 1995). Затем убиквитин передается к белку-мишени.
НЕСТ домен состоит приблизительно из 350 аминокислотных остатков, которые всегда находятся на С-конце лигазы, и состоит из большой N-концевой доли, которая содержит Е2 связывающий участок, и меньшей С-концевой доли, которая содержит каталитически-активный остаток цистеина. Доли связаны коротким участком, конформационная гибкость которого важна для взаимодействия Е2 и ЕЗ для облегчения реакции транстиоляции (Huang et al., 1999, Ogunjimi et al., 2005, Verdecia et al., 2003). Кроме того, для большинства НЕСТ убиквитин-лигаз ключевую роль в процессе передачи убиквитина от цистеина активного центра к белку-мишени играет остаток фенилаланина, расположенный в пределах четырех аминокислот от конца белка. Он необходим для того, чтобы ориентировать в пространстве молекулу убиквитина, которая связана с цистеином активного центра (Salvat et al., 1998).
Наиболее изученными среди НЕСТ доменных белков являются группы C2-WW-HECT убиквитин-протеин лигаз, также названная RSP5/NEDD4, и группа HERC белков.
Также, помимо белков RSP5/NEDD4 и HERC групп, имеются экспериментальные данные о других НЕСТ-доменных убиквитин лигазах, которые до сих пор авторы не отнесли в какую-либо группу. К таким белкам относятся HUWE1, EDD1, TRTPC, UBE3C и UBE3A из организма H.sapiens, UBE3C из М. musculus, ТОМІ, UPD4, HUL5 и HUL4 из S. cerevisiae, SUDX и HYD из D. melanogaster.
На сегодняшний день сравнительно полная характеристика с идентификацией белков-мишеней и механизмов регуляции сделана для группы C2-WW-HECT убиквитин-протеин лигаз (подсемейство RSP5/NEDD4). Детальная изученность группы C2-WW-HECT связана в первую очередь с тем, что они более удобны для анализа, чем другие НЕСТ-доменные убиквитин-протеин лигазы - их относительно просто изолировать in vivo в связи с наличием WW доменов, по которым производиться взаимодействие (Shearwin-Whyatt et al., 2006).
Белки данной группы содержат N-концевой С2-фосфолипид связывающий домен и несколько (от двух до четырех) WW доменов в центральной части белка, отвечающих за взаимодействие с белком-субстратом (Рис. 4). N-концевой С2 домен Nedd4 млекопитающих необходим для его локализации в плазматической мембране (Plant et al., 1997). WW домен связывает различные богатые пролином мотивы, такие как PY, PPLP и PGM мотивы (Bedford et al., 2000; Kay et al., 2000).
Одним из представителей RSP5/NEDD4 группы белков является дрожжевой белок Rsp5. Rsp5 регулирует процессы интернализации рецепторных белков, транскрипции и ряд других. Hein с соавторами показали, что функции белка Rsp5 являются критичными для организма, а разрушение rsp5 гена летально (Hein et al., 1995).
Роль НЕСТ-доменных убиквитин-протеин лигаз в развитии патологических состояний
Исходя из ключевой роли убиквитин-зависимых механизмов регуляции, их нарушение будет неизбежно вести к нарушению функций клетки при патологии. На сегодня установлено вовлечение системы убиквитина в патогенез различных форм злокачественных новообразований, нейродегенеративных и аутоиммунных заболеваний, генетических и метаболических нарушений (Гайнуллин и Гарсия, 2005; Bernassola et al., 2008). В целом, разнообразие биологических эффектов убиквитилирования в норме и вовлечение системы убиквитина в развитие целого ряда патологических состояний определяют актуальность исследований в этой области.
Хотя для многих НЕСТ-доменных ЕЗ лигаз на сегодняшний день не известны физиологически значимые субстраты, становится очевидным, что это семейство белков играет существенную роль в развитии спорадических и наследственных заболеваний человека. К их числу относятся сердечнососудистые (синдром Лиддла) и неврологические (синдром Ангельмана) расстройства, онкологические и неиродегенеративные заболевания. Таким образом, исследование активности некоторых НЕСТ ЕЗ лигаз или их субстратов могли бы помочь в разработке лечения соответствующих заболеваний (Scheffher and Staub, 2007).
Для НЕСТ-доменных убиквитин-протеин лигаз SmurfZ, Е6-АР, НЕСТН9, NEDD4 и UBR5 показано участие в процессах канцерогенеза. Предполагаемый механизм участия белка UBR в патогенезе опухолей заключается в том, что ген, кодирующий данный белок, является опухолевым супрессором. Таким образом, подавление экспрессии белка UBR будет способствовать развитию опухоли. Кроме того, при карциноме протоков молочных желез, происходят мутации в гене, кодирующем UBR, в следствие чего белок экспрессируется и накапливается в клетке в виде мутантной формы (Callaghan et al., 1998; Clancy et al., 2003).
Для белка HUWE1 показано участие в различных опухолевых процессах. В частности, при колоректальной карциноме HUWE1 выступает в роли негативного регулятора р53. Уровни белка HUWE1 и р53 обратно пропорциональны (Yoon et al., 2005).
Для Е6-АР установлено, что он связывается с белком Еб-онкопротеином и блокирует активность многих регуляторных белков (Scheffher and Whitaker, 2003). В рамках канцерогенеза для Smurf2 предложен возможный механизм, реализующийся за счет его негативной активации и инактивации (Fukuchi et al., 2003).
Белок Nedd4 и Nedd4-noflo6Hbie убиквитин-протеин лигазы вовлечены в различные физиологические процессы, включая эндоцитоз (Polo et al., 2002), деградацию мембранных белков (Abriel et al., 1999) и контроль над ростом клетки (Wang et al., 2007). В связи с этим Nedd4- подобные ЕЗ лигазы вовлечены в ряд патологий, включая гипертонию (Abriel et al., 1999), рак (Fukuchi et al., 2003) и дефекты в иммунной системе (Fang et al., 2002). Близкие гомологи Nedd4-1 и Nedd4-2 играют роль в развитии синдрома Лиддла (редкая наследственная форма гипертонии) и передаче сигнала от Т-клеточного рецептора (Strack et al, 2000; Heissmeyer et al., 2004). Также известны субстраты Nedd4-1 и Nedd4-2. Это мембранные каналы ENaC (в
рамках синдрома Лиддла), GAG белок вирусов (retroviral budding), РКС-0 и PLC-yl (TCR сигналинг) и PTEN (Strack et al., 2000; Heissmeyer et al., 2004; Wang et al., 2007). В1 частности, синдром Лиддла характеризован ранним началом серьезной гипертонии, гипокалиемии, метаболического алкалоза и низким уровнем циркуляции ренина и альдостерона (Liddle et al., 1963; Botero-Velez et al., 1994).
Несмотря на то, что субстраты или партнеры взаимодействия для HERC2 не показаны, данный белок представляет интерес в рамках изучения роли НЕСТ-доменных лигаз в развитии патологии. Во-первых, мутации в гене Негс2 были связаны с патофизиологическими фенотипами в мышах (дефекты роста, координации движения) (Rinchik et al., 1995; Lehman et al., 1998). Во-вторых, человеческий ген HERC2 расположен в хромосоме 15qll-13, которая известна как Prader-Willi/Angelman область (Amos-Landgraf et al., 1999; Scheffher and Staub, 2007). Синдром Prader-Willi (PWS) и синдром Ангельмана (AS) представляют два клинически отличных расстройства развития нервной системы, где PWS развивается в следствии отцовского генетического дефицита, тогда как AS развивается в следствии материнского генетического дефицита (Nicholls and Knepper, 2001).
Так же показано, что HERC5 действует как ЕЗ лигаза для убиквитин-подобного белка ISG15, который экспрессируется в ответ на возбуждение клеток интерфероном (Garcia-Gonzalo and Rosa, 2005; Dastur et al., 2006; Wong et al., 2006). Эти данные указывают, что HERC5 играет важную роль в иммунном ответе.
Биоинформатика - применение компьютерных технологий для администрирования биологических данных и их анализа с целью выявления сложных биологических закономерностей (Арчаков, Лисица, 2005).
Толчком к возникновению биоинформатики послужило, в первую очередь, быстрое накопление экспериментальных данных о структуре биомакромолекул — белков и нуклеиновых кислот. С момента опубликования первых работ о расшифровке аминокислотных и нуклеотидных последовательностей объем такого рода информации растет в экспоненциальной зависимости. В частности, количество материалов о структуре ДНК, депонированных в базе данных европейской молекулярно-биологической лаборатории EMBL Nucleotide Sequence Database, удваивается каждые 12 мес. Другой важнейшей предпосылкой развития биоинформатики стала возможность быстрого и общедоступного обмена информацией с помощью сети Интернет.
В настоящее время появилось множество качественно новых экспериментальных подходов: геномика, транскриптомика, протеомика, метаболомика, которые позволяют с высокой эффективностью исследовать биологические системы и процессы. Рутинными становятся такие задачи, как полная расшифровка геномов, пространственных структур белков, изучение метаболических профилей организмов, исследование и картирование полиморфизмов (генетических вариаций геномной ДНК в популяциях). В результате в последние десять лет в молекулярной биологии и генетике произошел информационный взрыв, сопровождаемый экспоненциальным ростом объемов экспериментальных данных. Поэтому создание высокопроизводительных информационно-компьютерных технологий, предназначенных для администрирования, анализа и интерпретации экспериментальных данных, стало в настоящее время необходимым для решения фундаментальных задач биологии, а тем более — для практического использования в биомедицине и биотехнологии (Арчаков, Лисица, 2005).
Однако, это только первый срез проблемы. Молекулярная биология и генетика, как экспериментальные науки, до последнего времени носили ярко выраженный аналитический характер, концентрируя свое внимание на изучении отдельных аспектов организации сложнейших по своей сущности биологических систем. Развитие в последнее десятилетие высокоэффективных экспериментальных технологий молекулярной биологии и генетики привело к накоплению огромных объемов первичных данных, касающихся различных уровней организации жизни (от геномов и кодируемых ими биологических макромолекул через молекулярно-генетические системы клеток к тканям, органам, организмам, вплоть до популяций, биологических видов и экосистем). Эти данные слабо связаны, плохо структурированы, имеют разную степень полноты и сами по себе не позволяют реконструировать полноценный портрет любой изучаемой биологической системы или процесса. Именно поэтому в настоящее время1 в биоинформатике на первое место выходят задачи синтеза — интеграции и систематизации экспериментальных данных, а также задачи получения новых знаний на основе современных информационных технологий (Арчаков, 2000).
Множественное выравнивание аминокислотных последовательностей
Для проведения множественных выравниваний использовались интерактивные ресурсы MAFFT (http://align.bmr.kyushu u.ac.jp/mafft/online/server/) и MUSCLE (http://www.ebi.ac.uk/Tools/es/cgi-bin/muscle/). Данные ресурсы предусматривают возможность загрузки файла, содержащего невыравненные последовательности в формате FASTA, подготовленного в программе BioEdit (версия 7.0.5.2). Множественное выравнивание рассчитывалось со следующими параметрами: - матрица замен - BLOSUM62 - штраф за открытие вставки — 1.53, за продолжение вставки - 0.00 Редактирование полученных множественных выравниваний осуществлялось в программе BioEdit (версия 7.0.5.2). Филогенетические деревья были получены с помощью дистанционно-матричного метода (метод ближайших соседей, Neighbor-Joining, NJ) (Saitou and Nei, 1987) и метода максимальной экономии (Maximum Parsimony, MP) (Eck and Dayhoff, 1966; Felsenstein, 1993) пакета программ PHYLIP (версия 3.66) с коррекцией многократных замен и 1000 псевдорепликами. Программа TreeView Win32 (версияЛ.6.6) использовалась для визуализации построенных филогенетических деревьев.
Аминокислотные последовательности каждого из исследуемых, белков анализировались в базах данных на наличие структурно-функциональных доменові Выявление доменов в исследуемых белках происходит посредством алгоритма BLAST. Последовательность запроса сравнивается с позиционно специфической матрицей счета, полученной; при выравнивании основных . консервативных доменов; Результаты могут быть показаны как парные выравнивания , последовательности запроса; .-./. с имеющимися последовательностями?доменов или как множественные выравнивания 2.8; Анализ профилей экспрессии белков
Был проведен транскриптомный анализ НЕЄТ-доменньїх убиквитин-протеин лигаз, экспрессирующихся- ві. организме: Homo .sapience. Поиск профилей экспрессии белков велся по транскриптомным. библиотекам» вt базе: данных UniGene молекулярно-биологического Интернет-сервиса NCBI: База данных UniGene (http://www.ncbi.rilm.nih.gov/entrez/unigene) представляет собой автоматизированную аналитическую систему, в которой собрана информация о геномах и транскриптомах различных организмов: Для- проведения; транскриптомного. анализа. В: UniGene информация представляется- в виде таблицы или гистограммы, отражающей профиль экспрессии гена, кодирующего конкретный белок. Профилирование ведется по органам,- стадиямфазвития организма: и; различным патологическим, состояниям: и представляет собой оценку экспрессии гена. Рассчитываемые in silico значения экспрессии каждого транскрипта для конкретной ткани/этапа развития/патологии выражаются через ТРМ (transcript per million, транскрипт на миллион). В UniGene при подобной форме представления данных для транскриптомного анализа учитываются все имеющиеся на данный момент . транскриптомные библиотеки. Глава Зі Результаты и их обсуждение На данном этапе анализируемые белки были распределены на группы близких гомологов с, помощью методов множественного выравнивания и филогенетического анализа; . Учитывая то, что в процессе эволюции большинство белков структурно усложнялись (что обуславливается появлением в их структуре- новых функциональных доменов), множественное выравнивание и филогенетический-анализ исследуемой группы белков был проведен І по домену НЕТ белков: группы. Для этого на основании;данных базьг консервативных доменов NGBH CDDс помощью программы BioEdit из первичной структуры исследуемых белков1 «вырезался»- домен НЕСТ. Коллекция доменов НЕЄТ исследуемых белков была сформирована в отдельном файле программы BioEdit для. дальнейшего анализа. :
Форма, в которой предоставляются результаты множественного выравнивания, неудобна для анализа, поэтому на основании полученного множественного выравнивания были построены филогенетические; деревья которые иллюстрируют картину распределения: белков на группы и схемы родственных отношений между отдельными белками и группами белков; :
Филогенетические деревья, построенные методами ближайших соседей (Neighbor-Joining, NJ) и максимальной экономии (Maximum Parsimony, MP) имеют сходную-топологию. Этот результат свидетельствует об объективности распределения исследуемых белков на подсемейства: Кроме того, для каждого метода были рассчитаны значения бутстреп-поддержки. Результаты представлены в таблице 3. Результаты филогенетического анализа проиллюстрированы филогенетическим деревом, построенным методом ближайших соседей (Neighbor-Joining, NJ) (рис. 12). Данный метод является наиболее надежным для больших эволюционных расстоянияй. Филогенетическое дерево, построенное методом максимальной экономии (Maximum Parsimony, MP) представлено в Приложении 1.
Эволюция белков семейства НЕСТ-доменных ЕЗ убиквитин-протеин лигаз была предположительно сопряжена с множественными дупликациями, потерей и слиянием генов, а также их горизонтальными переносами, что подтверждается, например, сложной многодоменной архитектурой ряда охарактеризованных представителей. В результате филогенетическое дерево НЕСТ-доменных ЕЗ лигаз из семи полногеномных организмов имеет достаточно сложную многоуровневую топологию.
Анализ доменной организации НЕСТ-доменных убиквитин-протеин лигаз
Анализ доменной организации показал, что, помимо С-концевого каталитического домена НЕСТ, N-концевой участок многих представителей исследуемой группы белков включает и другие домены. Домен Филамин или АВР280 повтор. Входит в состав rod домена, состоит из 24 тандемных повторов глицин- и пролин- богатых мотивов из 100 аминкислот. Вовлечен в процесс димеризации и белок-белковые взаимодействия. Для представителей первого филогенетического кластера характерны домены ZnF_UBRl и Poly А, основной функцией которых являются белок-белковые взаимодействия. Так, домен ZnFUBRl, с одной стороны отвечает за связывание ДНК или РНК, белок-белковые взаимодействия, ассоциацию с мембраной, а с другой стороны участвует в узнавании N-конца субстратов для деградации по правилу N-конца. Домен PolyA вовлечен в гомодимеризацию, инициацию трансляции у эукариот и стабилизацию/деградацию мРНК.
Для представителей второго филогенетического кластера наиболее характерны домены ANK, Sadl, MIBHERC2, ARM, SRP1 и WWE. В процессе филогенетического анализа белки данного подсемейства организовали три подкластера, для которых характерна собственная доменная организация.
Так, представители 1-ого подкластера содержат домены ARM, SRP1 и WWE. Домены ARM и WWE участвуют в распознавании убиквитин-протеин лигазой белков-субстратов. Домен SRP1 участвует во внутриклеточном транспорте и секреции.
Представители 2-ого подкластера имеют практически идентичную доменную организацию, характеризующуюся доменами ANK, Sadl и MIB_HERC2. Анкириновые повторы (домен ANK) отвечают за белок-белковые взаимодействия и встречаются в большом количестве разнообразных белковых семейств. Анкириновые повторы являются одними из наиболее общих мотивов, ответственных за белок-белковые взаимодействия, и встречаются функционально разных белках, главным образом, эукариотических организмов. В основном это белки - инициаторы транскрипции, регуляторы клеточного цикла, цитоскелета, ионные транспортеры (Ju et al., 2007).
Домен Sadl (или С-концевой домен, гомологичный белку UNC, UNC-like Cerminal) гомологичен белку UNC-48 из организма Caenorhabditis elegans, который участвует в процессах миграции ядра в процессе развития.
Домен MIB_HERC2 взаимодействует с внутриклеточным доменом Delta, инициируя его убиквитилирование и интернализацию. Функция МІВ важна в процессе передачи клеточного сигнала для эффективной активации белка Notch.
Повторы ARM белка UFD4 распознают убиквитиновые сигналы для деградации субстратов UFD4. Показано, что блокирование повторов ARM ведет к ингибированию убиквитилирующей активности UFD4.
Третий филогенетический кластер также состоит из двух подкластеров. Для первого из них характерно наличие таких доменов, как АРС10, RCC1 и ATS1. Данные домены задействованы в процессе деления клетки. В частности, АРС10, являясь компонентом комплекса АРС, отвечает за переход от метафазы к анафазе и выход клетки из митоза.
R.CC1 участвует в регуляции конденсации хромосом. Данный домен связывает хроматин и взаимодействует с белком ran - ядерным ГТФ-связывающим белком, блокирующим ГТФазу и действующим как стимулятор диссоциации гуанин-нуклеотида (GDS). Взаимодействие RCC1 с белком ran играет важную роль в регуляции экспрессии генов.
Домен ATS1 является родственным домену RCC1. Установлено, что данный домен участвует в регуляции процесса деления клетки и разделения хромосом.
Другие домены, такие как MIB_HERC2, Cyt-b5 и ZZ-Herc2, выявленные у ортологичньтх белков HERC2, являются модулями белок-белковых взаимодействий в процессах передачи) клеточного сигнала и регуляции клеточного цикла.
Для представителей четвертого кластера характерно наличие доменов ATS1 и RCC1, описанных выше для первого подкластера третьего филогенетического кластера. Белки данных групп входят в одно семейство и являются HERC белками, отличающимися по длине аминокислотой последовательности (Hochrainer et all, 2005).
Для белков пятого и шестого кластеров характерна монодоменная организация. В данные кластеры, в частности, входят такие НЕСТ-доменные лигазы, как HUL4 и HUL5 из организма Saccharomyces cerevisiae, и их гомологи из организма Homo sapiens UBE3A и UBE3C, UBE3B соответственно.
Белки, входящие в состав седьмого кластера являются мультидоменными и содержат С2 и WW домены, за исключение представителя Pub2 из организма Schizosaccharomyces pombe, который является уникальным представителем. Данная уникальность обусловлена тем, что белок Pub2 в своем составе не имеет домен С2. Вместе с тем показано, что данный белок является одним из прототипов данной группы белков (Tamai and Shimoda, 2002). Домен С2 является1 кальций-связывающим мотивом. Данный мотив связывает фосфолипиды, инозитолфосфаты и внутриклеточные белки. Этот модуль найден во многих белках, вовлеченных в трансдукцию сигнала или мембранный транспорт.
Домен WW является модулем белок-белковых взаимодействий, и представляет собой два консервативных триптофановых домена, известных также как домены WWP и RSP5. Функционирует данный домен как модуль взаимодействия для разнообразного набора сигнальных белков. Он связывает специфические богатые пролином последовательности, но с низкой специфичностью по сравнению с другими белками, распознающими этот пептид, такими как антитела и рецепторы. Домен WW связывает белки со специфическими пролиновыми мотивами и/или мотивами, содержащими фосфосерин-фосфотреонин. Он также связывается с другими доменами белков, участвующих в процессе передачи сигнала. В рамках убиквитилирования домены WW отвечают за распознавание белков-субстратов. Белки, входящие в состав восьмого подкластера, содержат в своем составе домены DUF908 и DUF913. Эти домены участвуют в транскрипции и процессинге мРНК, обладают убиквитин-протеин лигазной активностью. В данную группу входят такие представители, как белки PTRl_SCHPO и TOMl_YEAST, которые в свою очередь характеризуются высоким процентом идентичности и сходства аминокислотных последовательностей при парном выравнивании данных белков.