Электронная библиотека диссертаций и авторефератов России
dslib.net
Библиотека диссертаций
Навигация
Каталог диссертаций России
Англоязычные диссертации
Диссертации бесплатно
Предстоящие защиты
Рецензии на автореферат
Отчисления авторам
Мой кабинет
Заказы: забрать, оплатить
Мой личный счет
Мой профиль
Мой авторский профиль
Подписки на рассылки



расширенный поиск

Исследование структур мембраноассоциированных белков и белковых комплексов методами молекулярного моделирования Бакулина Анастасия Юрьевна

Исследование структур мембраноассоциированных белков и белковых комплексов методами молекулярного моделирования
<
Исследование структур мембраноассоциированных белков и белковых комплексов методами молекулярного моделирования Исследование структур мембраноассоциированных белков и белковых комплексов методами молекулярного моделирования Исследование структур мембраноассоциированных белков и белковых комплексов методами молекулярного моделирования Исследование структур мембраноассоциированных белков и белковых комплексов методами молекулярного моделирования Исследование структур мембраноассоциированных белков и белковых комплексов методами молекулярного моделирования
>

Диссертация - 480 руб., доставка 10 минут, круглосуточно, без выходных и праздников

Автореферат - бесплатно, доставка 10 минут, круглосуточно, без выходных и праздников

Бакулина Анастасия Юрьевна. Исследование структур мембраноассоциированных белков и белковых комплексов методами молекулярного моделирования : диссертация ... кандидата биологических наук : 03.01.03 / Бакулина Анастасия Юрьевна; [Место защиты: Гос. науч. центр вирусологии и биотехнологии "Вектор"].- Кольцово, 2010.- 127 с.: ил. РГБ ОД, 61 10-3/1255

Содержание к диссертации

Введение

Глава 1.Обзор литературы 12

1.1. Иерархия структурной организаций белков 13

1.1.1. Первичная структура 13

1.1.2. Вторичная структура 15

1.1.3. Супервторичная структура 17

1.1.4. Доменная структура 18

1.1.5. Третичная структура 20

1.1.6. Четвертичная структура 22

1.2. Предсказание белковых структур 23

1.2.1. Общие принципы статистических методов предсказания 24

1.2.2. Дизайн первичной структуры 25

1.2.3. Предсказание вторичной структуры 25

1.2.4. Предсказание супервторичной структуры 26

1.2.5. Предсказание доменной структуры 27

1.2.6. Предсказание третичной структуры 27

1.2.7. Предсказание четвертичной структуры 32

1.3. Особенности практического применения методов моделирования третичной структуры белков 34

1.3.1. Автоматизация моделирования 34

1.3.2. Моделирование мембранных белков 35

1.3.3. Построение моделей белков и белковых комплексов в сложных случаях 37

Глава 2.Методы 40

Глава 3.Разработка программы FILTREST3D 43

Глава 4.Резулкгаты и обсуждение 47

4.1. Моделирование структуры гемолизина II Bacillus cereus 47

4.1.1. Построение модели гептамера Hlyll 51

4.1.2. Анализ структуры гептамера Hlyll 52

4.1.3. Построение и анализ моделей структур гексамера и октамера Hlyll 57

4.1.4. Построение и анализ модели структуры С-концевого домена Hlyll 58

4.2. Моделирование структуры комплексов металлопротеазы ТАСЕ с субстратами 61

4.2.1. Выбор оптимального метода для докинга лигандов к ТАСЕ 64

4.2.2. Построение и анализ структуры комплекса ТАСЕ с фрагментом коллагена XVII типа 68

4.3. Моделирование структуры OmpF-подобного белка Yersinia pseudotuberculosis 71

4.3.1. Построение модели структуры OmpF-подобного белка и выбор перспективных антигенных районов 72

4.4. Моделирование структуры белка EtSAGl Eimeria tenella 75

4.4.1. Построение модели белка EtSAGl 76

4.4.2. Анализ модели белка EtSAGl 80

4.5. Моделирование структур белка ARNO человека и предположительно взаимодействующих с ним белков а2 и ARF6 83

4.5.1. Построение и анализ моделей структуры белка ARNO 87

4.5.2. Построение и анализ модели структуры комплекса ARNO с ARF6 90

4.5.3. Построение и анализ моделей ARNO с экспериментально полученными структурами РВ домена 92

4.5.4. Построение и анализ модели белка а2 94

4.5.5. Построение модели структуры комплекса ARNO и a2N 98

Заключение 100

Выводы 102

Благодарности 103

Список литературы 103

Введение к работе

Актуальность работы

Для решения многих фундаментальных и прикладных задач современной биологии требуется знание пространственной структуры белков и их комплексов с другими белками, нуклеиновыми кислотами и низкомолекулярными лигандами. В частности, такое знание необходимо для разработки новых лекарственных препаратов, современных вакцин, выбора антигенов для диагностических систем и ряда других актуальных задач. Без определения пространственной организации белков и их комплексов невозможно раскрыть молекулярные механизмы различных биологических процессов. Информация о структуре белка помогает интерпретировать результаты молекулярно-биологических экспериментов и планировать дальнейшие исследования.

В настоящее время известно около 10 миллионов нуклеотидных последовательностей, кодирующих белки. В то же время пространственные структуры экспериментально определены только для 60 тысяч белков. Для подавляющего большинства белков неизвестны ни третичная, ни четвертичная структуры. Еще сложнее ситуация с определением пространственной структуры белковых комплексов: в лучшем случае известны структуры всех белков по отдельности, но не их комплекса. В связи с этим сейчас активно развиваются и совершенствуются методы компьютерной биологии, позволяющие построить модель пространственной структуры белка с известной аминокислотной последовательностью, а также методы предсказания структур белковых комплексов.

Теоретически можно построить модель третичной или четвертичной структуры белка ab initio, исходя из физических законов, описывающих белок как термодинамическую систему. Правильная структура соответствует минимуму свободной энергии белка с учетом его окружения. Однако точное вычисление свободной энергии - крайне ресурсоемкая и недостижимая в настоящее время задача, несмотря на несомненный прогресс в развитии компьютерной техники и алгоритмов (Meirovitch Н. et al., 2009). Поэтому на практике для построения пространственных моделей белков и их комплексов обычно используется моделирование по гомологии. При этом в качестве шаблона используют известные из экспериментов структуры аналогичных белков (Shi J. et al., 2009). Такой подход основан на том факте, что третичная структура белка в среднем более консервативна, чем первичная (Murzin A.G., 2001). Для белок-белкового докинга и оценки качества моделей используются базирующиеся на статистических данных оценочные функции, которые позволяют упрощенно оценить свободную энергию.

При высокой степени сходства аминокислотных последовательностей шаблона и моделируемого белка, такая процедура не предстаатает сложности и может быть выполнена современными программами в автоматическом режиме. Если же уровень сходства первичных структур сравниваемых белков невелик, построение адекватной пространственной модели белка становится

нетривиальной задачей (Dalton J.A.R., Jackson R.M., 2007). Также в общем случае нелегко построить достоверную модель структуры белкового комплекса (Vajda S., Kozakov D., 2009).

Как правило, программы предсказания белковых структур позволяют рассчитать множество допустимых вариантов моделей. В простых случаях можно выбрать наилучшую модель с помощью оценочной функции, аппроксимирующей свободную энергию белка, но в более сложных случаях нельзя полагаться на точность такого подхода (Shi J. et al., 2009). Поэтому для выбора достоверной модели белка приходится либо сопоставлять результаты расчета с помощью различных оценочных функций (консенсусный подход), либо оценивать модели по согласованности с какими-либо известными экспериментальными данными (селекция моделей).

Для многих белков с неизвестной пространственной структурой имеется какая-то информация об их структуре, полученная экспериментальным путем. Например, расстояние между определенными участками белка или доступность каких-то районов для растворителя. Такие данные можно использовать в качестве критериев для селекции моделей белковых структур. Очевидно, что анализ соответствия множества теоретических моделей этим критериям вручную - процедура трудоемкая и крайне неэффективная. Поэтому представляется актуальной разработка удобного инструмента для автоматизации отбора белковых структур по заданным критериям.

Отметим, что в современных базах данных пространственных структур белков и их комплексов наиболее представлены не столько функционально важные белки, сколько те, пространственные структуры которых легче определить экспериментально. В то время как в большинстве геномов не менее трети генов кодирует мембранные белки, пространственная структура подавляющего большинства из них неизвестна. На долю трансмембранных и ассоциированных с мембраной белков приходятся такие важные функции, как мембранный транспорт и передача сигналов. К этому классу белков относится множество антигенов и некоторые токсины патогенных микроорганизмов. Рецепторы и другие белки, ассоциированные с плазматической мембраной, представляют интерес в качестве потенциальных мишеней лекарственных препаратов. Высокая сложность получения кристаллов мембранных белков делает применение методов молекулярного моделирования для этих белков особенно актуальным. Однако большинство таких методов разрабатывалось для глобулярных белков, поэтому для моделирования структур белков, интегрированных в мембрану или ассоциированных с ней, компьютерные подходы следует применять с осторожностью.

Цели исследования

Целью данной работы было построение и анализ моделей третичной и четвертичной структуры мембраноассоциированных белков человека и

патогенных микроорганизмов. Задачи исследования

Разработка программы отбора моделей белковых структур по заданным критериям.

Построение моделей структур гексамера, гептамера и октамера гемолизина II (Hlyll) Bacillus cereus, анализ структур ионных каналов, образованных олигомерами Hlyll, и предсказание функции С-концевого домена Hlyll.

Построение и анализ модели структуры комплекса человеческой металлопротеазы ТАСЕ с субстратом коллагеном XVII.

Построение модели структуры тримера OmpF-подобного белка Yersinia pseudotuberculosis и выбор районов, наиболее доступных для связывания антител.

Построение модели пространственной структуры гликопротеина SAG 1 Eimeria tenella и идентификация района связывания моноклонального антитела 2Н10ЕЗ.

Построение и анализ моделей пространственных структур аутоингибированной и активной конформации человеческих белков ARNO, ARF6, изоформы а2 субъединицы а V-АТФазы, комплексов ARNO с ARF6, ARNO с а2.

Научная новизна работы

Была разработана программа FILTREST3D, впервые позволяющая в удобном для пользователя виде задавать ограничения для селекции результатов моделирования белковых структур. Программа предназначена для отбора структур, соответствующих известным экспериментальным данным, и таким образом помогает получать достоверные модели белковых структур в сложных случаях моделирования.

Впервые получены модели структур гептамерной мембранной поры белка Hlyll Bacillus cereus и С-концевого домена этого белка. Впервые рассмотрена возможность существования гексамерной и октамерной форм мембранных пор и построены модели их четвертичных структур. Впервые построена модель структуры OmpF-подобного белка Y. pseudotuberculosis. Впервые построены модели, описывающие взаимодействие металлопротеазы человека ТАСЕ с субстратами ФНО (фактором некроза опухолей) и коллагеном XVII. Впервые построена модель структуры белка EtSAGl Е. tenella. Впервые построены модели пространственных структур следующих белков человека: ARNO с СС доменом, ARNO с фосфорилированным и нефосфорилированным доменом РВ, ARNO в комплексе с ARF6, N-концевого фрагмента изоформы а2 субъединицы а V-АТФазы.

Теоретическая и практическая значимость работы

Программа FILTREST3D использовалась в практической работе различными исследователями и в данный момент доступна по адресу

.

Построенные модели белковых структур имеют как теоретическую ценность, поскольку позволяют понимать молекулярные механизмы биологических процессов, так и практическую. Модель структуры ионного канала Hlyll используется для конструирования его ингибиторов на основе циклодекстринов. С помощью модели структуры OmpF были выбраны районы, на основе которых будут сконструированы иммуногены для защиты против Y. pseudotuberculosis. Модель структуры белка EtSAGl была использована для определения сайта связывания антитела 2Н10ЕЗ, в дальнейшем она может быть использована для характеризации других антител и для выбора антигенов на базе этого белка.

Апробация работы

Результаты работы были представлены на нескольких конференциях: 1st International Student Symposium in Computational Biology, Madrid, 2005; ISMB (Intelligent Systems for Molecular Biology) annual meeting, 2005, Michigan, USA; 5th International Conference on Bioinformatics of Genome Regulation, Structure, Novosibirsk, 2006; 14th Annual International Conference On Intelligent Systems For Molecular Biology, Fortaleza, Brazil, 2006; American Society for Microbiology, 106th General Meeting, Orlando, 2006; Конференция молодых ученых и специалистов ФГУН ГНЦ ВБ «Вектор», 2009, Новосибирск.

Публикации

По материалам работы было опубликовано 5 статей в реферируемых научных журналах.

Структура и объем работы

Общие принципы статистических методов предсказания

Как правило, именно первичная структура белка известна, и она является основной информацией для предсказания остальных уровней организации белка. Разработка первичной структуры белка с заданной пространственной структурой или свойствами называется белковым дизайном. Встречаются успешные примеры оптимизации первичной структуры белка для изменения его свойств (Gribenko et al., 2009), построения белка с заданной третичной структурой (Kuhlman et al., 2003), заданной функцией (Grzyb et al., 2010). Белковый дизайн является отдельной задачей структурной компьютерной биологией и не рассматривается в данной работе.

В настоящее время широко распространены методы предсказания вторичной структуры, основанные на нейронный сетях, например PSIPRED (McGuffin, L. J., Bryson, К. & Jones, D.T., 2000). Точность предсказания современных методов для белков, не имеющих близких гомологов в PDB, составляет в среднем более 80%. На основании предсказания вторичной структуры можно отнести белок к тому или иному структурному классу (Yang et al., 2010). Предсказанная вторичная структура может использоваться для распознавания третичной структуры и выравнивания первичных структур модели с шаблоном при моделировании третичной структуры.

Как отмечалось выше, термин "супервторичная структура" или "мотив" используется по отношению к двум различным типам структурных элементов: группам взаимодействующих вторичных структур и упорядоченным участкам белка, не относящимся к регулярной вторичной структуре.

Упорядоченные участки белка, не являющиеся ни альфа-спиралями, ни бета-складками, как правило, являются короткими петлями. Для их предсказания можно использовать поиск в базе известных петель по расстоянию и взаимной ориентации фланкирующих остатков и сходству первичных структур (Fernandez-Fuentes et al., 2006).

Предсказание пространственной структуры элементов белка, состоящих из трех последовательных элементов упорядоченной вторичной структуры и петель между ними, используется для построения моделей третичной структуры белка ab initio (Zhou, Skolnick, 2007). Для предсказания используется модификация метода Монте-Карло.

Важным и хорошо изученным примером супервторичной структуры являются суперспирализованные альфа-спирали. Существуют отдельные методы для их предсказания (Lupas et al., 1991а).

О точности современных методов предсказания супервторичной структуры говорить сложно, так как нет общепринятых критериев схожести предсказанной и реальной супервторичных структур.

Часто фрагменты белка, являющиеся доменами, обладают лучшей способностью к продукции и кристаллизации, чем многодоменный белок целиком. Поэтому предсказание границ доменов является одним из этапов экспериментального изучения белка. Иногда оказывается, что применение методов распознавания третичной структуры возможно только для отдельных доменов белка. Для предсказания третичной структры методами ab initio также желательно предварительно разбить белок на домены.

Современные методы предсказания доменной структуры базируются на различных принципах: поиск сходства первичной или предсказанной вторичной структур с известными доменами, выделение доменов на основе предсказания контактов в белке, консенсусные методы (Kirillova et al., 2009). Анализ результатов работы различных программ предсказания границ доменов показал, что в среднем результаты не очень хорошие, но в тех случаях, когда программа верно спрогнозировала число доменов, их границы оказались довольно точно определены. (Kirillova et al., 2009).

Методы предсказания третичной структуры белка можно разделить на три категории: моделирование по гомологии, распознавание третичной структуры и ab initio (Murzin, 2001). Для оценки различных методов моделирования раз в два года проводится конкурс по слепому предсказанию третичных структур белков, Critical Assessment of protein Structure Prediction (CASP) (Moult, 2005; Shi et al., 2009). По итогам этого конкурса можно оценить наиболее эффективные методы моделирования и их текущую точность.

Метод моделирования по гомологии является наиболее точным из всех методов предсказания третичной структуры, он иногда позволяет получать результаты с точностью не хуже, чем у экспериментальных методов определения пространственной структуры. Качество моделей, построенных по гомологии, оказывается достаточным для их использования в разработке новых лекарственных препаратов (Ekins et al., 2007).

Для построения модели по гомологии используется шаблон — белок с известной третичной структурой, сходный с тем белком, для которого надо построить модель. Моделирование состоит из четырех этапов: поиск подходящего шаблона, выравнивание аминокислотных последовательностей шаблона и модели, построение модели, оценка качества модели (Wallner, Elofsson, 2005а). В качестве шаблона используется белок с известной третичной структурой и максимально гомологичной последовательностью. Для поиска шаблона при моделировании по гомологии обычно используется программа BLAST (Altschul et al., 1997). Идентичность последовательностей модели и шаблона при моделировании по гомологии обычно превышает 30%.

Построение моделей белков и белковых комплексов в сложных случаях

Для 94 остатков с С-конца Hlyll поиск шаблона на метасервере Genesilico (Kurowski, Bujnicki, 2003) не дал результатов, поэтому модель этого фрагмента строилась методом de novo с помощью программы Rosetta (Rohl et al., 2004). Для белков такого размера моделирование de novo часто позволяет получать достоверные модели (Kaufmann et al., 2010). Было сгенерировано 5000 структур, после кластеризации оказалось, что в кластере наибольшего размера содержится около 5% структур, что соответствует среднему уровню достоверности (Rohl et al., 2004).

Для структуры из наибольшего кластера, наиболее близкой к консенсусной, был проведен поиск белка с наиболее близкой структурой на сервере FATCAT (Ye, Godzik, 2004), и обнаружилось значимое структурное сходство с белком CyaY Е. coli (Cho et al., 2000) (среднеквадратичное отклонение 3,95 А). Этот белок является ортологом фратаксинов и участвует в связывании железа. Фратаксины связывают ионы железа благодаря участкам, насыщенным отрицательно заряженными аминокислотами.

Модель С-концевого домена Hlyll была построена с использованием CyaY в качестве шаблона, процент идентичности составляет 9,9% (рис. 17). Выравнивание было сделано вручную с учетом пространственной структуры CyaY. У построенной модели С-концевого домена Hlyll имеется гораздо меньше отрицательно заряженных аминокислот в соответствующих участках белка, но некоторые отрицательно заряженные районы сохранились (рис. 18). Возможная роль С-концевого домена Hlyll в связывании железа неясна и требует экспериментальной проверки.

Другие цитолизирующие белки В. cereus (гемолизины I, III, IV, BL и цереолизиноподобный гемолизин) не имеют в своем составе гомологов С-концевого домена Hlyll. При этом Hlyll - единственный из цитолизирующих белков В. cereus, для которого экспрессия гена контролируется регулятором транскрипции Fur (ferram uptake repressor), который также контролирует экспрессию генов, отвечающих за связывание и транспорт железа (Harvie et al., 2005). Это говорит в пользу того, что железосвязывающая функция С-концевого домена метаболизм Hlyll вполне вероятна.

Расположение С-концевого домена относительно остального Hlyll не может быть достоверно предсказано, но из экспериментальных данных известно, что он не блокирует канал (Miles et al., 2002). Судя по общей структуре построенной модели и ее гидрофильной поверхности, С-концевой домен не погружен в мембрану. Принимая во внимание отрицательный заряд поверхности мембраны, можно предположить, что какая-либо часть С-концевого домена, не несущая островков отрицательно заряженных аминокислот, может контактировать с мембраной. Внеклеточные части некоторых трансмембранных белков могут отщепляться под воздействием протеаз (Blobel, 2000). Многие трансмембранные белки I и II типов, такие как рецепторы, факторы роста, молекулы межклеточной адгезии, имеют также и растворимые формы, которые часто получаются путем отщепления эктодоменов (Bissell et al., 2005; Blobel, 2000). Для понимания процессов отщепления на молекулярном уровне требуется, в частности, определять сайты протеолиза.

Коллаген XVII типа (коллаген XVII) является представителем семейства коллагеновых трансмембранных белков (Franzke et al., 2005). Он входит в состав гемидесмосом - белковых структур, которые связывают эпителиальные клетки с базальной мембраной (Nishizawa et al., 1993). Мутация гена коллагена XVII типа или образование антител к нему приводят к заболеваниям кожи (Franzke et al., 2005). Как и другие трансмембранные коллагены, коллаген XVII типа является трансмембранным белком II типа, и его эктодомен конститутативно отщепляется с клеточной поверхности. Отщепление эктодомена коллагена XVII типа необходимо для регуляции адгезии и подвижности эпителиальных клеток в процессе развития организма и регенерации. Отщепление происходит в районе линкерного внеклеточного домена NC16A, прилегающего к мембране (рис. 19) (Franzke et al., 2004). Этот процесс катализируется металлопротеазами семейства ADAM, в основном цинковой W/ металлопротеазой ADAM17/TACE (TNF-a converting enzyme, ФНО конвертирующий фермент) (Franzke et al., 2002). Для цинковых металлопротеаз известен механизм катализа: молекула воды, приобретающая за счет взаимодействия с ионом цинка нуклеофильные свойства, атакует карбоксильный атом углерода расщепляемой пептидной связи (Kester, Matthews, 1977). ТАСЕ является трансмембранным ферментом; который участвует в отщеплении различных трансмембранных белков I и II типов (Black, 2002). Для ТАСЕ известна пространственная структура нескольких комплексов внеклеточного фрагмента ТАСЕ с ингибиторами ТАСЕ. Пептидоподобный ингибитор ТАСЕ связывается в районах, обозначенных как карманы S1 и S3 (рис. 20) (Maskos et al, 1998).

Построение и анализ структуры комплекса ТАСЕ с фрагментом коллагена XVII типа

Eimeria tenella является одним из основных возбудителей кокцидиоза домашней птицы — болезни, имеющей большое экономическое значение. Цыплята обычно гибнут на 6-7-е сутки после заражения либо недостаточно набирают вес (Williams, 1999). Для контроля кокцидиоза используется вакцинация и профилактическое использование различных лекарственных препаратов-кокцидиостатиков. Для вакцинации используется живая вакцина, которую довольно дорого производить, поэтому сейчас ведутся активные разработки субъединичной или рекомбинантной вакцины (Allen, Fetterer, 2002; Dalloul, Lillehoj, 2006).

Поверхность E. tenella покрыта GPI-связанными поверхностными антигенами SAG. Часть их них вовлечена в инициацию инфекционного процесса. Эти белки могут быть потенциальными мишенями для новых лекарственных препаратов и перспективными иммуногенами для разработки терапевтических и диагностических моноклональных антител, а также вакцин. Один из них, белок EtSAGl, или антиген ТА4, является мишенью для мышиного моноклонального антитела 2Н10ЕЗ. Эксперименты по ограниченному протеолизу показали, что расщепление рекомбинантного EtSAGl в какой-то позиции в районе 68-77 а.о. разрушает взаимодействие с антителом 2Н10ЕЗ (Jahn et al., 2009). EtSAGl состоит из тяжелой и легкой субъединиц, которые образуются в результате отщепления от предшественника EtSAGl пептида 182-184 а.о.. Было показано, что белок EtSAGl существует как в мембранной, так и в.свободной форме, но функции этих форм неизвестны (Jahn et al., 2009). Поиск шаблона для моделирования по гомологии проводился на сервере GeneSilico Metaserver (Kurowski, Bujnicki, 2003). Этот сервер предоставляет интерфейс к следующим методам поиска шаблона: BLAST, PSI-BLAST (Altschul et al., 1997), FFAS (Jaroszewski et al., 2005), FUGUE (Shi et al., 2001), mGENTHREADER (McGuffm, Jones, 2003), SAM (Karplus et al., 2003), inub (Fischer, 2000), Pcons5 (Wallner, Elofsson, 2005b), SP4( Liu et al., 2007), 3D-PSSM (Kelley et al., 2000) , HHsearch (Soding, 2005). С помощью алгоритмов BLAST и PSI-BLAST не было найдено гомологов белка EtSAGl. Другие алгоритмы, доступные через сервер GeneSilico Metaserver, выдали результаты поиска гомолога EtSAGl с низкими уровнями достоверности. В такой ситуации использовать результаты какого-то одного алгоритма для построения модели было бы неправильно, поэтому были сопоставлены результаты всех алгоритмов.

Большинство алгоритмов (Табл. 2) предложили в качестве шаблона для построения модели структуры белков, относящиеся к фолду с идентификатором d. 111.1.1 в базе SCOP — белок Ves v 5 осы (идентификатор в базе PDB 1QNX) либо белок Р14а томата (1CFE). Визуальный анализ показал, что белок с идентификатором фосфоноацетальдегидгидролаза Bacillus cereus (1FEZ), которая относится к фолду с. 108.1.3, имеет сходную пространственную структуру. Структура хитиназы В Serratia marcescens (1E6Z) и белка змеиного яда Stecrisp Trimeresurus stejnegeri (1RC9), которые не классифицированы в базе SCOP, также оказалось близкой. Только один из 9 алгоритмов, HHsearch, выдал результат, значительно отличающийся от остальных (фактор инициации транскрипции TFIID человека, 1ВН9) .Такая корреляция результатов работы различных алгоритмов распознавания третичной структуры, которые базируются на разных принципах говорит о том, что, несмотря на невысокий уровень достоверности результатов каждой отдельной программы, белок EtSAGl с высокой вероятностью имеет структуру, близкую к фолду d. 111.1.1.

Фолд с индексом d.l 11.1.1 в SCOP называется "PR-1-like". Подсемейство PR-1 (Pathogenesis-Related group 1, группа 1 белков, связанных с патогенезом) первоначально включало в себя растительные белки, продукция которых повышается при инфекции или других стрессовых условиях. Затем подобные белки были обнаружены в животных, бактериях и вирусах (Asojo et al., 2005). Общей функции у белков PR-1 пока неизвестно, некоторые из них обладают ферментативными свойствами, для но их роль в организмах остается неясной.

Было построено несколько моделей EtSAGl с использованием разных шаблонов. При построении моделей выравнивания аминокислотных последовательностей шаблонов и EtSAGl, полученные в результате работы алгоритмов распознавания третичной структуры, были отредактированы вручную с учетом пространственной структуры шаблонов.

Построение и анализ моделей ARNO с экспериментально полученными структурами РВ домена

Факторы DP-рибозилирования (ARF) принадлежат к Ras-суперсемейству малых ГТФаз. Эти белки функционируют как молекулярные переключатели и регулируют множество клеточных процессов, связанных как с эндоцитозом, так и с экзоцитозом (Bourne- et al., 1990; D Souza-Schorey, Chavrier, 2006; Donaldson, Klausner, 1994). Семейство ARF состоит из шести белков, которые принадлежат к трем классам: класс I (ARF1, ARF2, ARF3), класс II (ARF4, ARF5) и класс III, к которому принадлежит ARF6. В активной форме все белки семейства ARF связаны с ГТФ; в неактивной — с ГДФ. Белки семейства ARF активируются факторами обмена гуанин нуклеотида (GEF), дезактивация катализируется ГТФаза-активирующими белками (GAP). Недавно было показано, что белки семейства цитогезинов, которые относятся к активаторам ARF, также могут находиться как в активном, так и в неактивном состоянии, что обеспечивает дополнительную регуляцию активации ARF (DiNitto et al., 2007). Так как ГДФ/ГТФ обмен сопряжен с высокоаффинным связыванием белков ARF с мембраной, активаторы ARF также отвечают за привлечение ARF к определенному участку мембраны. Хотя в экспериментах in vitro показано взаимодействие активаторов и деактиваторов ARF с несколькими белками из семейства ARF, показано что in vivo каждый белок из семейства ARF регулируется собственными активаторами и деактиваторами. Все известные активаторы ARF содержат высококонсервативный каталитический домен Sec7. Этот домен отвечает за каталитическую активность и родственен белку дрожжей Sec7p. В геноме человека идентифицировано 15 доменов семейства Sec7 (Casanova, 2007).

Один из активаторов ARF, белок ARNO, также известный как цитогезин-2, относится к подсемейству цитогезинов. Это семейство также содержит цитогезин-1 (ARN03), цитогезин-3 (GRP1) и цитогезин-4 (Casanova, 2007). Аминокислотные последовательности человеческих цитогезинов имеют не менее 80% идентичности в попарных выравниваниях и обладают общей доменной структурой. Они состоят из четырех районов: N-концевой суперспиральный участок, который обозначается как СС; домен Sec7; плекстриноподобный домен РН; С-концевой домен, богатый положительно заряженными аминокислотами РВ. В ARNO домен РВ фосфорилирован в позиции S392 протеинкиназой С (РКС), которая регулирует активность активаторов ARF (Santy et al., 1999). Методом РСА была получена пространственная структура GRP1 без СС-домена. Эта структура показала, что линкер между доменами Sec7 и РН вместе с доменом РВ вовлечен в аутоингибирование цитогезина (DiNitto et al.,2007).

Белок ARF6 из семейства ARF задействован в регуляции эндоцитоза. ARF6 активирует перестройку актинового цитоскелета, модификацию и реорганизацию липидов, формирование транспортных пузырьков (Marshansky, 2007). ARF6 специфически связывается с субъединицей с V-АТФазы и не связывается с изоформой а2.

V-АТФазы функционируют в качестве эндосомального рН-сенсора, передавая сигнал посредством ARNO и ARF6. Ранее было показано, что белок а2 V-АТФазы взаимодействует непосредственно с ARNO, причем взаимодействие зависит от рН (Hurtado-Lorerizo et al., 2006; Marshansky, 2007). Это взаимодействие необходимо для везикулярного транспорта между ранними и поздними эндосомами в эндосомально-лизосомальном пути деградации белков.

Для изучения молекулярных механизмов взаимодействия между N-концевым цитозольным районом а2 (a2N) и ARNO был проведен ряд экспериментов по взаимодействию фрагментов a2N и ARNO и поверхностному плазмонному резонансу (Merkulova et al., 2010). Оказалось, что во взаимодействие вовлечены различные районы ARNO. Домен Sec7 демонстрирует сильное взаимодействие, а домены РН, РВ и линкер между Sec7 и РН связываются более слабо. Связывание a2N с пептидом, соответствующим домену РВ ARNO, было специфическим и разрушалось при фосфорилировании остатка S392. Пространственная структура этого пептида, полученная методом ЯМР, показала изменение структуры при фосфорилировании. Также было проанализировано взаимодействие пептидов, покрывающих последовательность a2N, с ARNO и доменом Sec7 ARNO. Для интерпретации результатов экспериментов потребовалось построить модели ARNO в активном и аутоингибированном состояниях, с фосфорилированным и нефосфорилированным остатком S392, комплекса ARNO и ARF6, комплекса ARNO и N-концевого района а2 (a2N). Sec7 ARNO в комплексе с ARF1 (код в базе PDB 1S9D) и белок GRP1, в котором присутствуют домены Sec7, РН и РВ (код в базе PDB 2R09). Белки ARNO и GRP1 относятся к семейству цитогезинов, идентичность между их аминокислотными последовательностями, исключая N-концевой суперспиральный домен, составляет 85%. Структурное выравнивание программой СЕ (Shindyalov, Bourne, 1998) показало, что среднеквадратичное отклонение СА атомов между Sec7 доменами GRP1 и ARNO составляет 1,86 А. Белок GRP1 в структуре 2R09 находится в аутоингибированной форме, соответственно, построенная с использованием структуры 2R09 в качестве шаблона модель будет являться моделью ARNO в неактивном, аутоингибированном состоянии. Пространственные структуры доменов Sec7 ARNO и GRPl отличаются на 1,86 А, что сопоставимо с разрешениями структур, полученным методом РСА: 1,9 А для Sec7 ARNO и 1,8 А для Sec7 GRPl. Поэтому для моделирования ARNO было решено использовать только структуру GRP1. Выравнивание аминокислотных последовательностей ARNO и GRP1 было выполнено программой MUSCLE (Edgar, 2004) и проверено вручную (рис. 36). Построение модели методом моделирования по гомологии и оптимизация модели проводились программой Modeller (Sali, Blundell, 1993).

Похожие диссертации на Исследование структур мембраноассоциированных белков и белковых комплексов методами молекулярного моделирования