Содержание к диссертации
Введение
ГЛАВА 1. Литературный обзор 8
1.1. Основные методы анализа структуры белков по их спектрам кругового дихроизма 8
1.1.1. Анализ с помощью спектров «идеальных» элементов вторичной структуры 9
1.1.1.1. Использование спектров модельных пептидов 9
1.1.1.2. Получение базовых спектров из спектров белков с известной структурой 11
1.1.1.3. Метод выпуклого граничного анализа спектров КД. 14
1.1.2. Непосредственное использование в разложении спектров белков с известной вторичной структурой 16
1.1.2.1. Метод гребневой регрессии 19
1.1.2.2. Разложение по существенным значениям 21
1.1.2.3. Метод гибкого выбора решения 24
1.1.2.4. Метод нейронных сетей. 25
1.1.3. Чувствительность спектров КД к супервторичной структуре глобулярных белков 29
1.2. Белки в состоянии «расплавленной глобулы 31
1.2.1. Равновесное состояние расплавленной глобулы 32
1.2.2. Расплавленная глобула как кинетический интермедиат 36
ГЛАВА 2. Материалы и методы 39
2.1. Получение набора спектров белков с известным классом третичной структуры 39
2.2. Методы факторного анализа и теории распознавания образов 41
2.2.7. Поиск значащих компонент 41
2,2.2. Метод решающих функций 43
2.2.3. Метод иерархической классификации, или кластерного анализа 45
2.3. Получение и анализ спектров КД белков в состоянии расплавленной глобулы 49
ГЛАВА 3. Анализ чувствительности спектров кд глобулярных белков к классу третичной структуры 58
3.1. Представление спектра в виде точки в пространстве амплитуд.,.. 58
3.2. Получение набора спектров белков с известным классом третичной структуры 58
3.3. Визуализация распределения образов в пространстве 59
3.4. Исследование распределения образов с помощью иерархической классификации 62
3.5. Построение алгоритма определения класса третичной структуры белка по его спектру КД. 67
ГЛАВА 4. Анализ спектров кд белков в состоянии расплавленной глобулы 70
4.1. Спектры КД нашивных белков и белков в состоянии расплавленной глобулы 72
4.2. Информационное содержание спектров КД расплавленных глобул .. 72
4.3. Оценка содержания вторичной структуры в расплавленных глобулах по спектрам КД: сравнение срентгеноструктурными данными... 81
Выводы 89
Благодарности 90
Список литературы 91
- Белки в состоянии «расплавленной глобулы
- Методы факторного анализа и теории распознавания образов
- Получение набора спектров белков с известным классом третичной структуры
- Информационное содержание спектров КД расплавленных глобул
Введение к работе
Актуальность проблемы. Спектроскопия кругового дихроизма (КД) широко применяется для анализа интегральных параметров вторичной структуры глобулярных белков. Такое использование метода основано на предположении, что вид спектра в дальней ультрафиолетовой (УФ) области в наибольшей степени зависит от локальной конформации полипептидной цепи, которая как раз и описывается в терминах вторичной структуры. Однако, в последнее время становится все более очевидно, что подобная простая интерпретация спектральных данных является слишком грубой моделью, возможности которой ограничены. Имеется ряд свидетельств, как экспериментальных, так и теоретических, указывающих на то, что более высокие уровни организации белков также могут оказывать существенное влияние на форму и амплитуду спектров. Прежде всего, речь идет об особенностях укладки элементов вторичной структуры в белковую глобулу. С другой стороны, за последние годы накоплен большой экспериментальный материал по белкам в частично денатурированном состоянии, так называемых "расплавленных глобулах". Считается, что в таких белках третичные взаимодействия ослаблены,, но основная часть вторичной структуры остается неизменной. Систематическое сравнение спектров белков в нативном и частично денатурированном состоянии позволит исследовать влияние плотной упаковки на спектры КД. Представленная работа посвящена исследованию чувствительности спектров кругового дихроизма к супервторичной структуре глобулярных белков. Рассмотрена, возможность определения класса третичной структуры белка по его спектру. Также проанализированы спектры КД белков в состоянии расплавленной глобулы и исследована возможность оценки их структурных параметров. Цель и задачи исследования. Основной целью работы является исследование возможности анализа супервторичной структуры глобулярных белков с помощью спектроскопии кругового дихроизма. В задачи исследования входило;
Систематический анализ большого набора спектров КД белков различных структурных классов. Проверка наличия корреляции между формой спектра белка и его классом третичной структуры.
Создание алгоритма определения класса третичной структуры глобулярного белка по его спектру КД. Определение достоверности метода.
Сравнение информационного содержания набора спектров белков в нативном и в "расплавленном" состоянии. Проверка предположения о нативоподобности вторичной структуры расплавленных глобул.
Научная новизна работы. Впервые статистически достоверно показано наличие корреляции между формой спектров КД глобулярных белков и принадлежностью их к определенному классу третичной структуры. Показано, что спектральные образы в многомерном пространстве амплитуд образуют выраженные кластеры, соответствующие тому или иному классу третичной структуры. Впервые предложен численный метод определения класса третичной структуры белка по его спектру КД, Достоверность определения составляет 75-100% в зависимости от класса. Впервые исследовано информационное содержание набора спектров КД белков в "кислой" денатурированной форме и показано, что оно заметно ниже, чем в случае нативных белков. Продемонстрировано наличие корреляции между формой спектра и содержанием вторичной структуры в денатурированном белке. Предложен метод анализа вторичной структуры ненативных белков по их спектрам КД.
Практическое значение работы. Практическое применение полученных результатов возможно в двух областях:
- оперативное определение параметров третичной структуры глобулярных белков в растворе. Метод активно используется на практике - на него ссылаются в двух учебниках и в 15ти научных статьях.
- анализ параметров вторичной структуры частично денатурированных белков, для которых неприменимы стандартные методы, основанные на спектроскопии КД, Структура диссертации. Диссертационная работа состоит из «Введения», четырех глав, «Выводов» и «Списка литературы». Во «Введении» освещены актуальность изучаемой проблемы и цели исследования, а также отражена научная новизна работы. Глава 1 посвящена описанию и анализу литературных данных, отражающих современное состояние проблемы анализа структуры глобулярных белков по спектрам КД, а также освещены основные аспекты исследования белков в состоянии расплавленной глобулы. В главе 2 описаны материалы и методы, использованные в данной работе. В главе 3 представлено исследование чувствительности спектров кругового дихроизма к классу третичной структуры глобулярных белков. Глава 4 посвящена анализу спектров КД белков в состоянии расплавленной глобулы. В конце диссертации приведены основные выводы дайной работы и список цитируемой литературы в алфавитном порядке.
Основные результаты диссертации опубликованы в 7ми печатных работах, в том числе в 4х статьях в рецензируемых журналах.
Белки в состоянии «расплавленной глобулы
Еще в 1967 году были получены первые свидетельства того, что молекулы белков могут, при некоторых условиях, приобретать свойства, промежуточные между свойствами жесткой нативной структуры и полностью развернутого неупорядоченного клубка (Aune et al, 1967; Brandts & Hunt, 1967). Было показано, что для белков, денатурированных кислотой или температурой, существует еще один кооперативный структурный переход, вызываемый мочевиной или гуанидингидрохлоридом. Из этого следовало, что не все денатурированные состояния белка эквивалентны в структурном смысле - некоторые из них не являются полностью развернутыми. В вышедшем вскоре обзоре Тэнфорд (Tanford, 1968) впервые разделил понятия денатурации и разворачивания белка, показав, что более или менее полное разворачивание может быть достигнуто только высокими концентрациями мочевины или ГГХ, тогда как другие денатурирующие агенты (температура, рН и т.д.) могут переводить белки в иные, «частично развернутые» состояния. Позднее для целого ряда белков было показано существование как минимум двух кооперативных переходов при разворачивании их мочевиной или ГГХ. Наиболее важными явились работы Куваджимы с коллегами, которые обнаружили существование двух хорошо разделяющихся структурных переходов при разворачивании а-лактальбуминов человека и коровы гуанидингидрохлоридом и первыми описали существование промежуточного состояния, обладающего выраженной вторичной структурой и без жесткой третичной структуры (Kuwajima, 1977). Поскольку переходы, вызванные ГГХ, как правило сильно перекрываются, очень трудно получить промежуточное состояние белка в чистом виде, без примеси нативного и развернутого состояний.
К счастью, было обнаружено, что карбангидраза (Wong & Hamlin 1974), коровий (Kuwajima et al, 1976) и человеческий (Nozaka et al„ 1978) a-лактальбумины, также как и некоторые другие белки, могут под воздействием низких значений рН переходить в состояние по оптическим параметрам аналогичное интермедиату, вызванному ГГХ. Это открыло возможность использования кислых форм этих белков для изучения физических свойств промежуточного состояния. В 1981 году Долгих с соавторами показали (Dolgikh et al, 1981), что кислые формы коровьего и человеческого ос-лактальбуминов практичеки столь же компактны, как и нативные белки, и имеют нативоподобиое содержание вторичной структуры. С другой стороны, они не имеют жесткой третичной структуры, кооперативного температурного плавления, а их внутримолекулярная подвижность существенно выше, чем у нативных белков. Таким образом, этот интермедиат является не развернутой цепью с. локальными элементами вторичной структуры, как предполагал Куваджима (Kuwajima, 1977), а особым физическим состоянием белковой молекулы с необычной комбинацией свойств нативного и развернутого белков. Это состояние, позднее получившее название «расплавленная глобула» (Ohgushi & Wada, 1983), было подвергнуто детальному экспериментальному изучению (см. обзоры Baldwin, 1991; Christensen & Pain, 1991; Dobson, 1992; Fink, 1995; Kuwajima, 1989; Ptitsyn, 1987, 1992, 1995ab). Существование расплавленной глобулы было предсказано еще в 1973 году (Птицын, 1973), как «промежуточное» состояние белковой молекулы, которое является компактным, имеет вторичную структуру, подобную нативному белку, и ход основной цепи, сходный-с нативным состоянием (т.е. взаимное расположение а- и [3-участков как в последовательности, так и в пространстве), но отличается от нативного состояния потерей жесткой третичной структуры (т.е. точных положений атомов цепи). Первые данные о состоянии расплавленной глобулы как.стабильном равновесном-интермедиате (Kuwajima, 1989; Ptitsyn, 1987) подтвердили, что это состояние действительно лишь слегка менее компактно, чем нативное состояние [см. данные, суммированные в (Ptitsyn, 1992)]. Многочисленные данные по спектрам КД (Kuwajima, 1989; Ptitsyn, 1987) и инфракрасным спектрам (Ptitsyn, 1987) показывают, что общее содержание вторичной структуры в состоянии расплавленной глобулы должно быть сходно с таковым для нативного состояния.
С другой стороны, состояние расплавленной глобулы определенно является денатурированным в биохимическом смысле (т.е. ферменты являются неактивными в этом состоянии). Более того, оно имеет только следы нативных специфических третичных взаимодействий, и его внутримолекулярная ПОДВИЖНОСТЬ существенно выше, чем в нативном состоянии (Christensen & Pain, 1991; Kuwajima, 1989; Ptitsyn, 1987). Данные, полученные в ранних работах, не могли подтвердить или опровергнуть один из основных постулатов - то, что состояние расплавленной глобулы имеет нативоподобную грубую трехмерную структуру (взаимное расположение элементов вторичной структуры, folding pattern), т.е. сходны ли положения его ее- и (3-участков по цепи и в пространстве с таковыми в нативном состоянии. Термин «расплавленная глобула» может быть использован в двух значениях: структурированная (или «native-like») расплавленная глобула со сходным с нативным взаимным расположением элементов вторичной структуры, предсказанная в (Птицын, 1973) и «коллапсированная» форма (Kim & Baldwin, 1990; Baldwin, 1991) белковой молекулы («разупорядоченная» расплавленная; глобула), которая компактна и имеет сходное с нативным содержание вторичной структуры, но не имеет уникального, сходного с нативным расположения элементов вторичной структуры. В 1989 году для исследования: структуры равновесной расплавленной глобулы была применена техника двухмерного ЯМР в комбинации с частичным водородным обменом. Было показано, что положения многих а-спиралей в а-лактальбумине (Baum et ai., 1989; Chyan et ai, 1993), цитохроме с QengetaL, 1990; Baldwin & Roder, 1991) и апомиоглобине (Hughson et ai, 1990; Baldwin &. Roder, 1991) сходны в состоянии расплавленной глобулы (кислом) и в нативном состоянии. Более того, так как эти а-спирали образуют спиральные кластеры в нативной форме, то было высказано предположение (Hughson et ai, 1990), что даже их взаимное положение может оставаться подобным нативпому в расплавленной глобуле. Было показано (Harding et aL, 1991), что большая часть молекулы убиквитина имеет сходное с нативным взаимное расположение элементов вторичной структуры в денатурированном состоянии, напоминающем расплавленную глобулу. Наконец, с помощью
Методы факторного анализа и теории распознавания образов
На основе матрицы спектров Fa=f\-i. (где i,j - номера спектров и длин волн, соответственно) строилась симметричная матрица U F F С помощью алгоритма Якоби определялось унитарное преобразование Т и диагональная матрица А такая, что A = T UT. Ненулевые элементы матрицы А являются собственными значениями U. Для наибольших собственных значений определялись собственные вектора У\ матрицы V. На основе каждого из собственных векторов строился вектор Х\ -FY,, который нормировался на единицу Xа-, - Х\ / iJfj Полученные вектора Х являлись новой, ортогональной системой координат, оси которой расположены вдоль наиболее информативных относительно данного набора образов спектров направлений в полном, 24-мерном пространстве. Относительный вклад каждой базисной координаты Х\ в рассматриваемые спектры представлен квадратным корнем из собственного значения, соответствующего этой координате. Число базисных векторов (I, необходимое для экстрополяции экспериментального спектра с заданной точностью можно оценить по формуле: Сравнив а с объективной экспериментальной ошибкой, можно определить число базовых компонент, необходимых для корректного описания всех спектров набора, или, другими словами, оценить количество независимой информации, которое можно получить из анализа данного набора спектров. Значение экспериментальной ошибки при получении спектров КД было оценено (по максимуму) в 500 град дмоль см"!, исходя из разброса при определении концентрации и среднего приборного шума. Представление спектров в виде векторов в N-мерном пространстве амплитуд чрезвычайно удобно еще и в том смысле, что локализация точек в определенных областях пространства может отражать определенные свойства как спектров, так и исследуемых веществ.
Причем выделение подобных областей может использоваться как для доказательства определенных теорий, так и для поиска заранее не определенных закономерностей. Подобные подходы широко используются в прикладной математике и физике и являются одной из областей общей теории распознавания образов. В основе распознавания образов лежат численные методы классификации образов. Образы представляют собой совокупность свойств, извлекаемых из входных данных. В случае спектра такими свойствами являются значения его амплитуды на различных длинах волн, либо функции от этих значений. Функционирование системы распознавания образов (РО) разбивается на два этапа (Фор, 1989): а) извлечение свойств из входных (числовых) данных и получение на их основе образов, включаемых в совокупность образов, или совокупность свойств; б) классификация образов, т.е. отнесение их к одному , двум или более классам классификационной совокупности. Любой образ может быть представлен набором чисел, в котором каждое число соответствует значению некоторого свойства. Математически образ эквивалентен вектору. При п свойствах векторы считаются n-мерными и занимают п-пространство, или гиперпространство. В наиболее общей форме образ X можно выразить как: где индекс Т означает, что вектор транспонирован. В том случае, когда выбор свойств удачен, образы, принадлежащие одному классу, группируются в так называемые кластеры отдельно от точек, принадлежащих другим классам. Если нет пересекающихся кластеров, то с помощью гиперплоскостей можно разделить пространство таким образом, что области, определенные этими гиперплоскостями, будут представлять различные классы. Математические уравнения плоскостей разбиения на кластеры называются решающими функциями.
Прямые или гиперплоскости в общем случае выражаются линейными решающими функциями и могут правильно классифицировать только линейно разделимые кластеры, В таком случае решающие функции представляются п-мерными гиперплоскостями в форме D(X) = W X, где W - вектор весов. Его компоненты Wlt W2, W3, ... , Wn+l служат коэффициентами уравнения функции решения. Уравнение гиперплоскости выглядит следующим образом: Подобные решающие функции служат для разделения двух различных кластеров. Принадлежность исследуемого образа к тому или иному из двух разделяемых кластеров определяется по знаку функции D{X). Если требуется построить классификацию для нескольких кластеров, строится несколько решающих функций, разделяющих отдельные пары кластеров, либо группы кластеров, и по положению образа в областях пространства, найденному с помощью этих функций, определяется его принадлежность к конкретному кластеру. Для нахождения уравнений решающих функций используются несколько алгоритмов. Наиболее гибкими и удобными являются алгоритмы, использующие управляемое обучение. Одним из самых распространенных является алгоритм восприятия. В результате обучения по такому алгоритму создается вектор точных весов для классификации линейно разделимых кластеров. После обучения на образах известной классификации (обучающем наборе) этот алгоритм может осуществлять классификацию образов из неизвестных классов. Обучающее множество состоит из N образов в каждом из двух классов. Решающая функция для образов, принадлежащих классу 1, получает положительные числа: а для образов из класса 2 отрицательные: «, Алгоритм восприятия выбирает образ и определяет для него значение решающей функции.
Если образ классифицирован правильно, то корректировка W не требуется, В противном случае происходит корректировка W. Процедура повторяется до тех пор, пока все образы не будут правильно классифицированы по заданному вектору весов. Предположим, X принадлежит к 1-му кластеру, в таком случае к-й шаг процедуры коррекции выглядит так: где с - положительное приращение коррекции. При наложении определенных ограничений на значение с и при условии сепарабельности кластеров подобный алгоритм всегда сходится. Была написана программа, реализующая алгоритм восприятия. Вычисления выполнялись на компьютере IBM AT. Метод разделяющих функций удобен, если целью его применения является создание объективного алгоритма классификации образов на те или иные заранее определенные классы. Однако этот алгоритм становится необъективным, если требуется исследовать вопрос: группируются ли образы в пространстве в какие-либо обособленные кластеры и насколько такое разбиение информативно? Для подобных целей применяют другую
Получение набора спектров белков с известным классом третичной структуры
Были рассмотрены спектры 46 нативных глобулярных белков. Использовались как литературные, так и оригинальные данные. Для всех этих белков имеются рентгеноструктурные данные высокого разрешения, позволяющие однозначно определить их класс третичной структуры. Всего в обучающий набор вошло 9 аа, 12 а+р\ 13 а/(3 и 12 рр1 белков.Было показано (Privalov et al, 1989), что спектры денатурированных белков имеют характерную форму, близкую амплитуду и схожи со спектрами модельных полипептидов в клубкообразном состоянии. Вместе с тем, спектры КД белков с низким содержанием вторичной структуры также близки к спектрам денатурированных белков. В связи с этим показалось целесообразным рассматривать денатурированные белки и модельные пептиды в качестве самостоятельного "класса" и проанализировать отличие их спектров от спектров нативных белков. В исследуемый набор было включено 7 спектров денатурированных белков и модельных полипептидов.
На рис.2 приведены спектры всех рассматриваемых белков, сгруппированные по классам третичной структуры. Из рассмотрения спектров видно, что простые критерии классификации, предложенные Джонсоном (Manavalan & Johnson, 1983) (см. Обзор литературы), работают далеко не для всех белков. Прежде всего, нарушается однозначность соотношения амплитуд минимумов при длинах волн 208 и 220 нм для спектров белков сс+р и а/р классов. Спектры РР белков также являют собой гораздо большее разнообразие форм. Таким образом, возможности простого визуального анализа спектров с целью определения класса исследуемого белка весьма ограничены и вопрос о корреляции между формой спектра и классом третичной структуры требует дальнейшего рассмотрения. мы получаем возможность, путем вращения и сдвига системы координат, выделить несколько направлений в пространстве, распределение точек вдоль которых наиболее информативно. Таким образом, путем уменьшения размерности задачи ослабить влияние экспериментальной ошибки и получить наглядную информацию об относительном расположении точек в пространстве. Подобные подходы лежат в основе факторного анализа. Для визуализации распределения точек спектров в гиперпространстве необходимо свести размерность системы максимум к трем измерениям, чтобы сделать локализацию образов доступной для непосредственного восприятия. С этой целью к рассматриваемому набору данных был применен алгоритм поиска существенных координат (см. Материалы и методы) и была найдена новая ортогональная система координат. Три наибольших собственных значения симметричной матрицы U, построенной на основании спектров этих белков составили 120,3; 21,7 и 5,4. Соответствующие собственные вектора были использованы для создания Зх-мерной ортогональной системы координат. Проекции векторов: всех спектров на орты позволило получить распределение спектральных образов в этой системе координат, что изображено в виде трех проекций на Рис. 3.
Точки, соответствующие спектрам белков разных структурных классов, обозначены символами разного цвета. Тем же цветом очерчены минимальные выпуклые области, содержащие спектры белков одного класса третичной структуры. Из рассмотрения проекции по двум наиболее существенным координатам видно, что наборы образов спектров денатурированных и р В белков группируются в хорошо определенных областях пространства без пересечения с другими классами. Образы спектров белков аа, а+р и сс/р классов занимают на этой проекции заметно перекрывающиеся области. Добавление третьей координаты улучшает разделение. Точка может считаться попавшей не в свой класс, если она находится внутри фигуры, определяющей границы этого класса, на всех проекциях. Таких точек на трех проекциях всего три, это ct/pV белки - роданеза, субтилизин BPN и глицеральдегид-3-фосфатдегидрогеназа. Они попадают в область, определяемую образами спектров белков а+р - класса, однако лежат вблизи ее границы. Таким образом, можно принять, что если белок попадает в область, образованную фигурой, определяемой образами одного из классов, его с некоторой степенью вероятности можно отнести к этому классу. Это показывает, что дальнейшее исследование соответствия между распределением образов спектров в пространстве и классом третичной структуры соответствующих белков является оправданным, Для анализа распределения образов спектров в пространстве по критерию взаимного расстояния между ними к рассматриваемому набору спектров была далее применена процедура иерархической классификации. Данные были подвергнуты компьютерной обработке. Классификация строилась с помощью алгоритма Ланца-Вильямса с построением матрицы попарных расстояний между образами спектров на основе евклидовой метрики. Для построения дендрограмм применялись несколько методов определения расстояния между кластерами. Медианный метод, методы центроид и группового усреднения продемонстрировали наилучшие результаты, позволив добиться четкой кластеризации и продемонстрировав устойчивость полученного разбиения к применяемому методу. Разбиение на кластеры во всех трех методах практически одинаково. Вместе с тем чувствительность получаемого разбиения к добавлению и исключению спектров белков из обучающей выборки довольно высока. Это, вероятно, объясняется недостаточным количеством рассматриваемых белков для статистически адекватной классификации. Количество классифицируемых объектов в нашем случае.приблизительно в десять раз превышает число вероятных классов, что находится на грани статистически корректного анализа. Дендрограмма, полученная с помощью медианного метода, приведена на Рис. 4. По оси абсцисс в дендрограмме откладывалась величина сходства, где сходство Si} .между кластерами і и j определялось следующим образом: "ij - l«max " &\}) «max где d,j - расстояние между кластерами І и j, a dm.A - максимальное расстояние между двумя кластерами в данном рассмотрении. Эта величина нормирована на единицу и отражает близость между двумя кластерами. Из рассмотрения полученной дендрограммы можно видеть хорошее объединение в отдельный кластер ос-спиральных белков с высокой степенью спирализации.
Отделение денатурированных белков также очень хорошее, однако в один кластер с ними попали спектры (3-структурных белков - рубредоксина и эластазы, что, возможно, объясняется высокой неупорядоченностью их )3-структуры. Имеется также хорошо определенный кластер, содержащий спектры белков, принадлежащих (33 -классу. Можно выделить два кластера, содержащих спектры а+(3 и ct/(3 белков. Разделение между этими двумя классами не совсем четкое, однако один из кластеров преимущественно состоит из а/[3 белков и может быть принят, как соответствующий этому классу; другой состоит из двух подкластеров, один из которых практически полностью состоит из а/р белков, а второй включает как а+(3 белки, так и аос-белки низкой спиральности. Такое смешение си-(3 и а/(3 классов, вероятно, указывает на то, что области пространства, содержащие образы спектров белков этих классов, лежат очень близко друг к другу либо слабо перекрываются. Класс третичной структуры белка напрямую связан с содержанием элементов вторичной структуры. Это очевидно в случае eta и рр белков. Можно также считать, что в сс+Р белках в среднем преобладает р-структура, в то время как в а/Р белках ситуация обратная.
Можно предположить, что, поскольку форма и амплитуда спектров КД преимущественно зависит именно от интегральных параметров вторичной структуры, полученная кластеризация отражает схожесть параметров вторичной структуры белков внутри кластера. Для проверки этого был проведен кластерный анализ образов того же набора белков, однако в качестве свойств конкретного белка использовались значения содержания a-, (З- и неупорядоченной структур. Использовались параметры вторичной структуры, приведенные в работе (Kabsch & Sander, 1983), либо расчитанные с помощью программы DSSP. При таком рассмотрении, близкими считаются белки со схожими параметрами вторичной структуры. Полученная дендрограмма приведена на рис.5. Денатурированные белки: очевидно отделяются в хорошо определенный кластер, так же как и часть высокоспиральных и Pf3 белков. Однако четкого разделения сс+Р, а/р, РР и низкоспиральных оса белков не наблюдается. Разбиение по классам в этом случае даже хуже, чем в случае кластерного анализа спектров КД. Возможно, именно специфические особенности спектров белков разных классов (например, описанные в работе Manavalan & Johnson, 1983) вносят свой вклад в последнем случае. Нечеткость соответствия между разделением белков на кластеры w их классом третичной структуры может объясняться как недостаточностью статистической выборки, так и экспериментальными погрешностями, либо неоднозначностью принятой классификации белков. Однако, в целом, из рассмотрения результатов иерархической классификации спектров белков и визуализации расположения их образов в пространстве можно сделать вывод о наличии корреляции между классом третичной структуры белка и
Информационное содержание спектров КД расплавленных глобул
На рисунке 7 изображены собранные на одной панели спектры всех 10-ти нативных белков (Рис. 7а) и белков в состоянии расплавленной глобулы (Рис. 76). Даже простой визуальный анализ этих спектров позволяет прийти к заключению, что спектры расплавленных глобул в дальней ультрафиолетовой области не представляют такого многообразия форм, как спектры нативных белков. Так, например, значения молярной эллиптичности [9] на длинах волн 208 и 222 нм (т.е. в точках минимума КД спектров спиральных белков) варьирует в случае нативных белков от -3500 до -20000 и от -300 до -22000 град см2/дмоль, соответственно, тогда как в случае расплавленных глобул [9]2og принимает значения только от -7,500 до -19,000, а [Є]222 только от -5,000 до -15,000. Отношение [9]2оа / [0]г22, которое, возможно, зависит от укладки элементов вторичной структуры (Manavalan & Johnson, 1983), принимает значения от 0,8 до 5,0 для нативных белков, тогда как для расплавленных глобул оно лежит в диапазоне от 1,1 до 1,4. Таким образом, спектры расплавленных глобул существенно проще спектров нативных белков. Это качественное заключение подтверждается процедурой разложения по существенным значениям (singular value decomposition) (Hennesey & Johnson 1981). Эта процедура позволяет определить число независимых (ортогональных) спектров, на которые могут быть разложены спектры данного экспериментального набора с данной точностью. Другими словами, подобный метод позволяет оценить число независимых параметров, которые можно получить из анализа имеющегося набора данных, принимая во внимание экспериментальную ошибку. В случае анализа спектров КД белков это значение обычно интерпретируется, как число элементов вторичной структуры, вносящих вклад в спектр КД. Применение процедуры разложения по существенным значениям к нашему набору спектров нативных белков дает значение в 4 независимых компоненты (Рис. 8). Наличие более чем 3-х независимых компонент типично для наборов спектров нативных белков (Hennessey & Johnson, 1981; Perczel et ai, 1991).
С другой стороны, анализ спектров расплавленных глобул дает лишь 3 независимые компоненты. Это подтверждает наблюдение, что спектры расплавленных глобул проще спектров нативных белков. Количественный анализ спектров КД белков в дальней ультрафиолетовой области обычно строится на том предположении, что эти спектры являются суперпозицией вклада трех основных элементов вторичной структуры - а-спиралей, (З-структуры и неупорядоченных петель. Кажется вероятным, что это предположение работает лучше в случае расплавленных глобул, чем в случае нативных белков, поскольку спектры нативных белков могут быть усложнены вкладом ароматических боковых групп и S-S связей. Из вышесказанного следует, что спектры расплавленных глобул могут лучше описываться простой суперпозицией спектров трех основных элементов вторичной структуры, чем спектры нативных белков. 4.3. Оценка содержания вторичной структуры в расплаелепных глобулах по спектрам КД: сравнение с рентгеноструктурными данными. Центральным вопрос, на который можно попытаться ответить, исследуя спектры КД расплавленных глобул, является наличие соответствия между их вторичной структурой: и структурой соответствующих нативных белков.
С этой целью мы сравнили параметры вторичной структуры расплавленных глобул, оцененные на основании их спектров КД, с рентгеноструктурными данными по вторичной структуре соответствующих нативных белков. Структура восьми из десяти исследуемых белков - человеческий и бычий ос-лактальбумины, Р-лактамаза, рибонуклеаза А, аро-РСБ, фосфоглицераткиназа, лептин и цитохром с - была определена с высоким разрешением с помощью рентгеноструктурного анализа (Brookhaven Protein Data Bank; Bernstein et at, 1977). Один из оставшихся белков, карбоанкидраза коровы, имеет крайне высокую степень гомологии (98%) с аналогичным человеческим белком, для которого известна пространственная структура. Для оценочных целей мы приняли, что структуры этих белков можно считать близкими. Хотя пространственная структура апомиоглобина и была опубликована (Wagner et al., 1995), это не структура белка с полным отсутствием гема поскольку в работе был использован гем-аналог, который образовывал большинство гем-специфичных взаимодействий, играющих важную роль в формировании структуры. Такая форма белка не может рассматриваться как действительная апо-форма. Однако, анализ с помощью ЯМР показал, что нативная структура апомиоглобина схожа со структурой холо-белка, за исключением отсутствия спирали F (Eliezer & Wright, 1996; Eliezer et al, 1998).
Таким образом, в наших вычислениях мы принимали, что пространственная структура миоглобина идентична структуре холо-миоглобина без спирали F, В наборе белков с известной пространственной структурой человеческий и коровий а-лактальбумины имеют высокую степень гомологии и очень похожую структуру. Необходимо было решить, какой из этих двух близких белков включить в исследуемый набор? Предпринятый недавно количественный анализ параметров вторичной структуры расплавленных глобул этих двух белков с использованием комбинированного ИК-КД подхода и базового набора RaSP50 (Oberg & Uversky, 2001) показал увеличение содержания а-спиралей в человеческом белке при переходе из нативного в состояние расплавленной глобулы. Напротив, при таком переходе структура коровьего белка оставалась практически неизменной (К.A.Oberg, личное сообщение). Увеличение амплитуды спектра КД человеческого а-лактальбумина в состоянии расплавленной глобулы (Рис. 6Б) согласуется с этим наблюдением. С другой стороны, спектр КД коровьего а-лактальбумина в состоянии расплавленной глобулы очень близок к спектру нативного белка (Рис. 6А). Таким образом, для дальнейшего анализа был выбран а-лактальбумин коровы (Таблица 5). Содержания а-спиралей и (3-структуры, определенное методами Кабша-Сандера (Kabsch & Sander, 1983) и Левитта-Грира (Levitt & Greer,