Содержание к диссертации
Введение
Глава 1. Литературный обзор
1. Развитие масс-спектрометрии ИЦР ПФ 9
1.1. Циклотрон 9
1.2. Ловушка Пеннинга 10
1.3. Масс-спектрометр ИЦР ПФ 15
1.4. Методы ионизации 23
1.5. Протеомный анализ «по восходящей»(ВОТТОМ UP) 33
1.6. Методы фрагментация (МС/МС) 37
1.7. Поиск и идентификация Пост-Трансляционных Модификаций 40
1.8. Развитие метода точных массово-временных меток 45
1.9. Гумусовые кислоты 51
1.10. Моча человека 56
1.11. Конденсаты выдыхаемого человеком воздуха 57
Глава 2. Увеличение выхода многозарядных ионов в методе МАЛДИ 59
Глава 3. Исследование элементного состава гумусовых кислот при помощи масс-спектрометрии ИЦР ПФ 65
Глава 4. Исследование белкового состава мочи и КВВ человека при помощи масс-спектрометрии ИЦР ПФ 76
4.1. Хромато-масс-спектрометрическая методика для анализа проб мочи и КВВ человека 76
4.2. Метод точных массово-временных меток для исследования белкового состава мочи человека 81
4.3. Поиск и идентификация пост-трансляционных модификаций в белках, содержащихся в моче человека 88
Выводы 91
Список цитируемой литературы
- Масс-спектрометр ИЦР ПФ
- Развитие метода точных массово-временных меток
- Метод точных массово-временных меток для исследования белкового состава мочи человека
- Поиск и идентификация пост-трансляционных модификаций в белках, содержащихся в моче человека
Введение к работе
Введение. Актуальность проблемы.
При помощи современных методик, основанных на масс-спектрометрическом анализе, можно исследовать биологические объекты самого разного происхождения и сложности. Это стало возможным благодаря открытию новых методов ионизации вещества, метода электроспрей и метода лазерной десорбции/ионизации из матрицы (МАЛДИ), которые позволили переводить в газовую фазу и одновременно ионизировать большие биологические молекулы, такие как пептиды, белки и полинуклеотиды.
Масс-спектрометрия ионного циклотронного резонанса с преобразованием Фурье (ИЦР ПФ) обладает рядом преимуществ по сравнению с другими методами масс-спектрометрии. Главными достоинствами данной методики являются: сверхвысокая разрешающая способность и рекордная точность измерения масс. На базе современного масс-спектрометра ИЦР ПФ можно реализовывать методики для однозначной идентификации элементного состава как индивидуальных биомолекул, так и их смесей.
В настоящее время полностью расшифрованы геномы различных организмов, в том числе и человека. Относительно небольшим набором генов кодируется большое количество разных белков. В связи с исследованиями многообразия белков содержащихся в различных биологических объектах возникла новая фундаментальная концепция, названная «протеом» (ПРОТЕиновое дополнение к генОМу). Создана новая дисциплина -протеомика, которая призвана дополнить и аннотировать геномные исследования. Современная масс-спектрометрия ИЦР ПФ занимает передовые позиции в решении основной задачи протеомики - идентификация белков и пост-трансляционных модификаций в них.
Масс-спектрометр ИЦР ПФ обладает ограниченным динамическим диапозоном, в то же время, протеомы различных организмов содержат большой диапазон относительных концентраций белков. Необходимо использовать масс-
спектрометрии ИЦР ПФ в комбинации с существующими аналитическими методами разделения (жидкостная хроматография, электрофорез).
В данной работе автор разрабатывал и оптимизировал методы использующих масс-спектрометрию ИЦР ПФ для исследования элементного и протеомного состава таких объектов как: (1) моча человека, (2) конденсаты выдыхаемого человеком воздуха (КВВ), (3) гумусовые кислоты. Так же в работе были разработаны и использованы новые подходы для обработки и интерпретации полученных данных.
Цели и задачи: (1) исследовать механизмы получения многозарядных ионов и разработать способ, позволяющий увеличить выход многозарядных ионов в методе МАЛДИ; (2) исследовать возможности различных методов фрагментации для идентификации биомакромолекул; (3) исследовать зависимость достоверности идентификации биомакромолекул от точности измерения масс и разрешения; (4) разработать хромато-масс-спектрометрические методики для анализа протеомного состава мочи и КВВ человека; (5) разработать и внедрить метод точной массово-временной метки для анализа протеома мочи; (6) разработать подход идентификации белков с учетом произвольных пост-трансляционных модификаций в них и использовать данный подход при исследовании протеома мочи человека; (7) создать новую базу данных, состоящую из точных массово-временных меток, для быстрого поиска и идентификации белков содержащихся в моче человека; (8) разработать методику на основе масс-спектрометрии ИЦР для исследования элементного состава гумусовых кислот.
Научная новизна работы.
1. Впервые предложен способ увеличения выхода многозарядных ионов
биомакромолекул в методе МАЛДИ.
2. Впервые исследован протеомный состав конденсата выдыхаемого
человеком воздуха, при помощи разработанной хромато-масс-
спектрометрической методики.
Впервые разработан подход для протеомного анализа мочи человека, который позволяет осуществлять поиск и идентификацию пост-трансляционных модификаций, в том числе заранее неизвестных, в идентифицированных белках.
Впервые реализована новая процедура для поиска и идентификации белков, содержащихся в моче человека, использующая подход точных массово-временных меток.
Впервые создана новая база данных точных массово-временных меток протеома мочи человека.
Впервые предложен новый метод для определения элементного состава гумусовых кислот, основанный на точном измерении масс, при помощи масс-спектрометрии ИЦР ПФ, и статистической обработки данных.
Практическая значимость работы.
Предложенный способ получения многозарядных ионов в методе МАЛДИ позволит более эффективно использовать данный метод для масс-спектрометрии ИЦР ПФ.
Разработанные хромато-масс-спектрометрические подходы для анализа биологических жидкостей человека могут быть в дальнейшем использованы для диагностики различных отклонений в организме человека, вызванных, в том числе, заболеваниями.
Новая база данных точных массово-временных меток может использоваться для высокопроизводительного анализа протеома мочи человека.
Новый подход для анализа гумусовых кислот может использоваться для элементного и сравнительного анализа сложных смесей, различного БиоГео происхождения.
Методики, развитые для анализа конденсатов выдыхаемого человеком воздуха, в дальнейшем могут быть исльзованы для создания новых методов диагностики состояния легких.
Личный вклад автора. Материал, представленный в диссертации, получен при непосредственном участи автора как в постановке задачи, так и при
проведении исследований, выполнении экспериментов. Обработка и анализ ИЦР масс-спектров гумусовых кислот проводился автором совместно с Э.В. Куненковым (Химический факультет МГУ). База данных точных массово-временных меток создавалась автором совместно с Д.М. Автономовым (ИНЭП ХФ РАН) и И.А. Агроном (ГУ НИИ БМХ РАМН). Подход по поиску и идентификации пост-трансляционных модификаций был разработан автором совместно с Д.М. Автономовым (ИНЭП ХФ РАН). Пробы мочи были приготовлены С.А. Мошковсим (ГУ НИИ БМХ РАМН). Пробы конденсатов выдыхаемого воздуха были приготовлены B.C. Куровой (ИБХФ РАН). Диссертационная работа выполнена в Институте энергетических проблем химической физики Российской академии наук, в лаборатории ионной и молекулярной физики, часть работ одновременно выполнялась автором в Институте биохимической физики им. Н.М. Эмануэля Российской академии наук в период с 2004 по 2007 год.
Апробация работы. Результаты работы докладывались и обсуждались на следующих Российских и международных конференциях: 1-й Международный симпозиум по масс-спектрометрии сверхвысокого разрешения для анализа на молекулярном уровне сложных (БиоГео) систем, 6-7 Ноября, Германия, 2006; Конференция по программе фундаментальных исследований РАН «Фундаментальные науки- медицине», Москва, 2006 г.; Третья международная конференция-школа «Масс-спектрометрия в химической физике, биофизике и экологии», Звенигород, Россия, 16-21 Апреля, 2007; 55-я конференция Американского масс-спектрометрического общества, Индианаполис, США, 2007; 8-я Европейская конференция по ИЦР масс-спектрометрии и Российско-Немецкий семинар, 27 Август - 1 Сентябрь, Москва, Россия, 2007; Третий съезд ВМСО, 2-ая Всероссийская конференция с международным участием «Масс-спектрометрия и ее прикладные проблемы», 3-7 сентября 2007 г., Москва.
Публикации. Основное содержание диссертации опубликовано в работах, список которых приводится в конце автореферата. Работы, результаты
которых изложены в диссертации выполнены при поддержке РФФИ, INTAS, CRDF, в рамках программ Президиума РАН, ОХНМ РАН.
Структура и объем диссертации. Работа изложена на 105 страницах, содержит 30 рисунков и 4 таблицы. Диссертация состоит из четырех глав, заключения и списка цитируемой литературы.
Масс-спектрометр ИЦР ПФ
Первый масс-спектрометр ИЦР ПФ был предложен Комиссаровым и Маршалом в 1974 году [5-6]. Основными частями масс-спектрометра являются: магнит, ИЦР ячейка, вакуумная система откачки (10"9-10 п Торр), автоматическая система управления и система сбора и обработки данных. В качестве магнита обычно используется сверхпроводящий соленоид (0.3-24 Тл). В качестве ячейки ИЦР используется ловушка Пеннинга. Помимо удержания ионов ячейка ИЦР также используется для измерения частот циклотронного движения ионов в магнитном поле. На рисунке 3 показаны возможные конфигурации ИЦР ячейки [4,7]. Наиболее простая конфигурация представляет собой систему из шести пластин. Пластины попарно выполняют следующие функции:
- Запирающие пластины (Расположены перпендикулярно магнитному полю. На пластины подается постоянный потенциал, который создает потенциальный барьер для удержания ионов вдоль продольной оси).
- Возбуждающие пластины (Расположены параллельно магнитному полю. На пластины подается радиочастотный потенциал, который служит для возбуждения циклотронного движения ионов).
- Детектирующие пластины (Расположены параллельно магнитному полю. С детектирующих пластин снимается сигнал, наведенный движущимися зарядами).
Возбуждение и детектирование ИЦР сигнала.
Обычно для детектирования ИЦР сигнала используют пару пластин ЦР ячейки, которые параллельны магнитному полю. ИЦР сигнал регистрируется, когда ион подлетает к одной из пластин, создавая разницу наведенного заряда между пластинами (рис. 4). Во время удержания ионов в ИЦР ячейки они двигаются таким образом, что фаза каждого из них произвольна, поэтому суммарный сигнал, наводимый на детектирующие пластины, будет сбалансирован и равен нулю. Даже если бы все ионы с данным m/z отношением имели одинаковую фазу, циклотронный радиус ионов с тепловой энергией слишком мал для получения детектируемого сигнала. Таким образом, необходимо создать пространственно когерентный пакет ионов и возбудить его на достаточный для детектирования радиус. Для этого в плоскости циклотронного движения ионов (плоскость ху на рисунке 1) создают возбуждающее переменное электрическое поле (подавая на возбуждающие пластины соответствующее напряжение, частота изменения которого близка или совпадает с циклотронной частотой), и регистрируют ИЦР сигнал, наводимый возбужденными ионами на детектирующих пластинах (рис. 4). При наложении переменного электрического поля Erf, частота которого совпадает с циклотронной частотой сос, и направление лежит в плоскости вращения заряженной частицы, наблюдается явление циклотронного резонанса: энергия переменного электрического поля поглощается вращающейся частицей и переходит в кинетическую энергию вращения.
Масс-спектрометр ИЦР ПФ обычно работает в импульсном режиме (рис.5). Во время импульса ионизации создается ансамбль ионов (обычно ионы образуются вне ячейки ИЦР при помощи методов атмосферной ионизации: электроспрей, МАЛДИ, химическая ионизация, фотоионизация и др.). Селекция ионов нужного диапазона m/z может происходить как в ячейке ИЦР (при помощи импульса переменного электрического поля, частотный спектр которого содержит циклотронные частоты вращения ионов попадающих в выбранный диапазон m/z), так и вне ИЦР ячейки. Для селекции ионов вне ИЦР ячейки удобно использовать линейную квадрупольную ионную ловушку (LTQ), поскольку в таком случае можно сразу выполнять ряд процедур: накопление, изоляцию и предварительное сканирование числа ионов (AGC). Использование LTQ для селекции ионов также позволяет осуществлять ион-молекулярные реакции, такие как столкновительно-индуцированная диссоциация (CID). Ион-молекулярные реакции также могут происходить в атмосферном источнике ионов (образование комплексов) и в самой ИЦР ячейке (фрагментация иона методами IRMPD и ECD). Для возбуждения ионов в ИЦР ячейке на больший радиус используется широкополосный генератор (ЦАП) и усилитель мощности, при помощи которых на пластины возбуждения подается переменный импульсный напряжения (импульсный напряжения может использоваться также для изоляции и фрагментации ионов в ИЦР ячейке). Детектирование и запись ИЦР сигнала осуществляется при помощи широкополосного дифференциального усилителя и быстрого АЦП.
Развитие метода точных массово-временных меток
Подход «по восходящей» с использованием метода точных массовых меток для идентификации пептидов позволяет быстро охарактеризовать большое количество белков прямо из клеточного лизата или из биологической жидкости (без предварительного разделения одно- или двумерным электрофорезом). Этот подход подразумевает использование полипептидных точных массовых меток и основан на предположении, что молекулярные массы многих пептидов (в том числе и модифицированных) из белкового гидролизата уникальны среди всех пептидов от всех белков, предсказанных по известному геному (при достаточно высокой точности измерения масс). Поэтому данный подход похож на метод "пептидного отпечатка пальцев" при применении его к сложным белковым смесям. На практике специфичность метода можно улучшить, используя также разделение по времени (например, можно использовать время выхода из хроматографической колонки при жидкостной 46 хроматографии (ЖХ)). Точная масса пептида и точное время его выхода из хроматографической колонки создают в совокупности точную массово-временную метку пептида, которая почти однозначно его идентифицирует.
Так как ИЦР ПФ масс-спектрометрия может достигать точностей измерения меньше ррт, она является одним из наиболее мощных инструментов в этом подходе к исследованию протеома, обеспечивая большую надежность идентификации белков. Повышенная чувствительность ИЦР ПФ масс-спектрометров дает возможность обнаруживать белки, содержащиеся в очень малых относительных концентрациях, что ведет к лучшему покрытию протеома. Большим преимуществом методики точной массово-временной метки является высокая производительность, достигаемая за счет отсутствия шага тандемной масс-спектрометрии (МС/МС). В данной технологии МС/МС используется только для построения первоначального набора потенциальных массово-временных меток. Эти метки представляют собой точные массы пептидов белков, идентифицированных в МС/МС эксперименте, который может быть выполнен на практически любом масс-спектрометре (например, квадрупольном), как правило, с не очень высокой точностью измерения массы. В процессе идентификации трипсиновый гидролизат смеси белков протеома, который является смесью пептидов, анализируют при помощи тандемной хромато-масс-спектрометрии. Полученные масс-спектры далее подвергаются анализу с помощью различного программного обеспечения, используемого для
Процент идентифицированных белков в протеоме 47 идентификации пептидов, такого как SEQUEST [49] или MASCOT [50]. Массы этих идентифицированных пептидов и времена их выхода из хроматографической колонки и составляют набор предполагаемых массово временных меток. Впервые подход точной массово-временной метки был применен при анализе протеомов микроорганизмов группой Смита из Северо западной национальной лаборатории США (PNNL) [51,52]. Для максимизации покрытия протеома может быть применен ряд приемов. В случае микроорганизмов, при анализе протеома которых метод был впервые применен, было показано, что их выращивание при множестве различных условий повышает число зарегистрированных белков, а проведение ЖХ МС/МС позволяет идентифицировать большую часть протеома. Если тот же самый протеом снова проанализировать, используя жидкостную хроматографию в сочетании с ИЦР ПФ масс-спектрометрией и пептиды, выбранные как предполагаемые массово-временные метки, будут снова идентифицированы (с некоторыми разумными допусками, например, точностью измерения масс 1 ррт и совпадением нормализованного времени выхода в пределах 5%), тогда потенциальная массово-временная метка считается подтвержденной и становится "точной массово-временной меткой". Точные массово-временные метки служат надежными маркерами присутствия соответствующего белка в будущих экспериментах. Такой подход убирает дальнейшую необходимость в длительных измерениях, и, следовательно, сильно увеличивает производительность анализов. Критичным аспектом, правда, является 48 первоначальная затрата времени на создание базы данных меток. Этот процесс также может включать в себя различные шаги предварительного разделения пептидов, мало или ничем не отличающиеся от тех, которые используются при обычных МС/МС экспериментах. Эти шаги также нужны для того, чтобы охарактеризовать пептиды с низкой концентрацией, которые могут быть обнаружены при помощи ЖХ ИЦР ПФ масс-спектрометрии, но не ЖХ МС/МС (в отсутствие предварительного разделения). Зато результатом этих дополнительных усилий является устранение необходимости использования МС/МС в дальнейших анализах. Используя подход точных массово-временных меток группа Смита идентифицировала с высокой точностью более 61% предсказанного протеома D.radiodurans [51]. Такой процент покрытия в то время был наибольшим среди всех организмов и включал в себя 715 белков, которые ранее считались гипотетическими. При обычном ЖХ ИЦР ПФ МС анализе детектировались массы 1500 массово-временных меток, соответствующих 700 открытым рамкам считывания (ОРС) (в зависимости от клеточной культуры) и 15-20% всего протеома D. radiodurans. Позже дополнительная обработка данных и новые эксперименты увеличили покрытие протеома до 83% [52].
Метод точных массово-временных меток для исследования белкового состава мочи человека
Масс-спектрометрический анализ фракций пептидов осуществлялся при помощи программы Xcalibur (Thermo Electron, Бремен, Германия) в 2-х стадийном режиме автоматического измерения спектров (рис. 23). На первой стадии в масс-спектрометре ИЦР ПФ измерялись точные массы пептидов в диапазоне m/z 300-1600 с разрешением R=25000 для m/z 400 (число ионов в ячейке ИЦР 5х106). На второй стадии из ИЦР масс-спектра выбирались три максимальных пика, для которых производилась либо столкновительно индуцированная фрагментация (CID), либо фрагментация, при захвате медленных электронов (ECD). Фрагментация CID и измерение спектров СЮ фрагментов происходили в линейной квадрупольной ионной ловушке (число ионов 3 104). Фрагментация ECD и измерение спектров ECD фрагментов осуществлялись в ИЦР ячейке (число ионов 5х105). В режиме автоматического 2-х стадийного анализа пептиды, для которых фрагментация уже была проведена, динамическое исключались из рассмотрения на 30 секунд.
Данные хромато-масс-спектрометрического анализа обрабатывались при помощи программы BioworksBrowser 3.1 SRI (Thermo Electron, Бремен, Германия), которая формирует список из точных значения масс пептидов и масс их фрагментов. Данный список используется для поиска и идентификации белков по базе данных NCBInr (Comprehensive, non-identical protein database) при помощи программы Mascot (Matrix Science, London, UK; version 2.0.04).
Было идентифицировано около 200 белков при анализе проб мочи. В одном хромато-масс-спектрометрическом прогоне удается идентифицировать около 120 белков [85]. Приготовление пробы мочи и способ фрагментации пептидов влияют на количество и список идентифицированных белков (рис. 24).
В одном хромато-масс-спектрометрическом эксперименте в пробе КВВ удается идентифицировать около 20 белков [86]. Набор идентифицированных белков разный для проб КВВ, собранных от разных пациентов, и зависит от способа сбора пробы КВВ (рис. 25,26).
По интенсивности пиков в масс-хроматограммах, полученных при анализе проб КВВ, возможно сравнение профилей экспрессии белков у разных пациентов (рис. 27).
Метод точных массово-временных меток подразумевает под собой создание базы данных точных массово-временных меток и использование этой базы данных для поиска и идентификации белков в хромато-масс-спектрометрических экспериментах уже без применения методов фрагментации. Эта идеология была использована для анализа проб мочи человека (рис. 28). На первой стадии производился хромато-масс-спектрометрический анализ для предварительной идентификации пептидов, содержащихся в пробе. Из списка идентифицированных пептидов формировалась база данных, содержащая массы (подсчитанные по идентифицированной аминокислотной последовательности) и соответствующие им (измеренные) времена выхода пептидов в хроматографической колонке. Далее эта база данных сравнивалась с результатами хромато-масс-спектрометрического эксперимента с использованием масс-спектрометра ИЦР ПФ, в котором проводились измерения точных масс зарегистрированных пептидов при полученных раннее временах выхода. В результате процедуры сравнения формировалась база данных точных массово-временных меток, которая может использоваться для поиска и идентификации белков из мочи человека по точной массе пептидов, входящих в состав белка, и временам удерживания данных пептидов в хроматографической колонке [87].
База данных была разработана при помощи языка SQL (Structured Query Language - структурированный язык запросов). Она позволяет кроме хранения данных, также выполнять следующие процедуры: (1) загрузку новых данных; (2) сравнение данных, полученных в разных экспериментах; (3) сортировку данных.
Поиск и идентификация пост-трансляционных модификаций в белках, содержащихся в моче человека
Метод точных массово-временных меток подразумевает под собой создание базы данных точных массово-временных меток и использование этой базы данных для поиска и идентификации белков в хромато-масс-спектрометрических экспериментах уже без применения методов фрагментации. Эта идеология была использована для анализа проб мочи человека (рис. 28). На первой стадии производился хромато-масс-спектрометрический анализ для предварительной идентификации пептидов, содержащихся в пробе. Из списка идентифицированных пептидов формировалась база данных, содержащая массы (подсчитанные по идентифицированной аминокислотной последовательности) и соответствующие им (измеренные) времена выхода пептидов в хроматографической колонке. Далее эта база данных сравнивалась с результатами хромато-масс-спектрометрического эксперимента с использованием масс-спектрометра ИЦР ПФ, в котором проводились измерения точных масс зарегистрированных пептидов при полученных раннее временах выхода. В результате процедуры сравнения формировалась база данных точных массово-временных меток, которая может использоваться для поиска и идентификации белков из мочи человека по точной массе пептидов, входящих в состав белка, и временам удерживания данных пептидов в хроматографической колонке [87].
База данных была разработана при помощи языка SQL (Structured Query Language - структурированный язык запросов). Она позволяет кроме хранения данных, также выполнять следующие процедуры: (1) загрузку новых данных; (2) сравнение данных, полученных в разных экспериментах; (3) сортировку данных.
Созданная база данных позволяет с использованием идеологии метода точных массово-временных меток проводить идентификацию белков без применения методов фрагментации, в том числе при проведении высокопроизводительного анализа протеома мочи человека.
Поиск пост-трансляционных модификаций (ПТМ) в белках, содержащихся в моче человека, осуществлялся с использованием нового алгоритма, предложенного группой Певзнера [89]. Этот подход позволил находить не только известные модификации, но так же и любые другие, заранее неизвестные модификации. Методика поиска основана на предположении, что в смеси имеются как модифицированные белки, так и их немодифицированные варианты. Процедура поиска модификаций строилась следующим образом: проводился предварительный поиск по базе данных в результате которого идентифицировались немодифицированные белки, присутствующие в смеси. Далее в найденных немодифицированных белках, искались всевозможные модификации. Модификациями считались разности масс «похожих» пептидов, входящих в состав белков (пептиды считались похожими, если в масс-спектрах фрагментации совпадали хотя бы четыре пика). Набор возможных ПТМ, которые были идентифицированны при анализе белкового состава пробы мочи человека, представлен в Таблице 4. После определения характерных модификаций осуществлялся поиск по обычным базам данных, с указанием найденных модификаций. Новый подход позволил повысить количество идентифицированных белков, содержащихся в моче человека (см. рис. 29), и определить основные модификации, которые присутствуют в протеоме мочи человека [88].