Введение к работе
Диссертация посвящена статистическому анализу
экспериментально определенных пространственных структур белков,
проверке адекватности теоретических предпосылок статистических
методов распознавания соответствия аминокислотной
последовательности и типа пространственной укладки белка - методов "нанизывания" (threading) и "обратного фолдинга" (inverse folding), а также разработке новых математических подходов для этих методов. На базе этих подходов создана информационная система для предсказания типа структуры белков, для которых отсутствует экспериментальная информация по пространственной структуре.
Актуальность проблемы
Задача предсказания пространственной структуры белка по его аминокислотной последовательности традиционно считается важнейшей задачей молекулярной биофизики. Несмотря на многолетние усилия исследователей, эта задача все еще далека от своего решения. Вместе с тем, благодаря значительным успехам экспериментальных методов, в особенности рентгепоструктурного анализа, число известных трехмерных структур белков постоянно растет. В последние годы на основе статистического анализа банка пространственных структур белков сформулирован ряд количественных критериев соответствия аминокислотной последовательности и третичной структуры белка. С помощью таких критериев в ряде случаев удается вьщелить из банка пространственных структур трехмерную структуру с типом укладки, соответствующим данной аминокислотной последовательности (совместимым с пей), или найти аминокислотные последовательности, соответствующие определенному типу пространственной структуры.
В то же время возможности существующих в настоящее время статистических методов предсказания структуры белка сильно ограничены. Это делает необходимым анализ теоретических основ
статистических методов предсказания структур белков и дальнейшее совершенствование статистических методов распознавания структур.
Цель и задачи исследования
Целью работы явилось создание новых статистических подходов к распознаванию пространственной укладки белковой глобулы для данной аминокислотной последовательности, развитие так называемых подходов "обратного фолдинга" или, иначе говоря, "нанизывания". Важнейшей частью работы полагалось исследование теоретического фундамента этих методов и выяснение того, существуют ли принципиальные ограничения статистических методов предсказания пространственной структуры белка, исследование возможности постановки вероятностной задачи применительно к параметрам, характеризующим положения аминокислотных остатков в молекулах белков.
Научная новизна и практическая ценность
Впервые проверена адекватность принятых статистических подходов для анализа банка пространственных структур белков. Установлены значимые и незначимые статистические предпочтения аминокислотных остатков к определенным положениям в трехмерной структуре белка. Разработаны и протестированы принципиально новые методы распознавания соответствия аминокислотной последовательности и типа пространственной укладки белковой глобулы. Создана информационная система для работы с банками аминокислотных последовательностей и пространственных структур белков, предназначенная для широкого круга исследователей.
Аппробация работы
Результаты диссертации докладывались на Всероссийской конференции "Информационные системы в науке - 95".
Публикации
По материалам работы опубликовано пять статей и три сообщения
в форме тезисов.
Объем и структура диссертации
Работа изложена на 80 страницах, иллюстрирована семнадцатью
рисунками и содержит 10 таблиц. Диссертация состоит из Введения и трех глав, включая литературный обзор. Список цитированной литературы содержит 92 наименования.