Введение к работе
Актуальность темы
Функции биомакромолекул определяются их взаимодействиями. Физика таких взаимодействий, в свою очередь, во многом определяется их структурой. Таким образом, определение структур макромолекул - не только важный шаг в направлении понимания их функциональной активности на физическом уровне, но и перспективная модель для теоретического предсказания неизвестных взаимодействий.
Показано, что на разных стадиях биологической активности макромолекулы могут иметь различную структуру, так что конформационные перестройки играют первостепенную роль в реализации биологических функций. Этот факт делает актуальным предсказание не только «наилучшей» структуры, но и её альтернативных вариантов.
В-форма ДНК, открытая Watson и Crick, не является единственно возможной. В настоящее время исследуются и другие - альтернативные конформации, называемые необычными. Для образования таких структур, как правило, требуются определённые нуклеотидные последовательности. Необычные конформации могут возникать при сверхспирализации ДНК, в РНК и в комплексах нуклеиновых кислот с белками. Есть основания полагать, что наряду с такими уже известными необычными структурами нуклеиновых кислот как Кресты, Триплекси и Псевдоузлы существуют и другие типы.
В нашей лаборатории была предложена необычная конформация нуклеиновых кислот, названная Slipped Loop Structure (SLS), способная объяснить повышенную чувствительность участков с короткими прямыми повторами к действию одноцепочечных нуклеаз. Так как такие повторы широко распространены в геномных последовательностях, то способность к образованию предложенной нами структуры вполне могла бы быть использована в ходе эволюции. Молекулярным моделированием была показана принципиальная возможность существования такого типа структур из соображений молекулярной геометрии, т.е. без нарушения длин валентных связей, углов и с учётом тесных контактов. Были построены полноатомные молекулярные модели стерически возможных конформации как для ДНК. так и для РНК, а также, проанализирована конформационная жёсткость таких структур.
Как правило, неканонические конформации ДНК не являются энергетически наиболее выгодными. Однако аналогичные конформации для РНК, которая является одноцепочечной молекулой, могут быть энергетически выгодными и вопрос о функциональной роли таких структур становится весьма актуальным. Более того, интерес к изучению компактных пространственных структур нуклеиновых кислот основывается на их возможных каталитических свойствах.
Развитие Internet и конкретно World Wide Web революционизировало процесс обмена информацией в научном сообществе, и в настоящее время Internet предоставляет доступ к обширным ресурсам данных, в частности, по молекулярной биологии. К настоящему времени накоплено огромное количество прочитанных первичных последовательностей нуклеиновых кислот. Успешная реализация геномных проектов, включающие Дрозофилу и Человека, привело к экспоненциальному росту доступных геномных данных. Эти данные
являются важным источником экспериментальной информации для проверки различных гипотез и теоретических предсказаний. Анализ накопленных данных (основная задача биоинформатики) позволяет выдвигать новые гипотезы для экспериментальной проверки и использовать найденные статистические закономерности в эвристических алгоритмах.
Активное использование больших объёмов информации немыслимо без использования современных информационных систем на базе ЭВМ. Хранение и доступ к большим объёмам данных представляют собой целое направление в информатике и, на текущем этапе, системы интегрированного доступа к разнородным данным особенно актуальны. В данной работе использовалась активно разрабатываемая система SRS, способная предоставлять доступ к широкому спектру разнородных биологических данных и интегрировать методы анализа биополимеров. Помимо легкости интерактивного использования интегрированных под SRS данных, SRS WWW интерфейс открывает возможность использования результатов работы широкому научному сообществу.
Цели и задачи исследования
Основной целью данной работы было изучение методами биоинформатики теоретически предсказанной необычной структуры нуклеиновых кислот - SLS. Основной задачей являлось исследование встречаемости участков в геномных последовательностях, РНК транскрипт которых способен к образованию SLS, для выявления функциональной роли таких структур.
Научная новизна
Данная работа посвящена изучению конформации SLS, впервые предложенной в нашей лаборатории. В то время как PHK-SLS и Псевдоузел имеют одинаковые ограничения на первичную последовательность, и биологическую значимость Псевдоузла можно считать доказанной, предложенная пространственная структура SLS существенно отлична от геометрии Псевдоузла.
В данной работе впервые произведён систематический анализ встречаемости РНК транскриптов, способных к формированию SLS, в геномных последовательностях. Такие транскрипты были названы SL-палиндромами (SLP). Данная работа показала распространённость таких мотивов, что поддерживает гипотезу о возможной биологической значимости предложенной структуры. Полученные результаты позволяют предложить гипотезы о функциональной роли SLS для дальнейшего экспериментального и теоретического исследования.
Был предложен и использован оригинальный метод оценки значимости встречаемости SL-палиндромов в геномных последовательностях.
В работе использовалась перспективная развивающаяся система для однородного доступа к биологическим данным и интеграции методов анализа биополимеров - SRS.
Теоретическое и практическое значение
SLS пополнила ряд возможных пространственных мотивах нуклеиновых кислот. Анализ встречаемости транскриптов геномных последовательностей, способных к образованию SLS, показал значительную распространённость таких мотивов. Выявленные неоднородности распределения этих мотивов и
найденные консервативные SLP в рибосомных РНК позволяют выдвигать гипотезы о функциональной роли SLS.
Из практических выходов настоящей диссертации является интеграция доступа к данным и методам поиска SLP на базе SRS с Internet доступом.
Апробация диссертации и публикации
Материалы диссертации были доложены на XXXIX конференции МФТИ (1996), на Юбилейной XL конференции МФТИ (1997), на семинаре в Институте Молекулярной Биологии (1MB-Jena, Германия) (1998) и на семинаре в Институте Исследования Рака (DKFZ, Германия) (1998). Всего по теме диссертации опубликовано пять работ.
Структура диссертации
Диссертационная работа состоит из Введения, Обзора литературы, четырёх глав (Модель поиска SLP и критерий оценки значимости встречаемости, Результаты анализа встречаемости SLP, Консервативные SLP в Рибосомных РНК, Разработанная инфраструктура доступа к данным и методам), Выводов и Списка цитируемой литературы.