Введение к работе
Актуальность проблемы связи структуры функционально важных участков ДНК с их функцией в экспрессии генов требует разработки и использования все более новых изощренных методов компьютерного анализа их первичных структур.
Выявление и анализ периодичностей в первичной структуре ДНК важны для понимания законов формирования и стабильности структур ДНК более высоких порядков. Анализ периодичностей способствует пониманию процессов транскрипции и репликации ДНК. В данной работе предпринята попытка найти ключ к задаче о взаимодействии РНК-полимеразы с промоторами путем исследования периодичностей в первичной структуре индивидуальных промоторов.
Цель и задачи исследования
Ііелью данной работы является изучение периодических свойств совокупности нуклеотидных последовательностей бактериальных промоторов, сравнительное исследование локальных и глобальных свойств первичной структуры, связанных с функционированием этих участков.
В связи с указанной целью задачами данной работы являлись:
-
выбор и разработка методов, адекватных для решения задач распознавания последовательностей с заданными структурно-функциональными свойствами;
-
создание комплекса программ на основе методов нейронных сетей, частотного анализа, кластерного анализа и матричного Фурье-анализа для исследования участков нуклеотидных последовательностей, характеризующихся регулярным строением различного типа;
-
выявление и изучение периодических свойств промоторов методом матричного Фурье-анализа, сравнение Фурье-спектров промоторов прокариот и эукариот ( E.coti, B.subtilis и Н.sapiens);
-
установление периодических свойств распределения нуклеотидов на участках связывания РНК-полимеразы метолами Фурье-анализа и корреляционного анализа, нахождение консенсусов;
-
установление связи между особенностями первичной структуры промоторных областей и определяемыми ими конформаиионными и физико-химическими свойствами, прежде всего, особенностями гидратации ДНК промоторов;
-
применение агломеративно-иерархического кластерного анализа и метода искусственных нейронных сетей для классификации последовательностей в АНК промоторов.
Научная новизна работы
Продемонстрирована возможность проведения классификации промоторов по системам признаков, в основе которых лежат особенности распределения- частот встречаемости пар, троек и четверок нуклеотидов, что показало принципиальные отличия одних групп промоторов от других и позволило сделать вывод о том, что существенные закономерности регуляции считывания генов определяются свойствами участков специфического АНК-белкового взаимодействия самих промоторных
участков ДНК с регуляторными белками, в то же время места посадки РНК-полимеразы не выявляются с помощью консенсусного анализа.
Таким образом, показано, что посадка РНК-полимёразы на промоторные последовательности отличается от принципов так называемого специфического узнавания, которое характерно для известных регуляторных белков, чьи операторные последовательности четко сохраняются в эволюционном ряду. Полученные данные свидетельствуют о том, что узнавание РНК-полимеразой зон посадки на промоторах определяется Специфическими физическими свойствами зон посадки (признаки, использовавшиеся при проведении классификации промоторов, включают параметры, связанные с физическими характеристиками участков сильного взаимодействия РНК-полимеразы с ДНК).
Для установления, с одной стороны, глобальных свойств последовательностей функционально важных участков полинуклеотидных цепей, а с другой стороны, -характеристики их конформационных и физико-химических особенностей впервые использован подход, основанный на сравнительном анализе периодичностей распределения нуклеотидов и их групп (в том числе и по отношению к периодичностям основных структур сахарофосфаткого остова АНЮ методом матричного Фурье-анализа.
Впервые установлен и проанализирован набор периодов как для промоторных последовательностей, так и для примыкающих к ним участков генома. Установлены периодическая структура и конкретные периодичности расположения нуклеотидов в промоторах из E.coti и H.sapiens; показана высокая степень их гетерогенности.
Проведено разделение промоторных последовательностей E.coli на классы по трем системам признаков: 1- числу пиков в Фурье-спектре промотора; 2- величине периодов в распределении нуклеотидов и их сходству и различиям с периодичностью сахарофосфатного остова; 3- наличию или отсутствию блоков из одинаковых нуклеотидов. По типам несовпадений периодичностей различных нуклеотидов и групп нуклеотидов с периоличностями в сахарофосфатном остове сделан вывод о различных формах стабилизации вторичных структур ДНК в различных промоторах. Установлены резкие различия в параметрах гидратации различных промоторов, что заставляет сделать вывод о роли воды в процессах узнавания белком ДНК. Показано, что Фурье-спектры последовательностей нуклеотидов в промоторах прокариот и человека отличаются как по набору величин периодичностей, так и по параметрам блочносги для определенных групп нуклеотидов.
4 Обнаружены периодичности в расположении точек контактов РНК-полимеразы E.coli с промоторами, показано их несовпадение с периодичностями сахарофосфатного остова в канонической В-форме. Предложен механизм образования открытого комплекса промотора с РНК-полимеразой. Показано, что в большинстве промоторов нуклеотиды в позициях, соответствующих точкам контактов между РНК-полимеразой и 1ас-и\/5-промотором, имеют одинаковую периодичность.
Показана возможность распознавания нуклеотидных последовательностей эукариот и прокариот как методом нейронных сетей, так и методом частотного анализа, причем последний часто оказывается не менее эффективным, чем первый.
Практическое значение работы
Классификация и анализ функциональных участков геномов (таких как промоторы и терминаторы) важны для разметки полностью секвенированных геномов, а также для выяснения механизмов регуляции экспрессии генов. Полученные в данной работе результаты могут быть использованы при конструировании промоторных участков с заданной эффективностью функции.
Использованные в данной работе подходы могут быть применены для исследования других совокупностей последовательностей ДНК, выполняющих одну и ту же функцию, но не имеюших четко выраженного консенсуса в первичной структуре.
Разработанные методы анализа и классификации нуклеотидных
последовательностей могут быть применены для исследования любых биополимеров с любой последовательностью символов и в этом смысле могут быть распространены на белки, полисахариды и т.д.
Полученные результаты могут быть использованы в рамках программ "Геном человека", "Биоинженерия" и "Важнейшие проблемы генетики".
Апробация работы
Материалы диссертации были представлены на международной конференции "Математические методы распознавания образов'ЧПущино, 25-30 сентября 1995), на 24й" Aharon Katzir-Katchalsky Конференции "Bioinformatics - Structure" (Иерусалим, Израиль, 17-21 ноября 1996), на международном семинаре "Mathematical Analysis of Biological Sequences" (Norwegian University of Science and Technology, Trondheim, Norway, August 4-6 1996), на международном семинаре "Mathematical Analysis of Biological Sequences"(Rouen University, France, August 27-29 1997).
5 Публикации
По теме диссертации опубликовано 9 печатных работ.
Структура и объем работы