Введение к работе
Актуальность проблемы
Сигнал инициации трансляции (т.е. совокупность контекстных и структурных характеристик мРНК, определяющих выбор и эффективность распознавания стартового кодона трансляции) является одним из базовых элементов структуры гена. Предсказание позиции стартового кодона (сайта инициации трансляции) было основано на нескольких критериях, включающих (помимо целостности открытой рамки считывания) расположение по отношению к 5'-концу мРНК и нуклеотидное окружение (контекст). В рамках этой модели считалось, что эукариотические мРНК содержат одну открытую рамку считывания и кодируют один белок, поэтому подавляющее большинство мРНК в банках данных нуклеотидных последовательностей содержат один стартовый кодон. Однако, часть экспериментальных данных не укладывалась в эти рамки. Например, было показано, что некоторые мРНК могут содержать несколько сайтов инициации трансляции и открытых рамок считывания (Kozak, 1986; Yang et al., 1998; Bab et al., 1999 и др.), в распознавании стартовых кодонов в субоптимальном нуклеотидном контексте могут участвовать элементы вторичной структуры РНК (Kozak, 1990 и др.), структура 5'-нетранслируемой последовательности (5'-НТП, участка между 5'-концом мРНК и началом белок-кодирующей последовательности (БКП)) в целом может влиять на эффективность инициации трансляции и выбор стартовых кодонов (Gallie et al., 1987; Jobling & Gehrke, 1987; Kozak, 1987 и др.) и т.д. Таким образом, существовавшие представления о структуре сигнала инициации трансляции были основаны на упрощенной модели, не учитывающей как возможность существования альтернативных стартовых кодонов, так и возможность присутствия дополнительных сигналов, модулирующих эффективность распознавания сайтов инициации трансляции. Определение структуры и эффективности функционирования сигнала инициации трансляции является необходимым этапом в предсказании организации и параметров экспрессии эукариотического гена в целом, поэтому исследования в этом направлении рассматриваются как актуальные и фундаментально-значимые. Цель настоящей работы заключалась в изучении структурно-функциональной организации сигнала инициации трансляции в мРНК эукариотических генов. Задачи работы включали: 1. Выявление характеристик 5'-НТП мРНК, связанных с их функцией в
процессе инициации трансляции в клетках эукариотических организмов.
2. Изучение организации сигнала инициации трансляции в эукариотических
мРНК, включающее:
(а) оценку возможности использования нескольких сайтов инициации
трансляции;
(б) анализ роли дополнительных характеристик РНК (элементов вторичной
структуры и нуклеотидного контекста стартового кодона) в распознавании
сайтов инициации трансляции;
3. Оценка вклада альтернативной трансляции в кодирующий потенциал мРНК
и протеом эукариотических клеток.
Научная новизна. Обнаружено, что 5'-НТП эукариотических мРНК обладают район-специфическими характеристиками, приводящими к отсутствию стабильной вторичной структуры и, как следствие, способствующими эффективной инициации трансляции (дисбаланс в содержании комплементарных нуклеотидов G/C и A/U). Впервые показано, что мРНК эукариотических генов, экспрессирующихся на высоком уровне, оптимизированы для поддержания высокого уровня трансляционной активности по многим характеристикам (контекст стартового кодона трансляции, контекст терминатора трансляции, размер и особенности нуклеотидного состава 5'-НТП, отсутствие лидерных рамок считывания). Разработан первый способ предсказания трансляционной активности мРНК в клетках млекопитающих, двудольных и однодольных растений по структуре 5'-нетранслируемого района. Найдено, что некоторые мРНК дрожжей и млекопитающих могут содержать элементы вторичной структуры, локализованные в определенной позиции белок-кодирующей последовательности и способные увеличивать эффективность распознавания стартовых ко донов трансляции в субоптимальном контексте. Разработан информационный ресурс, позволяющий предсказывать наличие «компенсаторной» вторичной структуры в молекуле мРНК. Показано, что характеристика «размер поверхности молекулы, доступной для взаимодействия» (accessible source area, ASA) для участков молекулы РНК контекстно-зависима, при этом кодоны AUG и UGA характеризуются высокими значениями ASA, что могло служить одной из причин выбора именно этих кодонов в качестве сайтов инициации и терминации трансляции на ранних этапах эволюции жизни. Уточнена структура контекста стартового кодона трансляции в мРНК
млекопитающих: обнаружено, что аминокислотные остатки во второй позиции полипептидов человека и мыши могут влиять на эффективность инициации трансляции.
Впервые показано, что в структуре эукариотических мРНК с высокой частотой могут содержаться альтернативные стартовые кодоны трансляции. Продемонстрировано, что N-концевые трансляционные изоформы белков млекопитающих, растений и дрожжей часто различаются по предсказанной субклеточной локализации, что может быть связано с их функциональной значимостью. Сделана оценка возможности альтернативной терминации трансляции в клетках арабидопсиса и риса: найдено, что вклад этого механизма в синтез трансляционных изоформ белков в сравнении с альтернативной инициацией трансляции значительно менее выражен. Положения, выносимые на защиту.
1. Базовые контекстные характеристики нуклеотидных последовательностей 5'-
НТП мРНК генов эукариот эволюционно адаптированы для эффективного
взаимодействия с аппаратом трансляции.
2. Эффективность распознавания стартового кодона трансляции может
модулироваться факультативными сигналами, к которым относятся элементы
стабильной вторичной структуры РНК и определенные комбинации нуклеотидов
в позициях 5'-контекста сайта инициации трансляции и аминокислотных
остатков во второй позиции соответствующих полипептидов.
3. Эукариотический сигнал инициации трансляции с высокой частотой содержит
альтернативные стартовые кодоны. Альтернативная инициация трансляции
вносит значительный вклад в протеом эукариотических клеток.
Теоретическая значимость работы. Разработана расширенная модель структурно-функциональной организации эукариотического сигнала инициации трансляции, включающего факультативные элементы - модуляторы эффективности распознавания стартовых ко донов. Уточнены представления о значимости контекстной организации 5'-НТП эукариотических мРНК: предложена гипотеза о существовании «распределенных» сигналов - элементов контекста, вклад каждого из которых в функциональную активность 5'-НТП относительно мал и может быть значим для высокоэкспрессирующихся генов.
Научно-практическая значимость работы. В работе получены данные, корректирующие методы предсказания эффективности трансляции и
кодирующего потенциала эукариотических мРНК. Разработаны оригинальные методы (LeaderRNA, AUGhairpin) и база данных (TRSIG), которые могут использоваться для предсказания характеристик мРНК и для дизайна генетических конструкций для проведения экспериментов в областях генетики и биотехнологии растений и животных.
Апробация работы. Результаты работы были доложены или представлены на II Международном конгрессе «Биотехнология: состояние и перспективы развития», (Москва, 2003), III съезде ВОГИС (Москва, 2004), International Conference of Bioinformatics of Genome Regulation & Structure (Новосибирск 1998, 2000, 2002, 2004, 2006, 2008, 2010, 2012), International Moscow Conference on Computational Molecular Biology (Москва 2003, 2005, 2007, 2009, 2011), Genome Informatics Conference (Токио, 2001; Йокогама 2004; 2005), 8і International Engelhardt Conference on Mollecular Biology "RNA-protein interactions" (Москва, 2006), Conference on Translational Control and Non-coding RNA (Nove Hrad, Чехия 2006), German-Russian Foram Biotechnology (Новосибирск, 2009), International Conference on Plant Genetics, Genomics and Biotechnology (Новосибирск, 2010), Joint Russian-French Seminar "Genomics, Proteomics, Bioinformatics" (Новосибирск, 2010), Joint Indo-Russian Workshop "Predictive Biology using Systems and Integrative Analysis and Methods" (Индия, 2010), German/Russian Workshop on Integrative Biological Pathway Analysis and Simulation (Германия, 2009, 2010, 2011, 2012).
Публикации. По материалам диссертации опубликовано 96 научных работ, из них статей - 31, в том числе в зарубежной печати - 18. Основные результаты получены автором самостоятельно. Ряд исследований выполнен с участием М.П. Пономаренко, И.Б. Рогозина, И.И. Титова, Н.А. Колчанова, Л.Л. Киселева, Д.Г. Воробьева, А.Г. Пальянова, О.А. Волковой, Г.А. Базыкина, В.А. Иванисенко, В.Н. Бабенко, A. Sarai, I. Ventoso, S. Ahmad.
Структура и объем работы. Диссертация включает введение, обзор литературы, материалы и методы, результаты, обсуждение, выводы и список литературы (484 источника). Работа изложена на 225 страницах машинописного текста, включая 31 рисунок и 47 таблиц.