Электронная библиотека диссертаций и авторефератов России
dslib.net
Библиотека диссертаций
Навигация
Каталог диссертаций России
Англоязычные диссертации
Диссертации бесплатно
Предстоящие защиты
Рецензии на автореферат
Отчисления авторам
Мой кабинет
Заказы: забрать, оплатить
Мой личный счет
Мой профиль
Мой авторский профиль
Подписки на рассылки



расширенный поиск

Компьютерный контекстный анализ последовательностей ДНК мобильных генетических элементов Амикишиев, Вагиф Гочу оглы

Диссертация, - 480 руб., доставка 1-3 часа, с 10-19 (Московское время), кроме воскресенья

Автореферат - бесплатно, доставка 10 минут, круглосуточно, без выходных и праздников

Амикишиев, Вагиф Гочу оглы. Компьютерный контекстный анализ последовательностей ДНК мобильных генетических элементов : диссертация ... кандидата биологических наук : 03.00.15.- Новосибирск, 2000.- 201 с.: ил. РГБ ОД, 61 00-3/580-X

Введение к работе

Актуальность темы. Мобильные генетические элементы (МГЭ) являются составной частью геномных систем эукариот, занимая в среднем 10-30% их объема. Накоплены экспериментальные данные об участии МГЭ в регуляции экспрессии генов и полигенов, их изменчивости и селекции (Ратнер и др., 1992; Фурман и др., 1998; Ratner, 1998). С другой стороны, сами мобильные элементы подчинены генетическому управлению, за счет своей способности к восприятию внешних индуцирующих сигаалов: теплового шока, гормонов, ткане-специфичных сигналов и т.д. (Strand, McDonald, 1985; Bilanchone et al., 1993).

He оставляет сомнений, что чувствительность МГЭ к внешним воздействиям должна иметь структурную основу, а участие М1Э в молекулярно-генетических системах управления должно осуществляться посредством наличия в ДНК МГЭ соответ^твующих управляющих сайтов (энхансеров, сайленсеров и пр.).

Закономерности и различия в структурной органнзации геномов МГЭ могут быть ключом для понимания и предсказания их функционального поведения. Существующие на сегoдняшний лень экспериментальные работы описывают реализацию каких-либо частных функций или способностей МГЭ, но они не дают общего представления о потенциальных возможностях конкретного МГЭ в молекулярно-генетических системах управления. Основываясь на концепции МГЭ как возможных подвижных "кассет функциональных сайтов", способных вносить свой вклад в экспрессию генов, генетическую вариабельность и эволюцию видов, представлядо интерес подробное исследование геномов МГЭ на наличие разнообразных регуляторных сайтов.

Цель и задачи. Целью работы явился компьютерный поиск мотивов регуляторных сайтов вдоль последовательностей ДНК 19-ти мобильных элементов разных классов, а также анализ их распределения с точки зрения обеспечения их позмож; ых молекулярных фукігаий.

В задачи работы входило:

  1. Создание ряда компьютерных программ, позволяющих статистически обосновать н визуализировать результат компьютерного поиска мотивов регуляторных сайтов по последовательностям ДНК.

  2. Комплектация компьютерной базы данных секвенированных нуклеотидных последовательностей МГЭ и оптимизация содержания исходной базы данных регуляторных сайтов на основании современных представлений об их функциональной значимости и синонимии.

  3. Сканирование компьютерными методами последовательностей ДНК 19-ти МГЭ на наличие мотивов регуляторных сайтов из пересмотренной базы данных.

  4. Сравнение сводных картин распределения вылатенных мотивов функциональных сайтов по последовательностям ДНК 19-ти МГЭ со случайными последовательностями такой же длины и такого же нуклеотидного состава.

  5. Контекстный анализ распределения мотивов регуляторных сайтов МГЭ с точки зрения обеспечения их возможных молекулярных фу1кций.

  6. Сравнение характера распределения мотивов функциональных сайтов в геномах близкородственных МГЭ и МГЭ разных классов между собой с целью объяснения их функциональной гомологаи и различий.

  7. Поиск возможных новых закономерностей в распределении мотивов регуляторних, сайтов в последовательностях ДНК МГЭ с целью объяснения наблюдаемых и для предсказания новых особенностей их функционирования.

  8. Оценка возможной взаимосвязи распределения нуклеотидного состава последовательностей МГЭ и выявленных в их геномах мотивов функциональных сайтов.

Научная новизна. Создан ряд компьютерных программ, позволяющих статистически обосновать и визуализировать результат поиска мотивов функциональных сайтов вдоль любой последовательности ДНК. Создана компьютерная база данных МГЭ, состоящая из отсеквенированных куклеотидных последовательностей 40-ка мобильных элементов. Оптимизировано содержание исходной базы данных регуляторных сайтов (277 единиц).

Впервые последовательности ДНК 19-ти МГЭ разных классов были просканированы на наличие мотивов регуляторных сайтов. Статистически обосновано, что геномы МГЭ содержат неслучайные сгущения мотивов функциональных сайтов, тяготеющие во многих случаях к возможным регуляторным зонам: промоторным районам, LTRs, началам ORFs, началам доменов ORFs и т.д.

Анализ сгущений позволил объяснить известные молекулярные функции МГЭ на основании имеющихся в их структуре мотивов регуляторных сайтов. Были предсказаны возможные позиции старта и окончания транскрипции полноразмерных мРНК МГЭ. Предсказана возможность независимой транскрипции доменов 0RF2 и ORF3 у некоторых (не всех) исследованных ретротранспозонов. Найдена новая закономерность в распределении мотивов функциональных сайтов: наличие повышенного числа мотивов сайтов рецепции внешних сигналов перед доменами обратной транскриптазы и ннтегразы ретроэлементов.

Выявлена положительная корреляция распределения мотивов функциональных сайтов в последовательностях МГЭ с распределениями состава нуклеотидов (%А+Т).

Научно-практическая ценность. Созданная компьютерная база данных 40-ка МГЭ является удобной коллекцией иуклеотидных последовательностей МГЭ разных классов дая 'использования и приложений.

Оптимизированная компактная и представительная база данных регуляторных сайтов и метод ее использования позволяют быстро и эффективно проверить любую последовательность ДНК на наличие мотивов регуляторных сайтов с целью прогнозирования возможных свойств исследуемой последовательности ДНК.

Анализ данным методом последовательностей ДНК 19-тн мобильных элементов позволил на основании выявленных регуляторных сайтов объяснить общие молекулярные функции МГЭ и характерные особенности представителей

разных ктассов; высказать предположения о механизме осуществления ряда тастныx молекулярных функций МГЭ, которые требуют, тем не менее, іальнейшей экспериментальной проверки.

Данные о наличии мотивов регуляторных сайтов в геномах 19-ти МГЭ івляются ценным информативным материалом для экспериментальной генетики мобильных элеиентов в качестве справочника возможных потенциальных свойств л специфики функиионировання конкретных МГЭ. Полученные результаты представлены в виде Web-страницы в Интернет (адрес: .

Выявленный нами избыток регуляторных сайтов и неслучайность их эаспределения в геномах МГЭ служат дополнительным подтверждением теории ^пользования мобильных элементов молекулярно-генетическими системами (правления в качестве "подвижных кассет функциональных сайтов", способных, томимо собственных молекулярных функций размножения и транспозиций, называть модифицирующее регуляторное действие на соседние гены и полигены.

Упробапия работы. Основные результаты работы были представлены на Международной конференции по моделированию и компьютерным методам в .юлекулярной биологии и генетике (Новосибирск, 1990), Франко-советском лімпозиуме по регуляции и экспрессии генов (Новосибирск, 1995), ХХХШ-її Международной научной студенческой конференции (Новосибирск, 1995), Втором I Трет'ем сибирских конгрессах по прикладной и индустриальной математике "IMPRIM", Новосибирск, 1996, 1998), Международной конференции, юсвященной 80-летию со діИ рождения академика Д.К.Беляева (Новосибирск, 1997), Международной конференции "Биоинформат!ка: структура и регуляция енома" (Новосибирск, 1998), а также на отчетных сессиях Института цитологии и «нетики СО РАН (1996, 1999).

По теме диссертации опубликовано 10 работ, 3 из них - в рецензируемой 1ечати.

>рук1ура и объем работы. Диссертация cостоит из введения, обзора Литературы глава 1), описания объектов и методов исследования (глава 2), изложения )езультатов (глава 3), обсуждения (глава 4), выводов, списка литературы и трех іриложенпй.

Диссертация изложена на 198 страницах машинописного текста, содержит 39 іисунков и 9 таблиц. Список литературы включает 278 источников, в тем числе ;29 иностранных.

Толожсния. выносимые па зашпту. Предметом защиты настоящей диссертации вляются следующие положения:

геномы мобильных элементов содержат "сгущения" мотивов функциональных сайтов, достоверно отличающиеся от случайных;

геномы мобильных элементов содержат избыточное количество мотивов регуляторных сайтов, способных обеспечить основные молекулярные функции

МГЭ; экспрессию генов (ORF) МГЭ, воспроизведение (транспозицию) МГЭ, управление воспроизведением МГЭ внешними сигналами, модифицирующее действие со стороны МГЭ на соседние гены и полигены;

присутствие перед ORFs и их сегментами, отвечающими доменам ферментов транспозиции, инициирующих мотивов является свидетельством в пользу возможности их независимой транскрипции и трансляции;

наличие положительной,корреляции между распределением числа мотивов регуляторных сайтов в различных районах геномов МГЭ и процентного соотношения АТ-нуклеотидов в этих районах.

Объекты исследования. В качестве объектов были взяты 19 МГЭ разных классов - транспозоны: Р-элемент и hobo; LTR-содержащие ретротранспозоны gypsy-группы: mdg2, mdgl, Del, 2 gypsy из разных видов дрозофилы, 17.6, 297, Surl, Ted, Tom, Ulysses; copia-группы: copia, copia-white и 1731; LTR-несодержащие ретротранспозоны Line-1 human. Line M.Mus. и jockey. Исследуемые МГЭ секвенированы из геномов эукариот разных таксонов: растении, животных (насекомых, иглокожих и млекопитающих, включая человека). База данных функциональных сайтов. Исходная база данных (130 единиц) была сформирована В.В.Соловьевым (Solovyov et al., 1992а) и увеличена И.В.Морозовой до 350 единиц. Мы пересмотрели и оптимизировали ее содержание, в результате чего объем сократился до 277 единиц. Регуляторные сайты в базе классифицированы на следующие группы:

  1. Сайты инициации и терминащти репликации и транскрипции.

  2. Энхансеры и сайленсеры различных генов хромосом, вирусов и т.д.

  3. Сайты, опознаваемые общими клеточными белковыми факторами транскрипции и трансляции.

  4. Сайты, опознаваемые белками-рецепторами индуцирующих сигналов (теплового шока, ионов тяжелых металлов, лекарств, гормонов, голодания, цАМФ и др.).

  5. Сайты, опознаваемые ткане- и локусспецифичпыми белковыми факторами и др.

  6. Сайты рекомбинаций, перестроек и т.п.

Компьютерные методы. Мы использовали разработанный ранее В.В.Соловьевым и соавторами (Solovyov et al., 1992b) метод контекстного анализа (пакет "КОНТЕКСТ", программа SITE). Он основан на предположении, что известные функциональные сайты реально образуют семейства с устойчивым консенсусом. Метод производит поиск несовершенных мотивов, отличающихся от сайтов (или консенсусов) из базы данных не более чем на заданное небольшое число замсн нуклеотидов. Анализ генома МГЭ осуществлялся при помощи сканирующего окна размером 75 пн при шаге сканирования 15 пн ("жесткие критерии поиска") или реже, когда последовательность МГЭ разбивалась на 15 сегментов одинаковой длины с перекрыванием слева и справа по 10 пн а поиск мотивов велся по-сегментно при помощи окна такого же размера при шаге сканирования 1

нуклеочад ("мягкие критерии поиска"). Последний позволяет выявить большее количество мотивов функциональных сайтов, но с большим числом ошибок.

Для визуализации и статистической оценки результатов поиска мотивов регуляторных сайтов были созданы следующие программы: Begga - в виде диаграммы показывает распределение числа мотивов регуляторных сайтов вдоль последовательности МГЭ (по оси абцисс - геном МГЭ, по оси ординат - число регуляториых сайтов) (рис.1с). Tvg-B - показывает конкретное расположение вдоль МГЭ мотивов 53-х выборочных регуляторных сайтов четырех групп (рис la) Vs - показывает конкретное расположение вдоль МГЭ мотивов всех регуляторных сайтов кз базы данных Server - создэст на основе имеющейся

нуклеотиднои пОСЛеДОВЙТеЛЪНОСТИ СЛУЧЗЙНЫе ПОСЯеДОВЭТеЛЬНОСТИ Т2КОҐІ же длины и тЗКОГО же НУТСлРОТИДНОГО сОСтЭВЗ Stat3 - с ПоМОЩЬЮ КОИтеОИЯ У~ оliCнивtlсг

статистическую достоверность сгущений мотивов регуляторных сайтов. Согг -.статистически оценивает коэффициент корреляции между числом регуляторных сайтов в разных районах МГЭ и процентным содержанием в них АТ-нуклеотидов. Программа PROB для подсчета биноминального распределения была любезно предоставлена Келем А.Е.

Статистическая обработка результатов. Кроме перечисленных методов // , корреляционного анализа и биноминального распределения, в работе использовались и-кретерий" Вилкоксона-Манна-Уитни и непараметрическнй критерий знаков (Ллойд и др., 1990).