Содержание к диссертации
Введение
Глава 1. Основные подходы к использованию молекулярных данных для реконструкции филогении 7
1.1. Сравнительный вклад молекулярных и морфологических признаков при реконструкции филогении 7
1.2. Участки генома, используемые для филогенетических реконструкций на низком таксономическом уровне; выбор участков для данной работы 13
1.2.1. Участок ITS ядерной рибосомной ДНК 14
1.2.2. Участок p^A-ґгяН хлоропластной ДНК 20
1.3. Выравнивание последовательностей 27
1.4. Методы реконструкции филогенетических деревьев и оценки достоверности узлов дерева 31
1.4.1. Дистанционные методы 34
1.4.2. Метод максимальной экономии 35
1.4.3. Метод максимального правдоподобия 40
1.4.4. Метод Байеса 42
1.4.5. Способы оценки достоверности узлов дерева 44
Глава 2. Обзор работ по систематике и филогении исследуемых групп семейств бобовые (Leguminosae) и зонтичные (Umbeliferae): соотношение молекулярных и традиционных подходов 48
2.1. Триба Loteae семейства бобовые (Leguminosae) 48
2.2. Род Bunium (Umbelliferae) и родственные ему таксоны 55
Глава 3. Материалы и методы 60
3.1. Исходный материал 60
3.2. Выделение ДНК 60
3.3. Амплификация ДНК 61
3.4. Агарозный гель-электрофорез 62
3.5. Очистка ПЦР-продукта и секвенирование 63
3.6. Выравнивание и методы филогенетического анализа 63
Глава 4. Результаты и обсуждение 66
4.1. Филогенетический анализ представителей трибы Loteae семейства бобовые (Leguminosae) 66
4.1.1. Характеристика ITS яд-рДНК 67
4.1.2. Анализ данных о последовательностях ITS яд-рДНК 70
4.1.3. Анализ объединенных данных по ITS и морфологии 86
4.1.4. Характеристика спейсера/и&А-/гяН хпДНК 92
4.1.5. Анализ последовательностей спенсера psbA-trnH хпДНК 94
4.2. Филогенетические связи рода Bunium семейства зонтичные (Umbelliferae) 98
4.2.1. Характеристика ITS яд-рДНК 98
4.2.2. Анализ последовательностей ITS яд-рДНК 101
4.2.3. Кладистический анализ морфологических данных 114
4.2.4. Характеристика спейсеръ psbA-trnH хпДНК 118
4.2.5. Анализ последовательностей спейсера/и6А-/п?Н хпДНК 119
Заключение 124
Выводы 131
Список литературы 132
Приложение
- Участки генома, используемые для филогенетических реконструкций на низком таксономическом уровне; выбор участков для данной работы
- Методы реконструкции филогенетических деревьев и оценки достоверности узлов дерева
- Выравнивание и методы филогенетического анализа
- Филогенетические связи рода Bunium семейства зонтичные (Umbelliferae)
Введение к работе
Актуальность проблемы. В последние десятилетия накоплен значительный материал по нуклеотидным последовательностям отдельных участков ДНК у большого числа представителей различных групп растений. Разнообразие молекулярных маркеров и методов обработки данных способствовало увеличению числа конкурирующих филогенетических гипотез. На примере многих групп растений и животных было показано, что анализ данных по последовательностям ДНК может приводить к иным выводам о филогении группы, чем анализ «традиционных», в первую очередь морфологических данных (Антонов, 2000, 2002, 2006). В связи с этим актуальными задачами современной филогенетической систематики являются выяснение соотношения генотипических и фенотипических признаков как источников информации о родстве между таксонами, а также анализ согласованности гипотез, выдвигаемых при изучении различных участков генома. Анализ соответствий и прочиворечий между разными типами данных необходим при оценке значимости различных участков ДНК как филогенетических маркеров. Еще один актуальный вопрос - это влияние методов построения деревьев на топологию филогенетических деревьев конкретных групп организмов. Мы рассматриваем весь этот круг проблем на примере двух модельных групп: семействах бобовые (Leguminosae) и зонтичные (Umbelliferae), которые являются представителями высших двудольных покрытосеменных растений. При изучении семейства Leguminosae мы остановились на трибе Loteae, а в семействе Umbelliferae - на роде Bunium и родственных ему таксонах. Наш выбор таксонов объясняется тем, что представители этих групп уже достаточно хорошо изучены с морфологической точки зрения, а также тем, что мы располагаем богатой коллекцией гербарного материала для проведения анализа молекулярных данных. Изучение филогенетических взаимоотношений в пределах каждой из двух модельных групп поможет оценить значимость традиционно используемых таксономических признаков и степень эволюционной изолированности родственных таксонов. Тот факт, что рассматриваемые группы не являются близкородственными, позволяет обсуждать общие вопросы соотношения между различными типами филогенетических данных, а не частные свойства отдельных таксонов.
Цель и задачи исследования. Целью работы была оценка филогенетической значимости различных молекулярных маркеров и степени согласованности их эволюции с эволюцией структурных признаков растений, а также выявление причин возможных
расхождений между молекулярными и классическими данными по филогении рассматриваемых групп. В связи с этим были поставлены следующие задачи:
1. Определить последовательности участка psbA-trnH хлоропластной ДНК и участка
ITS 1-2 ядерной рибосомной ДНК для таксонов, данные по которым отсутствуют или
вызывают сомнения, особенно для видов с неясным систематическим положением.
2. Проанализировать информативность исследованных участков ДНК как
филогенетических маркеров в рассматриваемых группах семейств Leguminosae и
Umbelliferae; сопоставить полученные результаты с данными других молекулярных
исследований.
Оценить, в какой степени согласуются между собой данные по выбранным участкам хлоропластной и ядерной ДНК при использовании их в качестве филогенетических маркеров, а также выяснить степень их согласованности с морфологическими данными.
Протестировать на основе молекулярных данных естественность принимаемых в настоящее время границ родов в пределах изучаемых групп семейств Leguminosae и Umbelliferae.
Научная новизна и практическая значимость работы. Были определены нуклеотидные последовательности внутренних транскрибируемых спейсеров (ITS) ядерной рибосомной ДНК у 61 таксона трибы Loteae (Leguminosae) и у 90 таксонов семейства Umbelliferae, а также последовательности участка psbA-trnH хлоропластной ДНК у 77 таксонов трибы Loteae и у 73 таксонов семейства Umbelliferae. Произведена оценка информативности участков ITS и psbA-trnH для исследования филогенетических взаимоотношений в пределах изучаемых групп.
Впервые проведен филогенетический анализ по данным о последовательностях участка ITS яд-рДНК и psbA-trnW хпДНК у всех родов трибы Loteae (Leguminosae) и изучаемой группы семейства Umbelliferae. Сопоставление полученных последовательностей позволило уточнить границы родов и установить филогенетические связи некоторых таксонов. Проведено сравнение полученных в исследовании данных с традиционными таксономическими системами изучаемых групп семейств Leguminosae и Umbelliferae, основанными на морфологических данных.
Показано, что анализ нуклеотидных последовательностей участков ядерной и хлоропластной ДНК свидетельствует о монофилии всех принимаемых в настоящее время родов трибы Loteae (Leguminosae), и что род Bunium (Umbelliferae) не монофилетичен. По-новому трактуются филогенетические связи рода Bunium с другими представителями
семейства зонтичные, которые выдвигались ранее в качестве близкородственных на основании морфологических данных.
Сделаны выводы о границах применимости данных о строении участка psbA-trnU как маркера для установления родственных отношений в пределах изучаемых групп Leguminosae и Umbelliferae.
Полученные результаты являются вкладом в разработку филогенетической системы исследуемых групп растений и методологию филогенетического анализа.
Участки генома, используемые для филогенетических реконструкций на низком таксономическом уровне; выбор участков для данной работы
Анализ данных по нуклеотидным последовательностям стал неотъемлемой частью изучения эволюционной истории организмов. Основная задача в любой конкретной работе - выбрать для анализа такую последовательность, чтобы скорость накопления замен в ней соответствовала поставленной таксономической проблеме (таксономическому уровню) (см. Шнеер, 2005). Подбирая участки ДНК и анализируя их структуру, мы можем сопоставлять частичное строение генотипов у растений любой степени филогенетического родства (Антонов, 2006). Для изучения филогенетических взаимоотношений таксонов на уровне семейств, родов и видов уже давно с успехом используется участок ITS ядерной рибосомной ДНК (Baldwin, 1992; Ritland et al., 1993; Bayer et al., 1996; Coleman, Mai, 1997; Valiejo-Roman et al., 1998). В последнее время с развитием идеи ДНК-штрихкодирования, когда отдельные участки ДНК пробуют использовать при идентификации видов (Hebert et al., 2003; Chase et al., 2005; Cowan et al., 2006), для изучения филогенетических отношений среди таксонов низкого уровня был предложен также спейсерный участок psbArnft хлоропластной ДНК (Kress et al., 2005). Поэтому в качестве филогенетических маркеров для изучения взаимоотношений таксонов рассматриваемых групп Leguminosae и Umbelliferae мы выбрали участки ITS яд-рДНК и psbAmH хпДНК. Принадлежность этих участков к различным компартментам генома обуславливает разницу в характере эволюции и накоплении замен, а это в свою очередь определяет границы применимости участков, их достоинства и недостатки, что важно учитывать, анализируя последовательности при изучении родственных связей организмов.
Большая часть генов растений и обслуживающие их элементы генома сосредоточены в ядре. Как известно, в эволюции ядерного генома растений большое значение имеют дупликации и амплификации генов. В результате дупликаций образовываются семейства генов, состоящие часто из множества копий. Нуклеотидные последовательности членов отдельного семейства могут быть как идентичными, так и различными. Однородность членов поддерживается при помощи некоторых генетических механизмов унификации, таких как неравный кроссинговер (Elder, Turner, 1995) и генная конверсия (Hillis et al., 1991). При избыточном числе паралогичные гены не испытывают жесткого давления отбора и некоторые функциональные гены таких семейств могут в результате мутаций или структурных перестроек перейти в разряд псевдогенов, не принимающих участия в синтезе РНК и белков. Обычно псевдогены накапливают изменения в своей структуре гораздо быстрее, чем функциональные гены, так как находятся вне действия отбора, поэтому их включение в филогенетичесий анализ функциональных генов приводит к искажению реконструируемой филогении.
С этим связаны определенные трудности при использовании последовательностей ядерного генома (см. например, Антонов, 2000; Банникова, 2004). При проведении филогенетического анализа важно разграничивать гены ортологичные (результат дивергентной эволюции популяций и видов) и паралогичные (результат внутригеномной дупликации), а также функционально активные гены и псевдогены. Не учет возможного происхождения анализируемых последовательностей в результате внутригеномной дупликации может привести к парадоксальным выводам.
В ядерной ДНК растений однокопийных генов крайне мало. По этой причине излюбленным объектом геносистематики являются гены, структура которых подвергается периодической унификации. Наиболее широко используются гены рибосомной РНК и разделяющие их внутренние транскрибируемые спейсеры (ITS 1 и 2). Интерес геносистематиков к рДНК обусловлен наличием в ее составе как эволюционно консервативных кодирующих участков, так и быстро эволюционирующих спейсерных последовательностей (Jorgensen, Cluster, 1988). Это позволяет проводить филогенетический анализ на разном таксономическом уровне.
Рибосомная ДНК эукариот локализуется в определенном месте хромосомы - так называемом районе ядрышкового организатора (Ченцов, 1995). Число и расположение ядрышковых организаторов в геноме может различается в пределах семейства и рода (Liu et al., 2003; Muravenko et al., 2004). Гены рРНК присутствуют в виде тандемно расположенных и многократно повторенных копий. Число повторяющихся единиц весьма различно (Rogers, Bendich, 1987). Каждый повтор содержит, помимо кодирующих участков генов 18S, 5,8S, и 26S рРНК, два некодирующих транскрибируемых спейсера (ITS 1,2). Единицы транскрипции рДНК разделены межгенными спейсерами (IGS), включающими в себя внешний транскрибируемый (ETS) и нетранскрибируемый (NTS) спейсеры (Сингер, Берг, 1998) (рис. 1).
Размеры генов, кодирующих рРНК, варьируют среди организмов незначительно, у растений длина 18S составляет около 1800 п.н., 26S - около 3300 п.н. и 5,8S - 160 п.н. (Сингер, Берг 1998). Длина IGS, напротив, варьирует сильно: от 1 до 8 т.п.н. (Jorgensen, Cluster, 1988). Эти различия в длине IGS являются основной причиной вариаций полной длины повторяющихся участков рДНК у растений (Taira et al., 1988; Borisjuk et al., 1994). Структура межгенного спейсера IGS весьма сложна и характеризуется содержанием большого числа разного типа прямых тандемных повторов, различающихся по нуклеотидным последовательностям (Da Rocha, Bertrand, 1995; Markos, Baldwin, 2002). У покрытосеменных растений участок ITS1-5,8S рДНК-1Т82 незначительно варьирует по длине, составляя 600-700 п.н., в то время как у голосеменных его длина составляет от 630 до 3125 п.н., при этом наиболее вариабельным оказывается ITS1 (Liston et al., 1996).
Внутренние транскрибируемые спейсеры (ITS 1 и ITS2) рибосомной ДНК не входят в состав зрелых рибосом и в ходе процессинга благодаря серии эндонуклеазных реакций удаляются из первичного транскрипта в ходе многоступенчатого процесса созревания (Cote, Peculis, 2001; Nazar, 2004; Abeyranthne, Nazar, 2005). Несмотря на это, они обладают определенной функциональной нагрузкой. Было показано, что вторичная структура спейсеров крайне важна для сборки комплекса белков, осуществляющих процессинг предшественника рРНК, и правильного вырезания спейсеров (Cote et al., 2002). С использованием реакций избирательного ферментативного расщепления однонитевых участков РНК и компьютерного моделирования было предложено два альтернативных варианта вторичной структуры ITS2: шпилечная модель (hairpin model) (Joseph et al., 1999) и кольцевая модель (ring model) (Yeh, Lee, J 990), называемая также «моделью четырех пальцевой ладони» (Mai, Coleman, 1997). Наибольшее распространение получил второй вариант представления вторичной структуры. В ходе специально проведенного исследования с использованием мутантов с нарушенной вторичной структурой по обоим вариантам был сделан вывод о том, что для успешного процессинга важны оба варианта вторичной структуры, при этом, вероятно, молекула РНК укладывается согласно кольцевой модели по мере синтеза первичного транскрипта в направлении 5 — У и участвует в связывании белкового комплекса, осуществляющего вырезание спейсера, после этого под влиянием белков, вторичная структура принимает форму согласно шпилечной модели (Cote et al., 2002). Моделирование вторичной структуры спейсера ITS2 показало, что она является достаточно консервативной у самых разных представителей эукариот, включая наземные растения, зеленые и бурые водоросли, дрожжи, позвоночные животные, насекомые и молюски (Hershkovitz, Zimmer, 1996; Mai, Coleman, 1997; Joseph et al., 1999; Coleman, 2003; Schultz et al., 2005).
Методы реконструкции филогенетических деревьев и оценки достоверности узлов дерева
Наиболее широко схемы отношений между анализируемыми последовательностями представляют в виде филогенетического дерева, состоящего из узлов и ветвей. Узлы представляют собой таксоны, а ветви определяют взаимоотношения между ними. Концевые узлы на дереве соответствуют ныне живущим таксонам, нуклеотидные последовательности которых использовались в анализе. Для построения дерева по молекулярным данным разработаны различные методы, реализованные в специальных компьютерных программах. Используемые в настоящее время методы реконструкции филогении можно разделить на три большие группы: дистанционные методы, метод максимальной экономии и методы максимального правдоподобия (Ней, Кумар, 2004; Шнеер, 20056). Методы, относящиеся к первой группе, основываются на измерении числа нуклеотидных замен между последовательностями. Методы второй и третий групп оперируют состояниями признака, такими как нуклеотидные позиции в ДНК -Ь%/ или наличие инделей в определенных позициях.
Сравнение нуклеотидных последовательностей при упорядочивании таксонов в соответствии со степенью их родства представляет собой непростую задачу. Если какой-либо нуклеотид в ходе эволюции таксона замещался более, чем один раз, то в этом случае мы не знаем, какой нуклеотид был у предка. Неизвестно также менялся/ли нуклеотид вообще. Как следствие этого, если в двух последовательностях в определенной позиции выравнивания размещаются одинаковые нуклеотиды, то это не всегда означает, что в одной из последовательностей не происходило обратных мутаций. Поэтому, при сравнении последовательностей различают нескорректированную, основанную только на наблюдаемых различиях, и скорректированную оценку изменений между двумя последовательностями. Для корректировки оценки были предложены различные эволюционные модели нуклеотидных замен. Самой первой из предложенных моделей была модель Джукса и Кантора (JC). Она рассматривает мутационный процесс как равновероятное замещение нуклеотида на любой из четырех и предполагает равную частоту встречаемости всех четырех нуклеотидов (Jukes, Cantor, 1969).
Эволюционная модель по М. Kimura (К2Р) более сложная и предполагает, что транзиции и трансверсии происходят с разной частотой, а именно, транзиции (пурин-пурин и пиримидин-пиримидин) происходят чаще, чем трансверсии (пурин-пиримидин), но также, как и предыдущая модель, предполагает равные частоты встречаемости нуклеотидов (Kimura, 1980). Наряду с различной частотой транзиции и трансверсий, на частоту возникновения того или иного замещения оказывает влияние различная частота встречаемости нуклеотидов в последовательности. Так, например, в последовательностях хлоропластного генома наземных растений нуклеотиды А и Т встречаются намного чаще, чем G и С (см. Kusumi, Tachida, 2005). В связи с этим, Дж. Фельзенштейном была предложена модель (F81), которая учитывает отклонения от равенства нуклеотидного состава в последовательностях (Felsenstein, 1981).
Модель HKY85 учитывает с одной стороны неодинаковую вероятность трансверсий и транзиции, а с другой - разные частоты встречаемости нуклеотидов в последовательности (Hasegawa et al., 1985).
В последние годы все чаще можно встретить использование авторами модели GTR (General Time Reversible Model). Это самая общая модель, она рассматривает отдельно не только транзиции и трансверсии, но и все возможные переходы между нуклеотидами, при этом приравнивая прямые замены и реверсии (Rodriguez et al., 1990).
Все предложенные модели исходят из того, что замещения происходят по всем позициям выравнивания, и что вероятность замещения по всем позициям одинаково высока. Однако скорость замен может быть не одинакова для всех позиций последовательности. Это справедливо, например, для кодирующих последовательностей, где замены нуклеотидов в разных позициях кодонов не равновероятны. Поэтому для более точных расчетов учитывают также неравномерность скорости замен между различными позициями выравнивания (Yang, 1996). Показано, что в первом приближении скорость замен варьирует по позициям согласно гамма-распределению, которое описывается двумя параметрами, а и р. Нас особенно интересует параметр а, который описывает форму распределения. Определив значения этого параметра в соответствии с используемой моделью, можно судить о характере эволюции данной последовательности. Если а 1, то это означает, что большая часть позиций выравнивания характеризуется малой частотой замен, и что лишь незначительная часть позиций характеризуется высокими темпами замещений. Значение а 1 может говорить о случайном распределении скоростей замен по позициям в последовательностях. При а 1 большинство позиций имеет среднюю скорость замещения, тогда как отдельные позиции могут изменяться как с низкой так и высокой скоростью.
Все рассмотренные модели эволюционных изменений нуклеотидов могут использоваться с учетом гетерогенности темпов замещений на протяжении всех позиций выравнивания. Константные позиции (invariable sites) равно как и позиции с различными темпами замещений могут учитываться отдельно или совместно. При этом к выбранной модели добавляется обозначение «I», когда учитываются инвариантные позиции, и/или добавляется обозначение «Г», когда для учета позиций с разными темпами замещений используется гамма-распределение. Так, например, с учетом всех возможных вариантов, модель GTR становится более комплексной моделью GTR+Г+І.
Для выбора моделей, наиболее подходящих для тех или иных массивов данных при обработке тем или иным методом, разработаны специальные компьютерные программы, например, программа ModelTest (Posada, Crandal, 1998). При постепенном сравнении более простых моделей с более сложными выбирается такая модель, которая точнее всего описывает эволюцию данных последовательностей в данной группе таксонов. Сравнение моделей может проводиться разными способами. Наиболее часто используют Akaike Information Criterion (AIC) (Posada, Buckley, 2004), который оперирует штрафами для каждого параметра, и в конечном счете предлагает такую модель, которая при максимальном значении правдоподобия одновременно характеризуется малым числом штрафов. Практика показывает, что особенно часто предлагаются модели GTR+G, GTR+I или GTR+G+I, и очень редко - более простые модели.
Учитывая то, что все более простые модели нуклеотидных замен - частный случай общей модели GTR+G+I, то почему бы просто не применять только эту наиболее реалистичную модель? Однако использование только этой модели связано с определенными трудностями и недостатками. Гак, оценка всех входящих в эту модель параметров может потребовать слишком большого времени и компьютерных ресурсов, особенно при больших массивах данных. Помимо этого, значения всех параметров, используемых в модели - это результат оценки, которая производится с той или иной точностью и, чем больше оценивается различных параметров, тем больше общая ошибка (Knoop, Mueller, 2006). Так, в случае очень консервативных или коротких (до 100 оснований) последовательностей информации для вычисления адекватных значений всех параметров может быть слишком мало. Целый ряд исследований показал, что когда последовательности дивергировали слабо (в случае близкородственных таксонов), подходят и простые модели. Для более дивергировавших, особенно длинных (более 1000 пар нуклеотидов) последовательностей предпочтительны более сложные модели. Однако для сильно дивергировавших последовательностей опять необходимо использовать более простые модели (Li, 1997).
Выравнивание и методы филогенетического анализа
Полученные последовательности были выравнены автоматически с помощью программы Muscle (Edgar, 2004) и отредактированы вручную с помощью программы SED из пакета программ Vostorg (Zharkikh et al., 1990). При выравнивании последовательностей хлоропластного участка для распознавания границ инделей использовали программу DotHelix (Leontovich et al., 1993); для определения позиционной гомологии нуклеотидов, нарушенной инверсиями, применяли моделирование вторичной структуры с помощью интерактивной программы RNA mfold (http://bioinfo.math i.edu/mfold/rna/forml.cgi), использовали критерии построения, задаваемые программой по умолчанию (Zuker, 2003). Вторичная структура исследуемых участков генома была построена также с помощью программ DCSE (De Rijk, 1993) и RNA-viz 2.0 (De Rijk, De Wachter, 1997).
Для определения степени согласованности сигналов, извлекаемых при анализе участков ядерной и хлоропластной ДНК, филогенетические деревья строили по каждому из этих участков раздельно. Ввиду иного характера эволюции и насыщенности инделями участка psbArnti хпДНК в пределах рассматриваемых групп семейств Leguminosae и Umbelliferae, комбинирование в одном анализе данных о последовательностях хлоропластного участка с другими данными (ITS яд-рДНК и морфологией) не проводили. Филогенетический анализ проводили с применением метода объединения соседей (neighbor-joining, NJ), метода neighbor-net (NN), метода максимальной экономии (maximum parsimony, MP), метода максимального правдоподобия (maximum likelihood, ML) и метода Байеса (Bayesian inference, BI).
В методе максимальной экономии (MP) при анализе морфологических и молекулярных данных был использован эвристический поиск, реализованный в пакете PAUP 4.0Ь8 (Swofford, 2003). Для повышения вероятности нахождения максимально экономного дерева процедуру обмена ветвями осуществляли с помощью алгоритма реассоциации деревьев (tree bisection - reconnection, TBR). Все признаки рассматривались как неупорядоченные и равновесные. Только при проведении анализа морфологических данных для представителей семейства Leguminosae часть признаков рассматривалась как упорядоченные. Делеции принимали за отсутствующие данные.
При выборе эволюционных моделей нуклеотидных замен, наиболее подходящих для наших массивов, применяли программу ModelTest (Posada, Crandal, 1998), используя в качестве критерия при выборе модели Akaike Information Criterion (AIC) (Posada, Buckley, 2004). Для анализа последовательностей участка ITS у представителей семейства Leguminosae использовали GTR+I+G модель нуклеотидных замен, у представителей семейства Umbelliferae - GTR+G. Анализ методом объединения соседей (NJ) был проведен с использованием пакета PAUP 4.0Ь8 (Swofford, 2003).
Для представления взаимоотношения таксонов в виде сети с целью выявления конфликта сигналов использовали метод neighbor-net (NN), реализованный в пакете SplitsTree4 (Huson, Bryant, 2006). При построении матрицы различий использовали р-расстояния. Анализ методом максимального правдоподобия (ML) с использованием алгоритма квартетного паззлинга был проведен программой TREE-PUZZLE 5.2 (Schmidt et al., 2002).
Байесовская реконстукция филогении (BI) была проведена с помощью программы MrBayes 3.1 (Ronquist, Huelsenbeck, 2003). При запуске цепей Маркова было задано 2500000 генераций, число одновременно генерируемых цепей - 3. Апостериорную вероятность узла дерева вычисляли как частоту соответствующего узла в деревьях, которые получены после схождения значения правдоподобия к равновесию в ходе генерирования марковских цепей. Консенсусное дерево было выведено на основании 240000 деревьев. Для оценки устойчивости топологии деревьев использовали непараметрический бутстреп-анализ (Felsenstein, 1985). NJ и MP мажоритарные консенсусные деревья получали обработкой 1000 повторностей бутстрепа.
Филогенетические связи рода Bunium семейства зонтичные (Umbelliferae)
Нами определены нуклеотидные последовательности ITS1 и ITS2 рибосомной ядерной ДНК у 90 таксонов семейства Umbelliferae подсемейства Apioideae из родов Aegopodium, Bunium, Carum, Conopodium, Elaeosticta, Geocaryum, Hyalolaena, Mogoltavia, Oedibasis, Postiella, Scaligeria, Schulzia, Tamamschjanella и Trachysperтит. У вида Tamamschjanella rubella последовательности спейсеров, определенные ранее другими авторами (Valiejo-Roman, Shneyer et al., 2006), исследованы заново с использованием точно определенного материала. Полученные нами последовательности объединены с последовательностями этих же участков других представителей семейства Umbelliferae, хранящимися в базе данных GenBank, которые выявляется в качестве близкородственных по результатам предыдущих геносистематических исследований. В итоге наш анализ основан на выборке, включающей в себя 143 таксона. Чтобы получить представление о возможной внутривидовой изменчивости ITS1 и ITS2 для нескольких видов рода Bunium мы определяли нуклеотидные последовательности этих участков, используя образцы из разных частей ареала. Так, были изучены 2 образца Bunium bulbocastanum, 2 образца В. capusii, 2 образца В, fontanesii, 2 образца В. latilobum, 2 образца В. pachypodum и 3 образца В. rectangulum.
Помимо этого, мы определили последовательности участка psbArnH у 70 таксонов подсемейства Apioideae из родов Aegopodium, Anthriscus, Bunium, Carum, Chaerophyllum, Conopodium, Elaeosticta, Falcaria, Fuernrohria, Galagania, Geocaryum, Kozlovia, Lagoecia, Mogoltavia, Myrrhis, Oedibasis, Olymposciadium, Physospermum, Postiella, Pyramidoptera, Rhabdosciadium, Scaligeria, Schulzia и Tamamschjanella. Последовательности спейсера для Daucus carota, у которой секвенирован полный хлоропластный геном, Eleuterospermum cicutarium, Osmorhiza longistylis, Pleurospermum uralense, а также для представителей родственного зонтичным семейства аралиевые (Araliaceae) (Aralia elata, Hedera helix, Hedera nepalensis) были взяты из базы данных GenBank. У вида Bunium rectangulum мы определили последовательности спейсера psbArnli для двух образцов из разных частей ареала, чтобы оценить вариабельность этого спейсера в пределах вида.
Список изученных видов Umbelliferae и Araliaceae приведен в таблице 8 (стр. 197), где также указаны конкретные образцы, из которых проведено выделение ДНК и номера, под которыми использованные в работе нуклеотидные последовательности участков ITS1 и ITS2, а также psbArnH зарегистрированы в базе данных GenBank.
Для кладистического анализа с привлечением морфологических признаков составлена матрица, которая проанализирована отдельно от матрицы, включающей выравненные последовательности участка ITS. Матрица содержит данные о 38 признаках для 75 таксонов. Список признаков и сама морфологическая матрица приведены в приложении 3. При составлении матрицы использовали признаки строения побега, корня, цветка и плода. Информация по перечисленным признакам взята из работ (Пименов и соавт., 1981; Пименов, Клюйков, 1981; Клюйков, 1985; Клюйков, 1988; Пименов, Клюйков, 2002; Pimenov, Lavrova, 1994). Все признаки рассматривались как неупорядоченные.
При сравнении нуклеотидных последовательностей ITS1 и ITS2 у образцов одного вида из разных точек ареала мы не обнаружили различий в пределах таких видов, как Bunium capusii, В. latilobum, В. rectangulum и В. pachypodum. Однако незначительные различия у Bunium fontanesii были выявлены в ITS2, а у Bunium bulbocastanum - как в ITS1, так и в ITS2. При сравнении последовательностей ITS1 и ITS2 у вида Tamamschjanella rubella, хранящимися в генбанке и полученными нами, мы обнаружили небольшие различия в последовательностях ITS2. Поэтому все последовательности, в которых обнаружены различия при анализе разных образцов одного вида, включены в филогенетический анализ. В таблице 6 приведены некоторые характеристики ITS1 и ITS2 у изученных таксонов семейства зонтичные.
Размер ITS1 варьирует от 207 до 222 п.н. Средняя длина составляет 215 п.н. Самые длинные последовательности (222 п.н.) обнаружены у Neoconopodium laseroides. Самые короткие - у Kozlovia paleacea (207 п.н.), Carum carvi (208 п.н.) и Carum heldreichii (209 п.н.). Длина ITS1 в пределах рода Bunium варьирует от 213 до 216 п.н.
Размер ITS2 варьирует от 202 до 225 п.н. Средняя длина составляет 217 п.н. Самые длинные последовательности участка обнаружены у Chaerophyllum aureum и Chaerophyllum bulbosum (225 п.н.), самые короткие - у видов рода Conopodium (202-204 п.н. Длина ITS2 в пределах рода Bunium варьирует от 210 до 218 п.н. У видов рода Conopodium и Athamanta cretensis обнаружена группоспецифичная делеция размером 18 п.н. Уникальная делеция протяженностью 6 п.н. обнаружена у Bunium setaceum. Для ITS1 и ITS2 в целом характерно довольно высокое содержание GC-nap, которое варьирует от 46,7 % до 59,1 % у ITS1 и от 42,8 % до 65,4 % у ITS2. В пределах отдельных родов наблюдаются слабые различия по нуклеотидному составу. Наиболее сильный разброс отмечается в пределах родов Buniurn (ITS1: 46,7 - 58,1%; ITS2: 49,7 -59,6%) и Сагит (ITS 1:49,5 - 56,9%; ITS2: 51,4 - 63,1%). Уровень различий в нуклеотидных последовательностях ITS1 и 2 у изученных родов неодинаков. Наибольший разброс характерен для родов Buniurn (до 23,5%) и Сагит (до 27,3%). Наименее вариабельными оказались последовательности ITS в пределах родов Aegopodium (до 4,9%) и Galagania (до 5,8%). Если сравнивать уровень дивергенции между родами, то можно видеть, что часть видов рода Buniurn наиболее близка не к другим видам этого рода, а к представителям родов Elaeosticta, Galagania, Hyalolaena, Mogoltavia, Oedibasis, Schulzia и Pyramidoptera, в то время как другая часть - к видам родов Сагит, Crithmum, Hellenocarum, Postiella и Tamamschjanella. Сходная картина наблюдается и для рода Сагит. Отдельные виды оказываются более родственны предствителям таких родов, как Buniurn, Hellenocarum, Fuernrohria, Scaligeria, Schulzia и Trachyspermum.