Содержание к диссертации
Введение
ГЛАВА 1. Формирование генофонда тюркоязычных народов Южной Сибири и Центральной Азии по данным генетики и смежных наук
1.1. Пути формирования народонаселения Алтая, Саян, Тянь-Шаня и Памира 8
1.2. Характеристика изученных народов Алтая, Саян, Тянь-Шаня и Памира 26
1.3.История изучения генофонда населения Южной Сибири и Центральной Азии 35
ГЛАВА 2. Материалы и методы
2.1. Выбор объектов изучения и стратегия формирования выборок 55
2.2. Экспедиционное обследование 58
2.3. Методы генотипирования 59
2.4. Методы статистического, филогеографического и картографического анализа 61
ГЛАВА 3. Полиморфизм гаплогрупп Y-хромосомы в популяциях тюркских народов Алтая, Саян, Тянь-Шаня и Памира
3.1. Характеристика изученных народов по частотам гаплогрупп Y-хромосомы 64
3.2. Объединение популяций в региональные генофонды 67
3.3. Положение популяций в генетическом пространстве 72
ГЛАВА 4. Положение генофондов тюркских народов Алтая, Саян, Тянь-Шаня и Памира среди регионов Евразии (по гаплогруппам Y-хромосомы)
4.1. Положение изученных популяций среди региональных генофондов Евразии 75
4.2. Сравнение с регионами и народами Западной Евразии 80
4.3. Сравнение с регионами и народами Восточной Евразии 89
4.4. Сравнение с регионами и народами Северной Евразии 93
ГЛАВА 5. Дифференциация генофондов Алтая, Саян, Тянь-Шаня и Памира на разных уровнях иерархии популяционной системы
5.1. Дифференциация генофондов по данным о гаплогруппах Y-хромосомы 97
5.2. Дифференциация генофондов по данным об аутосомных маркерах 106
ГЛАВА 6. Филогенетический анализ на этническом уровне и уровне этнотерриториальных объединений (STR полиморфизм Y-хромосомы)
6.1. Генетические датировки кластеров основных гаплогрупп 113
6.2. Филогеография гаплогруппы Rlala 117
6.3. Филогеография гаплогруппы Rlblbl 119
6.4. Филогеография гаплоппы Nib 121
6.5. Филогеография гаплогруппы Nlcl 123
6.6. Филогеография гаплогруппы Q 125
6.7. Филогеография гаплогруппы D 127
Заключение 129
Выводы 136
Список литературы 138
- Характеристика изученных народов Алтая, Саян, Тянь-Шаня и Памира
- Методы статистического, филогеографического и картографического анализа
- Объединение популяций в региональные генофонды
- Сравнение с регионами и народами Восточной Евразии
Введение к работе
Актуальность проблемы. Классические исследования антропологии, археологии, лингвистики и этнографии, внесшие важнейший вклад в изучение истории и разнообразия народов мира, в ХХ веке пополнились новым историческим источником - популяционно-генетическими исследованиями. В результате изучения классических маркеров (иммунологических и биохимических) (Mourant et al., 1954; Рычков, 1969, 1978; Cavalli-Sforza, Bodmer et al., 1971; Шереметьева, Рычков, 1978; Рычков, Ящук, 1980, 1982; Сукерник и др, 1985; Спицын, 1985; Пузырев, 1991; Генофонд и геногеография народонаселения, 2002) были разработаны основные концепции, подходы и методы популяционно-генетического исследования народонаселения (Cavalli-Sforza, Bodmer, 1971; Nei, 1975; Балановская, 1980, 1985; Cavalli-Sforza et al., 1994; Алтухов, 1996, 2004; Zhivotovsky, 2004). При переходе к анализу ДНК маркеров с однородительским типом наследования (Y хромосомы и митохондриальной ДНК) появилась возможность реконструировать основные пути расселения человечества. На первых этапах эти исследования носили глобальный характер, однако в настоящее время все большую значимость приобретают исследования региональных и этнических генофондов (Angius et al., 2001; Golubenko et al., 2001; Деренко et al., 2002; Степанов, 2002; Kivisild et al., 2003; Behar et al., 2004; Cinnioglu et al., 2004; Rosa et al., 2007; Харьков и др, 2007; Balanovsky et al., 2008).
Наиболее информативными для изучения структуры и истории генофонда в настоящее время признаны маркеры NRY – нерекомбинирующей части Y хромосомы. Высокая информативность маркеров NRY обусловлена большим числом полиморфных сайтов, отсутствием рекомбинации между ними и чрезвычайно высокими межпопуляционными различиями. Наиболее актуальными являются комплексные популяционные исследования, использующие и редко мутирующие диаллельные маркеры (SNP – Single Nucleotide Polymorphism) для определения гаплогрупп, и высоко вариабельные маркеры (STR - Short Tandem Repeats) для определения гаплотипов.
При решении вопросов этногенеза населения Северной, Восточной и Центральной Азии одним из ключевых регионов является пограничная область, их разделяющая, – горные системы Алтая, Саян, Тянь-Шаня и Памира. Эта территория на протяжении тысячелетий являлась ареной взаимодействия различных племен и народов двух крупнейших рас – европеоидной и монголоидной. Такие области интенсивных межэтнических контактов являются важным объектом популяционных исследований, поскольку горные системы служат не только барьерами на пути мощных миграционных потоков, но и рефугиумами, сохраняющими следы генофондов разных эпох.
К настоящему времени получено общее представление о полиморфизме Y хромосомы в сибирских и среднеазиатских популяциях (Wells et al., 2001; Степанов, 2002; Karafet et al., 2002; Zerjal et al., 2003; Derenko et al., 2006, 2007; Харьков и др, 2007; Rootsi et al., 2007; Biro et al., 2009; Underhill et al., 2010), накоплен значительный фактический материал о разнообразии гаплогрупп и гаплотипов, выявлены значительные различия между генофондами Алтае-Саянского и Байкальского регионов, определена вероятность вклада монгольских племен эпохи Чингисхана в генофонд тюркских народов, показана эффективность применения Y хромосомы как для выявления древних этногенетических связей, так и для прослеживания более поздних миграционных потоков. Однако обобщающие работы по полиморфизму Y хромосомы у тюрков Сибири и Центральной Азии отсутствуют, поскольку разные народы изучены по разным наборам маркеров Y хромосомы. Остаются неисследованными и генофонды многих малых этнических и субэтнических популяций в составе алтайцев, шорцев, хакасов, казахов, киргизов, вследствие чего многие проблемы их этногенеза и формирования генофонда этой части Евразии еще далеки от ясности. Несопоставимость панелей и малый набор изученных маркеров, а также малые выборки не позволили дать полноценную характеристику народов Южной Сибири и Средней Азии, а отсутствие единой базы данных по Y хромосоме не позволяет различать многочисленные миграции. Частичному заполнению этих пробелов посвящена данная работа.
Цель исследования.
Изучить структуру генофонда тюркоязычных народов Алтая, Саян, Тянь-Шаня и Памира по единой панели SNP и STR маркеров Y хромосомы и выявить основные этногенетические связи с регионами западной и восточной Евразии.
Задачи исследования.
-
Дать по единой обширной панели - 40 SNP и 17 STR маркеров Y хромосомы - комплексную характеристику генофондов тюркоязычных народов Алтая, Саян, Тянь-Шаня и Памира по репрезентативной выборки - 1100 представителей 13 популяций (кумандинцы, челканцы, тубалары, алтай-кижи, теленгиты, шорцы горные и абаканские, качинцы, сагайцы, другие хакасские группы, казахи предгорий Алтая, киргизы Тянь-Шаня и Памира), проживающих на территории России, Казахстана, Киргизии и Таджикистана.
-
Охарактеризовать генофонды изучаемых популяций на различных иерархических уровнях популяционной системы, оценить соотношение межэтнической и внутри-этнической дифференциации генофондов по маркерам Y хромосомы. Выявить степень генетического своеобразия генофондов малых народностей Южной Сибири, обычно рассматриваемых на современном этапе в качестве не этносов, а лишь субэтнических групп.
-
Оценить степень филогенетического родства тюркоязычных популяций Алтая, Саян, Тянь-Шаня и Памира по данным не менее 500 STR гаплотипов Y хромосомы, выявить основные кластеры STR гаплотипов, определить время их появления в Южной Сибири и Средней Азии и источники миграций.
-
Провести сравнительный анализ генофондов тюркоязычных популяций Алтая, Саян, Тянь-Шаня и Памира с генофондами окружающих регионов западной и восточной Евразии методами многомерной статистики.
-
Создать картографический атлас распространения гаплогрупп Y хромосомы в Евразии, на основе которого выявить географические тренды в изменчивости генофондов тюркоязычного населения Алтая, Саян, Тянь-Шаня и Памира в контексте генетических особенностей западной и восточной Евразии.
Научная новизна.
Впервые по единой обширной панели SNP и STR маркеров Y хромосомы исследованы 1100 представителей тринадцати тюркоязычных этнотерриториальных популяций не только на территории России, но и трех других государств: Казахстана, Киргизии и Таджикистана.
Получены оценки уровня генетического разнообразия (гетерогенности) на разных уровнях иерархической организации тюркоязычных популяций Южной Сибири и Средней Азии. Впервые выявлены высокие межпопуляционные различия между малыми народностями Южной Сибири.
На основе сравнительного анализа гаплогрупп Y хромосомы методами многомерной статистики и картографического анализа выявлено положение генофондов коренных народов Алтая, Саян, Тянь-Шаня и Памира среди региональных генофондов западной и восточной Евразии. Впервые показано двоякое влияние изучаемых горных систем на структуру генофонда: не только в роли «барьера» для интенсивного потока генов, но и в роли «рефугиума», то есть консервативной «реликтовой» роли, сохраняющей следы древнейшего населения на протяжении многих эпох.
Благодаря анализу большого массива данных на основе единой широкой панели STR маркеров впервые обнаружен ряд кластеров гаплотипов, специфичных для отдельных народов и для родственных этносов. Генетические датировки этих кластеров позволили уточнить узловые моменты в этногенезе ряда народов изучаемого региона.
Научно-практическая значимость. Созданные ДНК коллекции, которые сопровождаются подробной информацией о родословной индивида, его этнической и географической идентификации, закладывают основу для крупномасштабных исследований на базе других генетических систем, включая полногеномный анализ.
База данных по распределению панели 17 STR маркеров Y хромосомы (набор Y-filer), используемых в судебной экспертизе, может применяться в судебно-медицинской экспертизе в качестве референтной базы при идентификации личности и определении районов возможного происхождения искомых гаплотипов Y хромосомы.
Выявление для ряда народов мощного эффекта основателя является прогнозом повышенной частоты наследственных болезней, вызванной накоплением мутантных аллелей основателя, и обосновывает необходимость проведения целенаправленного медико-генетического скрининга и консультирования для данных популяций.
Совокупность полученной информации о структуре генофонда изученных народов, созданные базы данных и картографический атлас обеспечивают проведение генетико-демографического мониторинга, включая прогнозирование изменений генофонда в результате продолжающихся массовых миграций и межэтнических браков.
Полученные результаты важны для понимания формирования коренных народов Северной Евразии, вопросов первоначального заселения Америки и этногенеза народов России. Они будут полезны специалистам смежных отраслей науки: антропологам, археологам, лингвистам, историкам, этнографам при реконструкции целостной истории народонаселения Евразии. Результаты работы найдут широкое применение в учебно-педагогическом процессе.
Более того, полученная новая информация об этногенезе тюркоязычных народов важна для самого коренного населения изучаемого региона в ситуации возрастания этнического самосознания, укрепления и развития национальной культуры, языка, растущего интереса к истории своего народа. Многие народы Алтае-Саянского нагорья имеют статус «коренных малочисленных народов» (Постановление Правительства РФ от 24 марта 2000г. №255 «О едином перечне коренных малочисленных народов РФ»), и результаты диссертационной работы будут использоваться для сохранения культурного наследия России.
Основные положения, выносимые на защиту:
-
Этапы формирования генофонда. Генофонд тюркских народов Алтая, Саян, Памира и Тянь-Шаня сформирован населением различных регионов Евразии. В основе лежит древний западно-евразийский (палео-европеоидный) субстрат, маркируемый гаплогруппой R1a1a. Древний северо-евразийский компонент (N1b, N1c1, Q) восходит к автохтонному населению Западной Сибири и Урала. Более поздние этапы формирования генофонда связаны с постепенным проникновением восточно-евразийского (монголоидного) компонента, маркируемого гаплогруппой С. С другими регионами Евразии связь незначительна: с Восточной Европой по гаплогруппам I и R1b1b2, с Тибетом по гаплогруппе D2, с Восточной Азией по гаплогруппе О.
-
Географические тренды в изменчивости генофондов. Распределение восточно-евразийского компонента в исследуемых популяциях географически неравномерно: он значителен в популяциях казахов южных предгорий Алтая, киргизов и южных алтайцев, но почти не достигает северных алтайцев, хакасов и шорцев. С севера на юг снижаются частоты «сибирских» гаплогрупп (N1b, Q) и возрастает общее разнообразие спектра гаплогрупп. Географически периферийные киргизы занимают в генетическом пространстве промежуточное положение между двумя основными кластерами - «алтае-саянским» и «степным», отражая исходные этногенетические связи киргизов с южносибирскими племенами и последующее влияние степных народов.
-
Показатели межпопуляционного разнообразия. Ярко выраженные различия между «малыми народностями» (кумандинцы, челканцы, тубалары, сагайцы, качинцы и др.) подтверждают как их генетическую реальность, так и условность их традиционного объединения в этно-территориальные группы по географическому принципу («северные алтайцы», «южные алтайцы», «хакасы»).
-
Филогенетический анализ гаплогрупп выявляет ряд кластеров STR гаплотипов, характерных для определенных этносов и их групп. В гаплогруппе R1a1a выделяются специфичные кластеры северных и южных алтайцев. Для гаплогруппы N1c1 разделение происходит только на уровне «европейского» и «южносибирского» кластеров. Для гаплогруппы N1b также характерно четкое разделение на «европейский» и «азиатский» кластеры. Генетические датировки обнаруженных кластеров уточняют особенности этногенеза изучаемых народов и указывают на значительную роль дрейфа генов (эффекта основателя) в формировании их генофондов.
Апробация работы. Результаты исследований были представлены на международной конференции по проекту «The Genographic» (Эстония, 2008), VIII Конгрессе этнографов и антропологов России (Оренбург, 2009), Международной конференции «Человек: его биологическая и социальная история» (Москва, 2009), конференции молодых ученых МГНЦ РАМН (Москва, 2009), VI Съезде Российского общества медицинских генетиков (Ростов-на-Дону, 2010), VIII Курчатовской молодежной научной школе (Москва, 2010).
Личный вклад автора. Автором выполнена основная часть работы на всех этапах исследования: от экспедиционного обследования генофондов населения Алтая, Горной Шории, Байкальского региона и Восточной Европы до генотипирования, включая выделение ДНК, измерение концентрации, формирование рабочих и архивных ДНК-коллекций, генотипирование SNP маркеров и фрагментный анализ STR маркеров Y хромосомы,, генотипирование ряда аутосомных ДНК маркеров, ведение баз данных по ДНК маркерам и анкетным данным. Автором самостоятельно проведен статистический анализ – от расчета частот гаплогрупп до многомерного анализа (генетических расстояний, кластерного анализа, многомерного шкалирования, АMOVA), построения филогенетических сетей и создания геногеографических карт распространения гаплогрупп Y хромосомы в Евразии.
Публикации. Основные результаты исследования представлены в 9 научных работах, в том числе в 4 статьях в ведущих рецензируемых научных журналах, рекомендованных ВАК РФ для защиты диссертаций.
Структура и объем работы. Работа изложена на 172 страницах и состоит из введения, заключения и 6 глав, включающих обзор литературы, материалы и методы, результаты исследования и их обсуждение, список литературы, содержащий 260 источников, из которых 79 иностранные. Работа иллюстрирована 8 таблицами и 24 рисунками.
Характеристика изученных народов Алтая, Саян, Тянь-Шаня и Памира
Изучена изменчивость Y-хромосомы среди тринадцати этнолингвистических групп коренных народов: алтайцев - кумандинцы, челканцы, тубалары, алтай-кижи, теленгиты, шорцев - горные и абаканские, хакасов - качинцы, сагайцы, койбалы, кызыльцы, киргизов - Тянь-Шаня и Памира, казахов предгорий Алтая.
Ареал распространения изученных народов простирается вдоль горных систем Алтая, Саян, Тянь-Шаня и Памира от южных границ Западной Сибири (55с.ш.) до высокогорного Памирского плато (38 с.ш.), тем самым, занимая территорию четырех государств - России, Казахстана, Киргизии и Таджикистана. Взаимодействие и взаимопроникновение культур запада и востока Евразийского материка, происходило здесь на протяжении тысячелетий, а формирование народов происходило в результате сложного и длительного процесса дробления, расхождения и повторного слияния различных племен, многочисленных миграций и переселений народов, поэтому целостная в своем развитии группа народов расселена столь дисперсно, а границы исторического ареала не совпадают с современным территориально-административным делением. Общая территория расселения изученных народов составляет почти 0.5 млн. км2. Исчерченность рельефа оказала значительное влияние на формирование этих народов. Рассмотрим подробнее, в каких географических условиях происходило становление их генофондов.
Основной район исторического ареала проходил по территории Алтая и Саян. Алтайские горы и Саянский хребет составляют единую горную систему, которая объединяет в настоящий момент такие крупные народы как хакасов, шорцев, алтайцев и казахов в единую общность.
Алтайцы, шорцы и восточные казахи проживают в основном в горных районах Алтая. Алтайские горы состоят из хребтов, имеющих сложное расположение. В горах Алтая типы рельефа разнообразнее, чем на равнинах: имеется низкогорье, среднегорье, высокогорье, участки древних равнин и межгорные котловины. Низкогорье поднимается над равнинами края на 500 м и постепенно переходит среднегорье с высотами до 2000 м. Высокогорье занимает юг и юго-восток региона, где находятся наиболее высокие хребты Горного Алтая: Катунский, Северно- и Южно-Чуйские, Курайский, Шапшальский, Чихачева. На Катунском хребте расположена гора Белуха. Восточная вершина Белухи высотой 4506 м является наивысшей точкой Сибири. В горную систему Алтая географически входят также Горная Шория и Кузнецкий Алатау.
Основная территория расселения хакасов Минусинская котловина, окруженная малопроходимыми Саянскими горами. В ландшафтном отношении основная территория Хакасии представляет собой равнинную или предгорную страну. Характерен низкогорный рельеф с плоскими, невысокими холмами - сопками, с редкими смешанными лесами и большими остепнёнными участками и среднегорный рельеф. Хребты более пологие, сильно изрезанные речными долинами, поросшие горной тайгой. ,По южной границе Республики Хакасия проходит Западный Саянский хребет. Саянский хребет ограничивается с запада Шапшальским хребтом Восточного Алтая и Абаканским хребтом Кузнецкого Алатау. Он тянется в широтном; направлении полосой, постепенно сужающейся с 200 до 80 км, от верховьев реки Абакан до стыка с хребтами Восточного Саяна в верховьях рек Казыр, Уда и Кижи-Хем. С севера к Западному Саяну примыкает Минусинская котловина, а с юга -Тувинская котловина. Таким образом, Саянский хребет мог служить барьером от сильного влияния южных соседей. Поэтому территорию Хакассии считают переходной зоной от южносибирского типа к центральноазиатскому. Киргизы близкие в своем происхождении с хакасами занимают географически отдаленную территорию высокогорных систем Тянь-Шаня и Памира. В систему Тянь-Шаня входит более тридцати вершин высотой более 6000 метров. Самой высокой точкой горной системы является пик Победы (Томур, 7439 м), расположенный на границе Киргизии и Китая. От Центрального Тянь-Шаня к западу расходятся три горные цепи, разделенные межгорными котловинами (Иссык-Кульская с озером Иссык-Куль, Нарынская, Ат-Башынская и др.) и соединенные на западе Ферганским хребтом. В этих котловинах проживает большая часть населения Киргизии. Вторая группа - Памирские киргизы проживают на территории Таджикистана на высокогорном Памирском плато. Памир находится на соединении отрогов мощных горных систем Центральной Азии — Гиндукуша, Каракорума, Куньлуня и Тянь-Шаня. Эта горная система располагается на территории Таджикистана, Киргизии, Китая и Афганистана. Высшая точка Памира — расположенный на территории Китая пик Конгур (высота 7 719 м). Метисация сибирских народностей друг с другом и с пришлым населением
Миграция в популяцию извне (внешняя миграция) и между субпопуляциями (внутренняя миграция) является важным фактором, противостоящим генному дрейфу. При одинаковой интенсивности генетическая эффективность миграции тем больше, чем больше генетическое разнообразие мигрантов извне. Сибирские коренные народы с момента завершения своего формирования на протяжении всей последующей истории либо обменивались брачными мигрантами с соседними этнически группами, либо ассимилировали их. Одной из причин брачной миграции между сибирскими популяциями являлось не только их территориальное соседство, но и существование норм родовой экзогамии, ограничивающих выбор брачного партнера в своей популяции.
Сибирские популяции существенно различаются по полноте исследования генетико-демографической структуры. Тесная взаимосвязь в историческом развитии тюркоязычных этнических групп юга Сибири и Центральной Азии, слияния местных этнических сообществ в единые этносы в прошлом, и стремительное выделение отдельных коренных в настоящем требует анализа генетико-демографической ситуации для каждого народа. Вопросы демографии представляют особый интерес, связанный, прежде всего, с пониманием процессов современного развития народов.
Значительная часть коренного населения Сибири, проживая среди преобладающего по численности иноэтничного окружения, подвергается воздействию со стороны других народов и культур, что может привести в итоге к стиранию генетического и этнокультурного своеобразия сибирских этносов. После вхождения в конце XVI - начале XVII вв. в состав Российского государства коренное население Сибири оказалось вовлеченным в протекавшие в России общественно-политические процессы, что повлияло на демографическое развитие этих народов [Октябрьская, 2002; Садовой, 2003; Скобелев, 1998]. Поскольку демографические и генетические изменения являются сторонами единого процесса и протекают одновременно, то любые колебания в динамике численности, соотношения полов, типов браков, брачных миграций, структуры родства и других параметров неизбежно сопровождаются изменениями генофонда популяции [Спицына, 2004].
Методы статистического, филогеографического и картографического анализа
Чтобы извлечь содержательную информацию об истории народонаселения для полученных обширных первичных данных, будет применен широкий спектр статистических и геногеографических методов.
Этнический уровень (уровень малых народностей): анализ разнообразия этносов в пределах выделенных крупных объединений; сравнительный анализ этнических генофондов по разным типам маркеров; многомерный статистический анализ сходства ключевых этносов с населением крупных регионов Евразии в целом; рассмотрение полученных результатов в контексте этногенеза народов Северной Евразии; выявление генетических аргументов в пользу различных гипотез этногенеза.
Уровень крупных народов (этно-териториальных объединений): рассмотрение генофондов крупных объединений в контексте генофондов народов Северной Евразии в целом; анализ основных паттернов и сценариев пространственной изменчивости в генофонде Северной Евразии с использованием картографического анализа
Региональный уровень: выделение в генофонде Северной Евразии региональных генофондов важных для решения вопросов этногенеза населения Северной, Восточной и Центральной Азии. Ключевым регионом является пограничная область, их разделяющая, - горные системы Алтая, Саян, Тянь-Шаня и Памира. На этом уровне будут анализироваться полиморфизмы SNP маркеров и STR гаплотипов Y-хромосомы; анализ различий между региональными генофондами; их сравнительный анализ; многомерный статистический.
Для анализа распределения частот гаплогрупп Y-хромосомьт в регионах Евразии использованы данные Y-base, созданной в лаборатории популяционной генетики человека под руководством О.П. Балановского (www.genofond.ru ). База данных является в настоящее время наиболее обширной в мире по полноте представленной информации о населении Евразии. Использование столь полной информации о народонаселении Евразии позволило оперировать только наиболее репрезентативной информацией при сравнении генофондов и создании картографического Атласа. На основе генетических расстояний М. Нея [Nei, 1975] (DJgenetic, www.genofond.ru ) проведен кластерный анализ и многомерное шкалирование, наглядно показывающие взаимную близость или отдаленность изученных народов Северной Евразии в сравнении с другими крупными регионами (Statistica 6.0). На основе расчета частот гаплогрупп получены графики главных компонент. Эти графики, построенные для изученных нами народов в сравнении с крупными регионами, позволят выявить происхождение гаплогрупп и основные направления миграций, которые сформировали такое разнообразие генофонда тюркских народов Южной Сибири и Центральной Азии (Statistica 6.0). Таким образом, были выделены комплексы гаплогрупп (по факторным нагрузкам на главные компоненты) и определены, какие именно гаплогруппы внесли основной вклад в своеобразие тех или иных популяций.
Параллельно с этими методами, нацеленными на визуализацию данных, был проведен анализ иерархической изменчивости (AMOVA) с целью выявить наиболее гетерогенные и наиболее гомогенные группы популяций. Расчет межпопуляционного разнообразия, выполненный на разных иерархических уровнях изученных популяций и данным по смежным регионам, позволил оценить степень разнообразия разных частей изучаемого тюркского ареала.
Именно в возможности датировок реконструируемых миграций заключается преимущество современных нерекомбинирующих генетических систем перед ранее широко применявшимися методами анализа частот аллелей. В частности, применение данных по Y-хромосоме позволяет датировать время распространения ее гаплогрупп. Результаты генотипирования предоставили все необходимое для надежного датирования возраста кластеров основных гаплогрупп, а именно: а) большое число STR маркеров (17, т.е. существенно выше, чем ранее использовавшиеся наборы - 7 или 9 STR маркеров); б) широкий географический охват популяций с целью избежать искажения в оценках возраста, неизбежно возникающие при использовании локальных и ограниченных по численности выборок. Конечно, при этом сохраняется основная проблема датирования в филогенетических исследованиях, а именно неизвестность точной скорости мутирования для эволюционных расчетов: применение «эволюционной скорости» [Zhivotovsky et al., 2004] или же «генеалогической» скорости [Ge et al., 2009]. Однако в данном случае погрешность в определении абсолютного возраста гаплогрупп не скажется существенно на выводах, поскольку для решения всех важнейших задач достаточно определения последовательности появления конкретных кластров гаплогрупп в изучаемом регионе.
Для датировки кластеров в пределах гаплогрупп использовался классический метод [Forster et al., 1996; Saillard et al., 2001], основанный на подсчете среднего числа мутаций, накопившихся в пределах кластера (rho estimator). Для датировки времени, прошедшего с момента разделения двух популяций от общего предка, использовалась мера TD, предложенная Л.А. Животовским [Zhivotovsky et al., 2004], и основанная на показателе ASD (average squared difference). Эти два вида анализа проведены для всех обнаруженных кластеров.
Картографический анализ заключался в детальном анализе гаплогрупп, которые оказались наиболее характерными для народов изученного региона. Геногеографические карты распределения гаплогрупп построены с помощью программы GeneGeo, созданной под руководством О.П. Балановского. Программное обеспечение картографо-статистического анализа соответствует мировым стандартам, в том числе в разделе графического отображения карт и совместимости с другими картографическим пакетами (Surfer, ArcGIS). С помощью компьютерного картографирования частот гаплогрупп и показателей их разнообразия, последовательное применение всего арсенала методов компьютерной геногеографии, мы выявили закономерности в структуре генофонда, последствия дрейфа генов и следы миграций различной степени древности.
При анализе информации, изученной по разному набору популяций (а именно такова реальная картина современных исследований), картографический анализ становится наиболее универсальным инструментом комплексного изучения генофонда.
Такой способ представления исходных данных - на картах - оптимален тем, что допускает использование результатов проекта не только коллегами-генетиками, но и специалистами в смежных областях (карта является универсальным средством, понятным представителям многих научных дисциплин, чего нельзя сказать о генетической терминологии).
Объединение популяций в региональные генофонды
Третья глава была посвящена анализу генофонда изученных народов Алтая, Саян, Тянь-Шаня и Памира по частотам гаплогрупп Y-хромосомы. Основное внимание уделялось особенностям спектра гаплогрупп и их частот у малых народностей и в их крупных этнических объединениях. Также мы рассматривали положение в генетическом пространстве изученных народов горных систем Алтая, Саян, Тянь-Шаня и Памира без сравнения их с другими регионами. Однако, понять пути формирования генофондов этих народов невозможно вне контекста других регионов Евразии. Современный генофонд этого региона является итогом многовекового взаимодействия многих народов. Военные походы, торговые взаимоотношения и межэтнические браки сформировали сложную генетическую структуру. Данная глава посвящена тому, как изученные тюркоязычные народы Алтая, Саян, Тянь-Шаня и Памира генетически соотносятся с генофондами народов различных регионов Евразии. С помощью многомерных методов анализа рассмотрим вначале, какое положение занимают изученные народы среди основных регионов Евразии, а затем подробно сравним все изученные народы с народами каждого региона в отдельности.
Для сравнительного анализа использовались частоты гаплогрупп из БД Y-base (www.genofond.ru). Суммарно было проанализировано более 35.5 тыс. человек из почти 200 популяций Западной и Восточной Европы, Волго-Уральского региона, Кавказа и Передней Азии, Южной, Центральной, Восточной Азии, а также популяции Западной, Центральной, Южной и Восточной Сибири (табл.4). Таким образом, были охвачены литературные данные практически всех ключевых регионов Евразии. Из анализа были исключены популяции с объемом выборок менее 40 человек.
Анализ всей совокупности гаплогрупп Y-хромосомы (табл. 4) методом многомерного шкалирования (рис. 4) выявил два основных крупных кластера: 1) западно-евразийский, в который вошли популяции Западной и Восточной Европы, Волго-Уральского региона, Кавказа, Передней и Южной Азии; 2) восточно-евразийский кластер, включающий популяции Восточной и Центральной Азии, Западной, Центральной, Южной и Восточной Сибири. Изученные в данной работе народы шорцы, северные и южные алтайцы, хакасы, киргизы и казахи предгорий Алтая на этом графике многомерного шкалирования расположились следующим образом: казахи оказались максимально приближены к центральноазиатскому региону. Южносибирские народы - алтайцы и хакасы - вместе со среднеазиатскими популяцими киргизов близки к обобщенному генофонду народов Южной Сибири и находятся на периферии восточно-евразийского кластера, приближаясь и западно-евразийскому. Шорцы находятся уже на периферии западно-евразийского кластера, что полностью согласуется с антропологическими данными, согласно которым среди всех изученных народов именно у шорцев в наибольшей степени выражен европеоидный компонент [Народы России, 1994].
Таким образом, шорцы, хакасы, алтайцы, казахи и киргизы не группируются компактно, как в географическом пространстве, но в генетическом пространстве Евразийских генофондов занимают дисперсное положение, отражая тем самым чрезвычайно большое разнообразие их генофондов.
По этим же данным (табл. 4) были рассчитаны главные компоненты изменчивости гаплогрупп Y-хромосомы. В расположении народов в генетическом пространстве главных компонент (рис. 5) отмечаются те же закономерности, что мы видели на графике многомерного шкалирования (рис.4). Однако анализ главных компонент позволяет оценить роль отдельных гаплогрупп в формировании этих кластеров, а также выявить спектр гаплогрупп, сформировавших генофонды крупных регионов и изученных народов. Вклад каждой гаплогруппы показан штриховой линией.
Первая две компоненты отражают суммарно 38.9% генетического разнообразия, причем наблюдается резкое уменьшение доли компонент (первая -22%, вторая - 16.9%), что свидетельствует об эффективности применения метода главных компонент. Поскольку анализируются 16 независимых признаков, то при неэффективности метода все компоненты составляли бы около 6% тотальной изменчивости.
Первая главная компонента разделяет западно-евразийские и восточно-евразийские генофонды. Все изученные в данной работе народы расположились в области положительных значений первой компоненты. Генофонды народов Западной Евразии, за исключением Волго-Уральского региона расположились в области отрицательных значений.
Вторая компонента делит восточный блок на Центральную и Восточную Азию и Сибирь. Основная часть изученных народов расположилась на этой границе, за исключением шорцев, которые тяготеют к Волго-Уральскому региону, и казахов, прилегающих к генофонду народов Центральной Азии.
Рассматривая роль отдельных гаплогрупп (гаплогруппы показаны штриховыми линиями) в формировании этих кластеров, обнаруживаем, что своеобразие центральноазиатского региона задается повышенными частотами гаплогрупп D, С и О. Для сибирского региона основная часть нагрузки приходится на 5 гаплогрупп: Q, Nib, Rlblbl, Nlcl и Rlala. Отметим, что гаплогруппа Rlala располагается на стыке западно-евразийского и сибирского генофондов. Основной вклад в генофонд Западной Евразии вносят типичные гаплогруппы I, Rlblb2, J, Е, а доля Т, L, Н и G не значительна.
В дальнейших разделах этой главы (4.2, 4.3, 4.4.) мы подробно рассмотрим место изученных нами народов среди популяций отдельных регионов Евразии, поскольку при увеличении масштаба взаимное расположение народов начинает более адекватно отражать их исторические связи.
Данный анализ будем проводить с учетом западно-евразийского (используемого как синоним европеоидного) и восточно-евразийского (используемого как синоним монголоидного) влияниий, ассоциированых с определенным спектром гаплогрупп. Комплекс определенных гаплогрупп в изученном регионе отражает миграционные потоки генов.
Сравнение с регионами и народами Восточной Евразии
Формирование генофонда коренных народов Алтая, Саян и Средней Азии проходило не только под влиянием генных потоков с запада или востока, но и на основе местного сибирского (северо-евразийского) субстрата.
Рассмотрим характер взаимоотношений изученных нами народов с другими народами Западной, Центральной, Восточной и Южной Сибири. Суммарно оценены частоты почти 3,5 тыс. представителей коренных народов этих регионов из 37 популяций (табл. 4). Для построения графика многомерного шкалирования малочисленные популяции одного этноса были объединены. Изученные в данной работе народы отмечены на графике кругами, а привлеченные для сравнительного анализа литературные данные - треугольниками.
Результаты анализа выявили шесть основных кластеров: три крупных кластера (североалтайский, южноалтайский и восточносибирский) и три небольших кластера (якутский, угорский и самодийский). Угорский кластер сформировали ханты, манси и примыкающие к ним качинцы.
Североалтайский кластер образован малыми народностями северных алтайцев, шорцев и хакасов. При этом на разных полюсах этого кластера оказались челканцы и сагайцы. Сагайцы тяготеют к угорскому кластеру (за счет высоких частот гаплогруппы Nib), а челканцы к самодийскому кластеру. Об участии протоуральского и палеоазиатского населения в этногенезе народов северного Алтая можно судить по частотам распространения гаплогрупп Nib (рис. 13А) и Q (рис. 13Б), которые поляризуют народы северного Алтая между этими двумя группами.
В южноалтайский кластер вошли южные алтайцы, киргизы и тувинцы, то есть народы, располагающиеся в географическом пространстве в южном секторе Алтае-Саян.Казахи Алтая наряду с эвенками, бурятами и долганами сформировали восточносибирский кластер за счет выраженного преобладания восточно-евразийских гаплогрупп в их генофонде. Рассмотрим подробнее географию гаплогрупп, сформировавших такое генетическое разнообразие у коренных народов Сибири.
Ареал распространения гаплогруппы Nib (рис. 13А) частично совпадает с Nlcl: этот вариант распространен в Западной Сибири и на арктическом побережье. Мы обнаружили, что вторая зона высоких частот Nib приходится в точности на Алтае-Саянский регион. При дальнейшем продвижении на юг частота Nib снижается, за исключением памирских киргизов. Самая западная область распространения гаплогруппы Nib - Финляндия, где частота этой гаплогруппы мала (0.4%). Однако у вепсов гаплогруппа Nib обнаружена с высокой частотой 17.9% [Lappalainen et al., 2006]. Также довольно высокие частоты обнаруживаются в Волго-Уральском регионе (у коми 35%, у удмуртов 29%). Наибольшей частоты Nib достигает в Западной Сибири - у нганасан 92%, у энцев 78%, у тундровых ненцев 74% и в Южной Сибири (у хакасов 34%, у тофаларов и эвенов около 25%, у тувинцев около 18%) [Tambets et al., 2004]. За пределами Северной Евразии гаплогруппа Nib редка, хотя и встречена у монголов и в северном Иране с частотой около 6%. Гаплогруппа Nib четко делится на два кластера гаплотипов: - «А» (азиатская) и «Е» (европейская), так же обозначенные как N2-A и N2-E [Derenko et al., 2007; Rootsi et al., 2007]. Карта распространения гаплогруппы Q (М242) демонстрирует (рис. 13Б), что ее основной ареал охватывает Среднюю Сибирь (бассейн Енисея), она также распространена у коренных народов Америки. Многие исследователи связывают распространение этой гаплогруппы с заселением Американского континента из Сибири. При этом на территории Сибири, Центральной и Передней Азии встречается только вариант Qla (MEN2), а у американских индейцев распространена её сестринская гаплогруппа Qla3a (МЗ).
Остановимся подробнее на евразийском варианте Qla. Эта гаплогруппа достигает особенно высоких частот у кетов (94%) и селькупов (66%) и не встречается ни к западу, ни к востоку от этого ареала, а на юг она тянется к Алтае-Саянскому нагорью и ещё южнее почти исчезает в степях Центральной Азии (рис. 13Б). С невысокими частотами (около 5%) эта гаплогруппа выявлена также на территории Индии, Передней и Средней Азии [Karafet et al., 2002; Seielstad et al., 2003]. В пределах Алтая эта гаплогруппа ранее была встречена у северных и (с несколько меньшей частотой) у южных алтайцев [Харьков и др., 2007].
Наше исследование генофонда народов Алтая показывает, что Qla встречается у всех народов Алтая с частотой около 5%, за исключением шорцев на самом севере Алтая и казахов на самом юге Алтая, где эта гаплогруппа не была обнаружена (рис.ІЗБ). Наличие гаплогруппы Q в большинстве популяций Алтая и всплеск её у северных алтайцев может отражать древнейший сибирский пласт в генофонде народов Алтая и говорить об участии протоуральского и палеоазиатского населения в этногенезе населения Алтая, максимально проявляющегося у северных алтайцев.
Гаплогруппа Nlcl (рис. 13В) преобладает на северо-востоке Европы, на Урале и восточной Сибири (у якутов, эвенков, бурят). Значительный процент Nlcl также присутствует у чукчей — около 50%, у хантов, манси, ненцев — до 40%. По причине распространенности и в Европе, и в Сибири, гаплогруппу Nlcl нельзя отнести ни к восточно-евразийским гаплогруппам, ни к западно-евразийским. Для неё характерно северо-евразийское распределение.
В настоящее время существует две альтернативные гипотезы происхождения этой гаплогруппы. Первая гипотеза основана на высоком гаплотипическом разнообразии линий Nlcl среди финно-угорских народов. Появление этой гаплогруппы в Сибири данная гипотеза связывает с миграциями из Волго-Уральского региона, а высокое накопление частот и низкое разнообразие линий в сибирских популяциях (особенно у якутов) объясняет дрейфом генов и эффектом основателя.
Исследования эстонских специалистов [Roots! et al., 2007] выявили другой возможный вариант распространения этой гаплогруппы - не с запада на восток, а в обратном направлении. Вторая гипотеза основана на наличии на территории Южной и Восточной Азии недифференцированной гаплогруппы NO (М214), являвшейся предковым вариантом по отношению к Nlcl. Поэтому представляется вероятным, что Nlcl выделилась из NO на территории Центральной Азии, откуда распространилась в Сибирь и уже затем в Восточную Европу. Низкое разнообразие линий Nlcl в Сибири, возможно, связано с тем, что сибирской прапопуляции пришлось пройти через «бутылочное горлышко», а в Европе аналогичные эффекты дрейфа генов были не столь сильны. В подтверждении второй гипотезы в популяциях кумандинцев и тубаларов нами обнаружена недифференцированная гаплогруппа N с высокой частотой - 14%.