Содержание к диссертации
Введение
Глава 1. Обзор литературы 11
1.1. Эволюция человека 11
1.1.1. Африканские предки 11
1.1.2. Расовые вариации Homo sapiens 13
1.2. Классификация языков и их формирование 15
1.3. Археологическая периодизация первобытной истории 19
1.4. Северная Азия в системе древних культур 21
1.4.1. Предыстория и история Сибири 21
1.4.2. Предыстория и история Средней Азии 27
1.4.3. Тюрки и монголы 32
1.5. Alu-повтор в геноме человека 35
1.5.1. Происхождение и структура 37
1.5.2. Локализация и распространение в геноме человека 39
1.5.3. Ретропозиция Alu-повтора 40
1.5.4. Функция Alu-повтора 41
1.5.5. Эволюция подсемейств 44
1.5.6. Alu-повтор как генетический маркер 49
Глава 2. Материалы и методы 53
2.1. Материал исследования 53
2.2. Маркеры 57
2.3. Методы исследования 60
2.3.1. Выделение ДНК 60
2.3.2. Полимеразная цепная реакция 60
2.3.3. Гель-электрофорез и типирование ДНК-полиморфизма 61
2.4. Статистический анализ 64
2.4.1. Анализ частот генов внутри популяции 64
2.4.2. Меры генного разнообразия 65
2.4.3. Меры генетической дифференциации популяций 67
2.4.4. Меры генетического расстояния 68
2.4.5. Филогенетический анализ 69
2.4.6. Метод главных компонент 70
2.4.7. Многомерное шкалирование 71
2.4.8. Анализ потока генов 72
2.4.9. Анализ корреляции матриц по Мантелю 73
Глава 3. Результаты и обсуждение 77
3.1. Частоты аллелей и генетическое разнообразие внутри популяций 77
3.2. Генетическая дифференциация популяций 86
3.3. Генетические взаимоотношения между популяциями 92
3 4. Анализ потока генов 104
3.5. Филогенетический анализ населения мира 109
3.6. Корреляция генетического разнообразия с географией, языком и антропологией 114
Заключение 117
Выводы 120
Список литературы 122
Приложение 141
- Классификация языков и их формирование
- Alu-повтор как генетический маркер
- Меры генетической дифференциации популяций
- Филогенетический анализ населения мира
Введение к работе
Традиционно прошлое исследуется археологами, историками и антропологами. С середины XX века к когорте этих исследователей подключились и молекулярные генетики, чьи исторические реконструкции основываются на аспектах генетического полиморфизма, представляющего собой уникальную запись генетической истории. Результаты по генетическому разнообразию популяций, получаемые с использованием различных систем генетических маркеров, позволяют детализировать генетическую историю как отдельных регионов или расово-этнических групп, так и человечества в целом (Осипова Л Л. и др., 2000; Голубенко М.В., 1998; Пузырев В.П. и др., 1999; Тарская Л.А. и др., 2002; Cavalli-Sforza L.L. et аЦ 1994).
Этногеномные исследования, связанные с генетической реконструкцией процессов происхождения современного человека, его последующего расселения на территории земного шара, эволюционной и демографической историей отдельных регионов или расово-этнических групп, проводятся различными научными центрами по всему миру (Деренко М.В., Малярчук Б.А., Захаров И.А., 2002; Лимборская С.А., Хуснутдинова Э.К., Балановская Е.В., 2002; Степанов В.А., 2000; Сукерник Р.И., 1996; Batzer М.А., Stoneking М., 1994; Hammer M.F. et al., 1998; Underfill P.A. et al., 2000; Wallace D.C., 1995).
Население различных регионов мира весьма специфично по своим генетическим характеристикам, что обусловлено историей расселения человека, особенностями этногенеза, микроэволюционными факторами, изменениями частот генов и генотипов в популяциях, а также историей миграций, завоеваний и смешением популяций. В течение последних нескольких лет на стыке таких наук как генетика, география, эволюция и история возникло новое научное направление - геногеография. Накопленный обширный материал по генетике народонаселения дает возможность увидеть не только картину наследственной изменчивости отдельных этнических групп, но и процессы,
5 под влиянием которых сформировалась структура генофондов наблюдаемая в настоящее время (Кучер А.Н., 2001; Рычков Ю.Г. и др., 1985).
В настоящее время накоплен уже достаточно большой массив данных по белковым системам (Mourant et al. А.Е., 1976; Генофонд и геногеогра-фия..., 2000 и др.), позволяющий оценивать общемировую картину распределения маркеров, выявлять закономерности и механизмы этого распределения, делать выводы о характере генетико-демографических процессов на разных иерархических уровнях организации человеческого общества (Cavalli-Sforza L.L. et al., 1994; Балановская Е.В., 1998). К концу 90-х гг. был накоплен обширный материал и по генетическому полиморфизму мтДНК (Wallace D.C., 1995; Jorde L.B. et al., 1998; Голубенко M.B., 1998; Салюков В.Б. и др., 2000 и др.) и различных аутосомных ДНК-маркеров (Stoneking М., 1997; Bowcock A.M. et al., 1994; и др.), освещающий различные стороны генетического разнообразия населения земного шара.
В то же время, многообразное по происхождению и этническому составу население Сибири, Средней Азии и Дальнего Востока остается малоизученным с точки зрения генетического полиморфизма. Наряду с обилием этнографических, лингвистических и антропологических данных об этногенезе этих народов неясными остаются вопросы о генетических взаимоотношениях этносов и о вкладе различных предковых групп в их современный генофонд. Расширение спектра изучаемых генетических маркеров у населения этих регионов тем более необходимо, поскольку Сибирь и Средняя Азия были областью соприкосновения самых разнообразных этнокультурных и антропологических элементов, проникавших сюда из сопредельных территорий.
Согласно археологическим и палеоантропологическим данным, человек современного типа начал заселять Северную Азию со времени верхнего палеолита (50 тыс. лет назад). Однако число известных археологических памятников на этой территории невелико, и все они сравнительно однородны, за исключением двух стоянок — Мальты и Бурети на Ангаре и ее притоке
6 Белой. Археологи отмечают, что там традиции в пещерной живописи, обработке камня и т.д. напоминают европейские. Палеоантропологические находки этого времени довольно редки и фрагментарны, однако в целом они свидетельствуют о доминировании монголоидных признаков у древнего населения Северной Азии. Между тем ряд фактов указывает на то, что степная часть Центральной Азии — от Алтая, Хакасии, Тувы и до Внутренней Монголии была ареной взаимодействия групп монголоидного и европеоидного происхождения (Алексеев В.П., 1989). Популяции европеоидного и смешанного происхождения широко расселились на указанных территориях уже в эпоху неолита. Однако культурная преемственность археологических памятников уводит генезис неолитического населения юга Сибири к более раннему времени (Алексеев В.П., 1989; Алексеев В.П., Гохман И.И., 1984).
Полиморфные Alu-повторы, в настоящее время, наряду с такими системами генетических маркеров как микросателлиты, SNP (однонуклеотидные полиморфизмы), широко используются для характеристики структуры генофондов современных популяций и анализа эволюции популяций человека. Полиморфизм Alu-инсерций является удобным маркером для этих исследований. Исследования по генетическому разнообразию популяций человека с помощью Alu-повторов ведутся в нескольких исследовательских центрах США и Европы. Полученные данные позволили охарактеризовать спектр генетического разнообразия по Alu-инсерциям у населения мира и подтвердить основные миграционные пути заселения территории земного шара человеком современного типа (Stoneking М. et al., 1997); уточнить генетические взаимоотношения между различными группами американских индейцев (Novick G.E. et.al., 1998); рядом кавказских этносов и реконструировать генетико-исторические связи между некоторыми коренными этническими группами Индостана (Majumder P.P. et al„ 1999).
Ahi-элементы представляют собой дим еры приблизительно 300 п.н., составляют более 10% всего генома человека и перемещаются посредством ретролозиции (Bartzer М.А., Deininger P.L., 2002). По-видимому, Alu-
7 повторы сыграли важную роль в эволюции генома. Выделяют 14 подсемейств Alu в зависимости от их возраста, эволюционного происхождения и степени гомологии. Некоторые из подсемейств Alu-повторов, представленных в геноме человека, встроились в новые локусы сравнительно недавно и полиморфны в современных популяциях человека. Те из копий Alu-повторов, перемещение которых пришлось на время этнической дивергенции современного человека, представляют интерес в качестве полезных маркеров для эволюционно-генетических исследований.
Цель работы: На основе разнообразия генофондов по полиморфным локусам Alu-повторов осуществить реконструкцию генетических взаимоотношений между коренными этническими группами Сибири, Средней Азии и Дальнего Востока.
Задачи исследования:
1. Оценить генетическое разнообразие в популяциях принадлежащих к различным этническим группам Сибири, Средней Азии и Дальнего Востока с использованием 8 полиморфных Alu-повторов (АСЕ, FXIIIB, APOAI, PLAT, PV92, CD4, А25, D1).
Оценить уровень генетической дифференциации на основе показателей межпопуляционной вариабельности и межпопуляционных генетических расстояний.
Провести анализ генетических взаимоотношений между исследованными популяциями и уточнить некоторые аспекта этногенеза коренных популяций Сибири, Средней Азии и Дальнего Востока.
Провести анализ потока генов на территории Северной Евразии.
Оценить уровень корреляции генетических дистанций между популяциями Сибири, Средней Азии и Дальнего Востока с антропологическими, лингвистическими и географическими характеристиками.
Новизна исследования:
В работе впервые охарактеризован генофонд коренного населения Сибири, Средней Азии и Дальнего Востока одновременно по 8 полиморфным локусам Alu-повторов (АСЕ, FXIHB, АРОАТ, PLAT, PV92, CD4, А25, D1). В результате исследования выявлены генетические взаимоотношения между этносами Сибири, Средней Азии и Дальнего Востока, охарактеризованы процессы расселения и эволюции популяций на территории Северной Евразии. Выявлены «европеоидные» (западно-евразийские) и «монголоидные» (восточно-евразийские) частоты спектра комплекса Alu-повторов. Показан существенный вклад древнего европеоидного компонента в генофонд современных популяций Алтае-Саянского региона. В ходе работы получены новые знания в области генетики народонаселения и геногеографии.
Научно-практическая значимость:
В работе получены данные по полиморфизму Alu-повторов для ранее не обследованных популяций Сибири, Средней Азии и Дальнего Востока. Результаты исследования имеют междисциплинарное значение, и будут представлять интерес для антропологов, этнографов, лингвистов и демографов, занимающихся проблемами истории народонаселения севера Евразии. Полученные данные могут быть использованы для изучения процессов формирования конкретных этнических групп, а также для реконструкции процессов заселения Евразии человеком в палеолите и неолите. Кроме этого результаты исследования могут быть применены для построения геногеографических карт и составления базы данных о генетическом разнообразии Севера Евразии. Полученные сведения могут так же быть использованы при чтении лекций в научно-педагогическом процессе на биологических факультетах. Изучение полиморфных вариантов ряда локусов генома, кандидатных в отношении мультифакторных заболеваний (АСЕ, АРОА1, PLAT, F13B), может стать
9 базой для дальнейших работ по молекулярной эпидемиологии этих болезней в коренных популяциях.
Положения, выносимые на защиту:
Популяции Алтае-Саянского региона (северные алтайцы и тувинцы) характеризуются высоким уровнем генетического разнообразия, вследствие особенностей этногенетического развития этих популяций.
Низкое межпопуляционное разнообразие для тувинцев, эвенков и киргизов свидетельствует о единстве генофонда внутри этих коренных этносов. Якуты, буряты и алтайцы характеризуются относительно высоким межпопуляционным разнообразием.
Генофонд популяций Северной Евразии, представляющих различные географические регионы и лингвистические группы, является высоко дифференцированным. Генетическая дифференциация населения региона в наибольшей степени коррелирует с антропологическими характеристиками.
В процессе формирования своего генного пула популяции славян, среднеазиатских европеоидов, обских угров, а также население Алтае-Саян являлись реципиентами значительного потока генов извне рассматриваемой системы, что соответствует активным миграционным событиям в различные периоды их этногенеза.
Апробация работы:
Основные результаты работы были представлены на итоговой конференции «Татьянин день» по результатам российского научного конкурса на лучшую студенческую работу студентов 1998 года по разделу «медицинские работы» (Москва, 1999); 31-й конференции Европейского общества генетики человека (Annual Meeting of theEuropean Socity of Human Genetics; Geneva, 1999); XXXVII и XXXVIII международных научных студенческих конференциях «Студент и научно-технический прогресс» (Новосибирск, 1999; 2000); на V и VI итоговых конференциях НИИ МГ «Генетика человека и патология»
10 (Томск, 2000; 2002); 1-ой международной конференции «Проблема вида и видообразования» (Томск, 2000); на втором (четвертом) российском съезде медицинских генетиков (Курск, 2000); международной конференции «Biodiversity and Dynamics of Ecosystems in North Eurasia» (BDENE, Novosibirsk, 2000); на международном симпозиуме «Молекулярные механизмы генетических процессов и биотехнология» (Москва, 2001); научных семинарах НИИ Медицинской генетики ТНЦ СО РАМН.
Публикации. По теме диссертации опубликовано 24 работы (6 в рецензируемых журналах, 8 статей в сборниках, 7 тезисов в отечественных материалах и 3 в зарубежных).
Структура и объем работы. Диссертационная работа изложена на 164 страницах машинописного текста и состоит из введения, обзора литературы, глав «Материалы и методы исследования» и «Результаты исследования и обсуждение», заключения, выводов, списка литературы и приложения. Работа проиллюстрирована 24 таблицами и 23 рисунками. Список литературы включает 212 источников, из них 99 работ отечественных авторов и 113 зарубежных.
Классификация языков и их формирование
Все современные люди, вероятно, произошли от относительно небольшой группы общих предков. Поскольку язык возник очень давно, возможно, даже ещё до окончательного формирования человека современного типа, то, скорее всего, члены вышеупомянутой небольшой группы говорили на одном языке, или нескольких довольно близких диалектах. Следовательно, все языки произошли от одного, и, изучив процесс их разделения можно представить себе и процесс разделения древних сообществ на современные народы (Иллич-Свитыч В.М., 1971). Существует несколько вариантов классификации языков - по общности происхождения, типологии, структуре звуков и так далее (Ruhlen М., 1997). Для вопросов этнической истории наибольшее значение имеет классификация по общности происхождения.
Изучением процесса изменения языка занимается множество специалистов, и их исследования привели к следующим результатам: наиболее родственные языки, разделившиеся относительно недавно, объединяются в языковые группы. Родственные группы, разделившиеся в более отдалённое время, сводятся в языковые семьи. Наконец, в последнее время ведётся работа по установлению генетических связей между отдельными языковыми семьями, и объединение их в макросемьи (Пучков П.И., 2003).
На данный момент общепризнанными можно считать две макросемьи -ностратическую и палеоевразийскую (она же сино-кавказская, и дене-кавказская). Говорят также и об аустрической макросемье, но её выделение более спорно, так как относимые к ней языки Юго-Восточной Азии довольно плохо изучены. Подавляющее большинство языков существующих или существовавших в Северной Евразии может быть отнесено к одной из двух вы шеупом янутых макросемей.
К первой (нострадической) макросемье относятся следующие языковые семьи: индоевропейская, афразийская, карвельтская, уральская, алтайская, тюркская, дравидская, эскимосо-алеутская, а также несколько языков не входящих в перечисленные семьи (японский, корейский, нивхский, айнский и юкагирский) (Пучков П.И., 2003).
Ко второй (палеоевразийской) относятся следующие семьи: абхазо-адыгская, нахско-дагестанская, хуррито-урартская, енисейская, сино-тибетская, на-дене, а также баскский язык и язык бурушаски (Серебренников Б.А. и др., 1982).
Предполагают (Swadesh М., 1955), что распад ностратического языкового единства произошел не раньше, чем 15 тыс. лет до н.э. Что касается локализации ностратической этноязыковой общности, то ее возникновение, как, впрочем, и распад, по-видимому, произошли где-то в Юго-Западной Азии. Можно определить и примерное время дивергенции праязыков разных семей, на которые раскололся ностратическии праязык: алтайский праязык распался на рубеже 6-5 тысячелетий до н.э. (впрочем, о наличии в прошлом единого алтайского праязыка высказываются некоторые сомнения), уральский - в 5-3 тысячелетиях до н.э., индоевропейский - в 4 - 3 тысячелетиях до н.э. или несколько ранее, эскимосско-алеутский - во 2 тысячелетии до н.э. Ареал возникновения и распространения индоевропейского праязыка, вероятно, находился где-то в Юго-Западной Азии между Верхней Месопотамией и Закавказьем. "Уральцы" до своего распада занимали территорию между Уральскими горами и рекой Обь, а "алтайцы" жили где-то в Средней Азии и примыкающих районах Ирана (Гамкрелидзе Т.В., Иванов В.В., 1982).
Еще одной макросемьей, отдаленно родственной ностратической макросемье является сино-кавказская (иначе дене-кавказская) макросемья (Бурлак С.А., Старостин С.А., 2001). Сравнив северокавказские, сино-тибетские и енисейские языки, лингвисты пришли к выводу об их отдаленном родстве. Также, предлагали отнести к сино-кавказской макросемье занимающий изолированное положение в лингвистической классификации баскский язык и распространенные в Северной Америке индейские языки на-дене. Дивергенция сино-кавказского праязыка произошла в 9 - 8 тысячелетиях до н.э. Где это случилось - не совсем ясно, однако есть определенные основания предполагать, что дивергенция могла произойти в одном из районов Юго-Западной Азии - в Анатолии или где-то восточнее.
При характеристике языковых групп, на которые разделено человечество, непременно встает вопрос о том, как эти лингвистические подразделения соотносятся с подразделениями антропологическими, то есть с человеческими расами. В научных работах, публиковавшихся в советский период, неизменно подчеркивалось об отсутствии какой-либо связи между этноязыковой и расовой принадлежностью. Для подтверждения этого тезиса в качестве примера нередко приводилась тюркская группа, в которой языковая близость действительно никак не сопровождается близостью расовой (Яхонтов С.Е., 1980; Якушин Б.В., 1985). В числе тюркоязычных народов можно встретить и европеоидов (турки, гагаузы, азербайджанцы и др.), и монголоидов (якуты, долганы, тувинцы, тофалары), и лиц смешанного европеоидно-монголоидного происхождения (туркмены, узбеки, киргизы, казахи, каракалпаки и т.д.). Однако такая позиция не учитывает то обстоятельство, что на ранней стадии истории человеческих популяций корреляция между языком и расой была гораздо более тесной, и только интенсивные миграции, сопровождавшиеся расовым смешением, нарушили во многих случаях эту связь (Десницкая А.В., 1984).
Носители ностратического праязыка были, бесспорно, европеоидами, о чем, в частности, свидетельствуют палеоантро пологи чески е находки, по месту и времени соответствующие предполагаемой прародине ностратической этноязыковой общности. Тем не менее, расовую однородность (даже на уровне большой расы) удалось сохранить далеко не всем ветвям, образовавшимся в результате распада ностратической этноязыковой общности. Полностью европеоидной осталась лишь малочисленная картвельская семья. Сохранила европеоидный облик и большая часть групп индоевропейской семьи, и лишь немногие народы индоарийской группы впитали в себя инородный (австралоидный) элемент (Пучков П.И., 2003).
Ряд народов уральско-юкагирской семьи получил большую или меньшую монголоидную примесь, хотя у основной части уральскоязычных этносов она заметна слабо. Лишь у хантов и манси монголоидные черты достаточно сильно выражены, а юкагиры вообще являются монголоидами.
Весьма сильно подверглись расовой "трасформащш" народы алтайской языковой семьи. Алтайская этноязыковая общность была, по-видимому, подобно другим общностям распавшегося ностратического этноязыкового единства, европеоидной, однако по мере продвижения на восток многие ее группы, сохраняя свои языки, все более поглощались в расовом отношении местным монголоидным населением. Лучше других удержали свои европеоидные морфологические черты некоторые народы тюркской группы, причем большинство юго-западных тюрков (турки и др.), если и были в какой-то мере метисированы, то при обратном движении на запад вновь впитали в себя европеоидный элемент, постепенно "растеряв" почти все приобретенные при движении в Восточном направлении монголоидные признаки. Предки же народов монгольской и тунгусо-маньчжурской групп, а также предки корейцев и японцев, двигаясь в восточном направлении, полностью "растеряли" все свои европеоидные черты. Такая же "монголизация" ожидала и предков эскимосов и алеутов (Пучков П.И., 2003).
Alu-повтор как генетический маркер
Alu-повторы, как генетический маркер, широко применяются для картирования генома, в клинической диагностике и характеристике геномных перестроек. Кроме того, полиморфизм Alu-повторов используют для изучения разнообразия генома человека на различных уровнях, и он может быть применен в анализе родословных и судебной экспертизе. Благодаря повсеместному распространению в геноме человека Аш повторы являются эффективными генетическими маркерами. Они применяются также при анализе геномных перестроек, что способствует пониманию некоторых процессов эволюции человека (Mnukova-Fajdelova Met al., 1994; Toda Y., Tomita M., 1997) и приматов (Hamdi H. et al., 1999; Szmulewicz M.N. et al., 1999) (рис. 7.).
Ряд свойств полиморфных Alu-повторов делают их очень удобными генетическими маркерами. К таким свойствам относятся высокая стабильность Alu-повторов, низкий уровень инсерций de novo, отсутствие механизма удаления из специфического локуса. Эти характеристики позволяют с высокой степенью надежности рассматривать инсерцию Alu-повтора в каждый из ло-кусов как независимое событие, произошедшее лишь однажды. Кроме того, природа перемещения Alu-повторов позволяет совершенно однозначно выявить начальное (отсутствие Alu-повтора в данном локусе) и конечное (ин-серция Alu) аллельное состояние локуса. Иными словами, для Alu-повторов, в отличие от других полиморфных диаллельных систем, всегда известно предковое состояние и направление мутации. Наконец, генотипирование подиморфных Alu-повторов отличается методической простотой (Novick G.E. et al., 1996; Stoneking M. et al., 1997).
В настоящее время полиморфные Alu-повторы, наряду с другими системами генетических маркеров (микросателлиты, митохондриальная ДНК, Y-хромосома, SNP) широко используются для анализа филогении и эволюции популяций человека и характеристики структуры генофондов современных популяций. Исследования по генетическому разнообразию популяций человека с помощью Alu-повторов ведутся в нескольких исследовательских центрах США и Европы, а также в России (Степанов В.А. и др., 2001; Хитрин-ская И.Ю. и др., 2001; Batzer М.А. et al., 1996; Stoneking М. et al., 1997; Ma-jumder P.P., 1999; York D.S., 1999; Nasidse I. et al., 2001). Полученные данные позволили охарактеризовать спектр генетического разнообразия по Alu-повторам у населения мира и подтвердить основные миграционные пути заселения территории земного шара современным человеком.
Анализ полиморфизма нескольких Alu-повторов у населения мира показал, что данные по распределению Alu-повторов в популяциях соответствуют гипотезе африканского происхождения современного человека (Batzer М.А. et al., 1996; Stoneking М. et al., 1997). Генетическое разнообразие африканских популяций выше, чем в популяциях других континентов. Время разделения африканских и не африканских популяций, согласно данным по Alu-повторам соответствует 137000 ± 15000 лет. Кроме того, было показано, что популяции Австралии и Новой Гвинеи почти так же близки к гипотетическому предку как и африканские популяции, что возможно говорит о ранней экспансии современного человека в Австралазию.
Среди немногочисленных примеров региональных исследований генофонда с помощью Alu-повторов можно привести такие как, уточнение генетических взаимоотношений между различными группами американских индейцев (Novick G.E. et al.,1998), рядом Кавказских этносов (Nasidse I. et al., 2001); реконструкцию генетико-исторических связей между коренными этническими группами Индостана (Majumder P.P., 1999). Наши собственные исследования посвящены реконструкции эволюционной истории населения севера Евразии (Степанов В.А. и др., 1999; Степанов В.А. и др., 2001; Хит-ринская И.Ю. и др., 2001).
Таким образом, в данном разделе мы обобщили современные данные о происхождении и эволюции Alu-повторов, механизмах их ретропозиции и использовании в качестве генетических маркеров в медицинской и популя-ционной генетике. Alu-повторы продолжают генерировать геномное разнообразие и их амплификация привела к тому, что сформировалось самое большое семейство мобильных элементов в геноме человека. Несколько тысяч Alu-повторов встроились в геном человека после расхождения приматов и человека и некоторые перемещения Alu-повторов в геноме являются причиной нарушения функции генов находящихся в сайте ретропозиции, что в некоторых случаях является мутацией, вызывающей фенотипический эффект в виде заболевания. Кроме того, рекомбинация между Alu-повторами вносит свой вклад в генетическое разнообразие человека и связана с различными генетическими болезнями человека. Многие Alu-повторы влияют на экспрессию генов путем их метилирования. Хотя некоторые Alu-повторы несут «вредные» мутации, подавляющее большинство недавно интегрировавших Alu не оказывает видимого негативного влияния на геном и представляют нейтральные мутационные события. Именно эти полиморфные Alu-повторы являются удобными генетическими маркерами для изучения взаимодействия между популяциями, их происхождения.
Материал исследования составили 34 популяционные выборки, принадлежащие 19 этническим группам, проживающие на территории Сибири, Средней Азии, Дальнего Востока и Восточной Европы. Общая численность суммарной выборки составила 2383 человека. Лингвистические и антропологические характеристики этнических групп приведены в таблице 2. Территориальное расположение изученных этнических групп представлено на рисунке 8.
Исследованные этнические группы относятся к двум основным расовым типам населения Евразии (европеоидному и монголоидному) н говорят на языках шести лингвистических семей - алтайской, индоевропейской, сино-тибетской, уральской, чукотско-камчатской, эскимосо-алеутской и палеоазиатской. В обследование включались индивиды неметисированные по крайней мере в трех поколениях. Северные алтайцы представлены двумя популяциями собранными в г. Горно-Алтайске и пос.Курмач-Байгол Туро-чакского района. Южные алтайцы представлены тремя сельскими популяциями: Кулада, Бешпельтир и Кош-Агач. В республике Тува обследованы три территориально дистанцированных популяции: пос. Тэли (запад Тувы), пос. Кунгуртуг (юго-восток республики) и пос. Тоора-Хем (северо-восточная часть Тувы). Буряты представлены четырьмя популяциями: г. Улан-Удэ, пос. Хурамша (30 км к западу от Улан-Удэ), пос. Курумкан (север Бурятии) и пос. Агинское (Агинский Бурятский автономный округ Читинской области). Три популяционные выборки эвенков собраны на территории Читинской области в пос. Тунгокочен (240 км к северо-востоку от Читы), пос. Чара (650 км к северо-востоку от Читы) и в пос. Тупик и Маклакан Тулик-Олёкминского района Читинской области (олёкминские эвенки). Популяция кетов собрана в пос. Келлог Туруханского района Красноярского края.
Меры генетической дифференциации популяций
На основании попарных расстояний, создавали матрицы генетических расстояний между популяциями. Для получения наиболее вероятной конфигурации генетического древа мы использовали бутстреп-перегруппировку (bootstrap) данных. Из исходного массива данных по частотам аллелей создавали 500 бутстреп-реплик, в каждой из которых один из локусов (случайно выбранный) был замещен дубликатом одного из оставшихся (случайно выбранных) локусов. На основании 500 бутстреп-реплик строили 500 реплик матрицы генетических расстояний и 500 реплик генетического дерева. Филогенетические деревья популяций строили с помощью алгоритма объединения "ближайших соседей" (neighbor joining) (Satou N., Nei M, 1987), реализованного в пакете программ PHYLIP (Felsenstein J., 1993). Консенсусные дендрограммы генетических взаимоотношений между популяциями создавали с помощью программы CONSENS. При построении древа по Alu-повторам в качестве внешнего корня использовали гипотетическую предковую популяцию для которой частота Alu-инсерций во всех локусах была установлена равной 0. Воссоздание генетической структуры «предковой» (по отношению к современным популяциям человека) популяции возможно по причине однонаправленного характера мутаций в локусах полиморфных ий-серций Alu-элемента. Исходным состоянием локуса всегда является отсут-свие копии Alu-iroBTOpa, а конечным - инсерция Alu-элемента.
Для выявления генетических взаимоотношений мы применяли также факторный анализ. Для выявления интегральных характеристик (факторов), обуславливающих изменчивость генных частот в популяциях использовали метод главных компонент (Ким Дж.О., Мьюллер Ч.У., 1989). Цель факторного анализа состоит в том, чтобы обнаружить сравнительно небольшое количество латентных (скрытых) факторов, которые объясняют связи (зависимости) между наблюдаемыми переменными. При этом количество выделяемых факторов существенно меньше числа наблюдаемых переменных, поэтому факторный анализ можно рассматривать как метод редукции данных. В основе метода главных компонент лежит предположение о том, что число факторов равно числу исходных признаков (k=m), а характерные факторы вообще отсутствуют: Очевидно, уравнения определяют здесь систему преобразования одних параметров в другие. Поскольку число факторов равно числу исходных параметров, задача искомого преобразования решается однозначно, т.е. факторные нагрузки определяются в этом методе однозначно.
Каждая из переменных Fj называется здесь і-и главной компонентой. Метод главных компонент состоит в построении факторов - главных компонент, каждый из которых представляет линейную комбинацию исходных признаков. Первая главная компонента F] определяет такое направление в пространстве исходных признаков, по которому совокупность объектов (точек) имеет наибольший разброс (дисперсию). Вторая главная компонента F2 строится с таким расчетом, чтобы ее направление было ортогонально направлению Fj и она объясняла как можно большую часть остаточной дисперсии, и т.д. вплоть до т-й главной компоненты Fm. Так как выделение главных компонент происходит в убывающем порядке с точки зрения доли объясняемой ими дисперсии, то признаки, входящие в первую главную компоненту с большими коэффициентами аи [i = i,m) оказывают максимальное влияние на дифференциацию изучаемых объектов.
Как и в факторном анализе, целью многомерного шкалирования является нахождение скрытых (латентных) факторов, определяющих структуру исходных переменных. Однако в отличие от факторного анализа, который основывается на корреляционной матрице анализируемых переменных, многомерное шкалирование имеет дело с матрицей сходств или различий. При этом совершенно не обязательно использовать очень точные измерения; единственным требованием к этим величинам является сохранение в них информации о рангах, т.е. отношении порядка наблюдаемых величин (например, чтобы большее значение сходства соответствовало большему реальному сходству между объектами) (Дэйвинсон М, 1988).
Основное предположение многомерного шкалирования заключается в том, что существует некоторое метрическое пространство существенных базовых характеристик, которые неявно и послужили основой для полученных эмпирических данных о близости между парами объектов. Следовательно, объекты можно представить как точки в этом пространстве. Предполагают также, что более близким (по исходной матрице) объектам соответствуют меньшие расстояния в пространстве базовых характеристик. Таким образом, многомерное шкалирование - это совокупность методов анализа эмпирических данных о близости объектов, с помощью которых определяется размерность пространства существенных для данной содержательной задачи характеристик измеряемых объектов и конструируется конфигурация точек (объектов) в этом пространстве. Основная идея метода состоит в приписывании каждому объекту значений координат, так, чтобы матрица евклидовых расстояний между объектами в этих координатах, помноженная на константу оказалась близка к матрице расстояний между объектами, определенной из каких-либо соображений ранее.
Кроме того, по аналогии с методом главных компонент, первая шкала выбирается с наибольшей дисперсией, вторая - имеет вторую наибольшую дисперсию и т.д. В работе используется неметрическое многомерное шкалирование раз-работаннное Шепардом и Краскэлом (Shepard R.N.,1962; Kxuscal J.B.,1964). Суть этого метода состоит в нелинейном преобразовании расстояний. Модель неметрического шкалирования имеет вид: где MfS} - монотонное преобразование исходной матрицы расстояний, D2 -матрица расстояний, полученная на основе созданных шкал, Е - матрица отклонений модели от исходных данных. Монотонное преобразование дает матрицу преобразованных расстояний T L{S}. Для определения относительной интенсивности потока генов для каждой популяции использовалась регрессионная модель впервые предложенная Харпендингом и Уордом (1982). Они разработали модель зависимости гетерозиготности и генетического расстояния между популяциями и показали, что в условиях равного потока генов извне во все «островные» популяции генетическое разнообразие «островных» популяций и расстояние частот аллелей в этих популяциях от центроида (средней частоты аллеля в тотальной популяции) связаны линейной зависимостью.
Филогенетический анализ населения мира
На протяжении большей части своей истории вид Homo sapiens распадался на племена, или группы, связанные близкородственными узами. Место происхождения и пути распространения по земному шару популяций человека - это проблема, которая всегда интересовала ученых в различных областях науки. Для решения этой проблемы можно попытаться оценить степень близости ныне живущих популяций с помощью филогенетического анализа населения мира используя 7 полиморфных Alu-повторов. Генетическое расстояние между популяциями тем меньше, чем меньше времени прошло с момента их разделения, или чем активнее строились взаимоотношения между представленными этносами.
Для того чтобы определить место исследованных нами популяций на филогенетическом древе человечества, мы провели кластерный анализ массива данных, состоящего из исследованных нами этно-популяционных групп и 42 популяций, описанных ранее (Batzer М.А. et.al., 1996; Stoneking N. et. al., 1997; Comas D. et al., 2000; Nasidse Iv. et al., 2001; Romualdi C. et al., 2002) (табл. 9). На основании частот аллелей по 7 локусам Alu-повторов была построена матрица генетических расстояний между 62 популяциями и эволюционное дерево, отражающее филогенетические взаимоотношения между популяциями. Для получения наиболее вероятной конфигурации генетического древа мы использовали бутстреп-метод перегруппировки данных, как было описано ранее (раздел 3.3).
Полученное в результате древо представлено на рисунке 23. В качестве внешнего корня для филогенетического дерева использовали гипотетическую предковую популяцию (корень), в которой частота Alu-инсерции (ал-леля «+») по каждому из локусов была установлена равной 0.
В представленном дереве, полученном на основе анализа семи локусов AIu-повторов, сложно выделить какие-либо кластеры, однако прослеживается тенденция к объединению популяций в группы, относящих их к определенным географическим регионам, лингвистическим группам и расово-этническим образованьям.
Предковая популяция оказалась наиболее близка к современным африканским популяциям, что соответствует представлениям об монофилети-ческом африканском происхождении современного человека. Все африканские популяции образуют единую группу, в которой они значительно отдалены друг от друга, что может быть индикатором возраста популяций, большой генетической дифференциации и генетического разнообразия. R.L. Сапп с соавторами (1987) по данным мтДНК, а позднее L.L. Cavalli-Sforza (1994) на основе анализа «классических» маркеров показали, что вид Homo sapiens имеет африканское происхождение. Они обнаружили, что генетические расстояния между африканскими и неафриканскими популяциями превышают соответственные величины для других межконтинентальных сопоставлений. Именно этого следует ожидать, если африканская ветвь была первой и самой древней на родословном древе человека. Из Африки могли начаться миграции в Азию через Суэцкий перешеек, а позднее из Азии в Европу.
За африканским кластером следуют популяции Северо-Кавказской языковой семьи (даргинцы, ингуши, кабардинцы), затем другие европеоидные популяции, относящиеся к индо-европейской и семито-хамитской языковым семьям. В эту часть древа попадают также изученные нами популяции славянской группы: русские и украинцы. Следующее ветвление филогенетического дерева разделяет популяции Австралии и Океании (горных и прибрежных жителей Папуа - Новой Гвинеи и аборигенов Австрании) и все оставшиеся популяции. Соседство с индусами и пуштунами позволяет подтвердить заселение Австралии выходцами из Азии. Отдельной группой на древе представлены четыре популяции, относящиеся к алтайской языковой семье (киргизы, эвенки, южные алтайцы и казахи). Ханты, манси, узбеки и таджики занимают промежуточной положение при переходе к монголоидной части древа. Таджики и узбеки кластеризуются с другими индоиранскими народами, что вполне предсказуемо для таджиков и соответствует их антропологической и лингвистической принадлежности. Что же касается узбеков, то, несмотря на тюркский язык и некоторую примесь монголоидных черт в их антропологическом типе, их генетическая близость к таджикам и положение в индоиранском подкластере свидетельствует, вероятно, о преимущественно индоиранском происхождении их генофонда. Дунгане, выходцы из Китая, располагаются с китайцами в одном кластере.
Что касается изученных нами популяций Восточной Сибири (якуты и буряты) и Дальнего Востока (эскимосы, нивхи, чукчи), то они расположены на древе вместе популяциями американских индейцев и Юго-Восточной Азии. Таким образом, при рассмотрении генетической кластеризации популяций различных регионов земного шара, используя инсерционно-делеционный полиморфизм, можно провести аналогию с антропологической классификацией. Четко выделяются два ствола: восточный амеро-азиатский и западный евроафриканский, а внутри этого деления более дробные расовые подразделения. В пределах восточного ствола - американоидная и азиатская ветви, а для западного - европеоидная, негроидная и австралоидная ветви.