Содержание к диссертации
Введение
Глава 1. Обзор литературы 13
1.1. Использование метода штрих-кодирования ДНК для выявления таксономической принадлежности организмов 13
1.1.1. Штрих-кодирование ДНК, его суть и основные подходы 13
1.1.2. Участок ДНК для «штрих-кодирования» организмов 15
1.1.2.1. Рибосомная ДНК (рДНК) 15
1.1.2.2. Хлоропластная ДНК (хлДНК) 18
1.1.2.3. Митохондриальная ДНК (мтДНК) 22
1.1.3. Молекулярно-филогенетический анализ 24
1.1.4. Метабаркодирование ДНК 26
1.1.5. Материалы для штрих-кодирования ДНК 29
1.1.6. Ограничения штрих-кодирования ДНК 30
1.2. Методы молекулярно-генетической идентификации организмов 31
1.2.1. ПЦР в реальном времени с использованием зондов 32
1.2.1.1. Молекулярные маяки («molecular beacons») 32
1.2.1.2 TaqMan зонды 33
1.2.2. Секвенирование следующего поколения (NGS) 35
1.2.2.1. 454 (Roche) пиросеквенирование 37
1.2.2.2. Ion Torrent 39
1.2.2.3. Illumina (Solexa) 40
Глава 2. Экспериментальная часть 42
2.1. Объекты и методы исследования 42
2.1.1. Объект исследования 42
2.1.2. Методы исследования 43
2.1.2.1. Выделение ДНК из биоматериала с помощью ЦТАБ - буфера 43
2.1.2.2. Выделение ДНК с помощью набора Quick – gDNA MiniPred (Zymo Research) 43
2.1.2.3. Проведение ПЦР 44
2.1.2.4. Проведение ПЦР в реальном времени 45
2.1.2.5. Гель - электрофорез в 2% агарозном геле 45
2.1.2.6. Экстракция ДНК из агарозного геля с помощью набора Cleanup Standard (Евроген, Россия) 46
2.1.2.7. Рестрикционный анализ (ПЦР – ПДРФ) 46
2.1.2.8. Разработка TaqMan зондов 47
2.1.2.9. ПЦР с TaqMan зондами 48
2.1.2.10. Секвенирование 49
2.1.2.11. Статистические алгоритмы и компьютерные программы, использованные для анализа полученных последовательностей 49
Глава 3. Результаты и их обсуждение 51
3.1. Дифференциация видов клопов рода Eurygaster Laporte, 1833 (Hemiptera: Heteroptera: Scutelleridae), основных вредителей зерновых культур в европейской части России, на основе морфологических признаков и штрих кодирования ДНК 51
3.1.1. Возможности дифференцировки видов клопов рода Eurygaster по морфологическим характеристикам 51
3.1.2. Идентификация клопов рода Eurygaster на основе секвенирования гена субъединицы 1 митохондриальной цитохромоксидазы 57
3.1.3. Разработка метода для экспресс - идентификации наиболее вредоносного вида для злаковых культур - Eu. integriceps 63
3.2. Дифференциация коммерчески доступных видов клещей родов Amblyseius и Neoseiulus (Acari: Phytoseiidae) с помощью молекулярно-генетических методов 67
3.2.1. Штрих-кодирование ДНК клещей родов Amblyseius и Neoseiulus 67
3.2.2. Разработка метода быстрой дифференциации коммерчески доступных видов клещей родов Amblyseius и Neoseiulus (Acari: Phytoseiidae) на основе рестрикционного анализа 73
3.3. Дифференциация подвидов медоносных пчел России на основе штрих кодирования ДНК и с помощью мутагенной ПЦР-ПДРФ 75
3.3.1. Штрих-кодирование ДНК подвидов медоносных пчел России 75
3.3.1. Разработка метода дифференциации ключевых пород медоносных пчел в России на основе мутагенной ПЦР-ПДРФ 83
Заключение 89
Перечень сокращений и условных обозначений 93
Список литературы 95
Приложение А 128
- Хлоропластная ДНК (хлДНК)
- 454 (Roche) пиросеквенирование
- Разработка метода для экспресс - идентификации наиболее вредоносного вида для злаковых культур - Eu. integriceps
- Разработка метода дифференциации ключевых пород медоносных пчел в России на основе мутагенной ПЦР-ПДРФ
Хлоропластная ДНК (хлДНК)
Обманчиво простая задача выбора подходящего локуса для использования в качестве штрих-кода растения оказалась гораздо более сложной, чем ожидалось, и вызвала серьезные споры. Несмотря на отсутствие консенсуса по универсальному штрих-коду растений, таксономисты, экологи, биологи-эволюционисты и специалисты по охране окружающей среды уже предполагают применение генетического идентификатора для широкого круга исследований и прикладных программ (Mace, 2004). Широкомасштабное стандартизированное секвенирование митохондриального гена CО1 сделало ДНК-штрих-кодирование эффективным инструментом идентификации видов во многих группах животных (Gustafsson et al., 2016; Camargo et al., 2016; Katugin et al., 2017; Gandolfi et al., 2017; Wang et al., 2018). У растений, однако, низкие показатели замещения мтДНК привели к поиску альтернативных областей штрих-кодирования.
Хлоропласты – характерные органеллы растительных клеток. В них проходят многочисленные важные метаболические пути, включая фотосинтез, который делает хлоропласты основным источником химической энергии на Земле (Zoschke and Bock, 2018). ХлДНК очень часто использовалась в систематических и филогенетических исследованиях растений (Yang et al., 2015; Meng et al., 2019; Li et al., 2019; Chen et al., 2020). Это круглая молекула размером 120–217 т.п.н., за исключением зеленой водоросли Floydiella terrestris с огромной хлДНК размером 521 168 п.н. (Gyulai et al., 2012).
В геноме хлоропласта около 100 функциональных генов. Он содержит, за некоторыми исключениями, две повторяющиеся области в обратной ориентации, известные как инвертированные повторы размером 10–76 т.п.н., которые делят геном хлоропласта на большую и малую единичную копию регионов. Структурная организация генома хлоропласта высоко консервативна, т.е. не содержит относительно больших делеций, вставок, транспозиций, инверсий и SNP (однонуклеотидный полиморфизм), что делает его полезным для филогенетических исследований. Кроме того, хлДНК относительно многочисленна (обычно 50 хлоропластов на клетку, умноженные на 50 копий хлДНК на хлоропласт) по сравнению с ядерной ДНК (обычно 2n.), что облегчает выделение и анализ ДНК. ХлДНК обычно передается по наследству (по материнской линии у покрытосеменных и по отцовской у голосеменных растений, за исключением некоторых видов), что облегчает определение материнского родителя у гибридов и аллополиплоидов (Ackerfield and Wen, 2003).
Одной из самых больших проблем при достижении согласия по штрих коду растений было отсутствие сравнительных данных, охватывающих все маркеры-кандидаты и обширную таксономическую выборку. Из первоначальных исследований пластидных областей (Chase et al., 2007; Pennisi, 2007; Ford et al., 2009) появилось несколько ведущих кандидатов (Kress and Erickson, 2007). Четыре являются частями кодирующих генов (matK, rbcL, rpoB и rpoC1), а 3 являются некодирующими спейсерами (atpF-atpH, trnH-psbA и psbK-psbI) (табл.1). К сожалению, очень немногие из этих локусов достаточно вариабельны, чтобы идентифицировать или различать виды растений при их использовании по отдельности. Это приводит к использованию нескольких комбинаций локусов, таких как rbcL + matK, rpoC1 + rpoB + matK, rpoC1 + matK + trnH – psbA, rbcL + trnH –PsbA, matK + atpF-H + psbK-I и matK + atpF-H + trnH-psbA (Нигматуллина и др., 2018; Cunoud et al., 2002; Fazekas et al., 2008; Erickson et al., 2008; Hollingsworth et al., 2009; Seberg, 2009).
Пожалуй, наиболее популярным хлоропластным маркером в филогенетических исследованиях растений является ген matK (Нигматуллина и др., 2018). Ген хлоропластной матуразы K (matK) является одним из наиболее вариабельных кодирующих генов покрытосеменных растений и считается «штрих-кодом» для наземных растений (McNeal et al., 2009). Ген matK имеет длину приблизительно 1570 п.н. и кодирует белок матуразы (рис.2).
Кодирующая область matK обычно находится в интроне гена trnK хлоропласта, за исключением некоторых папоротников, в которых она кодирует тРНК. Будучи кодирующим регионом, очень высокая скорость эволюции matK сделала его пригодным для использования в филогенетических исследованиях на высоких таксономических уровнях, таких как порядок или семейство, а иногда и на низких таксономических уровнях, таких как род или вид (Duan et al., 2019).
Имеются сведения, что ген matK не может быть использован в филогенетических исследованиях близких видов, так как данный участок в этом случае становится малоинформативным (Dizkirici et al., 2016). К примеру, последовательности гена у всех четырех видов диких диплоидных пшениц оказались идентичны (Golovnina et al., 2007). Huang et al., изучая пластидные гены Acc-1 и Pgk-1, которые кодируют белки ацетил – CoA карбоксилазу и 3-фосфоглицераткиназу, соответственно, выяснили, что хлоропластные геномы Aegilops speltoides и Trticum aestvum тесно связаны. Также, к Trticum aestvum оказался близок по этим генам Trticum urartu (Huang et al., 2002; Нигматуллина и др., 2018).
454 (Roche) пиросеквенирование
Технология 454 была первой из платформ NGS, представленных в 2005 году. Данный процесс носит название пиросеквенирование, которое включает генерацию света за счет каскада реакция, происходящих после высвобождения пирофоската. Дуплексная ДНК сначала разрезается на более мелкие фрагменты, за которыми следует лигирование адаптеров с обеих сторон фрагмента, комплементарных последовательностям праймеров (Shrestha et al., 2014). Эти адаптеры действуют как сайт для связывания праймеров и инициируют процесс секвенирования. Каждый фрагмент ДНК связан с эмульсионными микросферами, так что соотношение ДНК: микросфера составляет 1: 1. Затем следует амплификация каждой нити с помощью эмульсионной ПЦР, и после нескольких циклов получается много копий этих молекул ДНК на одну микросферу (Shrestha et al., 2014).
Иммобилизованные ферменты, включая ДНК-полимеразу, АТФ сульфурилазу, люциферазу и апиразу, добавляют в лунки в волоконно-оптическом планшете, содержащем по одной амплифицированной микросфере. Затем по очереди подается каждый из четырех dNTP. Комплементарный dNTP включается в цепь с помощью ДНК-полимеразы. Этот процесс сопровождается высвобождением пирофосфата (PPi), с которым взаимодействует ATФ-сульфорилаза, превращая его в ATФ. При наличии сгенерированной АТФ фермент люцифераза превращает люциферин в оксилюциферина, что сопровождается световым сигналом, который пропорционален количеству АТФ (Ambardar et al., 2016). Интенсивность полученного сигнала фиксируется CCD-камерой. Как только сигнал получен и обработан, фермент апираза расщепляет существующие нуклеотиды и АТФ, и затем добавляется следующий нуклеотид. Недавно эта методика была дополнена секвенированием «paired-end», где адаптеры связаны с обоими концами фрагментированной ДНК, что приводит к секвенированию с обоих концов. Основным преимуществом этого метода является его большая длина прочтения. В отличие от других технологий NGS, технология 454 дает длину чтения 400 пар оснований и может генерировать более 1 000 000 отдельных операций чтения за цикл. Эта функция наиболее оптимальна для сборки геномов de novo и изучения метагеномов (Keijser et al., 2008; Harrington et al., 2013). У данного типа секвенаторов есть проблема с прочтением гомополимеров, так как 8-10 повторяющихся нуклеотидов не дает возможности точно подсчитать их количество (Fakruddin et al., 2012).
Разработка метода для экспресс - идентификации наиболее вредоносного вида для злаковых культур - Eu. integriceps
Учитывая тот факт, что нуклеотидная последовательность Eu. integriceps существенно отличается от таковой двух других видов, и к тому же он является наиболее опасным представителем данного рода, была разработана система для экспресс - идентификации данного вида на основе молекулярно-генетических маркеров. Помимо того, что генетический анализ позволяет идентифицировать вид клопа не специалисту энтомологу, существенным преимуществом молекулярно-генетического анализа является также возможность проведения идентификации вредителя независимо от пола и на любой стадии развития, что в ряде случае невозможно сделать по морфологическим признакам. Данный подход может быть полезен для раннего обнаружения вредителя на злаках, т.к. на I-III личиночных стадиях развития Eu. integriceps очень сложно или невозможно отличить от других видов того же рода. В качестве таких методов нами были апробированы два подхода: ПЦР с TaqMan зондами и ПЦР-ПДРФ.
Нами был проведен анализ последовательностей и идентифицированы наиболее подходящие участки для присоединения зонда и праймеров. Всего были апробированы два сайта в пределах последовательности гена цитохромоксидазы несущие SNP. Были разработаны праймеры и потенциальные зонды для быстрой идентификации видов клопов рода Eurygaster (табл. 8), которые удовлетворяли следующим параметрам: 1) GC состав: 20-80% для праймеров и зондов; 2) длина праймеров от 20 до 30 п.н.; 3) минимальное содержание G/C на 3 конце праймеров; 4) отсутствие на 5 - конце зонда G; 5) размер ПЦР – продукта от 50 п.н. до 200 п.н.; 6) отсутствие димеров; 7) температура отжига зонда должна быть по крайней мере на 5 C выше температуры отжига праймеров; 8) минимум одинаковых нуклеотидов подряд в составе зонда.
При проведении ПЦР реакция оптимизировалась, как по температуре, так и по концентрации ДНК и праймеров/зондов. После многократного проведения ПЦР в реальном времени с данными зондами так и не удалось достичь 100% положительного результата, как для Eu. integriceps, так и для Eu. maura/Eu. testudinaria. В целом, на 7 положительных результатов приходилось два отрицательных результата. Под отрицательным результатом подразумевается отжиг зонда, предназначенного для одного из видов клопа, на другом виде клопа. Таким образом, проведение идентификационных процедур на основе Taqman зондов является не подходящим.
Другим способом экспресс идентификации наиболее опасного вида клопа служил ПЦР-ПДРФ. Предварительно нами был проведен анализ нуклеотидных последовательностей гена цитохромоксидазы, длиной 658 п.н. у разных видов клопов-черепашек на наличие сайтов рестрикции, которые бы различались между этими видами и были наиболее удобны при электрофоретическом анализе в агарозном геле. В конечном итоге, нами были выбраны следующие рестриктазы: Ahl I, BamH I, Bst2U I, Psi I (табл.9) (Syromyatnikov et al., 2017):
Выделение ДНК из клопов осуществляли наиболее подходящим способом (см. главу «Материалы и методы»). При проведении ПЦР использовали следующие температурные циклы: «94 С 4 мин, 35 циклов; 94 С 30 сек, 58 С 30 сек, 72 С 40 сек, конечная элонгация -72 С 8 мин» (Сыромятников и др., 2017). В качестве праймеров использовали следующие: прямой: GAATATGAGCCGGAATAGTAGGA, обратный: ATGTGTTGAAGTTACGGTCA.
Данные праймеры высокоспецифичны к роду Eurygaster sp. и амплифицируют продукт гена цитохромоксидазы субъединицы 1 длиной 569 п.н.
Продукты ПЦР подвергали рестрикции по следующей схеме: «к 10 мкл ПЦР продукта добавляли 1,5 мкл 10Х реакционного буфера, индивидуального для каждой рестриктазы и 10 ед. рестриктазы. Объем доводили до 15 мкл деионизированной водой. Инкубировали смесь в течение 1,5 часов при 37 С, фермент инактивировали нагревом до 75 С в течение 15 минут. Визуализацию продуктов рестрикции проводили с помощью электрофореза в 2 % агарозном геле» (Сыромятников и др., 2017; патент РФ № 2617935 C1).
При проведении рестрикционного анализа были получены положительные результаты. Теоретически ожидаемые фрагменты ДНК были получены для всех, анализируемых видов и для всех используемых рестриктаз (рис. 10). Примечательно, что для идентификации Eu. integriceps можно использовать любую из представленных рестриктаз.
«Предлагаемый способ идентификации вредной черепашки является высокочувствительным, хорошо воспроизводимым и не дорогим. В зависимости от используемого способа выделения ДНК из биологических образцов анализ занимает от 4,5 до 6 часов. Анализ можно проводить в лабораториях, имеющих термоциклер, центрифугу, камеру для электрофореза и сопутствующие реактивы и расходные материалы» (патент РФ № 2617935 C1).
Разработка метода дифференциации ключевых пород медоносных пчел в России на основе мутагенной ПЦР-ПДРФ
Следующим этапом явилось разработка молекулярно-генетического метода для быстрой идентификации подвидов пчел на основе полиморфизма длины рестрикционных фрагментов. При первоночальном in silico скрининге последовательностей и присутствующих там SNP нами не было найдено такой комбинации ферментов рестрикции, которая бы позволяла дифференцировать подвидов пчел на основе классической ПЦР-ПДРФ. Далее осуществляли разработку праймеров для проведения мутагенной ПЦР-ПДРФ. Праймеры разрабатывали так, чтобы продукты ПЦР были в диапазоне 120-160 п.н. для их хорошего разделения в агарозном геле (патент РФ №2653435 C1) (табл. 12).
Разработанные пары праймеров образуют продукты длина которых варьировала между 138 и 150 п.н. Мутагенный праймер несет искусственную замену нуклеотида (либо двух нуклеотидов) на 3 конце таким образом, чтобы вместе с SNP характерной для каждого из подвидов формируется сайт узнавания для какой-либо эндонуклеазы рестрикции. Кроме того, рестриктазы подбирались таким образом, чтобы отсутствовал не специфический сайт рестрикции внутри амплифицированной последовательности. Разработанные маркеры и ожидаемые длины фрагментов представлены в таблице 13.
Для A. mellifera carpatica и A. mellifera carnica при обработке рестриктазой HspA I продукта ПЦР, полученного с помощью пары праймеров AmCarp-f и AmCarp-r, образуется фрагменты длинами 111 и 30 п.н. (рис. 14). Для остальных подвидов не происходит разделения на 2 фрагмента.
A. mellifera carnica можно отличить от других подвидов пчел при обработке рестриктазой Msp I продукта ПЦР, полученного с помощью пары праймеров AmCar-f и AmCar-f. Образуются фрагменты длиной 118 и 30 п.н. (рис. 15). Для других подвидов не происходит разделения на 2 фрагмента.
Однако, необходимо отметить, что в 13% случаев наблюдается идентичная картина электрофореза для A. mellifera carnica и A. mellifera carpatica. Таким образом, в некоторых случая невозможно дифференцировать A. mellifera carnica и A. mellifera carpatica. Для среднерусской породы пчел первого гаплотипа при обработке рестриктазой Alu I продукта ПЦР, полученного с помощью пары праймеров AmEu1-f и AmEu1-r, образуется фрагменты длинами 107 и 32 п.н. (рис. 16). Для других трёх подвидов, а также второго гаплотипа среднерусской пчелы не происходит разделения на 2 фрагмента. Для A. mellifera mellifera второго гаплотипа при обработке рестриктазой Hinf I продукта ПЦР, полученного с помощью пары праймеров AmEu2-f и AmEu2-r, образуется фрагменты длинами 122 и 28 п.н. (рис. 17). Для других трёх подвидов, а также первого гаплотипа среднерусской пчелы не происходит разделения на 2 фрагмента (патент РФ №2653435 C1).
Для A. mellifera caucasica отсутствуют сайты рестрикции для всех вышеперечисленных ферментов рестрикции. Поэтому для идентификации данного подвида медоносных пчел необходимо проведение ПЦР со всеми вышеперечисленными праймерами и ферментами рестрикции.
«Данный метод является очень удобным поскольку требует недорого оборудования, такого как: центрифуга, термостат, ПЦР-амплификатор и электрофорезная камера, а также наличие не дорогостоящих реактивов и расходных материалов. При этом отсутствует потребность в проведение секвенирования, что также облегчает задачу, поскольку секвенирование требует либо наличия дорогостоящего оборудования и реактивов, либо требует транспортировки образцов в лабораторию, которая осуществляет секвенирование, что также сопряжено с дополнительными материальными и, особенно, временными затратами. В случае вышеописанной методики анализа время анализа составляет от 4 до 6 часов в зависимости от метода выделения ДНК» (патент РФ №2653435 C1).