Содержание к диссертации
Введение
Глава 1. Онтогнетическая структура популяций растений и лишайников 7
1.1 Календарный и биологический возраст особи 7
1.2 Параметры, характеризующие онтогенетический спектр популяции 8
1.3 Гетерогенность выборки из популяции . 11
Глава 2. Материалы и методы . 17
2.1 Методы ресамплинга 17
2.2 Метод главных компонент 21
2.3 Регрессионная модель для упорядоченных классов 22
2.4 Материалы по онтогенетическим спектрам природных популяций 26
Глава 3. Гетерогенность онтогенетических спектров популяций 30
3.1 Онтогенетические спектры манжетки обыкновенной (Alchemilla vulgaris L.s.l.) 30
3.2 Онтогенетические спектры брусники обыкновенной (Vaccinium vitis-idaea L.) . 37
3.3 Онтогенетические спектры гипогимнии вздутой (Hypogymnia physodes L.) . 39
3.4 Онтогенетические спектры эвернии сливовой (Evernia prunastri (L.) Ach.) . 40
3.5 Онтогенетические спектры псевдэвернии шелушащейся (Pseudevernia furfuracea (L.) Zopf) 43
3.6 Резюме 45
Глава 4. Оценка и сравнение параметров онтогенетических спектров популяций . 46
4.1 Алгоритм процедуры 46
4.2 Анализ выборок Alchemilla vulgaris . 52
4.3 Анализ выборок Vaccinium vitis-idaea . 59
4.4 Анализ выборок Hypogymnia physodes 61
4.5 Анализ выборок Evernia prunastri 65
4.6 Анализ выборок Pseudevernia furfuracea 67
4.7 Резюме 69
Глава 5. Применение метода главных компонент 71
5.1 Алгоритм процедуры . 71
5.2 Анализ выборок Alchemilla vulgaris . 73
5.3 Анализ выборок Vaccinium vitis-idaea . 75
5.4 Анализ выборок Hypogymnia physodes 78
5.5 Анализ выборок Evernia prunastri 80
5.6 Анализ выборок Pseudevernia furfuracea 81
5.7 Резюме . 82
Глава 6. Применение регрессионных моделей для упорядоченных классов 84
6.1 Алгоритм процедуры . 84
6.2 Анализ выборок Alchemilla vulgaris . 85
6.3 Анализ выборок Vaccinium vitis-idaea . 87
6.4 Анализ выборок Hypogymnia physodes 90
6.5 Анализ выборок Evernia prunastri 92
6.6 Анализ выборок Pseudevernia furfuracea 92
6.7 Резюме . 95 Заключение 96 Выводы . 102 Список цитированной литературы
- Параметры, характеризующие онтогенетический спектр популяции
- Регрессионная модель для упорядоченных классов
- Онтогенетические спектры гипогимнии вздутой (Hypogymnia physodes L.)
- Анализ выборок Hypogymnia physodes
Параметры, характеризующие онтогенетический спектр популяции
Онтогенетическое состояние – характеристика особи; рассматривая совокупность особей популяции, можно построить онтогенетический (возрастной) спектр популяции (Уранов, 1960). В популяционной ботанике выделяют несколько типичных спектров, характерных для разных видов растений (рис. 1).
Уранов (1975), исходя из логистической кривой роста особи в течение онтогенеза, ввел весовой коэффициент (численную характеристику) каждого онтогенетического состояния – коэффициент возрастности ki (табл. 1). Рисунок 1. Типы базовых спектров ценопопуляций (средние показатели); штриховкой показана величина ±3а (Ценопопуляции …, 1988). А - левосторонний спектр, Б - одновершинный симметричный, В - правосторонний, Г - двувершинный Таблица 1 Дискретное описание онтогенеза растений (по: Уранов, 1975) Период №, онтогенетическое состояние, символ Коэффициент возрастности, ki Латентный 1. Семена, sm 0,0025 Прегенеративный 2. Проросток, p 3. Ювенильное, j4. Имматурное, im5. Виргинильное, v 0,0067 0,0180 0,0474 0,1192 Генеративный 6. Молодое, g17. Зрелое, g28. Старое, g3 0,2700 0,5000 0,7310 Постгенеративный 9. Субсенильное, ss10. Сенильное, s 11. Отмирающее, sc 0,8808 0,9529 0,9819
При анализе онтогенетических спектров не учитываются семена и, как правило, проростки в связи с флуктуациями их возможного массового появления и массовой случайной гибели. Коэффициенты возрастности при разделении виргинильного онтогенетического состояния на два вычисляются, исходя из равных промежутков на отрезке im-gi, и равны, соответственно, для vi - 0,0884, для v2 - 0,1589 (Суетина и др., 2005).
Общепринятым параметром онтогенетического спектра является индекс возрастности А, введенный А.А. Урановым здесь ПІ - число особей в онтогенетическом состоянии с номером /, а kj -коэффициент возрастности онтогенетического состояния с номером /. Используют и другие параметры онтогенетического спектра. Л.А. Жуковой (1987) были предложены индекс восстановления Id то есть отношение числа особей прегенеративного периода (проростки не учитываются) к числу особей генеративного периода, и индекс замещения то есть отношение числа особей прегенеративного периода (проростки не учитываются) к сумме чисел особей генеративного и постгенеративного периодов. Н.В. Глотовым (1998) предложено для индекса восстановления Iв использовать формулу чтобы ограничить область задания индекса отрезком [0,1], а вместо индекса замещения Iз использовать индекс старения то есть отношение числа особей постгенеративного период к числу всех особей в популяции; при этом индексы I1 и I2 ортогональны (независимы). Возможно использование и других параметров. Например, Т.А. Работнов (1950) рассматривал отношение числа генеративных к сумме чисел виргинильных и генеративных особей в популяции: 1.3 Гетерогенность выборки из популяции
Методика сбора материала для характеристики онтогенетического спектра популяции заключается в том, что каждая выборка включает несколько субвыборок, собранных в разных частях популяции, в разные годы и т.п. В случае, например, травянистых растений обычно собирают (учитывают) все растения на учетной площадке 1 м2, определяя онтогенетическое состояния каждой особи; данные по всем учётным площадкам суммируют, получая онтогенетический спектр популяции (ценопопуляции), и затем вычисляют частоты (проценты) особей каждого онтогенетического состояния и параметры, характеризующие онтогенетический спектр популяции. Таким образом, единицей наблюдения здесь является учетная площадка. При исследовании, например, эпифитных лишайников учитывают особи (слоевища) всех онтогенетических состояний отдельно на каждом дереве, затем суммируя данные в пределах местообитания или определенного форофита (субстрата). Таким образом, единицей наблюдения здесь является отдельное дерево.
Рассмотрим конкретный пример - анализируемые ниже данные по эпифитному лишайнику Hypogymma physodes (табл. 2). Здесь имеется 3 форофита (липа, пихта, сосна), на каждом из них исследованы слоевища на нескольких деревьях - на 23 деревьях липы, на 7 - пихты и на 16 - сосны. Казалось бы, задача сравнения онтогенетических спектров выборок проста - достаточно сравнить суммарные для каждого форофита спектры (табл. 3), применив критерий для таблицы сопряженности 3x6 (число форофитов х число онтогенетических состояний) (Глотов и др., 1982). Если бы мы провели эту процедуру, то получили бы = 704,5; df = 2x5 = 10; р 10 15, разницы между выборками статистически высокозначимы. Если бы далее мы сравнили выборки попарно, то получили бы высоко значимые разницы для всех пар: липа-пихта = 497,0; df = 5; р 10 15; липа-сосна = 298,9; df =5; р 10 15; пихта-сосна = 275,7; df = 5; р 10"15. Даже если учесть поправку Бонферрони на множественные сравнения (Sokal, Rohlf, 1997), разницы между всеми выборками остаются статистически высоко значимыми - р ю-14.
Регрессионная модель для упорядоченных классов
При сравнении онтогенетических спектров традиционными методами (критерий хи-квадрат, точный критерий Фишера для таблиц RxC) сравниваются полиномиальные распределения. При этом не учитывается тот факт, что онтогенетические состояния являются упорядоченными классами (при полном онтогенезе особь последовательно проходит через все состояния, начиная с j, заканчивая sс) - при перестановке онтогенетических состояний результаты анализа не изменяются.
В регрессионной модели для упорядоченных классов (ordinal regression model, Agresti (2002) использует термин cumulative link model) учитывается упорядоченность онтогенетических состояний (Kleinbaum, Klein, 2010). Модель в общем виде можно представить следующим образом (Hardine, Hilbe, 2007): ( ) здесь - номер особи, - общее число особей во всех выборках, - номер онтогенетического состояния, J - число онтогенетических состояний, случайная величина, соответствующая /-ой особи, значением которой является
номер онтогенетического состояния данной особи. Тогда вероятность того, что особь имеет возраст (находится в онтогенетическом состоянии с номером) не больше . - эффект, вид которого зависит от вида исследуемых зависимостей (Дрейпер, Смит, 2007). Функция - функция связи (link function), обычно используется функция логистического или нормального распределения (cumulative distribution function), хотя можно использовать и функции других распределений.
Для данной модели можно предложить следующую интерпретацию. Числовой оси соответствует онтогенез особи, значению –оо соответствует появление особи, а +оо соответствует ее гибели. Так как в ходе онтогенеза особь последовательно проходит онтогенетические состояния, то онтогенетические состояния - это последовательные промежутки на оси. Пусть онтогенетическому состоянию с номером соответствует полуинтервал , тогда - это такая точка, что слева от нее лежат онтогенетические состояния с номером и меньше; а онтогенетические состояния с номером и больше лежат справа от точки . Эта точка называется разделяющей точкой (cut-point), разделяют числовую ось на промежутки - онтогенетические состояния. Первому онтогенетическому состоянию соответствует промежуток , последнему (при 11 онтогенетических состояниях) - . Заметим, что в этом смысле модель регрессии для упорядоченных классов точно соответствует концепции дискретного описания онтогенеза растений Т.А. Работного и А.А. Уранова: непрерывный процесс онтогенеза описывается как последовательность дискретных онтогенетических состояний.
Функция - функция распределения некоторой случайной величины, если используется стандартное логистическое распределение, то говорят о логит-регрессии, если используется стандартное нормальное распределение - пробит-регрессии. Функция распределения используется для того, чтобы получить распределение особей по онтогенетическим состояниям: { ) { ) [ [ - вероятность того, что особь находится в онтогенетическом состоянии с номером равна интегралу, или, другими словами, площади под графиком плотности распределения ( , плотность распределения). Разделяющие точки (всего значение) делят площадь под графиком функции на частей, каждая из которых равна частоте особей соответствующего онтогенетического состояния в субвыборке. Сумма этих площадей равна 1, так как - плотность распределения. В рамках модели значения оцениваются по всей совокупности данных (по онтогенетическим спектрам всех субвыборок всех выборок, а не по суммарному спектру) и принимаются одинаковыми для всех субвыборок всех выборок. Оценка значений - трудоемкая задача, для которой используются специальные вычислительные методы (Christensen, 2013).
Рассмотрим конкретный пример. Пусть для некоторой совокупности выборок, каждая из которых представлена несколькими субвыборками, имеются онтогенетические спектры субвыборок - распределения числа особей (слоевищ, парциальных кустов) по онтогенетическим состояниям. По этим данным с помощью метода максимального правдоподобия (см. раздел 6.1) находим оценки значений разделяющих точек , одни и те же (одинаковые) для всех субвыборок всех выборок. На рисунке 2а показано наблюдаемое в опыте распределение особей по онтогенетическим состояниям в одной из субвыборок (частоты особей соответствующих онтогенетических состояний). Это распределение необходимо «преобразовать» в нормальное распределение (или логистическое), но так, чтобы частоты последовательных онтогенетических групп соответствовали площадям под кривой, определяемым разделяющими точками
Онтогенетические спектры гипогимнии вздутой (Hypogymnia physodes L.)
По двум оставшимся параметрам (її и 12) анализ проводится так же. Выборки манжетки значимо различаются по индексу восстановления 1а (р = 0,0001) и по индексу старения 12 (р = 0,0001). Доля изменчивости между выборками в общей изменчивости по индексу восстановления її составляет 0,536 (0,422-0,664); по индексу старения 12 - 0,402 (0,286-0,537). По каждому из параметров доля межвыборочной изменчивости - около половины. На рисунке 10 представлены результаты оценки и парного сравнения значений индекса восстановления її выборок манжетки, на рисунке 11 - индекса восстановления 12. По индексу восстановления її на 5%-м уровне значимы 41 парная разность из 105 возможных, на 1%-м - 25 разностей. По индексу старения 12 на 5%-м уровне значимы 42 парные разности из 105 возможных, на 1%-м - 29 разностей. Рисунок 10. Сравнение индекса восстановления I1 разных выборок манжетки. Внизу - шкала значений I1; выше - положение выборок на шкале I1;
Сравнение выборок можно было бы провести и без учета гетерогенности выборок: на основании спектров выборок, получающихся суммированием спектров субвыборок в пределах выборки. Тогда для сравнения выборок необходимо проверить однородность таблицы сопряженности (табл. 20), в результате получаем, что согласно этому критерию выборки являются гетерогенными (p 10-15). Если провести парные сравнения на основании суммарных спектров выборок, то получим, что на 5%-м уровне значимы 100 парных разностей из 105 возможных, на 1%-м – 94 разности, что сильно расходится с результатами анализа с учетом гетерогенности.
Выборки манжетки являются гетерогенными, поэтому проводится анализ, учитывающий гетерогенность в пределах выборки. Выборки брусники значимо различаются по всем параметрам онтогенетических спектров: по индексу возрастности p = 0,0001, по индексу восстановления p = 0,0001 и по индексу старения p = 0,0048. Доля изменчивости между выборками в общей изменчивости по индексу возрастности составляет 0,208 (95%-ый доверительный интервал – 0,136-0,290), по индексу восстановления I1 – 0,358 (0,279-0,443); по индексу старения I2 – 0,108 (0,034-0,202). По каждому из параметров доля межвыборочной изменчивости меньше половины, следовательно, большая часть изменчивости сосредоточена в пределах выборок.
На рисунке 12 представлены результаты оценки и парного сравнения значений индекса возрастности выборок брусники, на рисунке 13 – индекса восстановления I1, на рисунке 14 – индекса старения I2. По индексу возрастности на 5%-м уровне значимы 20 парных разностей из 45 возможных, на 1%-м – 13 разностей. По индексу восстановления I1 на 5%-м уровне значимы 28 парных разностей из 45 возможных, на 1%-м – 24 разности. По индексу старения I2 на 5%-м уровне значимы только 7 парных разностей из 45 возможных, на 1%-м – 3 разности. Если провести парные сравнения на основании суммарных спектров выборок, то получим, что все 45 парных разностей статистически высоко значимы (p 10-12). Последний результат очень сильно отличается от результатов, полученных с учетом гетерогенности выборок. Рисунок 12. Сравнение индекса возрастности А разных выборок брусники. Внизу - шкала значений А; выше - положение выборок на шкале А;
Выборки гипогимнии являются гетерогенными, поэтому проводится анализ, учитывающий гетерогенность в пределах выборки. Выборки гипогимнии значимо различаются по всем параметрам онтогенетических спектров: по индексу возрастности р = 0,0011, по индексу восстановления р = 0,0032 и по индексу старения p = 0,0003. Доля изменчивости между выборками в общей изменчивости по индексу возрастности составляет 0,473 (95%-ый доверительный интервал -0,057-0,807), по индексу восстановления IХ - 0,491 (0,019-0,822); по индексу старения I2 - 0,478 (0,233-0,689).
Обращают на себя внимание очень большие доверительные интервалы для доли межвыборочной изменчивости по индексу возрастности и индексу восстановления, они охватывают 75% и 81% множества возможных значений соответственно! Необходимо проанализировать возможные причины данного результата. Для этого рассмотрим, как себя ведет распределение долей влияния, полученное в ходе процедуры ресамплинга (рис. 15). Видно, что распределение для индекса старения I2 имеет куполообразный вид. В отличие от него распределения для двух других параметров онтогенетических спектров являются двувершинными. Чтобы выяснить причину этого, рассмотрим онтогенетические Рисунок 15. Гистограммы распределения долей влияния для данных по гипогимнии спектры субвыборок гипогимнии (рис. 16). Можно видеть, что онтогенетический спектр дерева 22 липы сильно отличается от онтогенетических спектров других деревьев липы.
Онтогенетические спектры всех деревьев липы, онтогенетический спектр дерева 22 выделен Если исключить из рассмотрения дерево 22 липа, то распределения долей влияния, получающиеся в ходе процедуры ресамплинга, принимают куполообразный вид (рис.17). Соответственно изменяются оценки и доверительные интервалы доли межвыборочной изменчивости: доля изменчивости между выборками в общей изменчивости по индексу возрастности составляет 0,692 (95%-ый доверительный интервал – 0,489-0,827); по индексу восстановления I1 – 0,710 (0,517-0,853); по индексу старения I2 доля межвыборочной изменчивости не меняется – 0,494 (0,218-0,720). Доля межвыборочной изменчивости по индексу возрастности и по индексу восстановления I1 охватывает теперь только 34% множества возможных значений, доверительный интервал для доли по индексу старения I2 даже незначительно увеличился. Результаты анализа по индексу старения I2 (для гипогимнии – доля слоевищ онтогенетического состояния ss) не изменились, так как дерево 22 липа
Рисунок 17. Гистограммы распределения долей влияния для данных по гипогимнии при анализе без дерева 22 липа не отличается от остальных деревьев липы (см. рис. 16). По индексу возрастности и по индексу восстановления I! большая часть изменчивости содержится между выборками, по индексу старения I2 доли межвыборочной и внутривыборочной изменчивости равны. Парные сравнения параметров показали, что по индексу возрастности А значимо различаются выборки липы и пихты, липы и сосны (р 0,001) и не различаются выборки пихты и сосны (р=0,11); по индексу восстановления її различается выборки липы и пихты, липы и сосны (р 0,001) и на 5%-ом уровне различаются выборки пихты и сосны (р=0,014); по индексу старения 12 различаются выборки липы и сосны (р=0,0002), на 5%-м уровне различаются выборки липы и пихты (р=0,046) и не различаются выборки пихты и сосны (р=0,81). Если пренебречь гетерогенностью выборок, то онтогенетические спектры гипогимнии на всех субстратах статистически различаются высоко значимо (р 10 15), что отличается от результатов анализа с учетом гетерогенности.
Анализ выборок Hypogymnia physodes
Разработаны три подхода к анализу онтогенетических спектров популяций: 1) оценка и сравнение параметров онтогенетических спектров, 2) использование метода главных компонент, 3) использование регрессионных моделей для упорядоченных классов. Принципиально важно подчеркнуть, что все три подхода непосредственно учитывают гетерогенность выборок, чего нет в принятом упрощенном анализе, где рассматриваются суммарные данные в неявном предположении гомогенности выборок. Важно отметить и различия между подходами. При первом подходе проводится анализ параметров, а не собственно онтогенетических спектров распределений, естественно, при этом используется не вся информация, содержащаяся в экспериментальных данных. При втором подходе анализируются частоты онтогенетических состояний, то есть собственно распределения, однако не учитывается последовательность онтогенетических состояний, вообще говоря, она может быть произвольной. В третьем подходе анализируются частоты онтогенетических состояний с учетом их последовательности от j к sc.
Для всех исследованных объектов показано наличие статистически значимых различий между онтогенетическими спектрами выборок. Однако, на примере множественных сравнений параметров спектров выборок (с учетом внутривыборочной гетерогенности) и множественных сравнений суммарных спектров выборок (без учета внутривыборочной гетерогенности) выявлена некорректность последнего подхода, игнорирующего избыточную изменчивость и приводящего к ошибочным заключениям о различиях между спектрами выборок.
Проведем сопоставление результатов трех предложенных методов. В качестве сравниваемых «признаков» возьмем все парные разности между выборками: 1) разность между значениями параметра (A, h и 12) (оценка и сравнение параметров спектров), 2) евклидово расстояние между выборками (метод главных компонент) и 3) разность между величинами эффекта выборок (регрессия для упорядоченных классов). В таблице 40 приведены результаты сравнения применение метода главных компонент и регрессии для упорядоченных классов (логит-модель, очень близкие коэффициенты корреляции получены для пробит-модели). Хотя все коэффициенты корреляции отличаются от нуля статистически высоко значимо, их значения не очень велики (0,39-0,60). Это связно, очевидно, с тем, что метод главных компонент не учитывает, а регрессия для упорядоченных классов учитывает последовательность онтогенетических состояний.
В таблице 41 представлены результаты сравнения метода главных компонент и регрессии для упорядоченных классов с методом сравнения параметров онтогенетических спектров. Не приводятся данные по гипогимнии, поскольку в этом случае у нас всего три выборки; индекс h для псевдэвернии, как указывалось выше, не вычислялся, поскольку особи постгенеративных состояний в субвыборках здесь или отсутствуют, или очень редки.
Для индекса возрастности А в обоих случаях связь статистически значима (хотя бы на 5%-м уровне), однако значения коэффициентов всегда заметно ниже для метода главных компонент. Это связано, очевидно, с тем обстоятельством, что А (как и регрессия для упорядоченных классов) за счет включения в этот показатель весов онтогенетических состояний kt (см раздел 1.2) фактически учитывает последовательность онтогенетических состояний. Иначе обстоит дело с индексом восстановления І! и индексом старения 12. Характеризующий левую Таблица 41
Эверния (91) 0,50 3,8-10-7 0,52 1,2-10-7 часть онтогенетического спектра индекс I1 высок и примерно одинаков в обоих случаях для популяций брусники, эвернии и псевдэвернии. Для манжетки коэффциент корреляции I1 с методом главных компонент ниже, а с регрессией для упорядоченных классов очень мал и статистически незначим. Это может быть связано с небольшим пиком в спектре манжетки на виргинильных особях и большей внутривыборочной изменчивостью их частоты. I2 показывает примерно одинаковую и высокую корреляцию с обоими методами сравнения спектров для манжетки и отсутствие связи с ними у брусники. Таким образом, сравнение спектров, скорее, дополняет, а не заменяет сравнение параметров I1 и I2.
В каждом из предложенных подходов можно оценить долю изменчивости между выборками в общей изменчивости онтогенетических спектров, что в популяционной биологии растений и лишайников ранее не проводилось. В таблице 42 приведена сводка оценки доли межвыборочной изменчивости с использованием разных методов. Заметим, что подробный анализ этих данных, выявление связи межвыборочной изменчивости спектров с разнообразием экологических условий местообитаний, динамикой и развитием местных популяций и т.п. должно быть предметом специального исследования. Для брусники межвыборочная изменчивость параметров и эффектов регрессии относительно мала, несколько большую оценку дает метод главных компонент, не учитывающий упорядоченность онтогенетических состояний. Относительно большая доля межвыборочной изменчивости характерна для манжетки, при этом метод главных компонент и регрессия для упорядоченных классов дают близкие результаты. Из всех материалов наибольшую межвыборочную изменчивость спектров показывает гипогимния, что связано, скорее всего, с тем, что слоевища разных выборок взяты с разных форофитов. Оценки для эвернии ниже, хотя и здесь выборки взяты с разных форофитов. Наконец, низкие значения межвыборочной изменчивости онтогенетических спектров у псевдэвернии обусловлены, скорее всего, плохой сохранностью слоевищ поздних онтогенетических состояний. Таблица 42 Оценка доли межвыборочной изменчивости в структуре общей изменчивости онтогенетических спектров разными методами
Объект исследования Анализ по параметрам Методглавныхкомпонент Регрессия для упорядоченных классов
Анализ регрессии для упорядоченных классов представляется весьма перспективным. Он может быть распространен на случай варьирующего проявления количественного признака (разной экспрессивности) при учете только качественных градаций признака и на случай нарастания проявления комплекса признаков, когда в некий синдром вовлекаются несколько органов или систем органов.
Ответ на вопрос, какой из предложенных методов анализа гетерогенных выборок предпочтительнее, зависит от задачи конкретного исследования. Интерес может представлять и анализ определенных параметров, имеющих содержательный биологический смысл, и сравнения онтогенетических спектров в целом. Похоже, больше информации позволяет извлечь анализ регрессии для упорядоченных классов. Однако в каких-то случаях полезными могут быть и данные о структуре главных компонент (о вкладе в соответствующую главную компоненту непосредственно регистрируемых показателей), и визуализация результатов в плоскостях главных компонент