Электронная библиотека диссертаций и авторефератов России
dslib.net
Библиотека диссертаций
Навигация
Каталог диссертаций России
Англоязычные диссертации
Диссертации бесплатно
Предстоящие защиты
Рецензии на автореферат
Отчисления авторам
Мой кабинет
Заказы: забрать, оплатить
Мой личный счет
Мой профиль
Мой авторский профиль
Подписки на рассылки



расширенный поиск

Программно-информационное обеспечение исследований растительного покрова Зверев Андрей Анатольевич

Программно-информационное обеспечение исследований растительного покрова
<
Программно-информационное обеспечение исследований растительного покрова Программно-информационное обеспечение исследований растительного покрова Программно-информационное обеспечение исследований растительного покрова Программно-информационное обеспечение исследований растительного покрова Программно-информационное обеспечение исследований растительного покрова Программно-информационное обеспечение исследований растительного покрова Программно-информационное обеспечение исследований растительного покрова Программно-информационное обеспечение исследований растительного покрова Программно-информационное обеспечение исследований растительного покрова
>

Диссертация - 480 руб., доставка 10 минут, круглосуточно, без выходных и праздников

Автореферат - бесплатно, доставка 10 минут, круглосуточно, без выходных и праздников

Зверев Андрей Анатольевич. Программно-информационное обеспечение исследований растительного покрова : диссертация ... кандидата биологических наук : 03.00.05.- Томск, 2007.- 305 с.: ил. РГБ ОД, 61 07-3/1154

Содержание к диссертации

Введение

Глава 1. Применение компьютерных технологий в ботанике 11

1.1. Основные термины и понятия теории баз данных 12

1.2. Обзор прикладных ботанических программ 19

Глава 2. Интегрированная ботаническая информационная система IBIS 51

2.1. Краткая функциональная характеристика системы IBIS 52

2.2. Проблема информационной неопределенности в ботанических данных 61

2.3. Интегрированность ботанических программ 64

2.4. Комплексность ботанических данных 66

2.5. Способы организации и преобразование данных 84

2.6. Анализ данных 109

2.7. Обмен данными и их защита 155

Глава 3. Использование системы ibis для обработки ботанических данных 161

3.1. Материалы 161

3.2. Таксономический анализ 162

3.3. Типологический анализ 192

3.4. Сравнительный анализ 194

3.5. Флорогенетический анализ с использованием аппарата логического моделирования филогенеза 212

3.6. Сопряженный анализ 217

Заключение 225

Литература 227

Приложения

Введение к работе

В настоящее время вследствие активной компьютеризации всех отраслей знания и областей человеческой деятельности происходят существенные изменения в методах обработки информации, традиционно применявшихся в ботанике. Основываясь на таких особенностях электронно-вычислительных машин (ЭВМ), как высокое быстродействие и способность хранить огромные объемы информации, эти изменения носили в начале процесса компьютеризации в основном количественный характер. На машинную основу переносились традиционные методики, многократно усиленные производительностью ЭВМ (Компьютерная биометрика, 1990). Затем наступило время осознания ограниченности таких экстенсивных методов, и стали появляться методические работы, посвященные вопросам оптимальной формализации ботанических данных для лучшего представления в компьютерах. Технологические цепочки обработки информации стали проектироваться с учетом, как особенностей структуры ботанического знания, так и особенностей внутренней организации вычислительного процесса в ЭВМ. Многие из подобных методических работ основывались на применении оригинальных программных продуктов, созданных специально для решения нетрадиционных задач в ботанике. Теперь же можно говорить о третьем этапе, когда современные компьютерные технологии и новые программные средства порождают новые возможности и активно вмешиваются в процесс создания новых методов, или даже стратегий, обработки ботанических данных. Существенно возросла роль ботанических баз данных, которые стали рассматриваться как основа и связующее звено комплексных ботанических исследований.

Актуальность темы. Все более широкое распространение персональных компьютеров приобщило к использованию информационных методов широкие ряды ботаников, не имеющих специальной прикладной математической или программистской подготовки. Именно эта категория исследователей нуждается в интенсификации своих исследований, в едином информа-

5 ционном "пространстве", которое позволяет интегрировать разноформатные данные для обобщающих совместных и сравнительных работ, широкого привлечения статистических компьютерных программ для их обработки.

Возникла насущная потребность в специализированном интегрированном программном обеспечении, которое позволило бы пользователям-ботаникам самостоятельно применять компьютерные методы обработки своих материалов, комбинируя различные готовые программы для достижения желаемых результатов.

Несмотря на наличие достаточно большого количества зарубежных и отечественных продуктов на данный момент отсутствует интегрированный программный пакет, который в полной мере удовлетворяет потребности специалистов-флористов и геоботаников в обработке данных.

Настоящая работа посвящена рассмотрению воплощения технологий обработки флористических и геоботанических данных от стадии сбора исходного материала, его формализации и ввода в компьютер до получения интерпретируемого ботанического результата.

Цель и задачи исследования. Цель данной работы - на базе традиционных методик исследований в областях флористики и геоботаники разработать архитектуру интегрированной компьютерной программы для организации и обработки данных по растительному покрову, а также апробировать компьютерные варианты методов обработки данных на различном по типологии ботаническом материале.

Для выполнения поставленной цели были сформулированы следующие задачи:

провести обзор существующих программных продуктов, позволяющих проводить обработку флористических и геоботанических данных, оценить их функциональные возможности;

дать формализованное описание логики и методики флористических и геоботанических исследований как основы для разработки авторских компьютерных программ;

выполнить разработку данных программ, описать их структурные компоненты, технологию функционирования и возможности по обмену данными с другими программами;

апробировать программы на различном ботаническом материале и провести анализ полученных результатов.

Положения, выносимые на защиту:

  1. Разработанная с учетом специфики компьютерной обработки интегрированная структура данных для комплексной характеристики растительного покрова способствует лучшему описанию фактов и моделированию процессов в ботанической предметной области.

  2. Реализованная информационная система для комплексной обработки ботанических данных позволяет ботаникам без специальной подготовки многократно интенсифицировать исследовательский процесс, упрощает использование вьиислительно сложных технологий и позволяет полнее использовать современный инструментарий обработки данных.

  3. Предложенные новые методы анализа данных (сопряженный анализ типологических, систематических структур и кластерных классификаций, флоро-генетический анализ с привлечением логического аппарата моделирования филогенеза, использование взвешиваемых пользовательских типологических и градиентных фактор-множеств) расширяют возможности по выявлению связей, зависимостей и закономерностей между описываемыми ботаническими объектами и их характеристиками, способствуя получению более содержательных выводов.

Теоретическое и практическое значение работы. Традиционные и новые методики обработки ботанических данных в компьютерном варианте расширяют представления о возможностях интерпретации и установления закономерностей в растительном мире, а также многократно повышают производительность научного труда исследователей-ботаников.

Программное обеспечение для поддержки ботанических исследований, разработанное автором, установлено более чем в 20 организациях ботанического профиля и было использовано при подготовке 8 докторских и 20 кандидатских диссертаций по ботаническим специальностям. Авторские программы послужили основой для создания фитоценотеки описаний пойменной растительности объемом 1950 описаний, использованной для разработки многоаспектной доминантно-детерминантной эколого-морфологической классификации растительных сообществ (Прокопьев, 2001).

При участии автора создан и поддерживается ряд баз ботанических данных, в том числе сеть долговременного мониторинга биоразнообразия на уровне локальных флор для Азиатской Арктики (БИН РАН, Санкт-Петербург), базы биоразнообразия болотных экосистем Томской области и эндемичных растений Алтайской горной страны в рамках международных проектов фонда "Darwin Initiative".

Полученные материалы были использованы в разработке лекционных курсов "Информационные технологии в естественных науках" и "Методы компьютерной обработки ботанических данных" (программа магистерской подготовки, Томский государственный университет).

Материалы, методы и личный вклад автора. Работа выполнена на базе кафедры ботаники Томского государственного университета. В 1987-2005 гг. автор принимал участие в научных экспедициях кафедры ботаники, Гербария им. П.Н. Крылова ТГУ и лаборатории биогеоценологии НИИ биологии и биофизики при ТГУ на территории Томской, Новосибирской и Кемеровской областей, Алтайского края, Республики Алтай, а также Монголии и Казахстана. Часть собранных ботанических материалов была использована в иллюстративных целях в данной работе.

Обработка материала осуществлялась самостоятельно, программные средства, описанные в работе, разработаны непосредственно автором. Методики основываются на применении авторского программного продукта IBIS (интегрированной ботанической информационной системы) в качестве базо-

8 вого инструмента с привлечением других оригинальных программ: IRIX (фи-тоидикационный анализ), BioStat (сравнительно-флористический анализ), SYNAP (филогенетитческий и флорогенетический анализ). Дополнительно для обработки данных использовались следующие программные средства: для подготовки и трансформации наборов данных - MS Excel, QEdit Advanced (The Semware..., 1995), dBASE Viewer & Editor (Царенко, 1992), для статистической обработки, построения классификационных схем -NTSYS (Rohlf, 1989, 2000), Statistica for Windows (StatSoft, Inc. 2006; Hill & Lewicki, 2006).

Кроме личных сборов автор использовал ботанические данные, полученные другими исследователями. Часть материалов была получена автором из открытых источников (опубликована или использована в диссертационных работах, с соответствующими ссылками по тексту данной работы). Неопубликованные материалы переданы автору их владельцами (данные по сети мониторинга Азиатской Арктики на уровне локальных флор (Лаборатория растительности Крайнего Севера БИН РАН), флористические материалы А.И. Пяка по юго-востоку Западной Сибири, О.В. Ребристой по п-ову Ямал, О.В. Хитун по Гыданскому и Тазовскому полуостровам, Т.М. Королевой по Анюйскому нагорью, И.Б. Кучерова по Керетскому архипелагу, геоботанические материалы Е.П. Прокопьева по пойменной растительности Иртыша, Е.Д. Лапшиной по болотной растительности Томской области, М.М. Черосова по синантропной растительности Якутии, данные А.Л. Борисенко по бриофлоре юго-востока Томской области и Н.В. Щеголевой по роду Ranunculus в Алтае-Саянской флористической провинции), получено устное или письменное (Приложение 1) разрешение на их использование. Все материалы введены в базы данных и обработаны с помощью авторской информационной системы IBIS.

Апробация работы. Основные материалы, вошедшие в диссертацию были представлены на заседаниях кафедры ботаники ТГУ и Томского отделения Русского ботанического общества, на международном рабочем сове-

9 щании "Структура и динамика популяций растений, их сообществ и проблемы математического моделирования" (Пущино, 1991), международной конференции "Проблемы экологии Томской области" (Томск, 1992), на чтениях памяти Ю.А.Львова (Томск, 1995, 1998), на совещаниях "Компьютерные базы данных в ботанических исследованиях" (Санкт-Петербург, 1995, 1997), на рабочих совещаниях по сравнительной флористике (Березинский биосферный заповедник, 1993; Сыктывкар, 2003), на конференциях "Фундаментальные и прикладные проблемы охраны окружающей среды" (Томск, 1995), "Проблемы изучения растительного покрова Сибири" (Томск, 1995, 2000, 2005), "Состояние и перспективы развития гербариев Сибири" (Томск, 1997), "Проблемы промышленной ботаники индустриально-развитых регионов" (Кемерово, 2006), "Биоразнообразие растительного покрова Крайнего Севера: инвентаризация, мониторинг, охрана" (Сыктывкар, 2006), на региональном совещании "Проблемы создания ботанических баз данных" (Новосибирск, 2000), на международном симпозиуме "Информационно-поисковые системы в зоологии и ботанике" (Санкт-Петербург, 1999), на международных конференциях "Природные условия, история и культура Западной Монголии и сопредельных регионов" (Ховд, 1997, 2003; Томск, 1999; Кызыл, 2005), на международных научных семинарах фонда "Darwin Initiative" (Coventry, 1997; Томск, 2002; Pitlochry, 2002; Ховд, 2004; Риддер, 2005; Кызыл, 2005), на других региональных, Всероссийских и международных ботанических конференциях (Барнаул, 1995; Красноярск, 1997, Томск, 1997; Кемерово, 1997; Владивосток, 2000; Барнаул, 2005; Томск, 2006; Красноярск, 2006).

Публикации. По теме диссертации опубликовано 45 работ, в том числе 3 статьи в рецензируемых журналах из списка ВАК РФ.

Структура и объем работы. Диссертация состоит из введения, 3 основных глав, заключения, списка литературы и 13 приложений. Работа изложена на 268 страницах машинописного текста, содержит 22 таблицы и 72 рисунка. В списке цитируемой литературы 528 наименований, в том числе 251 - на иностранных языках.

10 Благодарности. Автор выражает благодарность своему научному руководителю д.б.н. профессору А.С. Ревушкину за понимание и терпение; д.б.н. Н.Н. Лащинскому, д.б.н. А.Ю. Королюку, д.б.н. К.С. Байкову, д.б.н. М.М. Черосову, д.б.н. Е.Д. Лапшиной, д.б.н. А.И. Пяку, к.б.н. И.Б. Кучерову, П.Н. Черногривову за ценные предложения и замечания при обсуждении новых методов обработки ботанических данных и создании компьютерных программ, а также всем сотрудникам кафедры ботаники Томского государственного университета. Особо хочется отметить многолетнюю поддержку работ автора сотрудниками Лаборатории растительности Крайнего Севера Ботанического института им В.Л. Комарова Российской академии наук (БИН

РАН) во главе с д.б.н. [Б .А. Юрцевым.| Автор выражает признательность всем исследователям, предоставившим автору свои ботанические материалы и принявшим участие в тестировании авторских компьютерных программ.

Основные термины и понятия теории баз данных

Так как наша работа посвящена, в основном, применению технологии компьютерных баз данных в области ботаники и экологии, то необходимо вначале дать определение самому понятию база данных. Существует немало вариантов определения объема этого термина.

База данных (БД) - это совокупность данных, организованных по определенным правилам, предусматривающим общие принципы описания, хранения и манипулирования данными, независимая от прикладных программ (Першиков, Савинков, 1991). Другие определения: БД -именованная совокупность данных, отражающая состояние объектов и их отношений в рассматриваемой предметной области (Наумов и др., 1991); БД - совокупность взаимосвязанных данных при такой минимальной избыточности, которая до пускает их использование оптимальным образом для одного или нескольких приложений в определенной предметной области человеческой деятельности (Зотов и др., 1989); БД - структурированный особым образом массив информации, созданный на компьютерной основе (Гельтман, Росков, 1997). Характерными признаками БД являются независимость организации и хранения данных от использующих их программ и наличие общих специальных средств для добавления новых, изменения существующих данных, а также для поиска требуемых данных в БД.

Здесь мы подходим к понятию системы управления базой данных (СУБД), которая в общем виде может быть определена как комплекс программ и языковых средств, предназначенных для создания, ведения и использования баз данных (Першиков, Савинков, 1991). Вообще, специалисты в области информатики говорят о существовании какой-либо БД только при наличии управляющей ею системы, т.е. СУБД, которая должна обладать следующими свойствами (Page, 1995): обеспечение постоянного хранилища данных (данные сохраняются на запоминающих устройствах даже после завершения работы компьютерной программы-приложения), предоставление формализованного языка для описания, поиска и модификации данных, поддержка механизма транзакций (неделимых действий, обеспечивающих целостность данных, т.е. безопасность всех операций с БД), обеспечение многопользовательских возможностей, системы резервирования и восстановления данных (в случае сбоев в работе программ и оборудования), конфиденциальности и разграничения доступа.

Базы данных в зависимости от способа представления данных могут иметь реляционную, иерархическую или сетевую структуру (иначе говоря, могут быть реализованы в соответствии с правилами реляционной, иерархической или сетевой модели данных). Модель данных, или информационная модель, является совокупностью правил порождения структур данных, она поддерживается СУБД и реализуется в структуре конкретных баз данных. Реляционная модель данных, или модель Кодда (Codd, 1970, 1982; Циктрит зис, Лоховски, 1985), наиболее известна и применяется чаще других для построения относительно простых по структуре баз данных.

На практике термин "база данных" может иметь множество толкований. В самом простом случае база данных может состоять лишь из одной таблицы или же набора несвязанных между собой таблиц. Каждая таблица может быть представлена в виде двумерной (плоской) матрицы, состоящей из колонок (полей) и строк (записей). В теории реляционных баз данных таблицы именуются "отношениями", записи - "кортежами", поля - "атрибутами". В таких базах данных две или более таблицы могут быть связаны вместе, объединяя различные наборы данных. Согласно требованиям теории реляционных баз данных, каждая таблица должна содержать ключевое поле с идентификаторами записей, которые используются для объединения записей данной таблицы с записями, имеющими тот же самый идентификатор в других таблицах. Основная идея такого объединения таблиц состоит в том, что содержащаяся в разных таблицах информация становится доступна для совместной обработки, преобразования и извлечения отчетов. Снижается также информационная избыточность (так например, для каждого из родов семейства Ranunculaceae достаточно хранить лишь идентификатор-ссылку на единственную копию описания собственно характеристик семейства).

В литературе справедливо указывается на ряд ограничений реляционных баз данных при моделировании явлений и сущностей предметной области, с которой имеют дело естественнонаучные дисциплины (Page, 1995). Эти ограничения связаны с противоречием между комплексным характером природных объектов (в нашем случае компонентов растительного покрова), которым часто присуща сложная пространственная структура и иерархическая внутренняя организация, и трудностью представления таких объектов и их отношений с помощью жестко определенных двумерных таблиц, составляющих основу реляционных баз данных. Таблицы реляционных баз данных хорошо подходят для описания объектов с простой регулярной структурой и ограниченным числом однотипных атрибутов

Обзор прикладных ботанических программ

Не пытаясь охватить всего многообразия программ и пакетов программ, созданных (особенно в последние два десятилетия после широкого распространения персональных компьютеров) для применения в ботанических дисциплинах, мы сконцентрируем свое внимание на рассмотрении специализированных программных продуктов - информационных системах для поддержки ботанических исследований в области общей и сравнительной флористики, ботанической географии, фитоценологии и экологии растений, а также кратко на программах для таксономических исследований и создания таксономических баз данных, которые служат основой для всех ботанических информационных систем, имеющих дело с теми или иными списками таксонов растений. Прочие информационные системы и базы данных ботанического профиля будут рассмотрены конспективно с целью общей характеристики всего спектра используемых подходов и создания более цельной картины применения компьютерных технологий в ботанике.

За пределами подробного обзора также останутся полнотекстовые базы данных и текстовые информационно-поисковые системы, представляющие собой инструменты выбора текстовых документов (аннотаций статей, рефератов, библиографических ссылок, фактологической информации) из больших коллекций наборов текстовой информации. В качестве примера можно привести библиографические БД по украинской микологии (Dudka, Minter, 1995), по биоразнообразию Северной Евразии (Перегоедова и др., 2001), по гербарным коллекциям, коллекторам и гербарному делу (Батурина и др., 2006, http://www.rasl.ru/e resours/Gerbarv bin/herbarii.php). Организация таких баз данных, содержащих ботанические сведения, не имеет каких-либо принципиальных отличий от баз данных, ориентированных на другие области знаний. Отметим лишь, что количество таких систем постоянно растет, в том числе и в области ботаники и экологии, что связано с широким распространением емких носителей информации - CD-ROM и DVD дисков. Для поиска информации на конкретную тему часто используются методы нечеткого поиска и вероятностные подходы. Следует также добавить, что практическое значение таких текстовых ИПС в повседневной работе ботаников относи тельно уменьшается, что связано с появлением on-line доступа к электрон ным версиям журналов ботанического профиля, созданием крупными изда тельствами (например, Kluwer Academic Publishers, Blackwell Publishing, Springer-Verlag) электронных архивов публикаций (http://www.bioone.org, http://links.istor.org). разработкой специализированных реферативных порта лов, а также с общим лавинообразный ростом количества документов, вы ставленных в сети Internet и развитием мощных поисковых машин для дос тупа к ним (Google, MSN Search, Yahoo, AltaVista, InfoSeek, Lycos, Magellan; для русскоязычного сегмента Internet - Yandex и Rambler). Весьма значитель ную помощь в поиске тематической информации предоставляют ботаниче ские каталоги. Их эффективность напрямую зависит от того, насколько акту альную информацию они содержат и как часто обновляются. Один из самых крупных ботанических порталов - это Internet Directory for Botany (http://www.botany.net/n , в русскоязычном сегменте заметен ботаниче ский сервер Московского университета "Herba" (http://herba.msu.ru/russian/index.htmn.

Кроме рассматриваемых ниже компьютерных продуктов, существует множество более специализированных программ, разработанных для целей классификации и ординации растительных сообществ, оптимизации табличной обработки по методике Браун-Бланке (см. обзоры Б.М. Миркина (1989), Л. Мучины и Э. Ван-дер Маарела (Mucina, van der Maarel, 1989) , А.Б. Новаковского (2005)). Такие программы включают инструменты для специализированной статистической обработки, ориентированной на ботанические данные, которые не доступны в пакетах общей статистики. Для более эффективной обработки данных использование таких программ может (и должно) быть скомбинировано с применением ботанических информационных систем, содержащих базы первичных ботанических данных о растительном покрове, но их подробное рассмотрение выходит собственно за рамки

данной работы. Мы вынесли их обзор в Приложение 2, и считаем, что данная компиляционная сводка может представлять значительный интерес для флористов и геоботаников как краткий путеводитель по ботаническому компьютерному инструментарию в условиях дефицита специализированных работ на русском языке, посвященных этой тематике. Необходимо отметить, что авторами всех программ, включенных в этот обзор, являются специалисты в области ботаники и экологии растений, поэтому набор реализованных методов учитывает специфику ботанических данных.

Часть программных продуктов, включенных в Приложение 2, представляет собой сложные и многочленные пакеты программ, включающие в свой состав кроме чисто статистических процедур функции создания и редактирования наборов данных функции импорта данных из других форматов, инструменты ограниченного ручного структурирования и транспонирования сводных таблиц, трансформации данных (MULVA, SYNTAX, NTSYS, MSVP, FIVE-PA и др.). Критерием разграничения всех программ на две категории (ботанические ИС и прочие) послужила реализованная в них технология работы с исходным ботаническим материалом. Программы, вынесенные в Приложение 2, не содержат в своей основе базу данных и в качестве входных данных получают готовый набор числовых значений (например, двумерную матрицу распределения видов по исследуемых объектам, площадкам, описаниям), над которым проделываются все дальнейшие операции. Отсутствие в таких программах средств ведения собственной БД делает каждый анализ уникальным, затрудняет комбинирование и селекцию первичных данных, проведение повторных и сравнительных исследований, сильно ограничивает использование в анализе символьной информации (а ботаника, как одна из описательных дисциплин, накапливает значительную часть информации именно в трудноформализуемой текстовой форме).

Краткая функциональная характеристика системы IBIS

Программа IBIS создана с применением системы управления базами данных (СУБД) СА-СИррег 5.2е (СА-СНррег, 1992), поддерживающей реляционную модель данных (Codd, 1970, 1982; Циктритзис, Лоховски, 1985). Управляющий интерфейс программы (система меню, диалоги с пользователем, система сообщений об ошибках, система помощи и т.д.) базируется на оригинальных библиотеках подпрограмм, разработанных автором для данного проекта.

Требования к основным моментам функциональности БД формулировались неоднократно как на "общем" уровне (Ульман, 1983; Наумов и др., 1991; Page, 1995; Дейт, 1998;), так и с учетом специфики ботанической предметной области (Лайвиньш и др., 19876; Кагало, Сычак, 1997; Попов, Кулаков, 1997; Ханина, 1997; Марина, Марин, 1998; Баранова, Жезняковский, 2000). Полнота таких требований различна, и в последнем случае чаще формулируется для уникальных программных продуктов - информационных систем, создаваемых в рамках локальных ботанических проектов. Тем не менее, любая из программ подобного назначения должна содержать блоки из списка следующих основных функциональных компонентов: блок ввода, хранения, редактирования и резервирования ботанических данных; блок настройки и/или изменения структур данных (управление представлением БД в среде хранения); блок обработки пользовательских запросов: поиска, сортировки данных, а также получения выборок данных для последующей обработки; блок обеспечения структурной и смысловой целостности данных (ограничение целостности данных) и восстановления в случае нарушений; блок обмена первичными данными с другими программными средствами, в том числе с использованием глобальной сети Internet; блок обработки данных (получение вторичных данных), в том числе путем структурного преобразования и с использованием математических процедур, генерация отчетов, экспорт вторичных данных (конвертирование) для последующей статистической обработки и графической визуализации; блок средств обучения и получения помощи для конечных пользователей; блок администрирования баз данных при их коллективном использовании.

Все эти компоненты в той или иной степени реализованы в системе IBIS и рассмотрены ниже в контексте соответствующих категорий традиционных ботанический задач (разделы 2.5-2.7).

В основу системы IBIS положена компьютерная интерпретация традиционных технологий работы с ботаническим материалом, насколько это возможно, учитывая довольно жесткие требования к формализации исходных данных для их компьютерной обработки. Логическая структура БД, в целом, следует метафоре ботанической картотеки (или фитоценотеки): основная ма-нипулятивная единица в БД - это описание таксономической, топологической или функциональной части растительного покрова, т.е. оно представляет собой в зависимости от набора регистрируемых атрибутов весь спектр вариантов от простого видового списка до полного геоботанического описания. Каждый список видов сопровождается набором полей для характеристики местообитания или иных параметров, имеющих равное отношение ко всему списку. Такой набор в терминологии, использованной нами, называется дескриптор описания. Т.е. основная единица хранения данных в программе -комбинация дескриптора описания и связанного с ним списка видов со своими атрибутами (в дальнейшем в целях экономии места - просто "описание").

Существуют два уровня иерархии описаний: описания объединяются в группы описаний (рис. 2.1), группы описаний в тома описаний (рис. 2.2). Последние физически состоят из набора файлов и представляют собой независимую "базу данных" в наиболее традиционном ее понимании. Каждый из этих уровней (группы и тома) имеет собственное имя, в основу объединения может быть положен любой произвольный принцип. При работе с новой базой данных сначала создается новый том, затем внутри него первая группа описаний, затем собственно описания, которые после первоначального ввода могут быть затем свободно перемещены в другие группы или скопированы (продублированы).

Таксономический анализ

Поскольку основным предметом данной работы является методы обработки данных и программно-информационное обеспечение исследований растительного покрова, в настоящей главе на примере конкретных ботанических материалов показаны результаты компьютерной реализации традиционных и новых подходов. Обоснованием использования разнообразных по структуре ботанических данных послужило желание наиболее полно и наглядно показать многообразие возможных способов их обработки, заострить внимание исследователей-ботаников на ключевых аспектах получаемых результатов, которые должны способствовать формулированию содержательных выводов и выявлять, возможно скрытые, связи, зависимости и закономерности между описываемыми ботаническими объектами и/или их характеристиками.

Ввод материалов, использованных в данной работе, в базы данных системы IBIS осуществлялся как лично автором, так его коллегами из ТГУ и сотрудниками других ботанических учреждений, в которых установлено это программное обеспечение. Эталонные библиотеки видов создавались в основном независимо для каждой копии системы IBIS. Для переноса данных в целях формирования объединенного массива, доступного для оперативной обработки, использовались процедуры экспорта-импорта с синтаксическим контролем (описано в разделе 2.4.3), что позволило привести к общему знаменателю различные трактовки объема и систематического положения таксонов. В целом, номенклатура следует последним номенклатурным справочникам и флористическим сводкам для соответствующих территорий и таксономических групп (Арктическая флора СССР, 1960-1987; Флора Сибири, 1988-2003; Игнатов, Афонина, 1992; Константинова и др., 1992; Черепанов, 1995).

Общий объем ботанических данных, использованных для иллюстрации методов обработки, для разработки и тестирования программного обеспечения, составил 13 280 геоботанических и флористических описаний, 1 870 сводных списков видов и флор различного ранга, 735 сводных и генерализованных таблиц. Суммарное число индивидуальных регистрации видов в базах данных, использованных автором непосредственно в этой работе - 252 790. Проведенный опрос большинства пользователей системы IBIS дает следующую приблизительную оценку накопленного в электронной форме ботанического материала в формате IBIS: более 100 тыс. описаний, около 5000 флор, более 1.2 млн. регистрации видов.

Таксономический, или систематический, анализ является базовым элементом при выполнении любых флористических исследований, он также является важным компонентов при анализе парциальных флор, ценофлор в геоботанических исследованиях. Современный научный арсенал предлагает целый ряд подходов при анализе таксономического разнообразия флористических списков флор разного уровня: вычисление основных количественных параметров и пропорций флор; анализ таксономических структур (спектров) разного систематического и географического ранга; сопоставление абсолютных и удельных таксономических показателей комплексных флористических образований; изучение таксономической оригинальности флор; выявление степени их систематической сложности; анализ соотносительной представленности ведущих таксонов ранга рода и семейства и градиентов их изменения. Ниже мы рассматриваем эти подходы в отдельных подразделах.

Многолетние дискуссии в отечественной флористической науке, у истоков которой стоял А.И. Толмачев (Юрцев, 2004а), привели к значительному прогрессу в разработке научно-методических подходов и логической системы понятий и терминологии современной флористики (Юрцев, Камелин, 1991). Обоснование важности и эффективности долгосрочного мониторинга биоразнообразия на уровне локальных флор (ЛФ), в том числе и для целей индикации глобальных изменений среды (Юрцев, 1997), позволило перейти к практическому воплощению проекта "Создание сети мониторинга биоразнообразия Азиатской Арктики на уровне локальных флор", поддержанного несколькими грантами Российского фонда фундаментальных исследований. Материалом для построения сети мониторинга послужили данные по ЛФ, полученные в ходе многолетних (1955-2002) полевых исследований сотрудниками лаборатории растительности Крайнего Севера Ботанического института им. В.Л. Комарова РАН. Для ведения БД (всего было запланировано 130 базовых и 30 вспомогательных ЛФ из более чем 500 изученных, полные списки видов 135 ЛФ введены в БД) и анализа данных с 1994 года использовалась система IBIS (последовательно версии 4.0, 4.1, 5.0), несколько раз подвергавшаяся модификации и дополнению под специфические задачи проекта. Часть результатов, базирующихся на обработке 96 ЛФ, доложена в работах Б.А. Юрцева с соавторами (2001, 2002, 2004) и Т.М. Королевой с соавторами (2006а, 20066).

Система флористического деления Арктики на провинции и подпровинции дана по работе Б.А. Юрцева (Yurtsev, 1994). Далее использованы следующие обозначения: YA - Ямало-Гыданская подпровинция (ПП) Западно-Евразиатской провинции; ТА - Таймырская ПП Восточносибирской провинции; СН - Чукотская провинция с подпровинциями: СС - Континетально-Чукотская, CW - Врангелевская, CS - Южно-Чукотская, СВ - Берингийско-Чукотская; RA - Азиатская Арктика (объединение перечисленных флористических выделов). Названия и номера ЛФ соответствуют обозначениям в работе Б.А. Юрцев и др. (2001, табл. 1), их географическое положение и деление на ПП показано на рис. 3.1. В списках видов локальных флор регистрировались только сосудистые растения.

Похожие диссертации на Программно-информационное обеспечение исследований растительного покрова