Содержание к диссертации
Введение
ГЛАВА 1. Обзор литературы 10
Раздел 1. Обзор почвенных информационных систем 10
1.1 .Обзор почвенных информационных систем и баз данных 10
1.2. Предпосылки и этапы создания почвенных информационных систем 11
1.3. Современные почвенные информационные системы 16
1.3.1. Почвенная информационная система SOTER 16
1.3.2. Почвенная информационная система CanSIS 24
1.3.3. Почвенная информационная система ASRIS 28
1.3.4. Почвенная база данных Европы ESDB 32
1.3.5. Почвенные информационные системы и базы данных США 36
1.3.6. Почвенная база данных WISE 37
1.3.7. Всемирная гармонизированная почвенная база данных HWSD 40
1.3.8. Цифровая почвенная карта мира - GlobalSoilMap.net 42
1.3.9. Другие почвенные информационные системы и базы данных 45
1.4. Ограничения современных почвенных информационных систем 48
Раздел 2. Обзор модельных представлений о почве 51
Глава 2. Условия, объекты и методы исследования 60
Глава 3. Обсуждение результатов исследований 62
Раздел 1. Модельные представления в почвоведении 62
Раздел 2. Принцип квантования 64
Раздел 3. Семантическая модель описания почвы 72
Раздел 4. Разработка системы формализации почвенных метаданных 86
Раздел 5. Проектирование и создание почвенной информационной системы 97
Раздел 6. Вывод картографической информации в Интернет 115
Раздел 7. Степень неоднородности при описании почвенного разреза по разным системам морфологического описания почв 121
Выводы 136
Литература
- Предпосылки и этапы создания почвенных информационных систем
- Почвенные информационные системы и базы данных США
- Принцип квантования
- Вывод картографической информации в Интернет
Введение к работе
Актуальность темы. Информационные технологии (ИТ) дают возможность получать информацию о почвах ежедневно и обрабатывать ее в реальном времени. ИТ позволяют проводить пространственно-распределенный статистический анализ и многое другое - от построения системы информативных признаков (диагностики) до распознавания новых объектов (классификации) (Рожков, 2007, 2011). Расширение спектра возможностей получения почвенных данных, обусловленное развитием современных цифровых методов, приводит к острой необходимости разработки почвенных информационных систем (ИС).
Исследование современного состояния российских и зарубежных разработок в области использования ИТ для работы с почвенными данными показало, что наиболее актуальными являются почвенные ИС третьего поколения, в которых присутствуют три компонента: реляционные базы данных (БД), геоинформационные системы (ГИС) и использование сети Интернет (Иванов, Рыбальский, Сафрошкин, 2008). Такие системы используются для прогнозирования, моделирования и других почвенных исследований (Хомяков, 1997), таких как прогноз опасности эрозии, окисления и других типов деградации почв; почвенный мониторинг; агро-экологическое районирование и многих др. На данный момент известно несколько десятков региональных систем, более 10 почвенных ИС национального уровня (Australian Soil Resource Information System; National Soil Information System (США) и др.), а также несколько мультинациональных и глобальных систем (European Soil Database, Европа; SOTER, глобальная почвенная ИС и др.) (Finke, 2001; Brough, 2006; van Engelen, 2010). В 70-80-х гг. XX в. российскими почвоведами был внесен существенный вклад в разработку общих идей построения почвенных ИС на первом этапе - разработке атрибутивных баз данных (Шишов и др., 1975; Рожков, 1976, 1980, 1983). Несмотря на повышение интереса к подобным разработкам (Белоусова, Мешалкина, 2009; Крыщенко, Голозубов, 2010), в РФ до сих пор не существует актуальной действующей почвенной ИС (Колесникова и др., 2010), поэтому одной из важнейших задач является создание отечественной системы.
Невзирая на стремительное развитие зарубежных почвенных ИС, остается актуальной проблема сохранения первичного смысла исходной информации о почвах при переводе почвенной информации из текстового, «бумажного» формата в электронную форму. Эта проблема является следствием слабо проработанной модели описания предметной области, и для ее решения необходимо создание системы формализации разнородных почвенных данных, отражающей в себе все многообразие почвенных объектов и свойств почвы и позволяющей избежать искажения получаемой информации, слабой масштабируемости и трудоемких ручных приемов работы. Кроме того, формализация связана с решением фундаментальной проблемы математизации почвоведения (Рожков, 2007) - отсутствием класса моделей, позволяющих включить в активное использование специфические почвенные категории и понятия. Работа над этой проблемой приближает нас к тому, чтобы сделать почвоведение точной наукой, о чем мечтал основатель учения о почвах В.В. Докучаев (Докучаев, 1886).
Цель работы: изучение информационных взаимоотношений и разработка методов формализации основных понятий предметной области - почвоведения, необходимых для перехода от визуально доступных форм хранения почвенных документов к электронным формам, и создание семантической модели описания почв в виде почвенной ИС.
В работе поставлены следующие задачи:
-
провести анализ современного состояния зарубежных и отечественных разработок в области использования ИТ для работы с почвенными данными, исследовать существующие модели их описания;
-
дать информационную характеристику документам предметной области исследования, оценить проблемы и возможности перехода от визуальных форм хранения почвенных данных к электронным формам;
-
разработать информационную модель описания почвы для использования в электронной среде хранения и обработки данных, и на ее основе создать систему формализации разнородных почвенных данных;
-
спроектировать и создать почвенную ИС описания предметной области;
-
исследовать возможность гармонизации почвенных описаний, выполненных с использованием разных методик морфологического описания почв.
Научная новизна. Впервые, с использованием семантического подхода, проведен информационный анализ текстов почвенных документов и сформулирован принцип квантования почвенной информации, заключающийся в том, что передача почвенной информации осуществляется стандартными дискретными порциями, имеющими однородный состав структурных элементов и однородную структуру внутренних отношений, и инвариантных относительно формы хранения почвенных данных - вербальной, визуальной или электронной.
Впервые разработана модель предметной области, описывающая почву как семантические отношения, возникающие между именами базовых понятий предметной области - показателей, их значений, методов определения значений показателей свойств почв, и именами характеризуемых ими почвенных объектов. Данная модель, реализованная в форме оригинальной БД, является основополагающей частью почвенной ИС. Она позволяет переводить данные из текстовых (аналоговых) описаний почвенных разрезов в электронную (цифровую) форму хранения и восстанавливать их из цифровой формы хранения в аналоговую без потерь и искажения информации - точность авторского описания поддерживается и контролируется полнотой метаданных, описывающих предметную область.
Разработанная модель описания предметной области впервые позволяет дать математическую интерпретацию описанию почвы - как ассоциированного массива показателей свойств почв; и почвенного профиля в целом - как дерева ассоциированных массивов показателей свойств почв в пространстве почвенных объектов. Подобная интерпретация позволяет устанавливать и выражать связи между элементами строения почвы и их показателями через формальные логические отношения.
Практическая значимость. Использование почвенной ИС, описывающей предметную область, позволяет обеспечить ввод, хранение и обработку большого количества фактических материалов по почвам. В основе созданной ИС лежит разработанная оригинальная модель БД, которая позволяет объединить показатели, описывающие свойства почвы, с объектами, из которых состоит почвенное тело, в единую систему, обеспечивая взаимодействие между ними при помощи формальной логики на базе набора определенных алгоритмов, теоретически позволяя работать с бесконечным множеством данных. Благодаря концепции минимальной информационной почвенной единицы, которая играет роль своеобразного кванта почвенной информации, разработанная почвенная ИС стала гибкой, легко расширяемой и поддерживающей масштабируемость и интероперабельность (способность взаимодействовать с другими почвенными ИС и БД без каких-либо ограничений).
Важная особенность разработанной почвенной ИС, иллюстрирующая принцип квантования почвенной информации, - вывод полноценного описания почвенного разреза в том же виде, в котором он существовал на бумажном носителе, что по сути является сохранением смысловых и логических связей между почвенными показателями и объектами. Коллективный доступ к системе, осуществляемый через Интернет, позволяет преодолеть проблему того, что большое количество получаемой научной информации о почвах оказывается в ограниченном использовании. Другими преимуществами данной модели являются открытость инфраструктуры, возможность персонализации интерфейса, сохранение алгоритмов обработки данных и извлечения информации при изменении списочного состава индексированных показателей и многое др.
Разработанная модель применена для реализации Почвенно-географической базы данных России (ПГБД).
Методология исследования. В работе использованы современные методы поиска и анализа информации, методы проектирования и построения моделей, методы преобразования и кодирования информации для ее представления в цифровых форматах и методы компьютерного моделирования для создания почвенной ИС.
Апробация работы. Результаты работы и основные положения были представлены и обсуждались на V съезде Всероссийского общества почвоведов им. В.В. Докучаева (Ростов- на-Дону, 2008), Всероссийской научной конференции «Научный сервис в сети Интернет: решение больших задач» (Новороссийск, 2008), XVII Международной конференции студентов, аспирантов и молодых ученых по фундаментальным наукам «Ломоносов - 2010» (Москва, 2010), Международной конференции «Научно-практические аспекты развития современной техники и технологий в условиях курса на инновации» (Санкт-Петербург, 2010), Европейском рабочем совещании «Global Soil Fertility: The role of next generation smart fertilizers» (Wageningen (Нидерланды), 2011), а также на рабочем заседании Международного информационно-справочного центра по почвам (ISRIC) (Wageningen (Нидерланды), 2011). Результаты
работы обсуждались на заседания семинара по цифровой почвенной картографии (ЦПК) под-
комиссии "Картография почв" и комиссии по педометрике Общества почвоведов им. В.В. Докучаева в Почвенном институте им. В.В. Докучаева. Разработанная семантическая модель обсуждалась на совещании, посвященном интеграции почвенных БД России, Украины и Белоруссии (Москва, 2011).
Публикации. По теме диссертации опубликовано 12 работ, из них 2 статьи в реферируемых изданиях, включенных в список ВАК.
Структура и объем работы. Диссертация состоит из введения, трех глав и выводов, изложенных на страницах машинописного текста. Содержит таблицы и рисунков. Список литературы насчитывает наименования, из них на иностранном языке.
Предпосылки и этапы создания почвенных информационных систем
В 70-80-х годах, российскими почвоведами был внесен существенный вклад в разработку общих идей построения почвенных ИС на первом этапе -разработке атрибутивных БД (Шишов и др., 1975; Рожков, 1976, 1980, 1983, 1987). С момента организации Рабочей группы по почвенным информационным системам на Международном конгрессе почвоведов в Москве (1974), российские ученые принимали активное участие в разработке почвенных ИС и БД (Рожков, 1980). В 90-х гг. XX в. века в связи с трудной экономической ситуацией интерес к подобным работам снизился; но даже несмотря на сложные условия, российские исследователи продолжали работать в данном направлении. Несмотря на повышение интереса к подобным разработкам (Белоусова, Мешалкина, 2009; Крыщенко, Голозубов, 2010), и активное участие в международных проектах (Столбовой и др., 2001; Land Resources of Russia, 2002) в РФ до сих пор не существует актуальной действующей почвенной ИС (Колесникова и др., 2010), поэтому одной из важнейших задач является создание отечественной системы.
Современные почвенные информационные системы 1.3.1. Почвенная информационная система SOTER
Программа SOTER - Всемирная цифровая база данных почв и территорий (Global Soil and Terrain Database - SOTER [Электронный ресурс]) имеет целью разработку стандартных форматов представления цифровых карты и вспомогательных данных по почвам для Мировой базы данных почв и территорий. Впервые вопрос о необходимости создания Глобальной почвенной БД был затронут в 1984 г. (Sombroek, 1984), а спустя два года FAO, UNEP и ISRIC начали работу над проектом. Разработка системы велась под эгидой IUSS в сотрудничестве с большим количеством национальных почвенных институтов. SOTER задумывалась как глобальная система, которая будет применяться по всему миру, поэтому в системе используется почвенная классификация WRB (World reference base for soil resources, 2006). Предполагалось, что итогом работы SOTER явится замена Почвенной карты мира FАО-UNESCO (FAO UNESCO, 1974).
Проект был инициирован для преодоления главных ограничений на пути к глобальному моделированию и исследованиям - нехватке стандартизированной, совместимой БД почв. Он был задуман как универсальная система картографической легенды к мировой цифровой базе данных почв и ландшафтов и должен был определить минимально необходимый набор признаков почв и ландшафтов, необходимых для построения карт почвенных ресурсов. За исходную основу был взят масштаб 1:1 000 000 (Handbook of Soil Science, 1999).
Главными целями проекта являлось: - предоставление информации об окружающих почвенных и ландшафтных ресурсах в глобальном масштабе (1:5 000 000) в форме, доступной для моделирования потенциала производства пищевых продуктов, изменения климата, речных потоков, распределения домашнего скота, выбора приоритетов исследований, конструирования ландшафтов и общего управления земельными ресурсами. - предоставление образовательного инструмента сообществу почвоведов; - обеспечение согласованных норм и правил для картографии, классификации, анализа почв и интерпретации информации о почвенных ресурсах. Фактически SOTER является не просто почвенной ИС, а представляет собой методологию или концепцию на основе которой любой исследователь может разработать свою собственную систему. Проект SOTER имеет различные версии, которые менялись по мере развития проекта. Каждая версия ознаменовывалась новым документом о проекте. Последняя, пятая версия вышла в 1995 году.
Методология картографирования SOTER порождена идеей, что ланд шафты (с физическими особенностями их территорий и почв), объединяют процессы и системы взаимосвязей между физическими, биологическими и социальными явлениями, развивающимися в течение времени. Эта идея была развита первоначально в России и Германии (ландшафтоведение) и стала постепенно принятой во всем мире. Поэтому SOTER рассматривает ландшафт, как естественный объект, состоящий из комбинаций физических особенностей местности и почвенных индивидумов (Global and National Soils and Terrain Digital Databases, 1995; Tempel, 2002).
В основе SOTER лежит идентификация областей ландшафтов с отличительным, часто повторяющимися, образцами литологии ландшафтов, поверхностной формой, наклоном, материнской породой и почвой. Части ландшафтов, которые отличаются по этим признакам, называют единицами SOTER. Таким образом, каждая единица SOTER представляет одну уникальную комбинацию физических особенностей местности и характеристик почв.
Критериями разделения на первом этапе уровня единиц являются: физиографические особенности местности - доминирующие градиенты наклона, интенсивность их проявления, гипсометрические характеристики, степень рассеченности, размеры области, а также литологические различия почвооб-разующих пород. На рис. 1 показано представление единиц SOTER в базе данных и дан пример карты SOTER с полигонами, которые были нанесены на карту на этом уровне дифференциации.
На втором этапе выделяются компоненты территории - части территориальных единиц SOTER, отличающиеся формами рельефа, наклоном, мезорельефом и в областях, покрытым неконсолидированным материалом, текстурой родительского материала. В зависимости от масштаба карты, возникают некартируемые компоненты территорий. В этом случае информация о них заносится в атрибутивную часть БД, но не отображается в ее геометрической части.
Почвенные информационные системы и базы данных США
Вместе - имя и его определение дают понятие о вещи. Понятие - определение вещи или мысль, обозначающая свойства каждой вещи, каждое из которых необходимо, а все вместе они достаточны для ее однозначного определения (обозначения, указания) в рассматриваемом отношении (качестве). Мы понимаем какую-либо вещь исчерпывающим образом, если и только если сможем определить ее понятие. Следствие - чтобы сформировать понятие о некоторой вещи, нужно знать ее свойства, но не всякие, а только необходимые и вместе достаточные.
Таким образом соотнесение имен и вещей является динамическим процессом. Реальная потребность в новом имени возникает тогда и только тогда, когда знание о свойствах вещи выходит за границы необходимых и достаточных условий понимания вещи. Тогда, старое имя или отмирает, или продолжает существовать в рамках этих условий, новое имя приобретает новый смысл. Если же одно имя заменяется другим без веских оснований, то это простое символьное переименование. Принцип "бритвы Оккама" - не плоди имен сверх необходимых.
Конечно, в повседневной ситуации мы не следуем столь строгим и педантичным правилам устного высказывания или записи принятый в научной среде, сообщений, а используем редуцированные формы. Но всегда подразумеваем его, дополняя усеченный вариант устного сообщения или текстового документа до полного варианта, что является характерной спецификой, принятой в научной среде. Приведенные примеры раскрывают общепринятую специфику обмена данными и информацией на уровне вербальных методов передачи информации от источника к получателю.
Анализ устных сообщений и текстовых документов, принятых в научной среде, показывает, что информационный обмен (коммуникация) между источником и получателем данных, принятый в научной среде, осуществляется строго закономерным способом; в частности, анализ устных сообщений и текстовых почвенных документов - вербальных методов передачи информации от источника к потребителю, показывает, что элементарный акт обмена информацией состоит из передачи однотипного набора вербальных утверждений (рис. 13): - объект о характеризуется значением v показателя і, определенного методом т, или - значение v показателя /, определенное методом т, принадлежит объекту о, где о, і, т и v - конкретные имена соответствующих сущностей, специфичные для предметной области; фактически это обобщенные значения имен понятий почвоведения. Рис. 13. Семантика элементов структуры утверждения в почвоведении
В качестве примера рассмотрим фрагмент описания почвенного разреза: "В горизонте AEL дерново-подзолистой глееватой почвы обильно представлены железисто-марганцевые конкреции размером 1-2 мм. Этот горизонт характеризуется следующими значениями: рНводн. - 4,0; рНсолев. - 3,2" (Апарин и др., 2007).
Этот фрагмент содержит информацию о следующих именах: 4 объектах - почве, почвенном горизонте, железо-марганцевых конкрециях, образце; 8 показателях - наименовании почвы, индексе почвенного горизонта, новообразованиях, обилии новообразований, нижней границе размеров новообразований, верхней границе размеров новообразований, рН водной и солевой суспензий; 8 значениях - дерново-подзолистая, AEL, обильно, железо-марганцевые конкреции, 1, 2, 4,0, 3,2; 7 методах - согласно Классификации почв (2004), Справочнику индексов почвенных горизонтов (2004), классификации видов новообразований, справочнику обилия новообразований, автор ский метод, потенциометрический метод, метод не указан.
Использование обычных наименований для структурных элементов о, і, т, v (табл. 5) позволяет превратить общую формулу информационного утверждения в конкретное осмысленное выражение простой подстановкой текстовых фрагментов из ячеек таблицы. Например, "объект почвенный горизонт характеризуется значением AEL показателя индекс горизонта, определенного методом согласно справочнику индексов почвенных горизонтов (2004)" или "значение 1 мм показателя нижняя граница размеров новообразований, определенное авторским методом принадлежит объекту железо-марганцевые конкреции".
Принцип квантования
В процессе работы над геоинформационной компонентой почвенной ИС, в Интернет была выведена карта почвенно-экологического районирования (ПЭР) России масштаба 1:2500000 (Карта почвенно-экологического..., 2007). Также осуществлена возможность отображения карты административного деления РФ (М 1:1000000) и точек разрезов с GPS-координатами, добавленными в БД. Заложена возможность вывода почвенной карты России в виде отдельного слоя (Почвенная карта России, 2007). Карты возможно просматривать как в традиционной конической равнопромежуточной проекции, так и в проекции Меркатора, совместно со слоем Google Maps (http://db.soil.msu.ru/map). Интерактивная составляющая позволяет выводить как все слои одновременно, так и по отдельности, например, верхняя иерархическая единица - почвенная зона, представленная 16-ю основными контурами, может быть преобразована в отдельный слой с 67 почвенными провинциями. Подобный вывод картографической информации облегчает ее вос 115 приятие и обеспечивает комфортную образовательную и научную работу. Архитектура системы позволяет выводить информацию о почвах через SQL-запросы к атрибутивной почвенной БД, что соответствует функционалу зарубежных систем.
Карты возможно просматривать как в традиционной конической равно-промежуточной проекции (рис. 22), так и в проекции Меркатора, совместно со слоем Google Maps (рис. 23).
Интерактивная составляющая карты позволяет выводить отдельные слои, например, верхняя иерархическая единица - почвенная зона, представленная 16-ю основными контурами, может быть преобразована в отдельный слой с 67 почвенных провинциями. Подобный вывод картографической информации облегчает ее восприятие и обеспечивает комфортную образовательную и научную работу. В свою очередь, каждая провинция поделена на округа и районы и в перспективе возможно выводить информацию о почвах, представленных в этом районе через к SQL запросы к атрибутивной почвенной БД.
В системе вывода картографической информации можно выделить следующие понятия модули (Soil Data Subcommittee Federal Geographic Data Committee, 1997):
Покрытие — это цифровая почвенная карта в формате базы данных геоинформационного пакета (такого как Arclnfo, Maplnfo и т.п.). Она представляет набор геометрических данных, описывающих конфигурацию и местоположение географических объектов, путём представления их в виде полигонов, и набор семантических характеристик, описывающих свойства или параметры (атрибуты) этих объектов.
Полигоны — это каждый нанесённый на карту замкнутый контур. Каждый полигон принадлежит только одной почвенной картографируемой единице и каждая картографируемая единица может содержать несколько полигонов. Каждому полигону должен быть присвоен определитель почвенной картографируемой единицы (SMU), который представляет собой число, служащее указателем местоположения описания этой почвенной картографируемой единицы (SMU) в таблице под названием STU.ORG.
Картографируемые почвенные единицы (SMU) - это закономерная сочетание типологических почвенных единиц и должна содержать не меньше одной типологической почвенной единицы. Аналогом картографической почвенной единицы является почвенная ассоциация, почвенная комбинация, комплексы, сочетания почвенных типологических единиц.
Типологические почвенные единицы (STU) — это почвенный тип, в пределах определённой поверхности характеризуемый однородностью свойств. Аналогом является тип почвы.
Одна и так же типологическая почв единиц может входить в состав нескольких карт единиц. В свою очередь почвенная типологическая единица (STU) может присутствовать более, чем в одной, почвенной картографируемой единице (SMU). Таким образом, с точки зрения БД мы имеем следующее соотношение между полигонами и типологическими почв единицами.
Каждой почвенной типологической единице (STU), присутствующей в почвенно-географической базе данных, должен соответствовать расчётный почвенный профиль, описанный в базе данных почвенных профилей. Фактически типологическая единица — это модель. Наполнение расчётного почвенного профиля данными должно основываться на обобщении результатов описания и анализа нескольких реальных профилей или на расчётном описании, выполненном экспертом, знакомым с данным почвенным типом. Расчетный профиль должен представлять собой усреднённый типовой профиль, который наилучшим образом характеризует почвенную типологическую единицу (STU).
Каждая типологическая почвенная единица характеризуется неким эталоном почвы, т.е. каждой типологической почв единице соответствует один эталонный почв профиль. Для построения БД мы должны иметь некий набор эталон профилей, количество которых ограничено количеством типологических единиц. Недостаток этого подхода — если меняется классификационный подход, то меняются контура, т.е. фактически вся работа становится некорректной. Вследствие этого, встает проблема -существующие почвенные классификации и почвенные типологические единицы являются недостаточными, для обеспечения стабильной работы.
Так как каждая эталонная STU представляет собой некий центральный образ почвы, который составляется на основе свойств многих разрезов, следует, что информационной базой должны быть экспериментальные данные, которые не ограничены количеством разрезов, а по возможности наиболее заполнены различными профилями почв.
Важнейшей задачей заключается то, чтобы не привязываться к почвенной единицы, а предоставить эксперту работать с максимально возможным количеством реальных почвенных профилей. Т.к. эксперт формирует центральный образ путем синтеза из отдельных описаний - надо провести обзор реально существующих профилей; для максимальной точности и однозначности информации, у экспертов, дающих характеристику почвенной единицы, должно быть как можно больше различных данных, из которых путем экспертной оценки формируются центральные образы почвенных типологических единиц.
Каждой почвенной типологической единице должны соответствовать один или несколько эквивалентных реальных, имеющих географическую привязку, почвенных профилей. Этот измеренный и географически привязанный почвенный профиль должен находиться в той почвенной картографируемой единице, в которую соответствующая почвенная типологическая единица входит в качестве компонента. Установление надёжной связи между почвенными типологическими единицами и базой данных почвенных профилей является важнейшей задачей.
Вывод картографической информации в Интернет
Согласно мнению исследователей Почвенного института им. В.В. Докучаева особенные расхождения наблюдаются в оценке почв на высоких таксономических уровнях (Герасимова, 2009). Например, глеевые почвы (глее-земы, Gleysols, Stagnosols) выделяются в большинстве классификаций и отсутствуют в американской таксономии почв (Soil Taxonomy, 1999), где они разбросаны как переувлажненные по разным категориям (Aquolls, Aquorthels, aquic подгруппы). На высших уровнях разных систем постоянно «меняются местами» глеевые и криогенные почвы (криоземы, Cryosols). Трудности процесса корреляции являются следствием как свойств объектов (почвенных тел, их континуальности и сложности), так и подходов к самому процессу корреляции, ведь почва - один из наиболее сложных для изучения и понимания объектов материального мира.
Субъективность описания почв была изучена в ходе исследовательских работ на основании сравнительного анализа описаний одного и того же разреза, сделанного разными исследователями (разные группы студентов, собственные описания и описания сотрудника ISRIC, Нидерланды). Сначала сравнивались описания, выполненные по Классификации почв (1977); затем - по классификации ФАО. Оказалось, что различия в описаниях существуют: различие в указании мощности горизонта в среднем 1-3 см; различие в цветах до полутона; в переходных горизонтах - различаются показатели влажности, порозности, твердости; неодинаково описаны переходы между горизонтами. Выявлено, что описания различаются в среднем до 10% по ключевым информационным параметрам. Очевидно, что несколько выше оказались различия в описаниях почв, полученных при использовании отечественного и зарубежного подхода, но эти различия не являются существенными и не ока 123 зывало влияние на отнесение почвы к той или иной классификационной единице (см. приложение 4).
Таким образом, человеческий фактор так или иначе оказывает определенное влияние на результаты морфологических описаний даже в рамках одного и того же почвенного разреза. В работе «Информация и самоорганизация» Хакен отмечает, что смысл сигналу приписывает тот, кто его принимает (Хакен, 1991). Это означает, что практически невозможно получить идентичные сведения, но расхождения не настолько велики, чтобы сместить почву в классификационном поле. Исследования в данном направлении следует продолжить и существенно расширить для более полного понимания влияния человеческого фактора, для оценки степени этого влияния и разработки способов снижения возникающих неопределенностей и неточностей.
Второй аспект гармонизации, рассматриваемый более подробно, возникает при использовании разных подходов к описанию условно одного и того же разреза. То есть мы изучаем ситуацию, в которой один и тот же разрез (с определенными географическими координатами) исследователи описывают с использованием разных методик. Предполагается, что может возникнуть проблема точности соответствия описаний друг другу, а также могут возникнуть несоответствия при попытке их гармонизировать, ведь основным объектом БД является конкретный почвенный разрез с присущим ему набором почвенных горизонтов, характеризующийся специфическим набором атрибутивных данных (Почвенные ресурсы России..., 2010).
Для оценки практической возможности корреляции морфологических характеристик, полученных при описании почв по двум различным системам, - принятой в России (Методическое руководство по описанию почв в поле, 1982; Розанов, 2004; шкала РосНИИземпроекта; Классификация почв..., 1977) и международной методологии FAO (Guidelines for soil description, 2006; Munsell Soil Color Charts, 1990; WRB, 2006) - были использованы полевые данные. Введение данных в систему занимало больше времени, чем введение данных в табличный формат Excel (перенесение информации из поле 124 вого дневника), но окупается быстротой и удобством их извлечения, а также появлением возможности осуществлять широкомасштабные аналитические исследования и многое др. Возможность использования гибких SQL-запросов позволяет проводить очень большое количество манипуляций с данными, хранящимися в массиве, постоянно обновляемом и пополняемом исследователями.
Что касается методологии корреляции классификаций, то она представляется достаточно сложной, часто субъективной, зависящей от принадлежности почвоведа к той или иной научной школе, следовательно, используемых им подходов, от почв - объектов корреляции, от таксономического уровня коррелируемых почв и может приводить к разным результатам, далеко не всегда однозначным и предсказуемым (работы B.C. Столбового, Б.В. Шеремета, П.В. Красильникова, П. Хажиньского и др.).
П.В. Красильников (Почвенная номенклатура и корреляция, 1999) проводит корреляцию преимущественно на основе «типичных профилей» или архетипов. В.С.Столбовой и Б.В. Шеремет (2000) подчеркивают, что трудности корреляции вызваны различиями в принципах и структуре классификаций. Есть разные подходы снижения описанных противоречий, наиболее часто их них используется так называемый «двухуровневый подход». Первоначально почвы описываются одинаковым набором свойств, и по совокупности параметров этих свойств выявляется степень сходства между почвами. Этот первый уровень методологии основан на концепции информационной базы классификаций. На втором уровне полученный результат подвергается экспертной оценке, основанной на представлениях о генезисе почв. Оценки возможности корреляции классификаций путем сопоставления их концептуальных основ кажутся весьма пессимистическими, хотя не следует исключать «согласования измеримых свойств почв», на основании которых возможно проводить некоторые сравнения.