Введение к работе
Современные методы дистанционных исследований, воплощаемые в технических средствах фотографирования, оптического сканирования и телевидения, радиометрии, радио и лазерной локации, создают реальную основу для регулярных наблюдений за землей и природной средой из космоса. Информация, полученная с помощью перечисленных технических средств, носит многоотраслевой характер, направленный на решение различных задач о природных ресурсах земли, деятельности человека, науке о земле.
Очевидно, что, обладая такой уникальной информацией, как аэрокосмические видеоданные, необходимо развивать средства и методы ее обработки.
При формировании идеологии обработки, как и при постановке любой задачи, важно определить ее конечную цель. Определяя конечную цель цифровой обработки видеоизображений при аэрокосмических исследованиях, можно выделить два главных направления:
1. Обработка видеоинформации, имеющая цель устранить
неопределенности и искажения, вносимые измерительным
трактатом (радиометрическая и геометрическая коррекция,
учет влияния атмосферы, улучшение визуального качества) -
так называемая предварительная обработка.
2. Классификационный и интерпретационный анализ данных
- тематическая обработка.
В большинстве случаев конечной целью обработки видеоизображений является их тематическая интерпретация, выработка рекомендаций по использованию в практических и научных целях полученных данных.
Теоретический и практический анализ существующих проблем цифровой обработки многозональных видеоданных показал, что целесообразнее всего процесс тематической обработ-
ки строить в виде замкнутого цикла. Тематической обработке должна предшествовать предварительная обработка, далее должен проводиться анализ видеоинформации с целью определения свойств и характеристик признакового пространства исследуемого объекта. После выделения признаков и определения их основных характеристик можно проводить процедуру классификации, которую, в свою очередь, можно разделить на контролируемую и неконтролируемую классификацию. Следующий этап — идентифицировать и интерпретировать полученные на предыдущем шаге результаты и представить их в удобном виде для качественного и количественного анализа и выработки рекомендаций.
Таковы основные этапы цикла тематической обработки, на всех этапах которой необходимо учитывать особенности обработки многозональных изображений.
Актуальность темы. Специфика задачи распознавания изображений определяется необходимостью достижения компромисса между противоречивыми факторами.
Основное противоречие связано с тем обстоятельством, что использование преимущества представления информации в виде изображений неразрывно связано с приданием этой информации "неизобразительного" вида, так как существующие алгоритмы ориентированы на число для количественного анализа. При количественном подходе необходимо перейти к формальному описанию изображений на языке выбранного признакового пространства. В этом смысле явления, происходящие на земной поверхности, можно рассматривать как случайный процесс, что в значительной степени облегчает- формализацию описания признаков объектов земной поверхности и позволяет проводить ее методами цифровой обработки изображения.
Следующее противоречие связано с тем, что при обработке многозональных видеоизображений известными методами трудно учесть незначительные изменения интенсивности принимаемой радиации. Эти изменения даже, казалось бы, для од-
нородных объектов могут быть обусловлены рядом причин, например, вариациями влажности почв сельскохозяйственных угодий, влиянием рельефа местности, вкраплениями разнообразных пород деревьев в лесных массивах и др. Отказ от учета этих вариаций приводит к неверной трактовке результатов статистической обработки видеоинформации.
Очевидно, вопрос о разделении объектов земной поверхности друг от друга по значениям тех или иных параметров многоспектральной видеоинформации и разработка эффективных, точных алгоритмов, реализующих эту процедуру, представляется актуальным и перспективным.
Анализ разработанных по данной проблеме подходов и методов показал, что известные эффективные методы только частично решают указанные проблемы, то есть задача разделения объектов земной поверхности на однородные области с последующей их интерпретацией решается неоднозначно. Успешное решение этой проблемы возможно лишь при системном подходе, на основе глубокого понимания и знания распределения спектральных характеристик объектов земной поверхности и факторов, влияющих на эти спектральные характеристики, например, такие, как пространственно-временные изменения.
Такой системный подход формирования структуры тематического цикла цифровой обработки должен предоставлять возможности оперировать стандартными и нестандартными средствами обработки изображений. Проводить многоуровневую процедуру, когда результаты одного уровня являются входными данными для другого, пока не будет достигнута оптимальная, по выбранному правилу, остановка решения или представление окончательного результата. И самое главное - структура тематического цикла должна предоставлять возможность вводить новые элементы обработки, нестандартные подходы и интегрировать их в достаточно полную систему обработки для решения широкого круга задач.
Тематический цикл обработки должен опираться на выбор наилучшего алгоритма распознавания по заданному критерию.
Критерием может стать качество распознавания, стоимость выполнения операций цифровой обработки или оперативность в получении результатов обработки.
Алгоритмы распознавания, входящие в цикл тематической обработки, как известно, делятся на контролируемую и неконтролируемую классификацию.
Вопросам неконтролируемой классификации (или автоматической) в последнее время уделяют все больше внимания в связи с разработкой универсальных и специализированных аппаратно-программных средств цифровой обработки в реальном масштабе времени. Сложность выполнения таких традиционных алгоритмов кластеризации в пространстве признаков, как К-ближайшего соседа или ИСОМАД существенно зависит от сложности сцены. Они требуют чрезмерно больших затрат времени, что вызвано большим количеством итераций при определении средних значений и пересчитывания центров кластеров.
Альтернативой такому подходу является метод анализа многомерных гистограмм и маркирование изображения, позволяющее за одно сканирование выделить связанное множество точек каждого объекта. Учитывая, что процедуры накопления гистограмм и маркирования операции быстрые и осуществляются за одно сканирование, такой подход можно считать заслуживающим внимания.
Перспективным также является сочетание кластерного анализа и контролируемой классификации, позволяющие корректировать несовпадение спектральных и информационных классов. Кластерный анализ выделяет объекты спектральных кластеров, а классификация (контролируемая) устанавливает их соответствие с информационными классами.
Идентифицирование объектов земной поверхности и установление соответствия с информационными классами достаточно сложная задача, так как она связана с банком наземной и бортовой информации, а следовательно, с необходимостью предварительно формировать априорные данные, то есть опи-
сать их на языке признакового пространства. Здесь также возникает проблема коррекции данных, влияние которых на результаты классификации достаточно существенны.
Решение перечисленных проблем — задача сегодняшнего дня, что является перспективным и целесообразным в целях создания структуры математического обеспечения высокого уровня для оперативного количественного и качественного анализа многоспектральной видеоинформации. Мерой качества математического обеспечения можеть стать его универсальность и гибкость по отношению к разным классам прикладных задач, а также наличие сервисных возможностей, предоставляемых потребителям аэрокосмической видеоинформации.
Цель работы. Целью диссертационной работы является построение универсальной математической модели распознающей системы для решения задачи идентификации природных образований по многоспектральной видеоинформации.
Для достижения поставленной цели решались задачи:
Разработки эффективного метода совмещения многомерных панорамных снимков, учитывающего параметры линейных сдвигов по координатным осям.
Разработки эффективного метода кластеризации многомерного изображения на базе анализа N-мерной гистограммы и отвечающего требованиям критериев:
а) компактности элементов N-мерных изображений;
б) альтернативного выбора наилучшего поднабора кластеров
по расстоянию (J-M).
Разработки эффективного метода выбора информативных поднаборов каналов для исследуемых объектов при автоматизированном анализе совмещенной спектральной схеме.
Разработки эффективного метода преобразования яркост-ных значений элементов изображения, учитывающего характеристики калибровочных клиньев на фотопозитивах.
Разработки эффективного алгоритма прослеживания контуров, не зависящего от выбора начальной точки движения.
- Разработки гибкой математической модели распознающей
системы, позволяющей проводить все необходимые этапы об
работки изображения.
Научная новизна работы. Новизна предложенных методов состоит в следующем:
Предложен новый подход к параметризации совмещения N-мерной панорамной информации, основанный на геометрических свойствах пространственного расположения объектов.
Предложен рекурентный (многоэтапный) алгоритм кластерного анализа, основанный на сочетании метода динамических сгущений, анализа мод гистограммы и иерархической группировки на основе минимального покрывающего дерева, а также новых критериев - меры многомерной компактности для элемента изображения, быстрого маркирования изображения, быстрого метода пересчета статистических характеристик на основе дискриминантной таблицы и альтернативная процедура кластеризации.
Предложен новый подход к выбору оптимального набора спектральных каналов, основанный на рекурентной процедуре отбора информационных классов по принципу их статистической разделимости в некотором наборе спектральных каналов.
Предложен новый подход к решению задачи выделения сложных контуров, реализующий рациональный выбор точки старта движения "жука" в каждой итерации.
Предложен новый подход к решению задачи преобразования яркостных значений элементов изображения, учитывающего характеристики калибровочных клиньев на фотопозитивах.
Предложена гибкая математическая модель системы цифровой обработки изображения, базируемая на известных алгоритмах цифровой обработки, и дополнительных, предлагаемыми в работе, эффективными алгоритмами решения задачи распознавания.
Предложена гибкая структура программного обеспечения, построенная на разработанном математическом обеспечении
высокого уровня, предоставляющая возможность проводить распознавание видеоданных, анализ и интерпретацию результатов.
Практическая ценность работы. Разработана гибкая математическая модель системы цифровой обработки данных, которая ориентирована для решения сложных задач распознавания и интерпретации аэрокосмической многозональной видеоинформации и выдачи практических рекомендаций исходя из количественного и качественного анализа исходных данных.
Система можеть применяться при решении задач распознавания во многих областях знаний: геология, гидрология, сельское хозяйство, медицинская диагностика и т.д.
Результаты работы реализованы в госбюджетной НИР, проводившийся в Институте экологии АНАКА "Разработка дистанционных и контактных методов средств регионального экологического мониторинга" (1993 г.), а также хоздоговоре с РКА РФ (ЦНИИМАШ) по теме "ТОРПАГ" (1994 г.). В госбюджетных НИР, проводимых в ИКИПР АНАКА по теме "СПЕКТР-ПВ" (1995-1997 гг.). Результаты проведенных исследований вошли в научно-технические отчеты, переданные на указанное выше предприятие.
Научные положения, выносимые на защиту:
Эффективный метод совмещения многомерных панорамных снимков, учитывающий параметры линейных сдвигов по координатным осям.
Эффективный метод кластеризации многомерного изображения на базе анализа N-мерной гистограммы и отвечающего требованиям критериев:
а) компактности элеметнов N-мерных изображений;
б) альтернативного выбора наилучшего поднабора кластеров
по расстоянию (J-M).
- Эффективный метод выбора информативных поднаборов
каналов для исследуемых объектов при автоматизированном
анализе совмещенной спектральной схеме.
Эффективный метод преобразования яркостных значений элементов изображения, учитывающий характеристики калибровочных клиньев на фотопозитивах.
Эффективный алгоритм прослеживания контуров, не зависящий от выбора начальной точки движения.
- Гибкая математическая модель распознающей системы,
позволяющая проводить все необходимые этапы обработки
изображении.
Апробация работы. Материалы диссертационной работы докладывались и обсуждались на:
-
X и XI Всесоюзных научно-технических конференциях молодых ученых и специалистов госцентра "Природа" (Москва, 1987 г.);
-
Всесоюзном совещании по картографии (Москва, 1987 г.);
-
VIII научной конференции молодых ученых НПО КИ (Нахчы-ван, 1992 г.);
-
Первом Евроазиатском симпозиуме по космическим исследованиям и технологиям (Турция, 1993 г.);
5. Специализированном семинаре отдела №45 ЦНИИМАШ
(Москва, 1993-1994 гг.);
6. Специализированном семинаре АНАКА (Баку, 1997 г.).
Публикации. Основные результаты диссертационной работы опубликованы в 7 печатных трудах, в том числе в 4-х статьях и 3-х тезисах докладов на Международных, Всесоюзных и Республиканских конференциях.
Структура диссертации. Диссертация состоит из введения, 3-х глав, выводов и заключения, содержит 142 страницы машинописного текста, в том числе 7 рисунков, 12 таблиц, 12 схем и список литературы из 96 наименований, из них 11-на английском языке.