Введение к работе
Актуальность темы
При создании создании сложных технических систем, решающих задачи анализа, управления и обработки информации, во многих случаях возникает необходимость обработки данных, представленных в форме изображений. Значительный объем анализируемых данных и ограничения на доступные вычислительные ресурсы осложняют использование высокоэффективных алгоритмов анализа и требуют разработки специального математического и алгоритмического обеспечения, позволяющего обеспечить удовлетворительное качество анализа при соблюдении налагаемых ограничений.
Методы и алгоритмы обработки изображений и распознавания образов рассматривались в работах В.В. Александрова, Н.Д. Горского, Р. Дуды, В.А.Дюка, Ю.И. Журавлева, Д. Марра, М. Минского, Ф. Розенблатта, М. Харинова, П. Харта и многих других.
Одной из подзадач, возникающей при анализе изображений, является разбиение изображения на области(сегменты), удовлетворяющие заданным критериям и их классификация. Если между объектами искомого класса и характерными по своим свойствам сегментами существует взаимно-однозначное соответствие, результат классификации сегментов может быть использован непосредственно. В противном случае, полученный результат может подвергаться дальнейшей обработке с помощью структурных методов распознавания образов. В частности, первый случай имеет место при поиске объектов естественного происхождения, а второй — искусственного по данным дистанционного зондирования (ДДЗ) Земли.
Таким образом, при функционировании систем сегментации и классификации сегментов основными этапами являются:
Сегментация изображений,
Обработка и описание сегментированного изображения - этап извлечения признаков (feature extraction),
Классификация полученных сегментов по их признакам.
На третьем этапе могут применяться классические методы классификации и кластеризации элементов пространства признаков (искусственные нейронные сети, кластерный анализ и др).
Общими трудностями, возникающими при создании таких систем являются:
На этапе сегментации - необходимость значительного труда высококвалифицированных экспертов для отбора, описания и настройки алгоритмов сегментации с учетом особенностей предметной области, что осложняется отсутствием развитой оценки качества отобранных алгоритмов.
При выполнении классификации — сложность процесса обучения искусственных нейронных сетей и других методов ИИ, которая зачастую заставляет отказаться от их использования в пользу более простых методов. Для улучшения результатов классификации используются предварительные преобразования пространства признаков. В частности, расчет сингулярного разложения матрицы (англ. Singular Value Decomposition, SVD), составленной
из обучающих векторов, позволяет уменьшить размерность пространства признаков. Последовательное использование SVD-разложения и классификации в новом пространстве признаков (SVD-классификация) превосходит по быстродействию классификацию с помощью ИНС. Однако при SVD-классификации затруднен учет информации о значимости отдельных признаков объекта и разница в цене ошибки классификации (англ. misclassification cost) при решении различных задач. Также не учитывается информация о классе объектов, близких к текущему пространстве и/или во времени. Необходимость устранения описанных выше недостатков обуславливает
актуальность научной задачи, решаемой в диссертации. Объектом исследования
является задача классификации и распознавания образов, а предметом — задача
автоматизированной сегментации изображений.
Цель работы Целью диссертационной работы является разработка
математических методов классификации и алгоритмов сегментации растровых
изображений с целью повышения эффективности систем анализа изображений с
учетом ограничения на вычислительные ресурсы.
Задачи исследования Для достижения поставленной цели требуется решить ряд
частных задач:
Анализ существующих методов и алгоритмов сегментации, извлечения признаков и классификации, применяемых для анализа растровых изображений с целью оценки текущего состояния предметной области и требований к системе анализа.
Развитие метода отбора алгоритмов сегментации на основе запатентованного в СПИИРАН инвариантного представления изображения1, посредством уточнения критериев интегральной оценки совокупности алгоритмов.
Создание языка описания алгоритмов сегментации (Properties Description Language, PDL) и совокупности алгоритмов сегментации для выделения элементов изображения, подлежащих последующей классификации.
Разработка методов классификации на основе SVD, позволяющих учитывать различную значимость признаков объектов и ошибок классификации.
Создание прототипа системы анализа ДДЗ для ГИС.
Методы исследования Для решения поставленных задач использовались методы теории распознавания образов и обработки изображений, элементы теории графов и теории множеств. При разработке программного обеспечения использовалась технология объектно-ориентированного программирования. Научная новизна
1. На основе метода отбора алгоритмов предложены критерии интегральной оценки совокупности параметрических представлений(ПП) изображения, позволяющие сформировать элементарные сегменты, из которых составляются объекты, и до обучения оценить возможность выделения
1 Патент РФ № 2329552. Адаптивное встраивание водяных знаков по нескольким каналам. / М.В.Харинов, заявители: СПИИРАН, «Самсунг Электроник Ко., Лтд.» // Бюл. №20. Опубл. 20.07.2008. -41 с.
объектов.
Разработана совокупность алгоритмов построения параметрических представлений, в том числе — алгоритм приближения изображения сегментами с различных уровней иерархической сегментации, который применяется для аппроксимации изображения в целом, исходя из величины дисперсии или энтропии.
Предложен алгоритм классификации образов, позволяющий учитывать экспертную информацию о вкладе свойства объекта в результат классификации, влиять на соотношение ошибок классификации первого и второго рода и учитывать класс объектов, близких к текущему для адаптации SVD-классификатора к требованиям различных предметных областей.
Практическая значимость. В результате работы программно реализована подсистема анализа ДДЗ для ИГИС. При этом разработана библиотека алгоритмов обработки изображений, включающая ряд алгоритмов разработанных с учетом большого размера ДДЗ и ограничений на время их обработки. На основе инвариантного представления изображения(ИПИ) программно реализована обучаемая система композиции алгоритмов сегментации(СКАС), позволяющая автоматизировать процесс отбора и композиции алгоритмов сегментации для выделения заданных экспертом элементов изображения. Разработан язык описания параметрических представлений и программно реализован транслятор с этого языка. Разработанный язык позволяет описывать последовательности ПП для автоматизации процесса анализа ДДЗ и композиции алгоритмов сегментации.
Разработанная система используется в ЗАО «СПИИРАН-НТБВТ», а также внедрена в серийные изделия «Алеврит» и АП ГАР «Кижуч» (проект «Создание экспериментальной аппаратуры подсистемы гидроакустических расчетов», шифр «Кижуч — СПИИРАН — АП ГАР»). Результаты работы использовались в рамках программы ПР РАН «Фундаментальные проблемы океанологии: физика, геология, биология, экология» (проект «Расчет акустического поля в слоисто-неоднородной океанической среде на основе интеллектуальной геоинформационной системы»), совместного Российско - Вьетнамского проекта «Разработка программного обеспечения информационно-справочной системы по гидроакустическим расчетам и отображению интегрированной базы океанографических и гидрометеорологических данных всемирного Гидрометцентра»; в рамках проекта РФФИ № 11-07-00685-А "Разработка инновационных алгоритмов преобразования информации цифровых изображений" и учебном процессе в Санкт-Петербургском государственном электротехнический университете «ЛЭТИ» им. В.И. Ульянова (Ленина). Практическая ценность подтверждена актами о внедрении результатов работы.
На защиту выносятся следующие результаты:
Система композиции алгоритмов сегментации на основе инвариантного представления изображения, позволяющая оптимизировать совокупность алгоритмов сегментации.
Алгоритм построения параметрических представлений для системы композиции алгоритмов сегментации на основе выбора сегментов из заданной
иерархии, отличающийся тем, что он применяется не к отдельным участкам изображения, а для аппроксимации изображения в целом. 3. Алгоритм классификации на основе SVD, позволяющий учитывать класс объектов, близких к классифицируемому, а также веса признаков и классов объектов.
Апробации работы. Результаты работы докладывались на международных семинарах IF&GIS «Интеграция информации и геоинформационные системы» (Санкт-Петербург, 2007 и 2009 год), Санкт-Петербургской международной конференции "Региональная информатика» (Санкт-Петербург, 2008 и 2010 год), «Математические методы распознавания образов» (Суздаль, 2009), а также использованы в НИР «Разработка подсистемы анализа данных для интеллектуальной ГИС» (СПИИРАН, шифр «ИГИС-ДДЗ»).
Публикации. Основные результаты и выводы диссертационной работы опубликованы в 8 печатных работах, в том числе 3 в журналах из перечня ВАК.
Структура и объем работы. Диссертационная работа состоит из введения, 4-х глав, заключения, двух приложений, списка использованной литературы, включающего 201 наименование и акта о внедрении полученных результатов. Общий объем работы составляет 129 страниц, в том числе 36 иллюстраций и 14 таблиц.