Содержание к диссертации
Введение
Обработка визуальной информации 14
Аналитический обзор методов 15
Обобщение метода поэлементной обработки 16
Обработка изображений скользящим окном 23
Принципы зрительного восприятия в биологических системах 29
Выводы и постановка задачи исследования 32
Оператор анализа локальных областей изображения 35
Выбор окрестности для анализа растра 37
Гексагональный растр 38
Выбор радиуса окрестности 39
Методы анализа окрестности 40
Обработка невидимых областей 41
Заполнение окрестности точки 42
Анализ лучей, исходящих из центрального пикселя окрестности 43
Вычисление вектора контурной линии в заданной точке 45
Выделение особых точек 46
Границы площадных объектов 47
Нейросетевая модель оператора анализа локальных областей изображения 49
Выводы по главе 50
Алгоритмы адаптивного анализа полутоновых изображений 52
Обработка артефактных зон 52
Поиск контуров, не имеющих особых точек 57
3.2.1, Поиск гладких контуров на изображении типа «Draw» 58
3.2.2. Поиск гладких контуров на изображении типа «Photo» 59
3.3. Трассировка линий 61
3.3.1. Выделение цепочек 61
3.3.2. Захват Особых Точек 62
3.3.3. Переход на слежение по краю 63
3.3.4. Адаптивная настройка анализирующих фильтров по характеру окрестности 63
3.3.5. Смена разрешающей способности 65
3.3.6. Утончение 67
3.4. Аппроксимация цепочек отрезками прямых и дуг 68
3.4.1. Разбиение последовательностей пикселей на участки 69
3.4.2. Вычисление параметров отрезков и дуг 71
3.5. Выводы по главе 75
4. Система анализа изображений 77
4.1. Архитектура системы и сценарий диалога 77
4.2. Эксперименты с изображениями двухмерных объектов 84
4.2.1. Обработка чертежных изображений 85
4.2.2. Обработка картографических изображений 86
4.2.3. Обработка электрокардиограмм (ЭКГ) 88
4.2.4. Анализ рукописного текста 91
4.2.5. Примеры обработки рисунков 96
4.3. Эксперименты с изображениями трехмерных объектов 97
4.3.1. Обработка аэро-фото снимков 99
4.3.2. Эксперименты с изображениями ушей 103
4.3.3. Эксперименты с изображениями лиц человека 104
4.4. Выводы по главе 108
Заключение 109
Список литературы
- Обобщение метода поэлементной обработки
- Анализ лучей, исходящих из центрального пикселя окрестности
- Поиск гладких контуров на изображении типа «Photo»
- Обработка картографических изображений
Введение к работе
Компьютерная обработка оцифрованных изображений - одна из наиболее развитых областей применения вычислительной техники. Она используется для решения задач во многих сферах научной и профессиональной деятельности: биологии, медицине, геодезии, картографии, в различных опытно-конструкторских и научно-исследовательских разработках. Цифровой обработке изображений посвящено множество работ отечественных ученых: Л.П. Ярославского, Ю.И. Журавлева, И.Б. Гуревича и др., в том числе Ижевского государственного технического университета: P.M. Гафарова, В.М. Златкиса, СЮ. Купчинауса, В.Н. Милича, А.И. Мурынова, A.M. Сметанина и зарубежных: У. Прэтта, А. Розенфельда, К. Фу, Р. Гонсалеса, К. Ли и др., издаются специализированные научно-прикладные журналы: Pattern Recognition and Image Analysis, Pattern Analysis and Applications, International Journal of Pattern Recognition and Artificial Intelligence, Image and Vision Computing и т.д.
Обработка изображений - это операция над изображениями, при которой в результате их изменений получаются новые изображения, в чем-то (для конкретных целей) лучше, чем оригинал. Часто этот метод используют для того, чтобы выделить интересующие исследователя детали. В качестве примера можно привести выделение контура на рентгеновских снимках - это помогает специалистам лучше рассмотреть детали изображения.
Обработка используется также и для последующего анализа изображения. Анализ изображения - это процесс извлечения из них количественной или качественной информации. Анализ изображения применяется тогда, когда требуется рутинным способом подсчитать большое количество элементов или атрибутов каких-либо деталей изображения, интересующих исследователя. В таких случаях компьютерный анализ
обеспечивает надежность и воспроизводимость результатов, существенно экономит время.
Следует отметить, что соответствующее программное обеспечение не всегда успевает за вновь возникающими потребностями пользователей, в частности, в таких задачах, как сжатие изображений, Internet-поиск, создание и хранение электронных документов и др. При этом существующие системы векторизации в основном выдают результат в виде множества контурных линий, представленных сплайнами, что удобно для дизайнера, но не эффективно в задачах распознавания и автоматизации проектирования.
С другой стороны, большинство методов анализа и распознавания ориентированны на обработку двух градационных, линейчатых и других изображений, заранее оговоренных классов объектов. До сих пор даже такие емкие прикладные области как картография или чертежные архивы требуют значительной доли ручного труда. Например, современные стандарты качества требуют внедрения CALS технологий, где электронная модель изделия, в том числе Геометрическая Модель (ГМ), должна формироваться на самых ранних стадиях проектирования (концептуальное, эскизное). Однако трудоемкость создания геометрических моделей сложной формы существующими методами и высокие требования к пользователям систем трехмерной графики затрудняют их широкое использование в областях, где необходим творческий поиск геометрической формы, где дизайнеру проще и привычнее работать карандашом.
Д. Хьюбел и Т. Визель, исследуя механизмы зрения низших позвоночных и млекопитающих, сумели выяснить логическую последовательность переработки сигналов поступающих из сетчатки глаза и высказали несколько предположений относительно того, какая организация коры головного мозга могла бы это обеспечить. Новый подход не только стимулировал выдвижение гипотез о механизмах, лежащих в основе зрительного восприятия, но и воодушевил тех, кто работал на других
направлениях. В 1983 году Гордон М. Шеперд выдвинул гипотезу о том, что переработка информации внутри функциональных корковых единиц, не является параллельной или последовательной, как предполагалось ранее, а опирается на оба типа связей. Проводимые физиологами исследования дают огромный материал для гипотез и широкое поле для исследований в области совершенствования технического зрения.
В связи с этим возникает необходимость в разработке универсальных, в смысле, применимых к широкому спектру изображений методов анализа, приближающихся по своим возможностям к зрению биологических систем, возможно, путем разделения и оперативного взаимодействия функций зрительного анализатора и логического (мыслительного) уровня.
Объектом исследования являются цифровые полутоновые изображения двухмерных и трехмерных объектов, получаемых из реального мира.
Предметом исследования являются методы анализа изображений двухмерных и трехмерных объектов, имитирующих работу механизмов зрения биологических систем в части возможности организации параллельной обработки и повышения качества анализа наиболее актуальных и часто встречающихся классов объектов (эскизы, чертежи, карты, изображения объектов трехмерной природы).
Основная цель работы - повышение качества и эффективности систем обработки изображений двухмерных и трехмерных объектов путем формализации и развития методов и технологий анализа изображений.
Для достижения поставленной цели требуется решение следующих задач:
-исследование существующих методов цифровой обработки изображений и краткий обзор основных достижений в области исследования механизмов зрения биологических систем;
-разработка многоуровневой итерационной технологии анализа и обработки растровых изображений;
исследование существующих и разработка новых методов выделения основных интегральных и дифференциальных характеристик заданных областей изображения;
разработка рекурсивных методов выделения признаков объектов;
разработка экстраполирующих методов выделения признаков объектов;
-разработка метода адаптивной настройки анализирующих фильтров по характеру окрестности;
-разработка итерационных алгоритмов аппроксимации цепочек пикселей отрезками прямых и дуг;
-реализация разработанных методов и алгоритмов в виде программы-прототипа системы распознавания изображений и исследование предложенных методов на примерах различных типов изображений, полученных из реального мира.
Методы исследования. Теоретические исследования выполнены с использованием математической логики, теории множеств, теории графов, векторной и матричной алгебры, вычислительной геометрии.
Экспериментальные исследования выполнены с помощью разработанного прототипа системы анализа изображений.
На защиту выносятся: Результаты аналитического обзора состояния в предметной области исследования; предлагаемые методы анализа и распознавания изображений двухмерных и трехмерных объектов реального мира, основанные на гипотетических моделях механизмов зрения биологических систем, а также результаты исследования предложенных методов и технологий их применения в задачах распознавания образов на полутоновых растровых изображениях:
результаты системного анализа существующих методов цифровой обработки изображений и краткого обзора основных достижений в области исследования механизмов зрения биологических систем;
многоуровневая итерационная технология анализа и обработки растровых изображений;
метод анализа локальных областей изображения;
нейросетевая модель локального анализатора;
рекурсивный метод оптимизации особых точек в зонах артефактов изображения;
экстраполяционный метод уточнения особых точек;
метод выделения контурных линий на полутоновых изображениях, автоматически настраиваемый по областям текущего изображения;
структурная схема и TDEF диаграмма процессов анализа и обработки изображений в программной системе, созданной на основе предложенных методов и моделей;
результаты экспериментальных исследований предложенных методов и моделей на примере обработки изображений двумерных и трехмерных объектов: чертежей, рисунков, карт, электрокардиограмм, рукописных текстов; фотоизображений, ландшафтов;
результаты сравнительного анализа качества векторизации чертежей, сканированных с бумажных носителей, обработанных с помощью известных программ и программной системы, созданной на основе предложенных методов и моделей.
Научная новизна полученных результатов определяется проведенными комплексными исследованиями, в ходе которых разработаны:
I. Метод анализа заданных областей для выделения контуров на изображениях, основанный на нейрофизиологических моделях сетчатки глаза, заключающийся в вычислении характеристик пикселей,
расположенных на лучах, исходящих из центра окрестности и сравнении интегральных характеристик лучей.
Метод выделения особых точек на изображении, заключающийся в рекурсивном приближении характеристик к локальному экстремуму.
Метод экстраполяции особых точек путем построения мнимой точки пересечения ветвей, исходящих из особой точки.
Метод трассировки линий контуров, отличающийся скачкообразным перемещением в предварительно выделенную особую точку зоны артефактов изображения, с целью сохранения топологии обрабатываемых объектов при их зашумлении.
Метод адаптации оператора анализа окрестности, заключающийся в динамической смене степени интеграции и пороговых значений на анализируемом участке для повышения чувствительности при выделении границ найденного объекта.
Практическая полезность. Разработанные методы и технологии анализа изображений позволяют расширить диапазон классов обрабатываемых изображений, повысить эффективность систем обработки за счет уменьшения трудоемкости, повышения качества, расширения библиотеки функций анализатора изображений в различных прикладных задачах, в том числе, при поиске и передаче изображений.
Разработанные алгоритмы и методы их комбинирования для обработки полутоновых изображений с целью последующего использования полученной информации в различных исследовательских и прикладных системах положены в основу программно-исследовательского комплекса AQR (AutoQuality Re searcher).
Разработанный модуль анализа изображений встроен в ряд программных систем для:
- создания электронных архивов конструкторско-технологической документации;
анализа и создания электронных архивов электрокардиограмм и историй болезней;
сбора и анализа экологической информации в геоинформационной системе "ЭКО грунт";
определения психологического портрета личности по почерку;
анализа папиллярных узоров пальцевых отпечатков;
определения структурных характеристик и оценки вероятности родства по конфигурации ушной раковины;
построения параметрических скульптурных портретов и трехмерных фотороботов по фотографиям или рисункам в системе Concept-Sculpter.
Реализация результатов работы. Результаты диссертационной работы внедрены в учебный процесс на кафедре "Автоматизированные системы обработки информации и управления" Ижевского государственного технического университета в дисциплине "Геоинформационные системы", а также на кафедре "Криминалистика и судебная экспертиза" Удмуртского государственного университета как основа для исследований в области интеграции компьютерной графики с криминалистическими задачами.
Разработанные программные модули внедрены в ИП "Ионова" (г. Ижевск) для ускорения компьютерного моделирования и дизайн-работ, в Республиканской клинической больнице №7 - для создания и анализа банка ЭКГ, на ОАО "Концерн "Ижмаш" - для автоматизированной модификации типовых каркасных моделей головы и автоматического синтеза поверхностных моделей скульптурных портретов.
Апробация работы. Основные положения диссертационной работы докладывались: на Международной научно-технической конференции "Информационные технологии в инновационных проектах" (Ижевск, 2001); на 11-й Международной конференции по компьютерной графике и машинному зрению Графикой - 2001 (Нижний Новгород, 2001); на
Международной научно-технической конференции IEEE AIS'05 (Дивноморское, 2005).
Публикации. По материалам диссертации опубликовано 7 статей. В том числе в списке, утвержденном ВАК: Кучуганов А.В. Построение трехмерной модели с использованием системы выделения контуров на полутоновых изображениях // Известия ТРТУ. Тематический выпуск "Интеллектуальные САПР" - Таганрог: Изд-во ТРТУ, № 8, 2006. С. 182-186.
Структура и объем работы. Диссертационная работа состоит из введения, четырех глав, заключения и приложений. Основной текст изложен на 120 машинописных страницах с иллюстрациями. Список литературы включает 93 наименования.
Аннотация диссертационной работы по главам.
В первой главе проанализированы существующие на данный момент методы обработки растров в современных компьютерных системах: пространственные и частотные методы, проведено обобщение методов поэлементной обработки, обработки изображений скользящим окном.
Кратко изложены основные достижения в области исследования механизмов зрения биологических систем. Сформулированы цель и задачи исследования.
Вторая глава посвящена разработке методов и модели оператора первого технологического уровня - анализатора локальных областей изображения. При этом учитывались известные нейрофизиологические модели сетчатки глаза, чтобы относительно простыми и допускающими параллельную обработку методами обеспечить выделение основных локальных характеристик изображения. Таких как: диапазон исходящих лучей, направления на центры тяжести лучей, тип точки, принадлежность площадному объекту и т.д.
В третьей главе описываются модели и методы второго (коплексного) уровня анализа объектов на изображении и технология их взаимодействия в
целом: оптимизация особых точек; экстраполяция особых точек типа "разветвление" и "угол"; трассировка и слияние точек, принадлежащих контурным линиям; классификация участков линий по признаку "дуга-прямая". Тем самым, имитируя анализ изображений биологическими системами, осуществляется переход с уровня локального анализа на более высокий - логического анализа.
В четвертой главе описывается система анализа изображений AQR (AutoQuality Researcher), представляющая собой комплекс программ, предназначенный для преобразования изображений 256 градаций серого цвета в векторный вид. Она снабжена несколькими удобными инструментами и настройками для исследования методов и их сочетаний. В системе реализованы методы и технологии их комбинаций предложенные в главах 2 и 3. Описаны архитектура и инструментарий AQR. Предложена методика обработки изображений, которая характеризуется тем, что при минимальном количестве внешних порогов позволяет получать удовлетворительные результаты. Пользователь имеет возможность компоновать по своему усмотрению план обработки интересующего типа изображений.
Исследование методов проводилось на изображениях двумерных объектов (чертежи, рисунки, карты, электрокардиограммы, рукописные тексты) и трехмерных объектов (фотоизображений ушей, лиц, ландшафтов).
В заключении приведена общая характеристика работы, а также основные выводы и результаты диссертационного исследования.
Обобщение метода поэлементной обработки
Очевидным достоинством процедур поэлементной обработки является их предельная простота. Вместе с тем, многие из них приводят к очевидному субъективному улучшению визуального качества. Этим определяется внимание, которое уделяется поэлементным процедурам. Очень часто поэлементная обработка применяется как начальный или заключительный этап при решении более сложной задачи обработки изображения.
Сущность поэлементной обработки изображений сводится к следующему. Пусть x(i,j)=x!J, у(і,]) = уч - значения яркости исходного и получаемого после обработки изображений соответственно в точке кадра, имеющей декартовы координаты і (номер строки) и J (номер столбца). Поэлементная обработка означает, что существует функциональная однозначная зависимость между этими яркостями позволяющая по значению исходного сигнала определить значение выходного. В общем случае, как это учтено в данном выражении, вид или параметры функции /Д-) описывающей обработку, зависят от текущих координат. При этом обработка является неоднородной. Однако в большинстве практически применяемых процедур используется однородная поэлементная обработка. В этом случае индексы і и у в выражении (1.1) могут отсутствовать. При этом зависимость между яркостями исходного и обработанного изображений описывается функцией: У = /{х) (Ь2) одинаковой для всех точек кадра. Рассмотрим некоторые наиболее распространенные процедуры поэлементной обработки [15, 17, 26, 27, 45, 49, 77].
Линейное контрастирование изображения. Задача контрастирования связана с улучшением согласования динамического диапазона изображения и экрана, на котором выполняется визуализация. Если для цифрового представления каждого отсчета изображения отводится 1 байт (8 бит) запоминающего устройства, то входной или выходной сигналы могут принимать одно из 256 значений. Обычно в качестве рабочего используется диапазон 0...255; при этом значение 0 соответствует при визуализации уровню черного, а значение 255 - уровню белого. Предположим, что минимальная и максимальная яркости исходного изображения равны хтм и Хтах соответственно. Если эти параметры или один из них существенно отличаются от граничных значений яркостного диапазона, то визуализированная картина выглядит как ненасыщенная, неудобная, утомляющая при наблюдении. Пример такого неудачного представления приведен на рис. 1.1а, где диапазон яркостей имеет границы хт!„ = 180,
Преобразование гистограмм, эквализация. Все поэлементные преобразования изображений можно рассмотреть с точки зрения изменения плотности вероятности распределения яркостей исходного и получаемого изображений. Очевидно, что ни при одном из них плотность вероятности выходного продукта не будет совпадать с плотностью вероятности исходного изображения (за исключением преобразования у /{х) = х) [50, 51,65,73,83].
Определение вероятностных характеристик изображений, прошедших нелинейную обработку, является прямой задачей анализа. При решении практических задач обработки изображений может быть поставлена обратная задача: по известному виду плотности вероятности wx{x) и желаемому виду w (у) определить требуемое преобразование у = /(х), которому следует подвергнуть исходное изображение. В практике цифровой обработки изображений часто к полезному результату приводит преобразование изображения к равновероятному распределению. В этом случае wy(y) = {Утю-УыЛ ПриУтт У Утах (1.4) 0, при других у, где утт и утах - минимальное и максимальное значения яркости преобразованного изображения. Определим характеристику преобразователя, решающего данную задачу. Пусть х яу связаны функцией (1.2), a Fx(х) и Fy[у] - интегральные законы распределения входной и выходной величин. Учитывая (1.4), находим: У-У. Утах У n Fy(y)= \y(y)dy = утп J max s mm
Подставляя это выражение в условие вероятностной эквивалентности после простых преобразований получаем соотношение представляющее собой характеристику (1.2) в решаемой задаче. Согласно (1.5) исходное изображение проходит нелинейное преобразование, характеристика которого Fx{x) определяется интегральным законом распределения самого исходного изображения. После этого результат приводится к заданному динамическому диапазону при помощи операции линейного контрастирования.
Таким образом, преобразование плотности вероятности предполагает знание интегрального распределения для исходного изображения. Как правило, достоверные сведения о нем отсутствуют. Использование для рассматриваемых целей аналитических аппроксимаций также малопригодно, т.к. их небольшие отклонения от истинных распределений могут приводить к существенному отличию результатов от требуемых. Поэтому в практике обработки изображений преобразование распределений выполняют в два этапа.
На первом этапе измеряется гистограмма исходного изображения. Для цифрового изображения, шкала яркостей которого, например, принадлежит целочисленному диапазону 0...255, гистограмма представляет собой таблицу из 256 чисел. Каждое из них показывает количество точек в кадре, имеющих данную яркость. Разделив все числа этой таблицы на общий размер выборки, равный числу используемых точек изображения, получают оценку распределения вероятностей яркости изображения. Обозначим эту оценку и (у), 0 у 255. Тогда оценка интегрального распределения получается по формуле:
Анализ лучей, исходящих из центрального пикселя окрестности
Тремор. После вычисления направления на следующий пиксель, из нескольких соседних пикселей в данном направлении выбирается тот, что имеет больший вес (чернее). Таким образом, закрываются невидимые области. Если выбранный пиксель лежит не точно на вычисленном направлении, а является смежным с ним, то производится перерасчет направления (угла).
Наложение или "стыковка" окрестностей. Данное действие является тем более обоснованным, если окрестности имеют сложную форму либо не одинаковы. Также возможно использование одного вида окрестности с наложенными друг на друга методами анализа этой окрестности (диагональ-диагональ, диагональ-окружность, окружность-окружность). Направления вычисляются из совместного анализа, поэтому невидимых пикселей не остается и корректировка направлений не нужна.
Математический анализ рассматриваемой окрестности позволяет точно распределить плотности (веса) по пикселям и выбрать точное направление, но такой анализ приводит к введению пороговых значений или становится громоздким, требовательным к ресурсам, если используется не совместно с другими методами. Этот метод не является близким к природным методам распознавания.
Используя полученные в процессе исследований данные, мы выбрали окрестность №7 (табл. 2.1). Представленная окрестность имеет оптимальный радиус, равный двум, и не имеет, в отличии от других, невидимые области, которые, как показали эксперименты, усложняют алгоритм анализа. Для анализа выбранной окрестности были использованы метод "Окружности" в сочетании с методом "Диагонали", т.е. пиксели окрестности хранятся в виде окружности, но сравниваются в процессе анализа по "Диагоналям" (путем сравнения характеристик, вычисляемых на заданных диагоналях). Для более точной корректировки пикселя в выбранном направлении использован метод "Тремор" (п. 2.L4) - с последующим пересчетом выбранного направления.
Для выделения локальных характеристик на первом уровне анализируются два вида окрестностей заданного пикселя: окрестность размером 3x3 и окрестность размером 5x5. На рис. 2.1 представлены окрестности центральной точки gxv радиусом R = 1 (рис. 2.1а) и радиусом R = 2 (рис. 2.16), в пределах которых осуществляются сравнения яркостей соседних точек. Нумерация точек, приведенная на рис. 2.1, соответствует порядку анализа окрестности.
Для определения принадлежности точки gxy множеству К объектов на изображении G необходимо предварительно заполнить множества R , R , соответственно 3 х 3 и 5 х 5 окрестностей данной точки (рис. 2.1).
Чтобы в дальнейшем произвести идентификацию точки, необходимо проанализировать перепады яркостей в окрестностях R = 1 и R = 2 относительно выбранной центральной точки. Введем дополнительное множество лучей ТВ, где каждый луч (половина диагонали) это последовательность пикселей внутри рассматриваемой окрестности, через которые проходит линия, исходящая из центрального пикселя gxy. С учетом формул (2.1), (2.2) множество ТВ можно представить в следующем виде: Д/-/), если {J3{r )-/3{r ) P) v( il)-A/-/) P)A( _1 25S)A{P{r ) p{r )) tb = J } , (2.3) иначе 25 где: (5(r}) - яркостьу-той точки в окрестности радиуса R = 2; j - принимает значение 1..16; Р - исходное пороговое значение яркости, заданное пользователем.
Формулу (2.3) можно интерпретировать следующим образом. Если разность яркостей предыдущего и текущего пикселей окружности больше либо равна Р, то произошло изменение яркостей рассматриваемых точек в сторону уменьшения, то есть спуск на черный луч. Яркость текущего пикселя заносится в множество ТВ с индексом номера направления луча (рис. 2.2). Если разность яркостей меньше порогового значения, но текущий пиксель темнее или равен по яркости предыдущему черному лучу, то пиксели находятся в яркостной "впадине" и рассматриваемый пиксель также будет занесен в множество ТВ. Когда текущий луч находится в яркостной впадине, он сравнивается с последующим и, если разность превышает или равна пороговому значению, он также заносится в множество ТВ.
Несколько соседних черных лучей составляют "темный" сектор, например, сектор, образованный лучами г л, г4 (рис. 2.2).
Здесь и далее, поскольку все лучи исходят из одного центра, и яркость конечной точки является интегрированной яркостью всего луча, будем для краткости обозначать их индексом конечной точки.
С целью повышения качества контуров, величина порога Р автоматически снижается, если хотя бы одна из соседних окрестностей принадлежит контуру, но в рассматриваемом текущем пикселе продолжение контура не найдено. Процедура изменения пороговых значений происходит под управлением более высоких уровней обработки полутоновых изображений. Необходимо отметить, что порог Р, единственный порог, задаваемый пользователем для обработки любых типов изображений, что соответствует требованию минимизации количества порогов.
Поиск гладких контуров на изображении типа «Photo»
После того, как все линии, кроме гладких, уже выделены, снова выполняется построчное сканирование кадра: gxy є ОТІ, если (KWxy 0)л (gxy е К), где ОТІ - множество точек гладких контуров (объектов), т.е. если точка имеет исходящие ветви и не была выделена, то точка принадлежит гладкому объекту (рис. 3.3).
На полутоновом изображении края объектов могут быть размыты и при сканировании кадра первая найденная точка гладкого объекта вероятнее всего будет находиться в размытой области, в то время как на изображениях типа "DRAW" наша задача - как можно более точно выделить объекты, а не размытую часть контуров, поэтому необходимо скорректировать положение найденной точки перед началом слежения: 3otimin = MIN k(oti,), (3.2) где otimm - точка с минимальной яркостью из множества 077; oti, - /-тая точка из множества 077; / - изменяется от I до , где к - количество точек множества ОТІ; MIN k - функция выбора точки с минимальной яркостью из множества ОТІ, т.е. если в окрестности R=1 точки otii есть более темная точка, отвечающая условию (3.2), то необходимо сместится в нее и повторять анализ и смещение до тех пор, пока есть более темная точка в окрестности.
Оптимизация точки начала слежения на изображениях типа "DRAW"
Таким образом, начиная выделение контуров с наиболее темной точки, мы выделим самую яркую (значимую для этого типа изображений) часть объекта (рис. 3.3б).
В отличие от изображений предыдущего типа, на изображении типа "Photo" необходимо наиболее полно выделить объект. Для этого после сканирования изображения и нахождения точки принадлежащей идеальному объекту, мы будем ее смещать не в темную область, а в более светлую (рис. 3.4): 3otimax = MAX kfotii), (3.3) где OTImax - точка с максимальной яркостью из множества ОТІ; otU - г -тая точка из множества ОТІ; і - изменяется от / до к, где к - количество точек множества ОТІ; МАХ к - функция выбора точки с максимальной яркостью из множества ОТІ, а) б) т.е. если в окрестности R=l точки otii есть более светлая точка, отвечающая условию (3.3), то необходимо сместится в нее и повторять анализ и смещение до тех пор, пока есть более светлая точка в окрестности (рис. 3.46). Начиная слежение с полученной точки, мы более качественно выделим размытый объект.
Следующий этап второго уровня анализа изображений - трассировка и слияние в цепочки точек, принадлежащих контурам. Особенностью данного этапа является автоматическое получение упорядоченной последовательности, где каждый элемент имеет направление на следующий. Это позволяет исключить необходимый для классических методов этап "Представление и описание" - упорядочивания полученных данных об изображении, для передачи в последующие задачи [22].
Известно, что процесс трассировки линий весьма чувствителен к помехам. Если на черно-белых (двухградационных) или цветных изображениях для выделения контуров объектов достаточно отслеживать смену цвета, то на полутоновых фотоизображениях, содержащих 256 оттенков серого, линии определяются переходом уровня цвета в несколько градаций яркости. Во многих случаях контуры размыты в поперечнике, а по длине плавно сходят на "нет", сливаясь с фоном.
Для повышения устойчивости процесса трассировки предлагается применять выявленные в процессе моделирования и экспериментов дополнительные функции поиска продолжения: - захват Особых Точек; - переход на слежение по краю; - автонастройка анализирующего фильтра по характеру окрестности; - смена разрешающей способности; - утончение.
Обработка картографических изображений
Полученные результаты показывают положительный эффект от использования предложенных методов. Система технического зрения, а вернее, его алгоритмическая реализация, имитирующая механизмы зрения биологических систем, позволяет обрабатывать широкий диапазон изображений с приемлемым качеством, повышает эффективность систем обработки, а технология их применения позволяет обрабатывать полутоновые изображения двумерных и трехмерных объектов.
Необходимо отметить, что для применения в какой-либо конкретной прикладной области представленная система требует соответствующей доработки. А именно, подключение решающего блока, который бы включал в себя методы логического вывода, выполнял функции третьего уровня иерархии - "осмысление" набора найденных объектов [22]).
Возможными направлениями доработок могут стать: создание дополнительных управляющих режимов (кроме Photo/Draw) для изображений, сочетающих объекты различного типа, применение многоэтапной (итерационной) обработки и построение иерархического изображения, создание модулей целевой выборки векторной информации, базы данных шаблонов и т.д. Необходимые сочетания инструментов и режимов также зависят от конкретной области применения.
Подводя итог проделанной работе, необходимо затронуть ситуацию, сложившуюся в области программного обеспечения для распознавания образов и дизайна. Если программное обеспечение для подготовки текстов осваивается достаточно быстро и широко используется, то пакеты геометрического моделирования чаще всего осваиваются с большим трудом (особенно неподготовленными пользователями), а их эффективное использование требует значительного опыта. Существующие методы анализа и распознавания растровых изображений, как правило, узкоспециализированы и ориентированны на конкретные классы изображений. С другой стороны, в связи с проникновением компьютеров во все сферы человеческой деятельности, включая бытовую, такие ограничения зачастую не удовлетворяют компьютеропользователей, т.к. требуют значительной доли ручного труда в процессе выделения нужной информации из изображений. В связи с этим, например художники и дизайнеры, принимающие участие в разработке внешнего вида изделий, персонажной анимации, экстерьеров и интерьеров и т.д. часто предпочитают традиционные методы работы, отказываясь от трудностей, связанных с освоением программных средств и систем компьютерной графики.
Одним из способов повышения гибкости и помехоустойчивости систем распознавания могут служить методы и технологии, имитирующие механизмы зрения биологических систем, в частности, за счет разделения и оперативного взаимодействия функций уровней: локального зрительного анализатора и логического (комплексного) анализа в процессе извлечения смысла из потока реальных изображений.
В данном диссертационном исследовании сделана попытка повысить универсальность программных средств обработки и анализа изображений, по упростить работу с ними конечным пользователям. В работе получены следующие основные выводы и результаты:
1. Существующие методы анализа и распознавания растровых изображений, как правило, узкоспециализированы на конкретные классы изображений. С другой стороны, в связи с проникновением компьютеров во все сферы человеческой деятельности, такие ограничения зачастую не удовлетворяют компьютеропользователей, т.к. требуют значительной доли ручного труда в процессе выделения нужной информации из изображений.
2. Одним из способов повышения гибкости и помехоустойчивости систем распознавания могут служить методы и технологии, имитирующие механизмы зрения биологических систем, в частности, за счет разделения и оперативного взаимодействия функций уровней: локального зрительного анализа и комплексного (логического) в процессе извлечения смысла из реальных изображений.
На первом уровне технологии анализа изображений - локального зрительного анализа:
3. Разработаны методы и технология оператора анализатора локальных областей изображения, состоящая из: - анализа лучей, исходящих из центра окрестности; - выделения темных секторов; - вычисления вектора контурной линии; - выделения особых точек; - определения границ площадного объекта, и заключающаяся в вычислении и сравнении интегральных характеристик пикселей, расположенных на лучах, исходящих из центра окрестности.