Электронная библиотека диссертаций и авторефератов России
dslib.net
Библиотека диссертаций
Навигация
Каталог диссертаций России
Англоязычные диссертации
Диссертации бесплатно
Предстоящие защиты
Рецензии на автореферат
Отчисления авторам
Мой кабинет
Заказы: забрать, оплатить
Мой личный счет
Мой профиль
Мой авторский профиль
Подписки на рассылки



расширенный поиск

Сравнительный анализ морфологических методов интерпретации изображений Кирнос Эдуард Анатольевич

Сравнительный анализ морфологических методов интерпретации изображений
<
Сравнительный анализ морфологических методов интерпретации изображений Сравнительный анализ морфологических методов интерпретации изображений Сравнительный анализ морфологических методов интерпретации изображений Сравнительный анализ морфологических методов интерпретации изображений Сравнительный анализ морфологических методов интерпретации изображений Сравнительный анализ морфологических методов интерпретации изображений Сравнительный анализ морфологических методов интерпретации изображений Сравнительный анализ морфологических методов интерпретации изображений Сравнительный анализ морфологических методов интерпретации изображений
>

Диссертация - 480 руб., доставка 10 минут, круглосуточно, без выходных и праздников

Автореферат - бесплатно, доставка 10 минут, круглосуточно, без выходных и праздников

Кирнос Эдуард Анатольевич. Сравнительный анализ морфологических методов интерпретации изображений : Дис. ... канд. физ.-мат. наук : 05.13.18 : Москва, 2004 134 c. РГБ ОД, 61:05-1/118

Содержание к диссертации

Введение

1 Морфологический анализ изображений 7

1.1 Морфологический анализ монохромных изображений 7

1.2 Морфологический анализ изображений ламбертовътх объектов 11

1.2.1 Понятие ламбертовости объекта 11

1.2.2 Эффективная размерность множества точных данных 15

1.2 3 Эффективная размерность множества измеренных с ошибками сигналов 21

2. Логические решающие функции 26

2.1 Основные понятия 26

2.1.1. Разнотипность характеристик (переменных) 26

2.1.2 Решающая функция и стратегия природы 27

2.1.3 Байесовская решающая функция 28

2.1.4 Таблица данных (обучающая выборка) 29

2.1.5 Элементарные высказывания и наборы высказываний 30

2 2 Алгоритм "CORAL" 31

2.3 Алгоритм "TEMP" 33

2.4 Алгоритм "R-метод" 34

2.5 Алгоритм обучения и распознавания типа "Кора" 35

2 5.1 Постановка задачи 35

2.5.2 Описание алгоритма 40

3. Анализ результатов 46

3.1 Метод морфологического анализа монохромных изображений 46

3 2 Метод морфологического анализа ламбертовых изображений 59

3.3 Параметрические алгоритмы распознавания 103

Заключение 122

Список литературы 124

Введение к работе

Введение

В последние годы проблема автоматического анализа формы и состояния пространственных объектов, информация о которых представлена в виде изображений (фотографий, видеосигналов и т.д.) является актуальной во многих отраслях человеческой деятельности. Но автоматизация процесса анализа и интерпретации изображений достаточно трудна. Дело не только в том, что для обработки большого объема информации, содержащейся в изображениях, требуются значительные вычислительные мощности, но и в том, что процессы регистрации изображений достаточно сложны или вообще неизвестны.

Многие из задач анализа формы и состояния пространственных объектов на качественном уровне решает сам человек. По всей видимости, в их основе лех<ат достаточно представительные модели, среди которых человек производит выбор, основываясь на информации, представленной в изображении и сопоставляет ее со своими знаниями об объекте исследований. Но существуют и задачи, с которыми ЭВМ справляются значительно лучше, чем человек. В их основе лежат простые модели процесса формирования изображений, позволяющие в той или иной мере анализировать информацию о форме объектов, содержащуюся в изображении.

В хороню известной теории морфологического анализа монохромных изображений (монохромной морфологии) [1-3,5] вводится понятие формы изображения объекта как класса его изображений, отвечающих различным условиям регистрации (освещения). Форма изображения, определенная таким образом, инвариантна относительно условий регистрации. При таком определении формы, для распознавания изображений объекта при разных условиях регистрации алгоритм распознавания, основанный на морфологическом анализе монохромных изображений, необходимо "обучать изображениям объекта", полученным при различных условиях его регистрации. }

Известно, что изображение объекта зависит как от оптических свойств самого

1 Под обучением алгоритма распознавания следует понимать построение формы объекта по его изображениям.

Введение

объекта, так и от условий освещения, при которых происходила регистрация изображения. И если учитывать априорную информацию об объекте, то появляется возможность значительно уменьшить число изображений, необходимых для обучения. Существует целый класс так называемых ламбертовых объектов, учет оптических свойств которых позволяет проводить обучение алгоритма распознавания трем изображениям объекта (при различных условиях регистрации) для распознавания изображений объекта, полученных при разных условиях его регистрации. Эти свойства заложены в основу морфологического анализа ламбертовых изображений (ламбертову морфологию) [7,95].

Из теории морфологического анализа ламбертовых изображений следует, что ответить на вопрос, являются ли предъявленные изображения изображениями ламбертового объекта, можно ретив задачу поиска минимальной размерности линейного подпространства, содержащего все предъявленные изображения объекта: если искомая размерность не превосходит 3, то предъявленное множество изображений есть множество изображений ламбертова объекта. Это так, если мы имеем дело с изображениями, полученными без ошибки. Но поскольку изображения всегда получаются с некоторой ошибкой, то поиск критерия, позволяющего по предъявленным изображениям объекта в шуме сделать заключение о ламбертовости объекта, нетривиален и является актуальной задачей.

Еще одной интересной и актуальной задачей является исследование влияния состава обучающей выборки на качество распознавания объектов в шуме. Хотя вопрос о том, следует ли на обучение подавать данные в шуме при распознавании данных в шуме, стоит давно. Изучение такого влияния до сих пор никем не производилось ни для алгоритмов распознавания, основанных на морфологическом анализе, ни для так называемых параметрических алгоритмов.

Параметрические алгоритмы хорошо зарекомендовали себя, в частности, в задачах медицинской диагностики, где необходимо на основе измерений некоторых косвенных характеристик (например, артериального давления, ЭКГ и т.д.) предсказать заболевание, поскольку прямое измерение некоторых

Введение

характеристик (например, характеристик, которые могут быть получены только при хирургической операции) связано со значительным риском. Все параметрические алгоритмы основаны на анализе эмпирической информации, представленной в виде таблиц данных. Параметрические алгоритмы производят построение устойчивых представительных наборов для каждого класса объектов таблицы данных. Каждый объект таких таблиц данных характеризуется значениями признаков Хі,...,Хп, где п — количество признаков. Для булевых признаков наиболее известным алгоритмом распознавания является алгоритм "Кора"[79-80,87,94], предназначенный для определения логических закономерностей в виде конъюнкций значений признаков и метод "тупиковых тестов" [89,90,97,98]. Решающее правило в обоих случах задается в виде алгоритмической процедуры: для распознавания объекта используется голосование либо по конъюнкциям, либо по "тупиковым тестам".

Для разнотипных признаков известны такие алгоритмы распознавания, как "TEMP", "R-метод", "CORAL" — эти алгоритмы основаны на построении представительных наборов в виде так называемых деревьев решений [16,17,30-33].

Цель диссертационной работы состоит:

  1. В поиске критерия ламбертовости, позволяющего по предъявленным изображениям объекта в тпуме сделать заключение о ламбертовости объекта;

  2. В изучении влияния состава обучающей выборки на качество распознавания объектов в шуме параметрическими алгоритмами и морфологическими алгоритмами;

З В изучении влияния на качество распознавания параметрическими и морфологическими алгоритмами зависимости между уровнем шума, добавляемого в обучающую выборку, и уровнем шума, который ожидается у предъявляемых для распознавания данных;

4. В сравнительном анализе качества распознавания параметрических алгоритмов и морфологических алгоритмов.

1.1 Морфологический анализ монохромных изображений

Морфологический анализ изображений ламбертовътх объектов

При регистрации изображения какого-либо реального объекта как правило используют регистрирующую аппаратуру, имеющую следующую схему: имеется оптическая система, проецирующая на поле зрения ХСІ2 распределение яркостей на поверхности объекта, создаваемое источниками освещения. На поле зрения X расположены датчики, регистрирующие мощность потока световой энергии, которая определяется яркостью тех точек объекта, изображения которых проецируются на датчик. Таким образом, в задаче анализа изображений ключевым является понятие яркости точки объекта.

Рассмотрим малую площадку а площадью s (рис. 1.1), находящуюся в точке г, на поверхности объекта. Пусть п(г) единичная нормаль к о в точке г, е — вектор, характеризующий положение датчика (направление наблюдения), s — вектор, определяющий направление и интенсивность падающего в данном направлении излучения. Поток световой энергии АЕ, идущий от площадки а в направлении е и падающий в малый телесный угол ДГ2 определяется выражением: где /(г, е, s) яркость в точке г.

Заметим, что в общем случае для определения яркости в точке г необходимо учитывать три угла между векторами п, е и s . Однако, существует класс объектов, оптические свойства которых таковы, что при вычислении яркости в точке достаточно знать величину только одного угла. Далее будем рассматривать класс так называемых ламбертовых объектов.

Определение 1. Объект называется ламбертовъш в точке г, если яркость I(r, e,s) в этой точке не зависит от направления наблюдения при любом характере освещения (/(г, е, s) = I(r, s)). Определение 2. Объект называется ламбертовым, если он ламбертов в каждой точке.

Учет свойства ламбертовости объекта при вычислении яркости в точке требует от нас знания величины только одного угла из трех выттте перечисленных, а именно угла между векторами nws.

Заметим, что если при регистрации изображения ламбертова объекта измеряется не само распределение яркостей I(r, s), а некоторое его преобразование f(I(r, s)), то ламбертово свойство объекта сохраняется. Действительно, поскольку яркость I(r, s) в каждой точке объекта не зависит от направления наблюдения е, то и величина /(/(г,s)) также не зависит от е в каждой точке, и объект остается ламбертовым, если его описывать в терминах преобразованных значений яркостей f(I(f, s)).

Зададимся вопросом: можно ли при вычислении яркости точки объекта взять в качестве вектора s суперпозицию падающих в точку г излучений? Вообще говоря, нет. В качестве примера рассмотрим сцену с зеркальной поверхностью и двумя точечными источниками освещений (рис. 1.2).

При вычислении яркости в точке А мы должны учитывать, что связь между углами а, /? и 7 такова, что углы а и (3 равны. Таким образом, направления наблюдения, в которых будет хоть что-то видно, характеризуются векторами 1 и 2. Если при вычислении яркости точки А взять суперпозицию векторов si и 52, характеризующих падающие в точку излучения от источников Si и 5г соответственно, то мы получим направление наблюдения, характеризующееся вектором 3, вдоль которого мы ничего не увидим. В случае же ламбертова объекта яркость в точке г S равна и не зависит от е. Поскольку выражение (4) линейно по s Є R3, то вектор s представляет собой суперпозицию падающих в точку г излучений: где s[ + ...+s — излучения (векторы освещений), падающие в точку г. Иначе говоря, если ламбертов объект освещен с нескольких направлений (или даже диффузно), яркость в каждой его точке определяется векторной суммой освещений s — s[ +... + s , в то время как для определения суммарной яркости в общем случае необходимо знать все векторы ё[,...,ё и направление наблюдения.

Вообще говоря, поскольку мы изучаем объект по его изображению, то мы должны наложить ограничение на освещения объекта, в противном случае изучение объекта по его изображению может стать невозможным. В качестве примера можно рассмотреть ситуацию, когда на изучаемый объект в качестве освещения проецируется изображение другого объекта. Изображение такой сцены делает анализ исходного объекта невозможным. Далее ограничимся пространственно-однородными освещениями, при которых вектор s не зависит от точки г на поверхности S, и в частности, поверхностями S, не допускающими самозатенения.

Пусть есть некоторое множество изображений ламбертова объекта, созданных при различных условиях освещения. Рассмотрим более подробно его структуру [7,95].Пусть X — поле зрения (область на плоскости R2), f(x) Є Ьг(Х), х Є X, — изображение ламбертова объекта, на поверхности S которого задано распределение яркостей I(f,s), г Є S (4). Здесь L2pQ — евклидово пространство функций, интегрируемых с квадратом на поле зрения X.

Пусть S\,S2,sz — линейно независимые векторы освещений, так называемые базовые освещения S. Тогда суть базовые яркости точек поверхности S, отвечающие излучениям ii,S2,S3-Рассмотрим класс освещений, определяемые равенством: в котором вектор (аі,а2) &з) пробегает выпуклый замкнутый конус К в Изображения /t(-), г = 1,2,3, предполагаются линейно независимыми в L2(X). Таким образом множество изображений ламбертова объекта представляет собой выпуклый замкнутый конус V(/) в трехмерном подпространстве евклидова пространства L2 [7,95].

Представим теперь, что предъявлены несколько изображений одного объекта, полученых с некоторой точностью. Как узнать, что все изображения суть изображения ламбертова объекта? Математически задача сводится к поиску минимальной размерности линейного подпространства, содержащего все предъявленные изображения. Если искомая размерность не превосходит 3, то предъявленное множество изображений есть множество изображений ламбертова объекта. Однако, поскольку изображения получены с некоторой ошибкой, то реіпение задачи определения фактической размерности предъявленного множества изображений не тривиально. Рассмотрим, следуя [7,95], математическое решение этой проблемы.

Эффективная размерность множества измеренных с ошибками сигналов

Поскольку на практике стратегия природы неизвестна, то для построения логической решающей функции используется эмпирическая информация, заданная в виде таблицы данных v — {х\у1}, і — 1,...,N, х% = (х\, ...,х10,...,Хп) = Х{аг)1 где ж = Х3[аэ) — значение переменной Х3 для объекта а, Є А; у% — Y(at) — значение целевой переменной, указывающее номер класса, к которому принадлежит объект ,Хр ..., хп ) - реализация объекта а%; А — множество объектов, данных для обучения, А Є Г; N — чило объектов множества А\ п — разномерность пространства (число переменных). Таблица v называется обучающей выборкой. Заметим, что для каждого объекта а» Є А известны не только значения переменных Хі,...,Хп, но и значение целевой переменной Y.

При использовании подходов, связанных с оцениванием распределений, выборочная логическая решающая функция имеет следующий вид:

В качестве оценки априорной вероятности P(s) используется величина P(s) — N(s)/N, где N(s) — число объектов класса с номером s в таблице данных v, N — Е N(8).

В качестве опенки условного распределения Р3(х) можно использовать величину Ps(x) = Ns(x)/N(s), где Ns(x) — число объектов класса с номером s в таблице данных v, для которых набор значений Х(аг) = хг = х, где х — произвольная фиксированная точка из D.

Назовем элементарным высказыванием Q3 на признаке Х3, j = 1,...,п одно из возможных значений признака X,. Например, если множество возможных значений признака Х3 есть пара чисел {а,Ь}, то значением Q-, может быть либо а, либо Ь. Поскольку Dj, j = 1,..., п есть множество значений признака Х3, то D3 еще называют множеством элементарных высказываний на признаке Х3. Высказыванием S называют конъюнкцию элементарных высказываний и их отрицаний: S = $si Л &2 Л ... Л 3 , (ц п). Под длиной высказывания понимается число входящих в него элементарных высказываний. Элементарное высказывание Q3 истинно на объекте аг Є А, г = 1,..., iV, если значение признака Х3 объекта at равно значению элементарного высказывания Q3. Высказывание S выполняется на объекте, если каждое элементарное высказывание, входящее в S, истинно на этом объекте. Два элементарных высказывания Щ и & эквивалентны, если они выполняются на одном и том же множестве объектов из А.

Обозначим через В = {SI,...,ST} набор высказываний, соответствующий разбиению пространства признаков на Т непересекающих областей. Набор высказываний В = {S\,...,ST} часто представляют в виде так называемого дерева решений R = {Ъ\, ...,bV}..., Ьм} (b„ — ветвь дерева, М — количество вертин дерева). Для любого объекта сначала проверяется истинность некоторого элементарного высказывания 0 . Если высказывание Щ истинно, то проверяется истинность некоторого высказывания $Sk, если ложно, то проверяется истинность высказывания Sj, и т.д. Если дереву R с конечными вершинами Ь\,...,Ъ„,...,Ьм поставить в соответствие набор решений r(R) — {si,...,s„, —,SM}, где sv Є {1,...,к}, к — количество классов, то получим логическую ретпаклцую функцию /, представленную в виде пары (R,r(R)) [16,17]. По построению критериев качества разбиения дерева решений R и последовательного ветвления дерева решений издано несколько работ [18-22], где дается подробное описание этих процессов. В литературе по распознаванию образов известны алгоритмы обнаружения логических закономерностей для булевых признаков [23-26] и для признаков, замеренных в шкале наименований [27-30]. Ниже рассматриваются алгоритмы обнаружения закономерностей для распознавания в случае разнотипных признаков.

Алгоритм "CORAL" реализует направленную процедуру поиска закономерностей, характеризующих класс Г3 (s — 1, ...,к), где к — число классов, и дает локально-оптимальное решение [17].

Логические закономерности ищутся для каждого класса отдельно. Для этого класс с номером s, s = 1,..., к назовем первым классом, а объединение всех остальных классов назовем вторым классом. Для любого высказывания S можно определить по таблице данных v число объектов первого класса N(\,S) и число объектов второго класса N(2,S), на которых указанное высказывание истинно. Например, для высказывания S = Э A si, j ф I, j, 1 = 1,...,п, на признаках Х3 и Xi iV(l, S) объектов первого класса будут иметь значения, совпадающие со значениями элементарных высказываний 0 и Qi.

Высказывание S называется логической закономерностью, характеризующей первый класс, если выполняются неравенства где 6 и р — некоторые параметры, 0 р 8 1. N(1) и ЛГ(2) — число объектов в первом и во втором классе соответственно. Чем больттте 6 и меньше /?, тем сильнее логическая закономерность. Высказывание S называют потенциальной логической закономерностью для первого класса, если выполняются неравенства Теперь приведем описание этапов перебора высказываний. 1 В начале поиска путем перебора всевозможных элементарных высказываний определяется наилучшее высказывание Щ, j = \,..., п, по критерию 7 — Pi(S) — т/2 P2(S), где т — номер этапа перебора [17]. 2. Рассматриваются все высказывания длины два типа S = S Л SJ", j ф I. Выбирается то высказывание S = Щ Л Щ, J ф I, для которого значение 7 максимально и т.д. Перебор заканчивается в том случае, если найдена закономерность или когда число элементарных высказываний, входящих в S , превысило некоторые Шо. Если закономерность не найдена, значение 6 уменьшается и перебор повторяется. 3. После нахождения первой закономерности исключаются объекты класса s, на которых выполнялось S, и процедура поиска закономерностей для оставшихся объектов продолжается до тех пор, пока не будет получено покрытие множества Vs, s — 1,..., к. 4. Для остальных классов процедура поиска закономерностей аналогична.

После исключения признаков, вошедших в выбранные закономерности, можно на оставшихся признаках получить новый набор закономерностей и т.д.

Элементарные высказывания и наборы высказываний

Для проведения тестов но распознаванию алгоритмом, основанном на методе морфологического анализа монохромных изображений (монохромной морфологии) брались сцены, полученные видеокамерой серии "Video Blaster WebCam 3 USB" и цифровым фотоаппаратом серии "HP Photosmart 715 USB". Были взяты изображения трех похожих сцен (рис. 3.1): начальная сцена (общий фон — рис. 3.1а) и разные предметы на фоне начальной сцены (рис. 3.1Ь и рис. 3.1с). При внесении на сцену новых предметов ничего в начальной сцене не менялось: ни освещение, ни пространственное расположение камеры. Алгоритму распознавания на обучение предоставили эти три сцены: изображения /і, /2, /з- Назовем их эталонными изображениями. На рис. 3.2 приведены формы эталонных изображений /і, /г, /з при разбиении шкалы интенсивностей на 32 уровня. Формы эталонных изображений получены исходя из правила (3).

Для тестирования алгоритма распознавания брались изображения тех же сцеп, что предъявлялись на обучение. Эти изображения заптумлялись белым гауссовым птумом со средним равным 0 и с дисперсией, менявшейся в пределах от 0 до 3 (рис. 3.3). Здесь изображения 7и, 72і ?зі — заптумленные изображения /1,/2,/3 белым гауссовым шумом с дисперсией 0.2, изображения ді2,922,9з2 — заптумленные изображения /1,/2,/3 белым гауссовым птумом с дисперсией 0.5. Заптумленные изображения, поданные на распознавание, назовем тестовыми изображениями.

Применение правила (4) позволяет получить проекцию тестовых изображений д (рис. 3.3), например, на изображение /і. Чем более затпумлено тестовое изображение и чем более тестовое изображение отличается от эталонного изображения, тем более бледной получаются изображения проекции Р/д эталонного изображения на тестовые (рис. 3.4 и рис. 3.6).

Применение правила морфологической разности (б) позволяет рептать задачу классификации тестовых изображений: чем меньше величина разности, тем меньше тестовое изображение отличается от эталонного. Рис. 3.5 и рис. 3.7 показывают, что монохромная морфология уверенно классифицирует тестовые изображения дц и #12 как изображение /І. Изображения 7і2, ?22 9з2, затттумленные с дисперсией 0.5 дают более высокую морфологическую разность, нежели изображения ді2,922,дз2, затттумленные с дисперсией 0.2. Рис. 3.58 показывает зависимость правильных ответов от величины дисперсии при классификации тестовых изображений. Кривые (а) и (с) — результаты распознавания тестовых изображений с ограничениями и без ограничений на яркость изображений соответственно.

Алгоритм распознавания, основанный на морфологическом анализе монохромных изображений, наряду с классификацией применяется и для выделения "новых" объектов на тестовом изображении. Сцены /1,/2,/3 отличаются лить внесением "новых" объектов на известную сцену Д: кружка, дискета, детская кегля — все это "новые" объекты на известной сцене /ь Если алгоритм распознавания обучить изображению /і (рис. 3 8а), а на распознавание ему подать изображение, отличающееся от изображения /і лишь привнесенным "новым" объектом (рис. 3.8Ь), то морфологическая разность (б) позволяет выделить "новый" объект на известной сцене /і (рис. 3.8d).

Даже если тестовое изображение затттумлено как на рис. 3.3с и рис. З.Зе, морфологическая разность (3) покажет привнесенные "новые" объекты. На рис. 3.3с и рис. З.Зе видны привнесенные "новые" объекты, но эти "новые" объекты в шуме, также как и сама сцена — чем больше затттумлено тестовое изображение, тем более затттумленными получаются выделенные объекты.

Итак, метод морфологического анализа монохромных изображений позволяет решать задачи классификации объектов с хорошей точностью. Однако, при решении реальных задач классификации изображений иногда складывается ситуация, когда этот метод не работает. Как известно [1-3,5], метод морфологического анализа монохромных изображений работает в терминах областей постоянной яркости.

Если эталонная сцена освещена с одного направления (т.е. области постоянной яркости определены при одном освещении), и на распознавание подается та же самая едена, но освещенная с другого направления, то происходит неправильное определение областей при построении формы изображения едены. В результате происходит существенное снижение качества распознавания.

Обратимся к примеру на рис. 3.9. Здесь на обучение подавалось изображение (а), на распознавание — изображение (Ь), полученное при одинаковых с изображением (а) условиях регистрации. Как видно из рис. 3.9е и рис. 3 9h морфологическая разность тестового изображения и проекции тестового изображения на форму эталонного изображения очень мала (она зависит от разбиения тпкалы интенсивности при построении формы эталонного изображения). Обратимся теперь к рис. 3.10. В этом случае на рспознавание подается изображение сцены (рис. 3.10b), полученное при другом условии регистрации, а именно при другом градиенте освещения. Морфологическая разность тестового изображения PI проекции тестового изображения на форму эталонного изображения в этом случае совершенно другая (рис. 3.10d и рис. 3.10f). Разница при одинаковых условиях построения формы эталонного изображения составляет соответственно 0.079 и 0.053.

Как и в случае проведения тестов по распознаванию алгоритмом, основанном на методе морфологического анализа монохромных изображений, для проведения тестов по распознаванию алгоритмом, основанном на методе морфологического анализа ламбертовых изображений (ламбертовой морфологии) брались сцены, полученные видеокамерой серии "Video Blaster WebCam 3 USB" и цифровым фотоаппаратом серии "HP PhotoSmart 715 USB".

Из 1.2.2 следует, что эффективную размерность множества точных данных (изображений) можно определить решая либо Задачу 1, либо Задачу 2. Теорема 1 дает решение этих двух задач и утверждает, что решение их совпадает. Но поскольку на практике изображения наблюдаются в шуме (шум вносит регистрирующая изображения аппаратура), то необходимо решать Задачу 3 (1.2.3). Решить эту задачу можно решив вариационную задачу (15), а Теорема 2 дает решение этой задачи при малом шуме. Эффективная размерность для большинства серий изображений, рассматриваемых в этом параграфе, находилась исходя из решения, которое дает Теорема 3. Вариационная задача (15) решалась только при исследовании влияния шума на эффективную размерность серии изображений.

Метод морфологического анализа ламбертовых изображений

Детали кувшина видны на всех без исключения изображениях собственных векторов этой едены (рис. 3.20). Рассматривая внимательно изображения собственных векторов, можно заметить именно те детали объекта, которые соответствуют участкам поверхности объекта, которые отражают свет.

На рис. 3.23-3.26 и рис. 3.27-3.30 приведены еще две сцены изображений разных объектов и результаты, получаемые при решении Задачи 3 для этих двух сцен.

Итак, чем отличается поведение собственных значений и вид собственных векторов для всех трех вытперассмотренных сцен и каков критерий ламбертовости объекта? Для всех рассмотренных спен наблюдаются следующие две закономерности. Первая: изображения соответствующих сценам собственных векторов, начиная с четвертого, ведут себя по-разному: для одних сцен на изображениях собственных векторов, начиная с четвертого, никакие детали сцены не различимы, а для других — наоборот. Если объект имеет отражающую свет поверхность (неламбертов объект), то детали этой поверхности наблюдаемы на изображениях всех собственных векторов (это выполняется для спен на рис. 3.19 и рис. 3.27). Для сцен на рис. 3.11, 3.15, 3.23 на изображениях собственных векторов, начиная с четвертого практически ничего различить невозможно

И вторая: для собственных значений всех вытперассмотренных сцен отношение первого собственного значения к четвертому дает величин} в несколько порядков. Интересен тот факт, что для одних сцен это отношение дает величину, порядок которой не менее 104, а для других — не более 102. А для изображений ровной поверхности это отношение (рис. 3.11) дает величину порядка 105.

Изображения всех вытперассмотренных сцен достаточно чисты, хотя, конечно же, регистрирующая изображения аппаратура привнесла в них шум (на глаз он не виден, но он присутствует). Если бы мы имели дело с идеальной ламбертовой поверхностью, если бы регистрирующая изображения аппаратура не привносила шум в изображения объекта и освещение было бы однородным, то отличными от нуля были бы только три первых собственных значения. Но на практике этого не наблюдается и поэтому мы обычно будем наблюдать отличными от нуля все собственные значения, начиная с четвертого. А насколько эти величины будут больше нуля зависит от того, насколько поверхность изучаемого объекта близка к ламбертовой, насколько велик шум, вносимый регистрирующей аппаратурой и насколько отлично освещение от однородного. И если шум белый, то начиная с изображения четвертого собственного вектора не будут просматриваться и детали едены.

Ярким примером того служит серия изображений ровной поверхности: ровная поверхность была подобрана таким образом, чтобы максимально соответствовать определению ламбертовости, т.е. это поверхность не содержала участков с самозатенением и яркость в каждой ее точке не зависела от направления наблюдения. Поведение собственных значений для ровной поверхности подтверждает тот факт, что если бы у нас была идеальная ламбертова поверхность, если бы регистрирующая изображения аппаратура не привносила шум в изображения объекта и освещение было бы чисто однородным, то отличными от нуля были бы только три первых собственных значения (рис. 3.13). Здесь видно, что собственные значения, начиная с четвертого, имеют небольшую величину (сравнительно с первыми тремя собственными значениями) и отличаются друг от друга на постоянную величину — это объясняется и квазиламбертовостью поверхности, и небольшим шумом, который привнесится регистрирующей изображения аппаратурой, и квазиоднородностью освещения.

Критерием ламбертовости объекта является отсутствие деталей сцены, начиная с изображения четвертого собственного вектора сцены.

Эффективная размерность, рассчитанная исходя из Теоремы 2, для сцен на рис. 3.11, 3.15, 3.23 не превышает трех, тогда как эффективная размерность сцен на рис. 3.19 и рис. 3.27 значительно больше трех.

Реальный объект может состоять из ламбертовых и неламбертовых частей. Рассмотрим, к примеру, изображения лиц, полученные при разном освещениии. На рис. 3 31 показана серия изображений лица одного и того же человека. Лицо снималось таким образом, чтобы охватить голову человека и ровное поле зрения за головой, вблизи которого снималось лицо (это видно по тени, отбрасываемой головой человека). Вторая серия изображений на рис. 3.33 — это приближенные изображений на рис. 3 31, полученные таким образом, чтобы охватить овал лица и исключить ровное поле зрения за головой и волосы. Анализируя изображения собственных векторов (рис. 3.32 и рис. 3.34), найденные при решении Задачи 3, можно заметить, что на всех изображениях собственных векторов этих двух серий изображений лиц, начиная с четвертого собственного вектора детали лиц не разлечимы, за исключением области глаз и носа (рис. 3.32 и рис. 3.34). На изображениях собственных векторов этих двух серий видно, что области глаз и носа — это области либо с отражающей поверхностью, либо с самозатенением. На рис. 3 35 приведена зависимость собственных значений от порядкового номера собственных значений для этих двух сцен изображений лиц. Из рис. 3.36 видно, что отношение первого собственного значения к четвертому для графиков рис. 3.35а и рис. 3.35Ь отличаются друг от друга примерно на 102.

Эффективная размерность для серии рис. 3.33 не превосходит трех, тогда как эффективная размерность для серии рис. 3.31 больше трех. В последнем случае это объясняется тем, что на этой серии изображений наблюдаются большие области с самозатенением (волосы и ровное поле зрения с тенью головы на нем).

При регистрации изображений реальных объектов встает проблема совмещения изображений внутри одной серии изображений. Возникает вопрос: как скажется несовметцение внутри одной серии изображений на величину эффективной размерности? Для этого рассмотрим две серии изображений, полученных при разном освещении2 одного и того же человеческого лица (рис. 3.37 и рис. 3 39).

Похожие диссертации на Сравнительный анализ морфологических методов интерпретации изображений