Электронная библиотека диссертаций и авторефератов России
dslib.net
Библиотека диссертаций
Навигация
Каталог диссертаций России
Англоязычные диссертации
Диссертации бесплатно
Предстоящие защиты
Рецензии на автореферат
Отчисления авторам
Мой кабинет
Заказы: забрать, оплатить
Мой личный счет
Мой профиль
Мой авторский профиль
Подписки на рассылки



расширенный поиск

Информационная технология восстановления изображений, основанная на принципах распознавания образов Чернов Андрей Владимирович

Информационная технология восстановления изображений, основанная на принципах распознавания образов
<
Информационная технология восстановления изображений, основанная на принципах распознавания образов Информационная технология восстановления изображений, основанная на принципах распознавания образов Информационная технология восстановления изображений, основанная на принципах распознавания образов Информационная технология восстановления изображений, основанная на принципах распознавания образов Информационная технология восстановления изображений, основанная на принципах распознавания образов Информационная технология восстановления изображений, основанная на принципах распознавания образов Информационная технология восстановления изображений, основанная на принципах распознавания образов Информационная технология восстановления изображений, основанная на принципах распознавания образов Информационная технология восстановления изображений, основанная на принципах распознавания образов
>

Диссертация - 480 руб., доставка 10 минут, круглосуточно, без выходных и праздников

Автореферат - бесплатно, доставка 10 минут, круглосуточно, без выходных и праздников

Чернов Андрей Владимирович. Информационная технология восстановления изображений, основанная на принципах распознавания образов : Дис. ... канд. техн. наук : 05.13.17 : Самара, 2004 112 c. РГБ ОД, 61:05-5/418

Содержание к диссертации

Введение

ГЛАВА 1. Решение задачи восстановления изображений на основе методологии распознавания образов 14

1.1.. Постановка задачи восстановления изображений 14

1.2. Общая схема преобразования данных 15

1.3. Постановка задачи построения восстанавливающих процедур с использованием P/R-методов 18

1.4. Выводы и результаты 21

ГЛАВА 2. Формирование признаков на изображении 22

2.1. Эффективно вычисляемые семейства признаков, используемые в P/R- методах 23

2.1.1. Локальные обобщенные моменты 23

2.1.2. Рекурсивно формируемые локальные обобщенные моменты 24

2.1.3. Моментные инварианты 26

2.2. Система признаков, описывающих форму изображения 28

2.2.1. Обеспечение инвариантности к повороту для системы признаков, описывающих форму изображения 30

2.2.2. Нормализация признаков, описывающих форму, к линейному преобразованию значений яркости изображения в окне 36

Выводы и результаты 40

ГЛАВА 3. Быстрое рекурсивное вычисление значений признаков на основе рекурсивных фильтров с конечной импульсной характеристикой 41

3.1. Общие сведения из теории линейных рекуррентных соотношений 42

3.2. Расчет одномерных КИХ-фильтров 45

3.2.1. Вычисление одномерной свертки с конечной импульсной характеристикой, удовлетворяющей ЛРС 45

3.2.2. Нахождение оптимальных коэффициентов ЛРС, приближающего заданную конечную импульсную характеристику 46

3.2.3. Методы улучшения устойчивости алгоритма нахождения оптимальных коэффициентов ЛРС 50

3.2.4. Вычисление одномерных сверток с рекуррентными последовательностями специального вида 51

3.3. Расчет рекурсивных двумерных КИХ-фильтров 54

3.3.1. Вычисление двумерной свертки с разделимой рекуррентной последовательностью 54

3.3.2. Аппроксимация неразделимой импульсной характеристики разделимыми импульсными характеристиками общего вида 55

3.3.3. Аппроксимация двумерной неразделимой ИХ произведением разделимых ИХ, удовлетворяющих ЛРС 58

3.3.4. Алгоритм аппроксимации неразделимой ИХ семейством разделимых ИХ, удовлетворяющих ЛРС 60

3.4. Экспериментальные исследования методов рекурсивного вычисления одномерных сверток 61

Выводы и результаты 66

ГЛАВА 4. Построение классификаторов и экспериментальные исследования информационной технологии восстановления изображений 67

4.1. Линейный классификатор 67

4.2. Классификатор в виде нейронной сети 69

4.3. Древовидные классификаторы 71

4.3.1. Древовидный классификатор с кусочно-постоянной аппроксимацией 73

4.3.2. Древовидный классификатор с кусочно-линейной аппроксимацией 74

4.4. Построение древовидных классификаторов 74

4.4.1. Параметры построения древовидных классификаторов 74

4.4.2. Способы разбиения признакового пространства 76

4.4.3. Методы повышения устойчивости вычислительного алгоритма кусочно-линейной аппроксимации 77

4.5. Соотнесение сложности решающей функции с объемом обучающей выборки 79

4.6. Параметрическая оптимизация семейства признаков 81

4.6.1. Подбор оптимальных параметров значений признаков 81

4.6.2. Определение оптимального размера окна обработки при вычислении признаков 84

4.7. Описание информационной технологии построения восстанавливающих процедур на основе P/R-методов 85

4.8. Экспериментальные исследования информационной технологии восстановления изображений 87

4.8.1. Эксперименты по определению достаточного объема выборки 88

4.8.2. Общее описание экспериментов по оценке эффективности информационной технологии восстановления и фильтрации изображений 90

4.8.3. Исследование эффективности фильтрации изображений 92

4.8.4. Исследование эффективности восстановления изображений 101

4.8.5. Экспериментальные исследования нахождения оптимального параметра двумерного гауссовского фильтра 103

4.8.6. Экспериментальное сравнение различных видов классификаторов 104

4.9. Выводы и результаты 106

Заключение 107

Список использованных источников 108

Введение к работе

Диссертация посвящена разработке информационной технологии восстановления и; фильтрации изображений, базирующейся на принципах теории распознавания образов.

Актуальность темы. Восстановление и фильтрация изображений являются обязательным этапом любых информационных, технологий: обработки двумерных сигналов. Традиционный путь,решения этих задач [1,2,4,9,23,35] включает в себя подбор или полуэвристический синтез большого числа обрабатывающих процедур, что объективно обусловлено разнообразием и сложностью математических моделей формирования оптических сигналов, плохой формализуемостью решаемых задач, критериев качества обработки и т.д. Вопросам разработки методов восстановления посвящено большое количество работ отечественных (Д.С.Лебедев, Л.П.Ярославский, Г.И.Василенко, В:А.Сойфер, А.А.Спектор, Ю.П.Пытьев и др.) и зарубежных ученых (У.Прэтт, Р.Бейтс,.Р.Мерсеро, и др.). Основной используемый в этих работах подход состоит в выборе моделей рассматриваемых входных сигналов, искажающей системы и шумов, оценивании их параметров на основе исходной информации и построении восстанавливающей процедуры. Широко известен < винеровский фильтр, являющийся . наилучшим в классе линейных восстанавливающих систем по критерию минимума среднеквадратичной ошибки восстановления [2,20].

Однако традиционный путь решения задачи восстановления обладает рядом существенных недостатков;

Во-первых, необходимым свойством эффективных алгоритмов восстановления, рассчитанных на? универсальное применение, является их адаптивность, т.е. способность самоподстройки к меняющимся свойствам- обрабатываемых данных. Общая идея адаптации может быть кратко описана следующим образом. Задается (фиксируется) некоторый параметрический класс алгоритмов восстановления (например, линейные цифровые фильтры с множеством возможных импульсных характеристик). Объект обработки (изображение или его фрагмент) сначала подвергается анализу с целью оценивания его характеристик: статистических, структурных и т.п. Затем по полученным значениям характеристик объекта рассчитываются параметры алгоритма (в приведенном примере - конкретная

импульсная характеристика восстанавливающего фильтра). И только после этого производится собственно обработка объекта (фильтрация изображения). Поэтому при применении стандартных восстанавливающих процедур приходится наряду с собственно обработкой проводить оценивание характеристик сигналов и «подстройку» их параметров. Вместо этого рациональнее было бы. построить восстанавливающую процедуру, в которой выбор значений используемых параметров непосредственно регулируются локальными характеристиками сигналов, поступаемых на обработку.

Во-вторых, объективное разнообразие и сложность математических моделей формирования оптических сигналов; (искажающих систем), критериев качества обработки делает невозможным аналитическое получение оптимальных процедур обработки и вынуждает использовать подбор или полуэвристический синтез большого числа обрабатывающих процедур. По этой причине для компьютерных систем анализа видеоинформации характерна весьма разветвленная и неудобная структура прикладного программного обеспечения, в рамках которой представлена широкая номенклатура алгоритмов обработки изображений. Сами же алгоритмы зачастую обладают низкой вычислительной эффективностью и/или не обеспечивают требуемое качество обработки. Гораздо более предпочтительным было бы построение обобщенного адаптивного- фильтра на основе заранее выбранных различных, возможно даже полуэвристических, алгоритмов восстановления.

В третьих, классический путь решения задачи * восстановления изображений? подразумевает идентификацию искажающей системы и построение «обратной к ней», что не всегда удается сделать с учетом принятых ограничений на скорость и качество обработки. Вместо этого разумнее было бы подбирать параметры именно восстанавливающей системы.

Дополнительным ограничением на выбор конкретных алгоритмов-восстановления является жесткие требования к вычислительной эффективности.

Поэтому современные исследования в области; восстановления изображений направлены, в основном, на построение «максимально адаптивных», обобщенных процедур восстановления практически в отсутствии предположений о характеристиках искажающих систем с учетом ограничений на вычислительную

7 реализацию (время обработки сигнала). Данная работа лежит в русле этих исследований.

Целью работы является построение информационной технологии восстановления и фильтрации изображений, использующей представление априорной информации в виде согласованной пары изображений, интерпретируемых по отношению к неизвестной искажающей системе как "входное" (идеальное) и "выходное" (наблюдаемое).

Задачи диссертационной работы. Для достижения указанной цели решаются следующие задачи:

  1. Разработка общей схемы преобразования данных для применения метода локальной "обработки через распознавание" изображений к задачам восстановления и фильтрации.

  2. Разработка методов формирования систем локальных признаков, описывающих форму функции яркости изображений, в том числе инвариантных к повороту, линейному преобразованию, а также процедур их эффективного вычисления.

  1. Синтез и исследование конечных импульсных характеристик (КИХ), обеспечивающих рекурсивное вычисление свертки для формирования локальных признаков изображения, и разработка соответствующих алгоритмов рекурсивного формирования признаков.

  2. Разработка алгоритмов обучения классификаторов, осуществляющих преобразование признаков в выходное (восстановленное) изображение, выработка критериев остановки процесса обучения.

  3. Разработка общей информационной технологии восстановления изображений, базирующейся на синтезированных алгоритмах вычисления признаков и обучения классификаторов.

  4. Экспериментальное исследование эффективности общей информационной технологии восстановления изображений, а также ее составных частей - методов построения и быстрого вычисления локальных признаков, алгоритмов обучения классификаторов.

Перечисленные задачи определяют структуру работы и содержание отдельных глав.

Краткое содержание диссертации; Диссертация состоит из введения,

четырех глав, заключения, списка? литературы, и приложения; Основной текст

диссертационной работы изложен на 113 страницах машинописного текста, содержит

25 рисунков; 5 таблиц, список использованных источников из 53 наименований. /

Первая" глава диссертации посвящена вопросу построения: общей схемы преобразования данных, использующей представление априорной информации в виде пары; изображений - идеальное "входное" и реальное "выходное" (искаженное в; канале и наблюдаемое: на его выходе); с применением методики, "обработки* через распознавание". Обосновывается переход к обработке в режиме "скользящего окна" (в предположении пространственной инвариантности искажений) для уменьшения числа возможных классов, формирования; достаточного объема обучающей> выборки, а также для ограничения набора рассматриваемых признаков. Приводится общая схема5 преобразования данных для? реализации методов^ локальной; "обработки (восстановления) через распознавание" ("processing via recognition" или; для? краткости, P/R-методов). При- этом в; рамках используемого* подхода оператор восстановления G реализуется в два этапа: G = M R\ где М - оператор формирования признаков, R- оператор построения аппроксимирующей функции (классификатор).

Во второй главе диссертации рассматривается* задача! разработки: методов; формирования локальных признаков на' изображении: В отличие: от задач распознавания; образов, где основное внимание* уделяется разделяющим? свойствам? признаков, в P/R-методах больше важны; их аппроксимирующие свойства.. Это означает, что система признаков,» во-первых, должна описывать.форму изображения; (хорошо аппроксимировать функцию яркости), во-вторых,, при і наличии дополнительной? априорной: информации о классе, предъявляемых, для; обработки? изображений, трансформироваться* в? систему характеристик, инвариантных к повороту, сдвигу, линейному преобразованию яркости, а: в- третьих, алгоритмы формирования признаков должны быть вычислительно эффективными.

Строится? система- признаков, описывающих форму изображения? х(щ,п2) в і скользящем окне на основе коэффициентов его приближения поверхностью порядка d, приводятся алгоритмы: для- их вычисления. Далее, решаетсяtзадача обеспечения инвариантности к преимущественному направлению (ориентации*изображения) в

9 окне (инвариантности к повороту), а также линейному преобразованию яркости. Приводятся алгоритмы вычисления преобразованной системы признаков г Sd, которая

содержит в явном виде оценку параметров нормализации* и инвариантную к ним часть. Показывается, что существует взаимно-однозначное отображение Sd {{jjj,i + jв систему локальных (геометрических) моментов изображения

порядка d, поэтому осуществление описанной процедуры нормализации не приводит к появлению дополнительных функциональных; зависимостей. Приводятся г оценки; требуемого числа операций для используемых на практике случаев d = 2,3.

Третья глава; диссертации посвящена разработке методові быстрого вычислению значений признаков, представимых; в виде свертки' с конечной импульсной характеристикой (ИХ) на? основе ее приближения семейством> функций специального вида, вычисление свертки; с которыми допускает рекурсивную реализацию с помощью* разностных схем; Предлагается обобщенный; подход, позволяющий подобрать наилучшее приближение заданной конечной импульсной характеристики1 в классе последовательностей^ удовлетворяющих линейно рекуррентным соотношениям (ЛРС) порядка R (рекуррентных последовательностей). Практически для R«N (длины ИХ) эту задачу можно рассматривать как задачу минимизации ошибки вычисления выходного; сигнала, проходящего через систему с конечной импульсной характеристикой; при заданной пользователем вычислительной сложности обработки. Ранее подобные методы были разработаны только для частных: случаев рекуррентных последовательностей из? прямоугольного* [24], полиномиального базиса: [8] и, тригонометрических функций; [24]. Предлагаемую: методику также можно рассматривать как перенос идей: построения рекуррентных фильтров і с бесконечной" импульсной характеристикой [41,47,51 ] на конечномерный случай.

Сначала рассматривается случай: одномерных ИХ и решается нелинейная; задача приближения заданной ИХ в г классе последовательностей; удовлетворяющих ЛРС. Выводятся* соотношения: для і вычисления* свертки с такими последовательностями с сокращенным количеством \ операций, зависящих только от порядка рекуррентности и не зависящих от длины ИХ N. Рассматриваются частные: случаи четных и нечетных импульсных характеристик, а также приближения в классе

10 многочленов, для которых дополнительно можно сократить количество операций при реализации свертки.

Затем производится обобщение разработанных: методов приближения двумерной; ИХ семейством разделимых рекуррентных последовательностей; для решения задачи быстрого вычисления признаков на изображении.

Bi четвертой главе диссертации рассматривается построение простых в реализации? и» быстрых классификаторов, предназначенных для преобразования изображений-признаков в: выходное (восстановленное) изображение;: производится экспериментальное сравнение классификаторов по качеству и вычислительной: сложности. Рассматриваются* линейные по параметрам, древовидные (кусочно-линейный и кусочно-постоянный); классификаторы: и: классификатор в виде двухслойной нейронной сети.

Для древовидных классификаторов решается; задача* соотнесениям сложности решающей функции: с количеством имеющихся данных (выработки: критерия остановки разбиения) при построении классификаторов (проблема переобучения) на основе теории, восстановления регрессии по эмпирическим; данным, предложенной * Вапником [3]. Также рассматриваются множество параметров, влияющих на процесс построения древовидных классификаторов *. и конкретный вид решающей \ функции" и различные способы деления перспективных вершин.

Далее, при* использовании! линейной илиг кусочно-линейной аппроксимации, разрабатываются: градиентные методы параметрической оптимизации признаков в случае, когда признаки, зависят от скалярных или векторных параметров и непрерывно-дифференцируемы по ним.

Приводится описание разработанной информационной технологии; синтеза восстанавливающих процедур- с использованием: древовидных классификаторов, основанной* на последовательном усложнении: решающего правила. Работа завершается описанием результатов экспериментальных исследований предложенных : методов, включая сравнение с восстановлением на основе винеровского фильтра.

Методы исследований: В диссертационной работе используются методы распознавания образов, цифровой обработки сигналов и изображений; теории вероятностей и статистического анализа, линейной алгебры и* математического

анализа, методы оптимизации.

Научная новизна работы. В диссертации получены следующие новые научные результаты.

  1. Разработана общая схема преобразования данных для применения P/R-методов в задачах восстановления и фильтрации изображений.

  2. Разработаны методы нахождения вычислительно эффективного семейства признаков, описывающих форму изображения, в т.ч. инвариантных к повороту изображения и линейному преобразованию его яркости.

  3. Разработаны быстрые алгоритмы вычисления одномерных и двумерных сверток с конечной импульсной: характеристикой на основе аппроксимации последовательностями, удовлетворяющими линейно-рекуррентным соотношениям.

  4. Разработаны алгоритмы параметрической оптимизации семейства признаков в P/R-методах.

  5. Разработаны алгоритмы обучения древовидных классификаторов, осуществляющих преобразование признаков в выходное (восстановленное) изображение, способы\ разбиения признакового пространства и правила остановки процесса обучения.

  6. Разработана сквозная информационная технология синтеза и применения* восстанавливающих процедур с использованием P/R-методов.

Практическая ценность работы. Разработанная информационная технология может быть использована для восстановления изображений в системах технического зрения при самых общих предположениях о характере искажений и классе обрабатываемых сигналов. Построенные быстрые алгоритмы восстановления могут быть использованы в цифровых системах оперативного анализа видеоинформации в режиме реального времени (в темпе видеоизмерений).

Отдельные алгоритмы, разработанные в рамках технологии, имеют применение, выходящее за рамки восстановления изображений. Алгоритмы формирования и параметрической оптимизации семейства локальных признаков могут применяться в широком классе задач распознавания изображений. Процедуры быстрого вычисления признаков могут использоваться для синтеза цифровых одномерных и двумерных рекурсивных фильтров с конечной импульсной характеристикой.

12 Предложенный в диссертационной работе подход позволяет, с одной стороны, улучшить качество восстановления за счет адаптации к свойствам обрабатываемых сигналов и более полного использования априорных данных, ас другой стороны, совместно с рекурсивными алгоритмами формирования локальных признаков, радикально снизить вычислительную сложность обработки видеоинформации.

Реализация результатов работы. Результаты диссертации внедрены в рамках ряда госбюджетных и хоздоговорных научно-исследовательских работ в Институте систем обработки изображений РАН и ЗАО "Самара-Информспутник".

Апробация работы. Основные результаты работы докладывались на следующих конференциях:

3-й Всероссийской конференции "Распознавание; образов и анализ изображений: новые информационные технологии" (РОАИ-3-97), г. Нижний Новгород, 1997;

5-th Open German-Russian Workshop on Pattern Recognition and Image Understanding, 21-25 сентября 1998г., г.Херршинг, Германия;

4-й Всероссийской конференции "Распознавание образов и анализ изображений: новые информационные технологии" (РОАИ-4-98), г.Новосибирск, 1998;

5-й Международной конференции "Распознавание образов и анализ изображений: новые информационные технологии" (РОАИ-5), Самара, 2000;

6-й Международной конференции "Распознавание образов и анализ изображений: новые информационные технологии" (РОАИ-6), Великий Новгород, 2002.

Работы по тематике диссертации были поддержаны грантами Российского фонда фундаментальных исследований (проекты № 96-01-00453, № 00-01-00600) Президента РФ № НШ-1007.2003.01 и Американского фонда гражданских исследований и развития (CRDF Project SA-014-02) в рамках российско-американской -программы "Фундаментальные исследования и высшее образование" (BRHE)..

Публикации. По теме диссертации опубликовано 1Г работ. Работы [32, 34, 36] выполнены автором единолично. В работах [21,26,38,39,40] автору принадлежат применение общего подхода "обработки через распознавание" к восстановлению и фильтрации изображений и экспериментальные исследования эффективности метода.

13 В работах [33, 37] автору принадлежат алгоритмы параметрической оптимизации семейства признаков в P/R-методах. В главе 8 монографии [20] автору принадлежит описание применения общего подхода "обработки через распознавание" к восстановлению и фильтрации изображений и экспериментальные исследования эффективности метода. В диссертацию включены только результаты, полученные соискателем лично. Ниже в тексте диссертации ссылки на публикации автора будут помечаться звездочками.

На защиту выносятся

  1. Общая схема преобразования данных для применения методов "обработки через распознавание" (P/R-методов) в задачах восстановления изображений.

  2. Методы нахождения вычислительно эффективного семейства признаков, описывающих форму изображения, в т.ч. инвариантных к повороту изображения и линейному преобразованию его яркости.

  3. Методы синтеза и быстрые алгоритмы вычисления КИХ-фильтров; на основе аппроксимации импульсных характеристик последовательностями, удовлетворяющими линейным рекуррентным соотношениям.

  4. Алгоритмы параметрической оптимизации семейства признаков в P/R-методах.

  5. Способы разбиения признакового пространства при обучении древовидных классификаторов, правила остановки процесса обучения.

  6. Информационная технология синтеза и применения восстанавливающих процедур с использованием P/R-методов.

Постановка задачи построения восстанавливающих процедур с использованием P/R-методов

Затем производится обобщение разработанных: методов приближения двумерной; ИХ семейством разделимых рекуррентных последовательностей; для решения задачи быстрого вычисления признаков на изображении.

B четвертой главе диссертации рассматривается построение простых в реализации? и» быстрых классификаторов, предназначенных для преобразования изображений-признаков в: выходное (восстановленное) изображение;: производится экспериментальное сравнение классификаторов по качеству и вычислительной: сложности. Рассматриваются линейные по параметрам, древовидные (кусочно-линейный и кусочно-постоянный); классификаторы: и: классификатор в виде двухслойной нейронной сети.

Для древовидных классификаторов решается; задача соотнесениям сложности решающей функции: с количеством имеющихся данных (выработки: критерия остановки разбиения) при построении классификаторов (проблема переобучения) на основе теории, восстановления регрессии по эмпирическим; данным, предложенной Вапником [3]. Также рассматриваются множество параметров, влияющих на процесс построения древовидных классификаторов . и конкретный вид решающей \ функции" и различные способы деления перспективных вершин.

Далее, при использовании! линейной илиг кусочно-линейной аппроксимации, разрабатываются: градиентные методы параметрической оптимизации признаков в случае, когда признаки, зависят от скалярных или векторных параметров и непрерывно-дифференцируемы по ним.

Приводится описание разработанной информационной технологии; синтеза восстанавливающих процедур- с использованием: древовидных классификаторов, основанной на последовательном усложнении: решающего правила. Работа завершается описанием результатов экспериментальных исследований предложенных : методов, включая сравнение с восстановлением на основе винеровского фильтра.

Методы исследований: В диссертационной работе используются методы распознавания образов, цифровой обработки сигналов и изображений; теории вероятностей и статистического анализа, линейной алгебры и математического анализа, методы оптимизации. Научная новизна работы. В диссертации получены следующие новые научные результаты. 1. Разработана общая схема преобразования данных для применения P/R-методов в задачах восстановления и фильтрации изображений. 2. Разработаны методы нахождения вычислительно эффективного семейства признаков, описывающих форму изображения, в т.ч. инвариантных к повороту изображения и линейному преобразованию его яркости. 3. Разработаны быстрые алгоритмы вычисления одномерных и двумерных сверток с конечной импульсной: характеристикой на основе аппроксимации последовательностями, удовлетворяющими линейно-рекуррентным соотношениям. 4. Разработаны алгоритмы параметрической оптимизации семейства признаков в P/R-методах. 5. Разработаны алгоритмы обучения древовидных классификаторов, осуществляющих преобразование признаков в выходное (восстановленное) изображение, способы\ разбиения признакового пространства и правила остановки процесса обучения. 6. Разработана сквозная информационная технология синтеза и применения восстанавливающих процедур с использованием P/R-методов. Практическая ценность работы. Разработанная информационная технология может быть использована для восстановления изображений в системах технического зрения при самых общих предположениях о характере искажений и классе обрабатываемых сигналов. Построенные быстрые алгоритмы восстановления могут быть использованы в цифровых системах оперативного анализа видеоинформации в режиме реального времени (в темпе видеоизмерений). Отдельные алгоритмы, разработанные в рамках технологии, имеют применение, выходящее за рамки восстановления изображений. Алгоритмы формирования и параметрической оптимизации семейства локальных признаков могут применяться в широком классе задач распознавания изображений. Процедуры быстрого вычисления признаков могут использоваться для синтеза цифровых одномерных и двумерных рекурсивных фильтров с конечной импульсной характеристикой. Предложенный в диссертационной работе подход позволяет, с одной стороны, улучшить качество восстановления за счет адаптации к свойствам обрабатываемых сигналов и более полного использования априорных данных, ас другой стороны, совместно с рекурсивными алгоритмами формирования локальных признаков, радикально снизить вычислительную сложность обработки видеоинформации. Реализация результатов работы. Результаты диссертации внедрены в рамках ряда госбюджетных и хоздоговорных научно-исследовательских работ в Институте систем обработки изображений РАН и ЗАО "Самара-Информспутник". Апробация работы. Основные результаты работы докладывались на следующих конференциях: 3-й Всероссийской конференции "Распознавание; образов и анализ изображений: новые информационные технологии" (РОАИ-3-97), г. Нижний Новгород, 1997; 5h Open German-Russian Workshop on Pattern Recognition and Image Understanding, 21-25 сентября 1998г., г.Херршинг, Германия; 4-й Всероссийской конференции "Распознавание образов и анализ изображений: новые информационные технологии" (РОАИ-4-98), г.Новосибирск, 1998; 5-й Международной конференции "Распознавание образов и анализ изображений: новые информационные технологии" (РОАИ-5), Самара, 2000; 6-й Международной конференции "Распознавание образов и анализ изображений: новые информационные технологии" (РОАИ-6), Великий Новгород, 2002. Работы по тематике диссертации были поддержаны грантами Российского фонда фундаментальных исследований (проекты № 96-01-00453, № 00-01-00600) Президента РФ № НШ-1007.2003.01 и Американского фонда гражданских исследований и развития (CRDF Project SA-014-02) в рамках российско-американской -программы "Фундаментальные исследования и высшее образование" (BRHE)..

Обеспечение инвариантности к повороту для системы признаков, описывающих форму изображения

Поэтому можно последовательно выполнять нормализацию сначала относительно поворота алгоритмом предыдущего параграфа, а затем относительно линейного преобразования яркости.

В заключении отметим, что конечным результатом выкладок, приведенных в пп. 2.2.1-2.2.2 является алгоритм построения системы признаков на основе локальных начальных моментов заданного порядка К. Одна часть системы признаков описывает локальные трансформации изображения (поворот, контрастирование, изменение яркости), а другая часть инвариантна к этим трансформациям, причем существует ее однозначное обратное отображение в систему локальных моментов порядка К.

При наличии априорной информации о классе изображений, предъявляемых для классификации (замкнутость семейства относительно локальных трансформаций определенного вида) необходимо при обучении и классификации использовать ограниченный набор признаков (например, не используя оценку угла поворота). Экспериментальные исследования по эффективности предложенных систем признаков приводятся в параграфе 4.8. Выводы и результаты Рассмотрены вопросы формирования признаков в задаче восстановления изображений. 1) Приведены примеры эффективно вычисляемых систем признаков - локальные обобщенные моменты с ядрами из прямоугольного и полиномиального базиса, а также моментные инварианты (параграф 2.1). 2) Получены семейства признаков, описывающих форму изображения на основе аппроксимации полиномом заданного порядка (параграф 2.2). 3) Разработан алгоритм нормализации семейства признаков, описывающих форму, к повороту изображения и линейному преобразованию яркости (пп. 2.2.1 — 2.2.2.). Важным свойством полученной системы признаков является обратимость процедуры нормализации, из которой следует отсутствие межпризнаковых функциональных зависимостей. Использование указанной системы признаков является альтернативой к использованию моментных характеристик (моментов и моментных инвариантов) при наличии априорной информации о замкнутости класса изображений относительно поворота и линейного преобразования яркости. 4) Получены оценки сложности вычисления системы признаков и проведения алгоритма нормализации. Все рассматриваемые в данной главе признаки являются обобщенными моментами (локальными свертками изображения с различными импульсными характеристиками) или эффективно вычисляются на их основе. В главе 3 рассматриваются методы ускорения вычисления локальных сверток с помощью аппроксимации произвольных импульсных характеристик семейством рекурсивных ядер.

Обработка изображений в режиме- "скользящего окна", осуществляемая, , в частности, для формирования» обобщенных моментов, предполагает вычисление цифровой свертки входного сигнала с конечной импульсной? характеристикой: линейных систем с постоянными параметрами (КИХ-фильтров) [20]. При этом "прямое" вычисление свертки для? каждого положения окна взвешенным суммированием отсчетов имеет практический смысл лишь для малых размеров окна, т.е. для? короткой І импульсной характеристики, поскольку объем вычислений; здесь пропорционален числу ненулевых отсчетов последней: Для больших окон (в задачах фильтрации и восстановления сигналов, вычисления признаков, корреляционного обнаружения І объектов и т.д.) прямое вычисление свертки; оказывается чрезмерно трудоемким. В этой связи; представляется целесообразным применение алгоритмов, воплощающих идею рекурсивной реализации: КИХ-фильтров, развитую в работах [24,25,46]. Основная; идея; этих алгоритмов - приближение конечной импульсной? характеристики; семейством; функций специального вида, вычисление свертки с которыми допускает рекурсивную реализацию с помощью разностных схем.

В данной главе рассматривается? задача построения наилучших приближений произвольно заданной" на отрезке конечной импульснойI характеристики линейно-рекуррентным соотношением; (ЛРС) R-того порядка. Как показано в [25], вычислительная сложность нахождения выходного отчета для такой і реализации зависит только от порядка рекуррентности R и не зависит от размеров окна обработки; N. Практически для R«N эту задачу можно рассматривать как задачу минимизации ошибки вычисления выходного сигнала при заданной пользователем вычислительной сложности обработки. Необходимо также заметить, что переход к рекуррентому вычислению выходного сигнала - это единственный. способ радикального снижения і вычислительной сложности по сравнению со сложностью вычисления прямой свертки или ее реализации с помощью дискретных ортогональных преобразований;

В теории построения рекурсивных фильтров; с бесконечной импульсной характеристикой (БИХ-фильтров) [ 15,22] эта задача решается путем приближений z-преобразования исходной импульсной характеристикой дробно-рациональной функцией различными методами [41,47,51]. В данной главе, с одной стороны, эти методы обобщаются для проектирования КИХ-фильтров, ас другой стороны, выполняется обобщение методов проектирования рекурсивных. КИХ-фильтров [24,25,46] специального вида за счет рассмотрения более широкого класса функций, удовлетворяющих ЛРС.

Следует заметить, что результаты, полученные в данной главе, охватывают гораздо более широкий класс задач, чем рекурсивное вычисление признаков в P/R-методах. Все рассмотренные во второй главе признаки эффективно вычисляются на і основе начальных моментов (сверток с многочленами). Полученные оценки; вычислительной сложности для такого частного случая (вычисления двумерных сверток с многочленами) совпадают с оценками: вычислительной сложности, полученными ранее в работах [8,46]. Исключением: является случай подсчета моментов и производных характеристик с нетривиальной функцией окна (импульсная характеристика отлична от "дельта-импульса"). Однако при использовании в качестве признаков других локальных обобщенных моментов (сверток с гауссовским фильтром, LOG-масок [20] и др.) использование результатов данной главы ведет к ускорению расчета признаков при приемлемой погрешности вычислений.

Нахождение оптимальных коэффициентов ЛРС, приближающего заданную конечную импульсную характеристику

На реальных изображениях редко удается построить линейную решающую функцию с удовлетворительной ошибкой аппроксимации. Распределение элементов обучающей выборки в пополненном (отсчетами идеального изображения) пространстве признаков плохо описывается гиперплоскостью. Поэтому целесообразно производить разбиение признакового пространства на подобласти и в каждой из подобластей строить независимые оценки, т.е. перейти к кусочно-постоянным или кусочно-линейным классификаторам.

Заметим, что качество=построения таких классификаторов в большой степени зависит от способа:разбиения признакового пространства на подобласти. Наиболее естественным; было бы применение какого-либо алгоритма автоматической; таксономии г с фиксированным числом кластеров [29]. Существуют работы [11] по адаптивному подбору критерия кластеризации в- зависимости от ошибки аппроксимации? функции решения на кластерах. Однако такие процедуры требуют-существенно большего числа операций на этапах обучения и классификации, чем рассматриваемые древовидные (иерархические) классификаторы.

Поэтому в данной; работе используются древовидные классификаторы, при построении которых используется более простая схема разбиения. Синтез такого классификатора заключается в следующем. В процессе обучения область определения-функции решения; представляющее собой -мерный гиперкуб, последовательно разбивается по осям? и порождает в памяти ЭВМ древовидную структуру (см. "двумерную" иллюстрацию на рисунке 43.). В каждой из областей, полученных в результате разбиения, аппроксимация функции решений в соответствии с выбранным критерием (например, обычным методом наименьших квадратов (4.2) для варианта линейной аппроксимации). Области с малой ошибкой аппроксимации принимаются за терминальные вершины дерева. Те области; в которых ошибка велика, подвергаются; дальнейшему разбиению. Процедура обучения завершается либо при достижении заданной точности аппроксимации, либо при исчерпании ресурсов памяти ЭВМ, отведенной на хранение древовидной структуры вместе с коэффициентами аппроксимации в терминальных вершинах дерева.

Как показали эксперименты, такие классификаторы при небольшой размерности признакового пространства достаточно быстро обучаются; и далее: демонстрируют хорошие результаты распознавания при весьма незначительных вычислительных затратах. Рассмотрим общую рекурсивную схему построения дерева решений; Пусть на некотором этапе построения имеется дерево решений В (в начале построения рассматривается дерево, состоящее из одной корневой вершины). С этим? деревом последовательно проводятся следующие операции. 1) Определение перспективности деления на подобласти конечных вершин. В соответствии с выбранным критерием (во всех нижеописанных методах им служит ошибка аппроксимации), вершины упорядочиваются по степени перспективности; Определяется количество перспективных вершин, подлежащих делению. 2) Деление перспективных вершин. Определяются оси (номера признаков), по которым происходит деление и пороги деления. Перспективные вершины заменяются на поддерево, состоящее из двух новых конечных вершин. 3) Построение аппроксимирующей функции в новых конечных вершинах и вычисление ошибки аппроксимации. 4) Проверка условий завершения процесса. В случае их невыполнения - переход на шаг 1. В памяти ЭВМ для древовидного классификатора в нетерминальных вершинах хранятся значения признака и порога разбиения (если эти параметры определяются адаптивно для каждого нетерминального узла), а для терминальных вершин хранятся элементы, необходимые для получения оценки идеального изображения (коэффициенты аппроксимации для кусочно-линейного классификатора). При применении древовидных классификаторов для каждого пришедшего на классификацию вектора Жщ п2) происходит последовательное сравнение значений признаков с порогами в нетерминальных узлах, находится соответствующая вектору терминальная вершина и вычисляется оценка у(щ,П2). В следующих пунктах рассматриваются различные виды аппроксимации в терминальных вершинах. В общем случае при построении кусочно-линейной аппроксимации используются формулы (4.2)-(4.3) и находится линейная аппроксимация (способом описанным в пункте 4.Ш) в каждой из терминальных вершин построенного древовидного классификатора. При этом погрешность в каждой терминальной вершине древовидного» классификатора считается по формуле (4.8), которая аналогична формуле (4:3), с той лишь разницей, что суммирование ведется лишь по точкам, попавшим в данную терминальную вершину: где А1- количество признаков по которым строится аппроксимация, N(i) - количество точек попавших в /-ую терминальную вершину. Общая суммарная погрешность вычисляется по формуле (4.7). В памяти ЭВМ при таком виде аппроксимации в каждой из терминальных вершин1 хранится полный набор из К вещественных значений а - коэффициентов аппроксимирующей гиперплоскости. При построении древовидных классификаторов существует множество различных параметров, от правильного подбора которых зависит качество аппроксимации и скорость обработки при наличии дополнительных ограничений на вычислительные ресурсы. Перечислим и проклассифицируем эти параметры. 1) Параметры информационной модели восстановления изображений: - число признаков К (размерность признакового пространства); - конкретный вид признаков Ц% = С"о/ »-» / ЛГ-І,/ ) (см- главу 2); - вид аппроксимирующей функции (оператора R (1.4)) - кусочно-линейная, кусочно-постоянная (см. параграф 4.1); - вид функции потерь I - в рамках данной работы принимается показатель среднеквадратичной ошибки (4.1); - допустимая ошибка аппроксимации на обучающей выборке є in. 2) Параметры, описывающие ограничения вычислительной реализации: - максимальный объем памяти, отводимый под хранение параметров классификатора (максимальное количество терминальных узлов при заданном виде аппроксимирующей функции) Ртах;= Ртах(R,K); - максимальная hmax или средняя И глубина, дерева (максимальное или среднее количество операций сравнения с порогом при классификации); - максимальное время,.отводимое на процедуру обучения tmax - определяется через максимальное количество итераций при разбиении признакового пространства. 3) Параметры, описывающие процесс разбиения признакового пространства: - способ разбиения узлов древовидного классификатора (номер признака, по которому происходит разбиение и значение порога разбиения); - количество разбиваемых узлов на каждом шаге итерации;: - параметры остановки процесса разбиения.

Методы повышения устойчивости вычислительного алгоритма кусочно-линейной аппроксимации

Поэтому, задав начальное приближение р0, можно найти оптимальные значения векторов р и а, используя метод градиентного спуска. Отметим, что на каждом шаге итерации производится минимизация сразу и по вектору параметров р, и по коэффициентам линейной аппроксимации а. Проведя минимизацию выражения (4.16), мы получим первое приближение рі: Рік = Рок+ которое будет использовано в качестве р0 на втором шаге, и так далее пока норма разности р - р0 не станет меньше некоторого, наперед заданного, значения. Тогда коэффициенты при Мк(Рок) в (4.16) стремятся к нулю и определяющими являются значение Рк(Р0к) следовательно, значение параметрар является близким к оптимальному.

Итерационный процесс совместной оптимизации по вектору параметров р и коэффициентам аппроксимации а состоит из следующих шагов. 1) Задаются начальные приближения р . 2) Вычисляется система изображений - признаков цк (р0) и juk (р0) 3) Находятся матрицы М и М, вектора си с и решается СЛУ (4.17) относительно Переменных tf и & . 4) Находятся р = Pok+ kfak и проверяется условие завершения процесса (норма разности коэффициентов, полученных на предыдущем и последующем шагах, не превышает наперед заданное є). 5) Если условие завершения не выполняется, происходит переход к шагу 2) с начальными приближениями Рок=Рк Этот же принцип легко обобщается и на случаи зависимости одного или нескольких от векторных параметров цк.= (рр. При этом система уравнений (4.17) решается относительно параметров а и b # = (р# - ро )ак. В случае зависимости нескольких признаков от одного параметра р (неважно, скалярного или векторного) система уравнений (4; 17) относительно переменных яд и; Ъ . получается переопределенной. В самом деле, пусть для простоты изложения и без ограничения общности- К признаков зависят от одного параметра и (М-К) признаков не зависят от параметров. Мы имеем систему из (М+К) линейных уравнений относительно переменных ад и Ь , всего лишь с (М+1) неизвестными..Таким образом необходимо решать систему из (М+К) линейных уравнений с учетом К-Ї ограничений. Более простым способом является использование метода покоординатного спуска. Зафиксировав некоторое р=ро, найдем оптимальные значения вектора весовых коэффициентов: faf} решив систему (4Л7). После чего, используя полученный набор коэффициентов {а, }"+1 найдем popt, взяв производную от функционала (4.16) по (р-ро) и решив GЛУ относительно р; Процесс продолжается до,тех пор пока разница не будут меньше какого-между найденным рот и PQ, , и норма вектора aSn _ я(п !) либо наперед заданного значения. Замечание 1. В задаче распознавания образов на классы из-за недифференцируемости функции; решения для подобной подстройки прибегают к достаточно сложным методам алгебраического замыкания; [12] (если рассматривать.различные алгоритмы распознавания как признаки). В [5] приводится общий подход для методов линейной и монотонной» коррекции, который для задач; восстановления регрессии? фактически представляет собой метод покоординатного спуска поочередного нахождения параметров І признаков (алгоритмов) и корректирующих коэффициентов. В отличие от него, приведенные в параграфе алгоритмы (при указанных допущениях) позволяют проводить минимизацию сразу и по параметрам: признаков, и по коэффициентам коррекции, что существенно повышает сходимость алгоритма. Замечание 2. Приведенные алгоритмы минимизации являются, по сути, градиентными, как и алгоритмы: обратного распространения ошибки обучения нейронных сетей; (см. параграф 4.2). Однако модификация алгоритма параметрической оптимизации для входных нейронов первого слоя в алгоритме back propagation при использовании нейронной сети вместо линейного классификатора выходит за рамки настоящей диссертации. При восстановлении изображений с помощью P/R-методов одним из параметров обработки является размер окна, используемый для вычисления признаков. Заметим, что процедуры, описанные в п.4.6.1, можно выполнить и в случае, когда параметр р принимает упорядоченное множество дискретных значений (например, размер окна для вычисления признаков на изображении). В этом случае роль «производных по параметру» играют их дискретные аналоги - разности в значениях признаков на соседних значениях параметров. Значения (р-ро) на каждом шаге итерации показывают направление и предполагаемую величину изменения дискретного параметра (размера окна). Другим вариантом является использование так называемых гауссовских окон для признаков, вычисляемых с помощью локальных сверток изображения в окне, суть которых состоит в умножении исходной импульсной характеристики h(ni,n2) на двумерную гауссовскую функцию:

Параметр а в этом случае для каждого из признаков находится с помощью методов, описанных в п. 4.6.1.. Если по причине сокращения объема вычислений нежелательно использовать модифицированные признаки, умноженные на функцию гауссовского окна, то можно после предварительного подбора параметра а далее использовать окно обработки D = [-За,За] х [-Зет, За] для исходных признаков.

В случае, когда ставится задача определения единого размера окна обработки для вычисления всех признаков, необходимо использовать алгоритм параметрической оптимизации для зависимости нескольких признаков от одного параметра.

Разработанные в работе алгоритмы легли в основу общей информационной технологии построения восстанавливающих процедуру основанной на итерационном усложнении решающего правила. Основу информационной технологии составляет процедура последовательного наращивания размерности признакового пространства ("Step-Up" метод) [19]. Согласие ей, сначала выбирается единственный признак, обеспечивающий экстремальное значение показателя качества, затем к нему присоединяется еще один, дающий наилучшее качество линейной аппроксимации в паре с уже выбранным признаком, и т.д. до получения набора из К признаков; Идея "Step-up" метода обобщается для случая построения древовидных классификаторов, если рассматривать в качестве процедур наращивания сложности разделение вершин дерева, присоединение очередного признака; непараметрического семейства и присоединение одного признака параметрического семейства с найденным значением параметра.

Похожие диссертации на Информационная технология восстановления изображений, основанная на принципах распознавания образов