Электронная библиотека диссертаций и авторефератов России
dslib.net
Библиотека диссертаций
Навигация
Каталог диссертаций России
Англоязычные диссертации
Диссертации бесплатно
Предстоящие защиты
Рецензии на автореферат
Отчисления авторам
Мой кабинет
Заказы: забрать, оплатить
Мой личный счет
Мой профиль
Мой авторский профиль
Подписки на рассылки



расширенный поиск

Математическое моделирование выделения признаков видеоизображения в реальном масштабе времени Гнеушев Александр Николаевич

Математическое моделирование выделения признаков видеоизображения в реальном масштабе времени
<
Математическое моделирование выделения признаков видеоизображения в реальном масштабе времени Математическое моделирование выделения признаков видеоизображения в реальном масштабе времени Математическое моделирование выделения признаков видеоизображения в реальном масштабе времени Математическое моделирование выделения признаков видеоизображения в реальном масштабе времени Математическое моделирование выделения признаков видеоизображения в реальном масштабе времени Математическое моделирование выделения признаков видеоизображения в реальном масштабе времени Математическое моделирование выделения признаков видеоизображения в реальном масштабе времени Математическое моделирование выделения признаков видеоизображения в реальном масштабе времени Математическое моделирование выделения признаков видеоизображения в реальном масштабе времени
>

Диссертация - 480 руб., доставка 10 минут, круглосуточно, без выходных и праздников

Автореферат - бесплатно, доставка 10 минут, круглосуточно, без выходных и праздников

Гнеушев Александр Николаевич. Математическое моделирование выделения признаков видеоизображения в реальном масштабе времени : диссертация ... кандидата физико-математических наук : 05.13.18.- Москва, 2005.- 107 с.: ил. РГБ ОД, 61 06-1/56

Содержание к диссертации

Введение

Глава 1. Основные подходы к описанию изображения объектов в системах искусственного зрения 10

1.1 Построение признакового пространства на основе моделей изображения 20

1.2 Описание изображения объекта на основе контурных признаков 25

1.3 Описание изображения объекта на основе текстурных признаков 29

Выводы к главе 1 34

Глава 2. Выделение контурных признаков изображения с использованием градиентного подхода 35

2.1 Принципы построения градиентного фильтра для выделения контурных признаков 35

2.2 Модель перепада интенсивности для адаптивной настройки градиентного фильтра 40

2.3 Результаты адаптивной градиентной фильтрации 48

Выводы к главе 2 52

Глава 3. Контурная модель для оценки скорости движущихся объектов 53

3.1 Постановка задачи оценивания скорости объектов 56

3.2 Модель перспективного преобразования систем координат 57

3.3 Выделение контурных признаков объектов 59

3.4 Локализация объектов и начальная оценка параметров. 61

3.5 Контурная модель объекта 64

3.6 Модель слежения и уточнения оценки параметров 67

3.7 Система оценки скорости движения автомобилей 70

Выводы к главе 3 72

Глава 4. Текстурно-геометрическая модель изображения объектов 73

4.1 Представление изображения в базисе функций габора .73

4.2 Построение gwn модели объекта путем обучения 77

4.3 Оценка параметров объекта путем оптимизации gwn модели 79

Выводы к главе 4 82

Глава 5. Иерархическое описание объекта на основе текстурно-геометрической модели 83

5.1 Использование gwn модели для иерархического описания изображения объекта 84

5.2 Система для оценки характеристик лица и слежения 86

Выводы к главе 5 88

Выводы к диссертации 89

Список использованных источников 90

Приложение

Введение к работе

Развитие вычислительной техники и увеличение количества обрабатываемой видеоинформации привело к необходимости создания различных распознающих систем. Одной из важнейших задач в этой области является разработка методов анализа реальных трехмерных сцен по видеоизображению в режиме реального масштаба времени. Такие системы помогают автоматизировать многие процессы, недоступные человеку по различным причинам, таким как большая длительность наблюдения (трудоемкость) или недоступность места наблюдения.

Ключевой проблемой в области распознающих систем является проблема обработки изображения с целью выделения объекта, определения его характеристик. Трудности, возникающие при разработке таких систем, прежде всего, связаны с многофакторностью реальных сцен, отсутствием единого подхода к подобным задачам. Часто также на распознающие системы накладывается ограничение к ресурсоемкости для работы в режиме реального времени. Однако нервная система человека и животных, обладающих зрением, успешно справляется со многими задачами зрительного восприятия, поэтому изучение механизмов зрения является направляющим процессом для построения эффективных моделей понимания изображений. Проблема состоит в том, что в силу огромной сложности природных механизмов, о них имеются лишь косвенные данные. По этой причине применение тех или иных физиологических моделей часто имеет только биологическое обоснование и с точки зрения адекватности решения о них ничего сказать нельзя. В связи с этим на сегодняшний день существуют лишь множество частных решений конкретных задач, которые, тем не менее, очень востребованы и вносят свой вклад в создание моделей распознавания.

Формализация частной задачи анализа изображения сводится к построению модели рассматриваемого класса объектов при заданных условиях наблюдения. Специфика объектов определяет методы обработки изображения для выделения оптимально характеризующих их признаков. Множество объектов можно условно разделить на два класса: имеющие геометрически правильную структуру и естественные деформируемые объекты, имеющие сложную внутреннюю структуру на изображении. Первый класс объектов может быть описан путем задания контуров их областей, второй класс объектов описываются в терминах текстуры. Таким образом, в настоящий момент активно развиваются два основных подхода к построению моделей изображения объектов: на основе контурных и текстурных признаков. Развитие данных подходов является весьма актуальным для создания современных систем компьютерного зрения.

Целью диссертации является разработка методов построения контурных и текстурных моделей изображения динамических объектов путем специальной его обработки с целью выделения признаков для последующей оценки структурных и динамических параметров моделей в реальном масштабе времени. Ставится задача построения контурной модели для изображения первого класса объектов и текстурной модели изображения для объектов второго класса. В контексте этих классов рассматривается задача анализа поведения объектов, в частности оценки линейной скорости их движения, слежения, локализации на изображении. Таким образом, задачи исследования состоят в следующем:

разработка адаптивного метода выделения контурных признаков для объектов первого класса на основе градиентного подхода;

построение контурной динамической модели для детектирования движущихся объектов на изображении и слежения за ними;

разработка адаптивного метода выделения текстурных признаков для объектов второго класса на основе аппроксимации областей объекта на изображении;

построение деформируемой текстурной модели на основе оптимизационного построения функционального базиса для представления в нем изображения объекта;

разработка эффективного оптимизационного численного метода оценки параметров текстурной модели в режиме реального масштаба времени;

экспериментальное исследование предложенных методов и алгоритмов.

В результате проведенных исследований предложена модель перепада интенсивности (кромки) на изображении для определения диапазона параметров градиентного фильтра (градиент функции Гаусса) с целью его настройки на наилучшее выделение контурных признаков объектов. Данная модель позволяет теоретически оценить параметр, определяющий характерную ширину градиентных фильтров, таких как фильтр Canny. На основе выделения контурных признаков, реализована контурная модель динамического объекта для оценки скорости его движения. Предложена модификация текстурной модели на основе оптимизационного построения базиса функций Габора с помощью обучения на заданный класс объектов. Разработан метод, позволяющий эффективно оценивать параметры аффинной деформации текстурной модели путем нелинейной оптимизации с учетом всех образов из обучающей выборки. Используется норма, увеличивающая устойчивость к неравномерной освещенности объекта на изображении. Оптимизация в пространстве и геометрической системе координат базиса увеличивает экономичность вычислений и потенциально допускает оценку не только аффинных, но и нелинейных параметров деформации модели, что позволяет описывать как более широкий класс объектов

с помощью одной модели, так и учитывать нелинейные изменения внутренней структуры объекта. К новым результатам также можно отнести использование данной текстурной модели в системе иерархического описания сложных объектов (таких как лицо человека) для локализации его элементов, слежения за ними в режиме реального времени.

Разработанный градиентный метод на основе модели перепада интенсивности (кромки) может быть применен в задачах выделения контуров различных объектов на начальном этапе предобработки с целью их дальнейшей сегментации. Комплекс программ для оценки скорости движения объектов может быть использован как составная часть системы мониторинга дорог в режиме реального времени, который предназначен для задач сбора статистики по скоростям транспортного потока.

Деформируемая текстурная модель и основанные на ее использовании методы оценки параметров могут быть применены для устойчивого слежения за объектом со сложной структурой, оценки его ориентации и положения на изображении. Разработанные методы и алгоритмы иерархического выделения элементов объекта могут быть применены при работе с базами данных фотографий лиц. Также подход будет полезен в системах идентификации и верификации в задачах ограничения доступа, основанных на распознавании лица пользователя.

Представленные в диссертационной работе методы построения моделей и выделения признаков, их алгоритмическая реализация изложены в 4 научных публикациях [2,3,4,5] и доложены на третьей научно-практической конференции Общества содействия развитию фотограмметрии и дистанционного зондирования "Современные проблемы фотограмметрии и дистанционного зондирования" (Москва, 11-12 апреля 2002 г.), на научной конференции ВЦ РАН "Математические модели сложных систем и междисциплинарные исследования" (Москва, 23-24 октября 2002 г.),

а также на научных семинарах отдела сложных систем Вычислительного Центра РАН и кафедры интеллектуальных систем МФТИ.

Диссертация состоит из введения, пяти глав, заключения, списка использованных источников и приложения. Содержание работы изложено на 107 страницах. Список использованных источников включает 130 наименований.

Во введении обосновывается тема диссертации, ее актуальность, сформулированы цель и задачи исследования, изложены полученные результаты и их практическая значимость.

В первой главе представлен обзор состояния методов распознавания изображений и подходы к построению моделей изображения объектов, на основе выделения их признаков. Описаны различные признаки изображений, применяемые при построении моделей. Рассмотрено основное отличие разработанных в этой работе методов от существующих аналогов.

Во второй главе рассмотрены основные принципы построения градиентного фильтра с использованием функции Гаусса для выделения контурных признаков объектов на изображении. Предлагается модель двустороннего перепада интенсивности (кромки) для адаптивной настройки градиентного фильтра с целью оптимального выделения контурных признаков. Приведены примеры обработки экспериментальных данных.

В третьей главе рассматривается задача построения контурной модели изображения объектов для анализа их движения, в частности для задачи оценивания по последовательности кадров, полученных со стационарной монокулярной видеокамеры, линейной скорости объектов с учетом их перспективной проекции на изображение. Показано, что использование контурных признаков, выделенных адаптивным градиентным методом, для нахождения межкадровых сдвигов объектов дает оценку скорости движения объектов с приемлемой точностью без введения каких-либо сложных

пространственных моделей формы. Построен алгоритм начальной оценки

параметров и локализации объектов на изображении на основе кластеризации динамических контурных признаков. Предлагаемые методы реализованы в комплексе программ, моделирующем процесс оценивания скорости движения автомобилей в режиме реального времени и проведены эксперименты на последовательности реальных изображений транспортного потока.

В четвертой главе рассматривается задача построения текстурно-геометрической модели изображения объекта, со сложной структурой. Развивается подход построения модели с помощью аппроксимации участков изображения линейной комбинацией базисных функций Габора (Gabor Wavelet Network - GWN [54]). Представлено развитие метода оценивания параметров объекта и слежения за ним, заключающееся в оптимизации модели в собственной системе координат. Предлагаемый подход увеличивает эффективность оценивания и устойчивость, как к неравномерной освещенности изображения, так и к разнообразию объектов одного класса.

В пятой главе рассматривается задача выделения элементов объекта со сложной структурой и слежения за ними на основе оптимизации текстурно-геометрических GWN моделей, иерархически представляющие области объекта на изображении. Предлагаемые модели реализованы в комплексе программ, моделирующем процесс локализации лица, его элементов и слежение за ними.

В Заключении формулируются основные результаты работы.

Приложение содержит описание градиентного итерационного метода Trust Region в контексте оптимизации GWN модели.

Описание изображения объекта на основе контурных признаков

Большой класс искусственных объектов (автомобили, строения и т.д.), обладающих простой геометрической структурой на изображении, может быть представлен совокупностью областей, ориентированных соответствующим образом, так что обычно [14] в качестве признаков берут границы этих плоскостей, которые являются контурными признаками и представляются на изображении как максимальные перепады значений интенсивности (рис. 1). Рис. 1. Вид некоторых видов перепадов интенсивности (кромок), характеризующие контрастные границы областей изображения объекта.

В литературе предложено большое число операторов для выделения контурных признаков (границ), причем большинство из используемых операторов границ можно классифицировать [8, 35, 106] на операторы, аппроксимирующие математические дифференциальные операторы (например, оператор Лапласа) и операторы, включающие свертку изображений с рядом шаблонов различной ориентации.

Ранние алгоритмы выделения контурных признаков выделяли точки с большим значением градиента. Аппроксимация производных производилась непосредственно на основе конечных разностей интенсивности точек. На таком подходе построены Robert s cross оператор [109], оператор Собе-ля [17, 103], оператор Превита [107]. Haralick [67] предложил граничный детектор, основанный на второй производной по направлению. Также использовали восемь шаблонов-масок, повернутых в восьми направлениях. Маска, дающая максимальный выход, определяет ориентацию и величину границы. В основанном на сегментах алгоритме Medioni и Nevatia [92] точки границ выделяются с помощью ряда масок, ориентированных с интервалом 30. Выделенные точки сопоставляются с кусочно-линейными сегментами на базе подхода Nevatia и Babu [99].

Искажения различной физической природы на изображениях реальных сцен препятствуют качественному выделению контурных признаков. Они изменяют пространственно-частотные образы объектов, распределяя признаки в достаточно широкой полосе пространственных частот. Искажения могут быть различных видов: импульсные шумы, затенения, блики. Например, на затененных областях изображения перепады локализуются на низких частотах (плавные перепады интенсивности), а более контраст ные области содержат высокочастотные перепады (резкие перепады интенсивности). Заметим, что импульсные шумы локализуются на высоких частотах, а тени на низких. Поэтому наиболее эффективно применять выделяющие операторы в различных частотных диапазонах (пространственных масштабах). Это позволяет, как выделять полезную информацию (признаки), так и отсеивать шумы (например, импульсные), используя оптимальную настройку фильтров. Для нахождения контурных признаков в разных частотных диапазонах обычно используют производные фильтра Гаусса. Функция Гаусса обладает оптимальной локализацией, как в пространственной, так и в частотной областях, позволяет эффективно настраивать дифференциальный оператор на различные частотные диапазоны [28].

Torre и Poggio [121] обратили внимание на то, что перед дифференцированием изображения нужно производить линейную предобработку изображения. Man и Hildreth [91] предложили производить свертку изображения с маской, аппроксимирующей функцию лапласиана от гауссиана, и отмечать пересечения нулевого уровня результата свертки как граничные точки. Однако из-за осевой симметрии лапласиана оператор не зависит от направления, и он плохо выделяет кривые границы и детектирует много ложных перепадов.

Canny [44] рассмотрел задачу построения "оптимального сглаживающего фильтра" для детектирования ступенчатого перепада интенсивности (рис. 1). Его подход основывается на максимизации некоторой функции качества для достижения следующих целей: максимизация отношения сигнал/шум для наилучшего выделения границы, максимизация точности детектирования, минимизация ложных детектирований границ. Canny получил в итоге фильтр с 4 экспонентами, который хорошо аппроксимируется производной функции Гаусса. Он так же ввел подход бинаризации контурного изображения на основе гестерезисных порогов для прослеживания соседних контурных точек. Deriche [50] развил данный подход и предложил численную реализацию с использованием рекурсивной фильтрации. Независимо от них Когп [81] разработал аналогичный метод с использованием градиента гауссиана для выделения контурных признаков и предложил идею анализа всех возможных пространственных масштабов (частотных диапазонов). Для настройки фильтра на заданный частотный диапазон используется параметр а функции Гаусса. Однако Когп [81] предложил только общие практические соображения выбора диапазона т для выделения границ по всем масштабам.

Другие методы построения "оптимальных" детекторов границ на основе моделей различных типов и разнообразных критериев разработаны авторами: Nalwa и Binford [97], Boyer и Sarkar [38], Petrou и Kittler [102], Wilson и Bhalerao [125].

Основной проблемой методов Canny, Korna и других исследователей является определение масштаба (частотного диапазона) для наилучшего выделения границ (контурных признаков). Bergholm [36] предложил выделять границы сначала на грубом (большом) масштабе, а затем на меньшем, определяя наилучший. Lindeberg в ряде работ [85, 86] предложил метод высших производных для автоматического определения масштабного уровня для локализации граничных точек на основе "/-нормализации" квадрата модуля градиента гауссиана и нормализации третьей производной по направлению градиента, умноженной на модуль градиента в третьей степени, используемой для характеристики силы перепада. Функция силы перепада аппроксимируется в каждой точке по всем обработанным градиентным фильтром масштабам для нахождения локального максимума. По сути Lindeberg использует тот же подход, что и Когп [81] - поиск максимального градиента по всем масштабам изображения, но предложил свой критерий для определения наилучшего уровня масштаба локализации границ. Однако, Lindeberg так же не дает рецепта определения диапазона этих уровней и обрабатывает все возможные масштабы для данного изображения: используемый им диапазон а — 0.1 ... 256 для изображения размером 256x256 точек [85]. Такой метод не работает в режиме реального масштаба времени.

В данной работе развивается подход Когпа [81]. Рассматривается задача адаптивного выделения признаков с использованием градиента гаус-сиана. Оценка диапазона параметра сг гауссиана находится путем построения простой модели двустороннего перепада интенсивности. Основные параметры модели определяются характерными размерами целевых объектов на изображении. Задание этих размеров значительно уменьшает вычислительные затраты для выделения контурных признаков.

Модель перепада интенсивности для адаптивной настройки градиентного фильтра

На изображениях реальных сцен с неравномерной освещенностью и контрастностью максимальные перепады интенсивности распределены в достаточно широкой полосе пространственных частот.

При изменении параметра а (характерной ширины гауссиана), изменяется центральная частота градиентного фильтра, что позволяет его настраивать на требуемую частотную область для наилучшего выделения максимумом перепадов интенсивности. При увеличении сг, на выходе фильтра уменьшается градиент резких перепадов и увеличивается градиент плавных.

В [81] предлагается некоторый подход перебора параметра а для настройки фильтра, но он указывает только общие практические соображения выбора диапазона перебора а, не учитывая параметров данного изображения и целевых объектов.

Предложим процедуру определения диапазона т для наилучшего выделения контурных признаков. Будем искать оптимальное значение параметра настройки фильтра ст в зависимости от поведения свертки (2.1.4) на границах выделяемых областей. Введем модель Pm(x0,b,Pl,P2) функции интенсивности Р(х) на участке двустороннего перепада (рис. 5).

Параметр модели 0 характеризует половину ширины перепада интенсивности. Параметр Ъ определяет ширину полосы, на краях которой происходит перепад (линейные размеры областей, контур которых нужно выделить). Параметры Р, ,Р2,Р3 задают значения интенсивности на различных участках перепада. Так как Р2— Рг( Рг в соответствии с моделью (2.2.2) , то точка 0 определяет границу (кромку) перепада. Таким образом, будем исследовать поведение фильтра (2.1.4) в точке х0.

Параметры х0 и Ъ зависят от разрешающей способности камеры и от характера объекта. Для импульсных шумов Ь малая величина, порядка одно го- двух пикселей, поэтому, выбирая параметр Ъ большим, будут подавляться импульсные шумы. Параметры модели Pj, Р2 зависят от контрастности изображения в области перепада.

На реальном изображении представлены перепады в широкой пространственной частотной полосе, на различных масштабах. Поэтому, задавая параметры модели Рт в (2.2.8) для высокочастотных и низкочастотных перепадов, оцениваем границы диапазона возможных значения параметра а.

Параметры модели Рт для высокочастотных перепадов ( отіп-минимально различимая половина ширины перепада, Z min- минимальная детализация объектов) определяют нижнюю границу диапазона crmin. Параметры модели для низкочастотных перепадов (х0тах- максимально возможная половина ширины перепада, Ьтах - максимальная детализация объектов) определяют верхнюю границу диапазона сгтяк.

Для экспериментов использовались реальные изображения с видеокамеры с разрешением 320x240. Задавались следующие минимальные параметры модели Рт: х0= 0.5, Ъ = 3 и максимальные параметры Рт: х0= 1.5, Ъ = 10. Диапазон параметра сг, подсчитанный по формуле (2.2.8), полностью совпал с практическими рекомендациями Корна [81] для реальных изображений.

Для сравнения приведены результаты часто используемых (узкополосных) методов выделения контуров на основе оператора Собеля и простых дифференциальных операторов [і 0 -1] и [1 0 -1] (рис.10). На рисунке рис. 11 показаны фрагменты контурных изображений при фиксированной настройке градиента гауссиана а. Данные максимальные градиенты фильтровались по среднему порогу. На рисунке Рис. 11ж и 1 Із показаны контурные изображения полученные при широкополосной адаптивной фильтрации с подавлением шумов при каждой настройке фильтра с последующей бинаризацией и изображения, полученные применением оператора Собеля с бинаризацией по среднему.

Результаты показывают, что метод адаптивного выделения контурных признаков дает хороший результат на изображениях с пространственно непостоянной контрастностью и освещенностью и, в отличие от [81] и [44], теоретически указывает диапазон настройки фильтра, что уменьшает количество переборов масштабных уровней.

Модель перспективного преобразования систем координат

Для процесса оценивания динамических параметров объектов в системе координат (с.к.), связанной с дорогой (0R,xR,yR,zR) (рис. 13), построим перспективное преобразование из этой с.к. в с.к. изображения \хр УР) (рис. 13в). Для этого введем систему координат камеры (xk,yk,zk), совместимую с системой координат дороги (рис. 136). Перспективное преобразование определяется следующими параметрами: d - фокусное расстояние камеры, h - высота камеры над дорогой, а -угол между вертикалью и оптической осью камеры; ах - угол обзора камеры по оси xR с.к. камеры; aY - угол обзора камеры по оси yR с.к. камеры, W - ширина изображения, Н - высота изображения.

Если параметры, задающие преобразование, не известны, тогда их можно найти через несложную процедуру калибровки. В системе координат дороги на изображение накладывается измерительная сетка. После этого выбираются объекты известных размеров или известного расположения (маркеры) в с.к. дороги. Далее находятся параметры камеры так, чтобы маркеры совпали с соответствующими измерениями по сетке.

Для описания объектов используются выделенные с помощью адаптивного градиентного метода на основе градиента гауссиана, описанного во второй главе, контурные признаки. Контурное изображение Ас (х,у), полученное из выражения (2.2.9), будем представлять в виде матрицы А у(ґя) , где /„- дискретное время, n = l..N - номер кадра, N - общее количество кадров, i-\.W и у = 1..Я - дискретные координаты точки на изображении, WxH- размер изображения. Таким образом, матрица АДґ„) получается из матрицы исходного видеоизображения F, у (tn) с помощью процедуры адаптивного выделения контурных признаков.

Следуя описанному во второй главе алгоритму, дополнительно осуществляется процедура фильтрации шумов в каждом частотном диапазоне (в каждом масштабе): после операции поиска локальных максимумов при каждой а отбрасываются те контурные точки, градиент которых меньше некоторого порога, зависящего от среднего значения максимального градиента.

Так как в область локализации объекта на изображении попадают статичные элементы фона, например разметка дороги, производится их фильтрация. Используемый в данной работе алгоритм основан на усреднении контурного изображения на временной последовательности нескольких первых кадров (оценка фона).

Для первоначальной локализации объектов задается область (полоса) первичного оценивания. Ширина полосы зависит от типичных размеров объекта. Если он не полностью попадает в полосу первичной оценки, то процесс локализации будет уточнять область объекта до его выхода из данной полосы. Для определения области объекта, необходимо выделить области на изображении, принадлежащие каждому из объектов.

Разобьем контурное изображение AtJ в полосе оценивания на фрагменты, размеры которых равны половине типичной ширины объекта в с.к. изображения. Фрагменты, принадлежащие одному объекту, ведут себя сходно в процессе движения, в отличие от участков контуров, соответствующих разным объектам. Таким образом, эти фрагменты образуют кластеры в областях объектов в процессе их движения.

Для выявления кластеров используется эвристический алгоритм кластеризации, основанный на принципе максиминного расстояния [21]. На первом шаге алгоритма первый выделенный в полосе оценивания фрагмент назначается центром первого кластера. Затем отыскивается фрагмент, отстоящий от первого на наибольшее расстояние. Если это расстояние превышает размер фрагмента, то он назначается центром второго кластера.

На третьем шаге алгоритма кластеризации производится вычисление расстояний (3.4.1) между всеми остальными выделенными фрагментами и центрами выбранных кластеров. В каждой группе этих расстояний выделяется минимальное. После этого выявляется максимальное из этих минимальных расстояний. Если последнее больше размера фрагмента, соответствующий фрагмент назначается центром нового кластера и повторяется операция с третьего шага. В противном случае работа алгоритма прекращается.

Далее, формируются кластеры, вокруг выделенных центров, из ближайших к ним фрагментов. На следующем шаге уточняются центры выделенных кластеров, центры масс и их средний межкадровый сдвиг.

Если расстояние между центрами кластеров меньше размера фрагмента, то они объединяются в новый кластер. Затем устанавливается соответствие между кластерами на данном кадре и выделенными на предыдущих путем поиска максимальной площади перекрытия. По соответственным кластерам определяется область объекта (рис. 16) и его скорость (в с.к. дороги). К моменту пересечения границы полосы оценивания задней частью объекта, оцененные параметры определяются как исходные для процесса слежения.

Построение gwn модели объекта путем обучения

Модель изображения объекта в соответствии с (4.1.5) задается набором базисных функций Габора (GWN-базисом), векторами весов разложения образов объекта по базису и геометрическим вектором, характеризующим пространственную структуру объекта. Цель обучающей процедуры — получить параметры модели, наиболее соответствующие изображениям обучающей выборки.

Обучающая выборка изображений объектов приводится к одному масштабу в соответствии с заданным положением трех опорных точек в системе координат GWN-базиса и размеченных вручную соответствующих характерных точек объекта на изображении из выборки. Характерные точки объекта, характеризующие его пространственную структуру, также преобразовываются в систему координат GWN-базиса, в котором определяют вектор Р = гДе М- количество характерных точек.

Локализация объекта с помощью GWN модели (4.1.5) может быть получена путем оптимизации трансформируемого GWN-базиса на изображении относительно параметров Та [54, 53]. По найденному аффинному преобразованию могут быть найденны характерные точки объекта в системе координат изображения: PmJg =Т obj (POJ J. Однако эффективнее про-изводить оптимизацию GWN-базиса в собственной системе координат меньшего масштаба, трансформируя изображение, так как это позволяет избежать восстановления трансформированного GWN-образа в системе координат изображения и дает возможность использовать заранее вычисленный GWN-базис модели. Удобно так же производить оптимизацию модели в пространстве функций GWN-базиса [54]. Пусть f{x,y) - изображение, содержащее целевой объект, v - вектор весов разложения трансформированного изображения в GWN-базисе, w- опорный весовой вектор-образ объекта в пространстве GWN.

Таким образом, минимизация (4.3.2) по норме (4.3.3) эквивалентна максимизации нормированного коэффициента корреляции весовых векторов изображения и образа в модели. Использование нормы (4.3.3) дает устойчивость локализации объекта относительно мультипликативного изменения контрастности изображения. Минимизация (4.3.2) производится методом Trust Region (см. Приложение), модифицированным для поиска условного экстремума. Преобразование изображения /{х, у) в систему координат модели производится с билинейной интерполяцией. Для инициализации итеративного процесса (4.3.2) задается начальное приближение вектора Та на основе формирования начального аффинного преобразования опорных точек на изображении в соответствующие точки в системе координат GWN модели объекта. На практике получена следующая минимальная точность задания начальных параметров Та для сходимости (4.3.2): начальный сдвиг от истинного положения объекта: 25-27% размера целевого объекта; начальный размер по отношению к истинному: 3-х кратное различие в масштабе в большую или меньшую сторону; начальный поворот от истинной ориентации объекта: ±40 градусов.

Возможность оптимизации (4.3.2) итеративным градиентным методом доверительных областей в с.к. модели достигается за счет того, что в якобианах функций у/п. по параметрам Та, вследствие обратимости преобразования ТТа, производится замена с.к. изображения на с.к. модели меньшего масштаба. Заметим, что вместо аффинного преобразования ТТа в (4.3.2) возможно использование нелинейного преобразования изображения.

Похожие диссертации на Математическое моделирование выделения признаков видеоизображения в реальном масштабе времени