Электронная библиотека диссертаций и авторефератов России
dslib.net
Библиотека диссертаций
Навигация
Каталог диссертаций России
Англоязычные диссертации
Диссертации бесплатно
Предстоящие защиты
Рецензии на автореферат
Отчисления авторам
Мой кабинет
Заказы: забрать, оплатить
Мой личный счет
Мой профиль
Мой авторский профиль
Подписки на рассылки



расширенный поиск

Математические модели нейроноподобных сред для разработки систем обнаружения и распознавания объектов заданных классов Тельных Александр Александрович

Математические модели нейроноподобных сред для разработки систем обнаружения и распознавания объектов заданных классов
<
Математические модели нейроноподобных сред для разработки систем обнаружения и распознавания объектов заданных классов Математические модели нейроноподобных сред для разработки систем обнаружения и распознавания объектов заданных классов Математические модели нейроноподобных сред для разработки систем обнаружения и распознавания объектов заданных классов Математические модели нейроноподобных сред для разработки систем обнаружения и распознавания объектов заданных классов Математические модели нейроноподобных сред для разработки систем обнаружения и распознавания объектов заданных классов Математические модели нейроноподобных сред для разработки систем обнаружения и распознавания объектов заданных классов Математические модели нейроноподобных сред для разработки систем обнаружения и распознавания объектов заданных классов Математические модели нейроноподобных сред для разработки систем обнаружения и распознавания объектов заданных классов Математические модели нейроноподобных сред для разработки систем обнаружения и распознавания объектов заданных классов Математические модели нейроноподобных сред для разработки систем обнаружения и распознавания объектов заданных классов Математические модели нейроноподобных сред для разработки систем обнаружения и распознавания объектов заданных классов Математические модели нейроноподобных сред для разработки систем обнаружения и распознавания объектов заданных классов
>

Диссертация - 480 руб., доставка 10 минут, круглосуточно, без выходных и праздников

Автореферат - бесплатно, доставка 10 минут, круглосуточно, без выходных и праздников

Тельных Александр Александрович. Математические модели нейроноподобных сред для разработки систем обнаружения и распознавания объектов заданных классов : диссертация ... кандидата физико-математических наук : 05.13.18 / Тельных Александр Александрович; [Место защиты: Моск. физ.-техн. ин-т (гос. ун-т)].- Нижний Новгород, 2009.- 131 с.: ил. РГБ ОД, 61 09-1/622

Содержание к диссертации

ВВЕДЕНИЕ 4

ГЛАВА 1. МОДЕЛИ РАСПРЕДЕЛЕННЫХ ДВУМЕРНЫХ НЕЙРОНОПОДОБНЫХ СРЕД ДЛЯ
ОБРАБОТКИ ИНФОРМАЦИОННЫХ СИГНАЛОВ
15

1.1 ИСТОРИЯ ПРОБЛЕМЫ ИССЛЕДОВАНИЯ НЕЙРОФИЗИОЛОГИЧЕСКИХ ПРОЦЕССОВ В ОДНОМ НЕЙРОНЕ И В СЕТИ
ИЗ ВОЗБУЖДАЮЩИХ И ТОРМОЗНЫХ ЭЛЕМЕНТОВ 15

1.2 БИОЛОГОПРАВДОПОДОБНАЯ МОДЕЛЬ 17

Упрощенные варианты общей модели 20

  1. МЕТОДЫ ИССЛЕДОВАНИЯ СТРУКТУР КОЛЛЕКТИВНОЙ АКТИВНОСТИ В РАСПРЕДЕЛЕННЫХ ОДНОРОДНЫХ НЕЙРОНОПОДОБНЫХ СИСТЕМАХ 22

  2. рецептивные поля. Карты рецептивных полей 24

  3. ВИДЫ ИСПОЛЬЗУЕМЫХ рецептивных ПОЛЕЙ. ФУНКЦИИ СВЯЗИ МЕЖДУ ЭЛЕМЕНТАМИ НЕИРОНОПОДОБНОЙ СИСТЕМЫ 25

Фильтры Габора 26

Лапласиан гауссиана. Латеральное торможение 28

Двумерные рецептивные поля Хаара. Вычисления с использованием интегрального изображения 30

1.6 ОБРАБОТКА НЕПОДВИЖНЫХ ИЗОБРАЖЕНИЙ В ОДНОРОДНЫХ, РАСПРЕДЕЛЕННЫХ НЕЙРОНОПОДОБНЫХ
СИСТЕМАХ С ИСПОЛЬЗОВАНИЕМ ФУНКЦИЙ ЛАТЕРАЛЬНОГО ТОРМОЖЕНИЯ, ФУНКЦИЙ ХААРА И ФУНКЦИЙ

ГАБОРА 33

Получение простейших препаратов неподвижного изображения: контраст, контур заданной
толщины, линии заданных направлений, объекты заданных масштабов
34

ГЛАВА 2. ИСПОЛЬЗОВАНИЕ МОДЕЛИ ОДНОРОДНОЙ РАСПРЕДЕЛЕННОЙ ДВУМЕРНОЙ
НЕИРОНОПОДОБНОЙ СРЕДЫ ДЛЯ ПРЕДВАРИТЕЛЬНОГО ЦЕЛЕУКАЗАНИЯ. НА ПРИМЕРЕ
СИСТЕМЫ ПОИСКА ЛИЦ
36

2.1 МЕСТОПОЛОЖЕНИЕ ОБЪЕКТА. АНАЛИЗИРУЕМАЯ ОБЛАСТЬ. ЭФФЕКТИВНОСТЬ АЛГОРИТМА
ПРЕДВАРИТЕЛЬНОГО ЦЕЛЕУКАЗАНИЯ 37

2.2 СИНТЕЗ МАССИВА КАНДИДАТОВ ДЛЯ ДАЛЬНЕЙШЕГО АНАЛИЗА 40

Формирование карты активности рецептивных полей 41

Выделение горизонтальных штрихов 43

Пространственная кластеризация штрихов 44

Математическая модель 48

Вычислительный эксперимент 50

Детектор движения 51

2.3 ИСКЛЮЧЕНИЕ ИЗ ПРЕДВАРИТЕЛЬНО ЗАДАННОГО МАССИВА 52

Регулярные сетки 53

Математическая модель 54

Вычислительный эксперимент 55

ГЛАВА 3. ИСПОЛЬЗОВАНИЕ МОДЕЛИ ОДНОРОДНОЙ РАСПРЕДЕЛЕННОЙ ДВУМЕРНОЙ
НЕЙРОНОПОДОБНОЙ СРЕДЫ ОБНАРУЖЕНИЯ МЕСТОПОЛОЖЕНИЯ ОБЪЕКТОВ НА
СЛОЖНОМ ФОНЕ
57

  1. модель преобразования информации с использованием среды состоящей из неироноподобных элементов 58

  2. Математическая модель системы обнаружения объектов, состоящая из нейроноподобных элементов и пространство ее параметров 62

Целевая функция для системы обнаружения объектов на сложном фоне 65

Целевая функция для «сильного классификатора» Н, 66

Ассоциативная машина. Формирование сильного классификатора Н. Процедура AdaBoost. 68

Формирование функции активации рецептивного поля. Слабая модель обучения 70

Рецептивное полена основе МСТ(ModifiedCensus Transform) и его функция активации 74

  1. ВЫЧИСЛИТЕЛЬНЫЙ ЭКСПЕРИМЕНТ 77

  2. ПАРАЛЛЕЛЬНОЕ СОЕДИНЕНИЕ КАСКАДОВ 81

ГЛАВА 4. КЛАССИФИКАЦИЯ НАЙДЕННОГО ОБЪЕКТА 82

  1. Задача распознавания 83

  2. Переход к двухклассовой схеме распознавания 87

  3. ФОРМИРОВАНИЕ ПРОСТРАНСТВА ПРИЗНАКОВ .' 88

  4. РЕЗУЛЬТАТЫ ВЫЧИСЛИТЕЛЬНОГО ЭКСПЕРИМЕНТА 91

  5. ПРИМЕРЫ ПРАКТИЧЕСКОЙ РЕАЛИЗАЦИИ СИСТЕМ ОБНАРУЖЕНИЯ И КЛАССИФИКАЦИИ НАЙДЕННЫХ ОБЪЕКТОВ 92

Основные характеристики интегральной биометрической системы распознавания человека 93

Система распознавания музыкальных сигналов 94

Демонстрационная система видеонаблюдения с детектированием лиц и распознаванием по ним

людей. 95

Разработка версии электронного фотоархива с индексацией по лицам людей 97

Демонстрационная программа, позволяющая производить поиск специальных изображений по
контексту.
99

ЗАКЛЮЧЕНИЕ 100

ЛИТЕРАТУРА 101

ПРИЛОЖЕНИЕ 1. ИНСТРУМЕНТАРИЙ РАЗРАБОТЧИК А 111

ПРИЛОЖЕНИЕ 2. ТЕХНИЧЕСКИЕ ОСОБЕННОСТИ РЕАЛИЗАЦИИ ПРОГРАММНОГО
КОМПЛЕКСА 125

Введение к работе

Актуальность темы. Задачи обнаружения объектов на цифровых изображениях характерны для целого ряда прикладных систем: обработки цифровой информации в системах видеонаблюдения, поиска полезной информации в цифровых фото - и видеоархивах, в системах ориентации автономных устройств, в системах контроля качества, в системах организации доступа на охраняемые объекты с использованием биометрических данных, в системах обработки медицинских изображений и многих других. Особенно актуальным является анализ видео-потока в реальном масштабе времени для создания интеллектуальных камер, позволяющих записывать только те события, происходящие в их поле зрения, которые «достойны внимания» с точки зрения пользователя системы. В настоящее время получили широкое распространение устройства, реагирующие на наличие «движения» в поле зрения камеры, как правило, работающие с использованием алгоритмов оценки «оптического потока». При этом классификация объекта или группы объектов, попавших в поле зрения камеры, отсутствует. Данная работа демонстрирует возможности расширения способностей подобных устройств. Обладая возможностью обнаруживать заданные объекты (людей, лица людей, транспортные средства и т.д.), идентифицировать их в реальном времени, устройства видео-наблюдения получают совершенно новые качества, которые позволяют оценивать «ситуацию» в наблюдаемом пространстве и реагировать только на такие события, которые интересны пользователям этих систем. В предлагаемой работе рассматриваются также актуальные задачи, связанные с систематизацией, индексацией и быстрым доступом к графическим данным в цифровых видеоархивах. Предложенные системы позволяют проводить поиск и автоматическую рубрикацию данных без участия оператора, опираясь только на заложенные в них алгоритмы и предложенную к рассмотрению видеоинформацию. Точность и надежность результатов, полученных при решении задач обнаружения, уточнения и распознавания объектов на сложном фоне, является критическим параметром всей системы в целом, наряду с быстродействием системы. Таким образом, актуальной является задача оптимизации параметров распознающей системы как по точности, так и по времени отклика. Цель данной работы заключается в разработке математических моделей и нейроноподобных алгоритмов, ориентированных на реализацию обучающейся системы для распознавания и мониторинга объектов с нетривиальной геометрией на сложном фоне в реальном времени. Разработанная модель должна позволять использующей ее системе

эффективно функционировать в типичной программной среде персональных компьютеров. Система должна обладать подсистемой контроля полученного результата.

Для достижения поставленных целей необходимо решить следующие задачи:

1. Разработка теоретических принципов распознающей модели.

2. Разработка архитектуры программного комплекса для настройки создаваемых
распознающих систем, работающих в режиме реального времени.

  1. Реализация комплекса в виде пакета программ.

  2. Разработка модели тестирования эффективности работы создаваемых распознающих систем.

5. Разработка методики статистического обучения нейроноподобных моделей для
обнаружения объектов на сложном фоне с использованием прецедентной базы данных.

Методы исследования. Для решения поставленных в диссертационной работе задач были использованы методы теории распознавания образов, математической статистики, математического моделирования, теории искусственных нейронных сетей, цифровой обработки сигналов и изображений, теории вероятностей. Научная новизна работы.

1. Сформирована модель нейроноподобной системы для обнаружения, сопровождения и
распознавания объектов заданного типа на сложном фоне в режиме реального времени.

  1. Разработаны алгоритмы и архитектура нейроноподобной системы распознавания, позволяющие формировать модельное описание заранее заданных объектов.

  2. Разработан способ параллельного соединения каскадов «сильных классификаторов», обученных на разных прецедентных базах, существенно повышающий производительность системы обнаружения.

  3. Проведено исследование эффективности работы нескольких алгоритмов формирования функции активации сигналов от рецептивных полей.

5. Исследованы алгоритмы классификации найденного объекта с использованием
нейроноподобной системы.

. Практическая ценность работы. Полученные в диссертационной работе результаты исследований и реализация программного комплекса для настройки нейроноподобных систем видеонаблюдения являются основой для построения перспективных систем и устройств обнаружения, сопровождения и классификации объектов на произвольном сложном фоне. Результаты данной работы могут использоваться также в системах

оперативного анализа информации на борту летательных аппаратов и системах зрения автономных мобильных роботов.

Реализация результатов работы.

Разработанные алгоритмы и программы используются в действующих вариантах демонстрационных биометрических систем для распознавания человека: по руке; по лицу; по дактоотпечатку; интегральная биометрическая система (SDK и Демо для IBRS). Разработаны системы для распознавания музыкальных сигналов, а также особенностей вида ЭЭГ. Разработана версия фотоархива с индексацией по лицам, система контекстного поиска для изображений специального характера. Системы ориентированы на применение в системах анализа информации в Интернете, в биометрических системах доступа, в системах обеспечения безопасности предприятий.

Апробация работы. Результаты работы обсуждались на 3-м рабочем семинаре-совещании «Теория приложения искусственных нейронных сетей» (Снежинск, РФЯЦ ВНИИТФ, 1998), на 4-й всероссийской конференции «Биомеханика» (Нижний Новгород, 1998), на 12-й международной конференции по нейрокибернетике (Ростов-на-Дону, 1999), на 2-м съезде биофизиков России (Москва, 1999), 4-й конференции по радиофизике (Нижний Новгород, 2000), на международной конференции ICONIP'02 (Сингапур, 2002), на международной конференции APHYS 2003 (Spain, Badajoz, 2003), на 6-й, 8-й, 9-й и 10-й всероссийской научно-технической конференции «Нейроинформатика» (Москва, МИФИ, 2004, 2006, 2007, 2008), на конференции «Управление и информационные технологии» (Санкт-Петербург, 2005), на 2-й Троицкой конференции «Медицинская физика и инновации в медицине» (Троицк, 2006), на 13-й всероссийской конференции «Математические методы распознавания образов» (Санкт-Петербург, 2007), на 9-й международной конференции Pattern Recognition and Image Analysis: New Information Technologies, PRIA-9-2008 (Нижний Новгород, 2008).

Публикации. Всего по теме диссертации опубликовано 26 работ, включая 7

международных. Из них 1 международный патент, 2 российских патента, 2 статьи в

научных журналах из списка ВАК РФ, 16 статей в научных сборниках и 5 тезисов

докладов на конференциях.

Структура диссертации. Диссертация состоит из введения, четырех глав, заключения и

двух приложений. Она изложена на 125 страницах, Список литературы включает 77

наименований.

Положения, выносимые на защиту

1. Архитектура нейроноподобных моделей распознавания для «слабых классификаторов»
(сенсоры первого уровня).

2. Архитектура нейроноподобных моделей распознавания для «сильных
классификаторов» (сенсоры второго уровня).

3. Способ параллельного соединения каскадов «сильных классификаторов», обученных на
разных прецедентных базах, существенно повышающий производительность системы
обнаружения.

  1. Алгоритмы предварительного целеуказания, уточнения местоположения и классификации найденного объекта с использованием нейроноподобной системы.

  2. Комплекс программ, позволяющий настраивать нейроноподобные системы распознавания для обнаружения и распознавания заданных классов на сложном произвольном фоне.

Личный вклад автора. В совместных работах автор принимал непосредственное участие в выборе направлений исследований, постановке основных задач, разработке и обсуждении результатов. Все представленные в диссертационной работе результаты получены лично автором КРАТКОЕ СОДЕРЖАНИЕ ДИССЕРТАЦИИ

В настоящем введении обоснована актуальность диссертационной работы, сформулированы цель и задачи исследования, охарактеризована научная новизна полученных результатов и их практическая значимость, указаны методы исследования, указаны положения, выносимые на защиту

В первой главе диссертации рассмотрена история исследования нейрофизиологических процессов в одном нейроне и в сети из возбуждающих и тормозных элементов. Представлена биологоправдоподобная модель нейрона. Помимо устройства отдельной клетки относительно рассмотрены глобальные аспекты деятельности мозга, специализация его областей, связи между ними и т.п. Но мало что известно, как осуществляется обработка информации на промежуточном уровне, в участках нейронной сети, содержащих сотни тысяч нервных клеток. Далее рассматривается модель именно такого участка. Которая включает в себя балансные интегро-дифференциальные уравнения распределенной среды для «классической» схемы взаимодействия между нейроноподобными элементами с возбуждающими и тормозными связями. Затем рассматриваются упрощенные варианты базовой модели в приближении, когда влияние тормозных нейронов на себя мало. Введено понятие функции «латерального торможения»

и в результате получена модель плоского двумерного слоя - однослойная (однокомпонентная) распределенная нейроноподобная система. Которая записана как в непрерывном, так и в дискретном виде.

В п. 1.3 рассмотрены методы исследования структур коллективной активности в таких распределенных однородных неироноподобных системах. Указано, что в пространственно-временных структурах, полученных в результате вычислительного эксперимента дискретизация по времени и пространству приводит к несоответствию с точными решениями распределенных систем. При этом, основываясь на результатах предыдущих работ, показано, что в дискретном варианте возможны различные режимы ее работы, в частности режимы взаимодействия фронтов и импульсов возбуждения.

В п. 1.4 введена математическая модель рецептивного поля и указаны приближения, в которых была выполнена работа. В частности, предполагалось, что время срабатывания нейроноподобного элемента (рецептивного поля) равно шагу дискретизации системы. В этом приближении получена дискретная форма уравнение рецептивного поля, которая может быть удобно запрограммирована на современной вычислительной технике. Заявлено, что, проведя вычисление с использованием уравнения рецептивного поля для* всех неироноподобных элементов, входящих в нашу систему, мы получим так называемую «карту рецептивного поля». В терминах теории обработки изображений, карта рецептивного поля соответствует нелинейной фильтрации входного изображения. В нашем случае это карта активности неироноподобных элементов. Которая и будет в дальнейшем использоваться для построения систем распознавания, работающих в реальном времени.

В п. 1.5 описаны различные виды рецептивных полей, которые определяются функциями пространственной связи между активными элементами. Функция пространственной связи показывает, какое воздействие активный элемент оказывает на своих соседей в зоне своего пространственного влияния. Если элемент старается возбудить соседей, это соответствует диффузной связи, а пространственно-временные структуры соответствуют результатам для диффузных сред Функции связи с положительным центром и отрицательными флангами, соответствуют тому, что каждый активный элемент старается поддержать, или активировать своих ближайших соседей, и подавить возбуждение более активных далеких элементов в своей сфере влияния, т.е. реализуется латеральное торможение за счет отрицательных коэффициентов связей между отдельными элементами. Такой принцип избирательности по пространственной частоте реализуется в зрительной коре млекопитающих. Показано, что функция связи может быть

как изотропной, так и анизотропной, что позволяет выполнять операции пространственной локализации, частотной локализации, избирательности пространственной частоты, избирательности направления. Рассмотрены некоторые типы функций пространственной связи, применение которых возможно для моделирования обработки сигналов сенсорной активности в мозгу млекопитающих и для формирования технических устройств построенных на таких «бионических принципах». В частности рассмотрены функции Габора, функции типа «латеральное торможение», лапласиан гауссиана и функции Хаара. Введено понятие «интегрального изображения» и показан способ быстрого вычисления значений откликов рецептивных полей Хаара с использованием интегрального изображения.

В завершении главы приведены примеры численных расчетов с использованием модели «рецептивного поля», которые показывают возможность проведения всевозможных обработок изображения с использованием . одного единственного уравнения. Сущность обработки информации в распределенной нейроноподобной системе заключается в выборе из всего множества возможных автоволновых процессов (возникновение стационарных автоструктур, распространение фронтов, импульсов, возникновение источников волн, отражение импульсов при взаимодействии, развитие возмущений на фронте, прорастание локализованных областей активности в двухкомпонентной среде, режимы самовозбуждения в трехкомпонентной среде) таких, при которых в системе из исходного начального условия в неподвижного изображения формируются стационарные автоструктуры. Формирование различного вида стационарных структур интерпретируется как выделение различных упрощенных препаратов исходного неподвижного изображения (например, контур или линии разных направлений). С помощью модели однородной нейроноподобной среды исключительно за счет смены ее параметров, могут быть реализованы различные требуемые для обработки и принятия решений варианты нелинейной фильтрации изображений.

Во второй главе диссертации рассмотрены вопросы применения моделей однородных распределенных нейроноподобных систем для решения задачи предварительного целеуказания. Целью работы системы предварительной обработки изображения является уменьшение числа рассматриваемых классификатором (системой принятия решения) фрагментов изображения путем формирования относительно небольшого числа зон «внимания».

В п. 2.1 введено понятие местоположения объекта, которое задается двумя точками. Для случая обнаружения лиц эти точки будут соответствовать глазам

найденного объекта на изображении, введено понятие расстояния между местоположениями найденных объектов. Показано, как, зная местоположение найденного объекта формировалась прямоугольная анализируемая область изображения. И наоборот, введено правило как, зная прямоугольную анализируемую область сформировать местоположение найденного объекта. На основании этих понятий, местоположения и анализируемой области, сформулирована задача предварительного целеуказания:

Из всего массива анализируемых областей, которые могут покрывать изображение, оставить для дальнейшего анализа только те, в которых возможно наличие искомого объекта и указать местоположения этих объектов. Также введено понятие эффективности работы системы целеуказания. Ошибки первого и второго родов.

Далее в главе рассмотрены два подхода к решению задачи предварительного целеуказания.

  1. Синтез массива областей кандидатов для дальнейшего анализа. Синтез производится по изображению, сегментированному некоторым алгоритмом.

  2. Исключение из предварительно заданного массива областей для анализа таких, в которых заведомо нет искомого объекта. В этом случае анализ производится на изображении сегментированном некоторым алгоритмом.

Показано, что для решения задачи обнаружения объектов в реальном времени, где основным критерием качества является скорость выполнения операции при фиксированной ошибке, предпочтительным является второй подход. Исключение из заданного массива областей позволяет проводить операцию предварительного целеуказания исходного изображения за фиксированное время.

Для системы синтеза анализируемых областей представлена блок-схема преобразования входного сигнала в массив местоположений, включающая следующие этапы: преобразование изображения в полутоновое, фильтрация с использованием модели распределенной однородной среды, состоящей из нейроноподобных элементов, выделение горизонтальных штриховых линий, пространственная кластеризация штриховых линий, фильтрация найденных кластеров по некоторому правилу, формирование массива анализируемых областей. Так же предложена математическая модель процесса фиксации взгляда в случае системы поиска лиц на изображении на основании описанных выше процедур и описано пространство ее параметров. Предложен алгоритм оптимизации параметров этой модели относительно целевой функции, которая введена в 2.3.4. Далее в главе описывается детектор движения, построенный на основе

предварительной обработки изображения с использованием нейроноподобных элементов. Его математическая модель и пространство ее параметров.

Следующая часть второй главы посвящена алгоритмам исключения кандидатов из предварительного заданного массива возможных местоположений. Описана, регулярная сетка, на которую разбивается изображения и приведены результаты исследований, по оптимальным параметрам разбиения изображения на перекрывающиеся фрагменты. Показано, как с использованием «интегрального изображения» и карты активности рецептивных полей принимается решение об исключении исследуемого фрагмента изображения из массива предложенных кандидатов. Как и в случае синтеза областей для «фиксации взгляда», предложена математическую модель в виде цепочки преобразования исходного изображения. Описано пространство ее параметров и целевая функция для поиска максимума эффективности работы системы предварительного целеуказания в заданном пространстве параметров. Также описана модель детектора движения для рассматриваемого случая.

В заключение этой главы описан вычислительный эксперимент и приведены его результаты. Анализируя результаты сравнения двух алгоритмов предварительного разбиения на тестовой базе данных размеченных изображений объемом 1000 штук, мы получили, что алгоритм «синтеза областей фиксации взгляда» при максимально допустимом уровне ошибки локализации объекта имеет ненулевую ошибку потери объекта. При этом требует значительных вычислительных затрат. С другой стороны разбиение изображения с помощью регулярной сетки не дает ошибки локализации объекта и не требует времени для организации массива фрагментов, но предъявляет жесткие требования к временным параметрам срабатывания блока принятия решения. Компромисс между вычислительными затратами и точностью можно достичь, объединяя алгоритм разбиения входного изображения методом регулярной сетки, и последующего анализа наличия в каждом фрагменте изменений, генерируемых детектором движения.

В третьей главе диссертации рассмотрены вопросы построения функции обнаружения искомого объекта. Данная функция ищется как бинарный классификатор образцов фона и образцов полезного сигнала. Введено понятия области фиксации взгляда и предположение о том, что анализ изображения происходит именно в области фиксации взгляда путем формирования множества карт активности рецептивных полей различного типа. Другими словами, рецептивных полей с различными видами функции связи.

Показано, что плотность распределения рецептивных полей не является равномерной по всему полю и содержит явно выраженную точку, где количество участвующих в процессе преобразования входного изображения рецептивных полей максимально. Эта точка и является аналогом точки «фиксации взгляда» для живой системы, для которой число вовлеченных в анализ рецептивных полей максимально. При этом область, в которой произведено построение плотности распределения числа рецептивных полей и является областью анализа содержимого и принятия решения.

Также в главе предложена математическая модель системы обнаружения объектов, состоящая из нейроноподобных элементов и пространство ее параметров. Для нахождения неизвестных параметров модели мы должны найти локальный минимум для некоторой целевой функции. Предложен способ формирования целевой функции на множестве объектов U, которое в той или иной степени должно отражать реальный мир. Показано, что формирование детектора ведется до тех пор, пока изменение целевой функции детектора не будут меньше некоторого порога. Также Введено понятие целевой функции для «сильного классификатора» и описана процедура формирования сильного классификатора как ассоциативной машины, построенной на большом множестве рецептивных полей с использованием процедуры AdaBoost. В некотором приближении описан процесс обучения детектора и задан критерий его окончания.

П. 3.2.4. посвящен слабым моделям обучения для каждого рецептивного поля и формированию функции активации рецептивного поля на некотором подмножестве исходного множества U. Причем подмножество выбирается таким образом, что, все образцы объектов в нем остаются, а образцы фона формируются из ошибок существующего классификатора. Для формирования функции активации рецептивного поля предложено использование правило принятия решения на основе критерия «максимального правдоподобия» с использованием его оценки по обучающему множеству U.

В дальнейшем рассмотрено несколько методов оценки плотностей вероятности полезных и шумовых сигналов для рецептивных полей Хаара. Рассмотрена гипотеза о нормальном распределении откликов от рецептивных полей, на основании которой, с использованием критерия «максимального правдоподобия» строится слабая модель обучения для рецептивного поля. Предложено использование метода оценки плотности распределения с использованием дискретной гистограммы. Показано, что использование второго метода для слабой модели обучения дает лучшие результаты, чем использование

гипотезы о нормальном распределении откликов от рецептивного поля на обучающем множестве.

Также рассмотрено применение рецептивных полей, основанных на Modified Census Transform для использования в модели детектора. И показано, что применение рецептивньрс полей на основе Modified Census Transform значительно уменьшает число используемых рецептивных полей в окончательном варианте детектора.

В пЗ.З описан вычислительный эксперимент по формированию высококачественной системы обнаружения объектов на произвольном фоне и представлены его результаты.

В заключение главы предложен алгоритм параллельного соединения детекторов. Суть параллельного соединения двух и более каскадов заключается в анализе активности каждого не на конкретном фрагменте изображения, а в некоторой области, которая окружает искомый объект. Как известно, наша система предварительного анализа формирует множество фрагментов, которые попадают в область рассогласования между истинным положением объекта и областями, где тестируется гипотеза о его наличии. Приведены результаты применения параллельного соединения каскадов на тестовой базе данных, которые демонстрируют значительное уменьшения ошибки ложных тревог, при незначительном увеличении ошибки пропуска цели.

В четвертой главе диссертации рассматриваются методы распознавания найденных объектов. Распознавание представляет собой отнесение исследуемого объекта, представленного совокупностью наблюдений, к одному из взаимоисключающих классов. Совокупность предъявленных наблюдений в процессе обучения обычно записывают в виде матрицы и называют «обучающей выборкой». Проводятся аналогии между системой обнаружения и системой классификации найденной цели. Показано, каким образом свести задачу многоклассовой классификации к задаче двуклассовой классификации, что прямо соответствует изложенным в предыдущих разделах задачам. Применение, методов описанных в главе 3. к решению задач классификации найденного объекта позволяет формировать системы, способные к распознаванию цели из множества альтернатив, используя при этом аппарат рецептивных полей, сильных классификаторов и детекторов.

Таким образом, использование техники перехода к двухклассовой задаче и использование концепции рецептивных полей позволяет создавать работоспособные системы распознавания.

В четвертой главе приведено также описание конкретных систем распознавания, в

которых используются разработанные в данной работе схемы и алгоритмы.

Описываются основные характеристики интегральной биометрической системы по

изображениям руки, лица, дактоотпечатка и звукам голоса. Приведены характеристики

разработанных систем распознавания музыкальных сигналов.

Дано описание системы видеонаблюдения с детектированием лиц и распознаванием по

ним людей.

Приведено описание электронного фотоархива с индексацией по лицам людей.

В заключении изложены основные результаты диссертации

В приложении 1 рассматривается состав и особенности реализации программного

комплекса с точки зрения пользователя.

В приложении 2 рассматриваются технические особенности реализации программного

комплекса.

Похожие диссертации на Математические модели нейроноподобных сред для разработки систем обнаружения и распознавания объектов заданных классов