Электронная библиотека диссертаций и авторефератов России
dslib.net
Библиотека диссертаций
Навигация
Каталог диссертаций России
Англоязычные диссертации
Диссертации бесплатно
Предстоящие защиты
Рецензии на автореферат
Отчисления авторам
Мой кабинет
Заказы: забрать, оплатить
Мой личный счет
Мой профиль
Мой авторский профиль
Подписки на рассылки



расширенный поиск

Алгоритмы и программная система классификации полутоновых изображений на основе нейронных сетей Макаренко Алексей Александрович

Алгоритмы и программная система классификации полутоновых изображений на основе нейронных сетей
<
Алгоритмы и программная система классификации полутоновых изображений на основе нейронных сетей Алгоритмы и программная система классификации полутоновых изображений на основе нейронных сетей Алгоритмы и программная система классификации полутоновых изображений на основе нейронных сетей Алгоритмы и программная система классификации полутоновых изображений на основе нейронных сетей Алгоритмы и программная система классификации полутоновых изображений на основе нейронных сетей Алгоритмы и программная система классификации полутоновых изображений на основе нейронных сетей Алгоритмы и программная система классификации полутоновых изображений на основе нейронных сетей Алгоритмы и программная система классификации полутоновых изображений на основе нейронных сетей Алгоритмы и программная система классификации полутоновых изображений на основе нейронных сетей Алгоритмы и программная система классификации полутоновых изображений на основе нейронных сетей Алгоритмы и программная система классификации полутоновых изображений на основе нейронных сетей Алгоритмы и программная система классификации полутоновых изображений на основе нейронных сетей
>

Диссертация - 480 руб., доставка 10 минут, круглосуточно, без выходных и праздников

Автореферат - бесплатно, доставка 10 минут, круглосуточно, без выходных и праздников

Макаренко Алексей Александрович. Алгоритмы и программная система классификации полутоновых изображений на основе нейронных сетей : диссертация... кандидата технических наук : 05.13.18 Томск, 2007 117 с. РГБ ОД, 61:07-5/3224

Содержание к диссертации

Введение

1 Методы выделения сюжетной части изображения в системах распознавания 10

1.1 Методы и средства выделения лица человека на изображении 11

1.2 Методы основанные на построении модели лица 18

1.2.1 Искусственные нейронные сети в системах распознавания 27

Выводы 38

2 Разработка топологии искусственной нейронной сети для задач выделения сюжетной части изображения 39

2.1 Структура сети для выделения сюжета изображения 39

2.1.1 Свёрточные нейронные сети 41

2.1.2 Топология свёрточной нейронной сети 46

2.2 Алгоритм обучения нейронной сети для ускоренной сходимости обучения 52

2.2.1 Алгоритм обратного распространения ошибки 53

2.2.2 Режим обучения 58

2.2.3 Выбор активационной функции 60

2.2.4 Обоснование целевых значений 61

2.2.5 Инициализация синаптических коэффициентов 63

2.2.6 Оценка скоростей обучения 64

2.2.7 Масштабирование входных значений 66

Выводы 68

3 Программная реализация системы выделения сюжетной части изображения 69

3.1 Алгоритм обучения нейронной сети 69

3.1.1 Формирование обучающей выборки 69

3.1.2 Результаты обучения нейронной сети 74

3.2 Программная реализация 77

3.2.1 Принцип локализации лица нейронной сетью 81

3.2.2 Минимизация ресурсных требований к программной реализации 89

3.3 Экспериментальные исследования 93

3.3.1 Оцениваемые характеристики 93

3.3.1 Создание тестового набора 94

3.3.3 Оценка чувствительности системы к повороту образа лица относительно горизонтальной плоскости 96

3.3.4 Оценка чувствительности нейронной сети к изменению масштаба...98

3.3.5 Оценка чувствительности нейронной сети к уровню освещения 99

Выводы 101

Заключение 102

Список использованной литературы

Введение к работе

Актуальность исследований. Многие направления науки, техники и производства в значительной степени ориентируются на развитие систем, в которых информация носит характер поля (изображения). При обработке такой информации возникает ряд сложных научных, технических и технологических проблем. Одной из самых сложных на сегодняшний момент из них является обработка и распознавание изображений. О важности этой проблемы говорит тот факт, что исследования по распознаванию образов, анализу изображений и речи включены в перечень приоритетных направлений развития науки и техники и критических технологий федерального уровня [1].

Распознавание изображений находит широкое применение в различных приложениях - это может быть контроль топологии печатных плат [2], текстуры ткани, робототехника (интеллектуальные системы) [3,4]. В информатике - контроль доступа к информации по идентификации личности (биометрическая идентификация) [5]. Спецприменение - доступ к объектам ограниченного доступа, оперативный поиск в картотеке изображений, дактилоскопия и др. Широко используются эти методы для классификации исторических источников на бумаге, а также в физике, химии, биологии и др. областях науки [6-11].

Особую значимость задачи анализа и обработки изображений имеют в обеспечении обороноспособности страны - повышение надежности предотвращения несанкционированного доступа к образцам военной техники и объектам военного назначения. В настоящее время эта задача решается с помощью организационно-технических мероприятий, реализуемых специальными службами с привлечением значительного количества личного состава и материально-технических ресурсов, не обеспечивая при этом достаточного уровня надежности и оперативности. В последние годы актуальность решения проблемы возрастает в связи с осуществляемым сокращением Вооруженных Сил и переходом их на контрактную систему комплектования, а также вследствие активизации деятельности террористических групп, способных, используя несанкцио-

5 нированныи доступ к комплексам вооружения и военным объектам, нанести

существенный ущерб безопасности страны, привести к гибели людей.

В настоящее время всё более широкое распространение получают биометрические системы идентификации человека. Традиционные системы идентификации требуют знания пароля, наличия ключа, идентификационной карточки, либо иного идентифицирующего предмета, который можно забыть или потерять. В отличие от них биометрические системы основываются на уникальных биологических характеристиках человека, которые трудно подделать и которые однозначно определяют конкретного человека. К таким характеристикам относятся отпечатки пальцев, форма ладони, узор радужной оболочки, изображение сетчатки глаза. Лицо, голос и запах каждого человека так же индивидуальны [12-14].

Задача обнаружения лица (выделения сюжета) на изображении является "первым шагом", предобработкой в процессе решения задачи идентификации личности человека по изображению лица (например узнавания лица, распознавания выражения лица). В настоящее время наиболее перспективными являются подходы с использованием искусственных нейронных сетей. Нейронные сети [15,16,17] применяются для решения задач классификации или кластеризации многомерных данных.

Объектом данного исследования являются системы обработки изображений, основанные на искусственных нейронных сетях.

Предметом исследования являются алгоритмы выделения сюжетной части на групповом изображении, основанные на искусственных нейронных сетях.

Естественно, что конфигурация системы выделения сюжетной части изображения существенно определяется характером решаемых задач, однако, в целом она должна удовлетворять некоторой совокупности требований, важнейшими из которых являются следующие.

  1. Система должна быть ориентирована на эксплуатацию обработку изображений для конкретной предметной области.

  2. Система должна обеспечивать возможность обработки данных в реальном режиме времени.

  3. Система должна обладать инвариантностью к изменениям условий съемки (освещению, цветовой баланс камеры, искажение изображения, привносимые оптикой системы, качество изображения).

Основная цель исследований - разработка методов и средств повышения эффективности выделения информативных частей группового изображения в системах видеонаблюдения и контроля доступа.

Основные задачи диссертации:

  1. Анализ методов построения алгоритмов обработки изображений, основанных на использовании искусственных нейронных сетей.

  2. Разработка эффективной архитектуры нейронной сети для выделения информативной части на групповых изображениях.

  3. Разработка метода обучения используемой нейронной сети.

  4. Реализация и исследование работоспособности и эффективности, программной системы выделения сюжетной части изображения основанной на использовании искусственной нейронной сети.

Методы исследования.

В диссертационной работе при решении поставленных задач использованы методы теории искусственных нейронных сетей, математического моделирования, теории вероятностей и математической статистики.

Основные защищаемые положения:

  1. Топология нейронной сети, обеспечивающая вероятность обнаружения образа лица на уровне 0,95.

  2. Алгоритм обучения нейронной сети, позволяющий обеспечить эффективную работу нейронной сети при изменений углов наблюдения до ±15, уровня освещения в ~ 3 раза и изменения масштаба изображения в ~ 2 раза.

7 3. Программная система, обеспечивающая обработку изображения с вероятностью обнаружения образа лица на уровне 0,95 при времени обработки не более 100 мс.

Достоверность результатов диссертационной работы подтверждается экспериментальными данными, полученными при использовании программно-технических систем созданных при непосредственном участии соискателя, имеющими как научную, так и практическую ценность. Достоверность результатов, выводов и положений диссертационной работы обеспечивается:

тщательной разработкой структуры нейронной сети и алгоритма её обучения;

тщательной разработкой методики и алгоритмов выделения сюжетной части на групповом изображении;

качественным и количественным сопоставлением полученных результатов с имеющимися современными теоретическими и экспериментальными данными.

Научная новизна заключается в следующем.

  1. Предложена топология нейронной сети с добавленной сверточной плоскостью и модифицированной активационной функцией нейронов, обеспечивающая выделение сюжета на произвольном фоне с вероятностью 0,95.

  2. Разработан алгоритм обучения, использующий процедуру самонастройки, обеспечивающий возможность выделения сюжетной части изображения при изменений углов наблюдения до ±15, уровня освещения в ~ 3 раза и изменения масштаба изображения в ~ 2 раза.

  3. Предложен алгоритм локализации сюжетной части изображения, основанный на двухэтапной схеме, повышающий вероятность правильного обнаружения и снижающий вероятность ложного обнаружения лиц.

Практическая значимость:

Разработанная топология сверточной нейронной сети и алгоритм её обучения послужили основой для создания программной системы выделения сюжетной части на групповом изображении с произвольным фоном. Разрабо-

8 тайные в диссертации методические, алгоритмические и информационные

средства предназначаются для использования в системах безопасности, видеонаблюдения и видеоконтроля и имеют практическую значимость независимо от типов ЭВМ и операционных сред.

Работа поддержана грантом РФФИ проект № 06-08-00751.

Апробация работы. Основные научные результаты работы докладывались и обсуждались на следующих конференциях: Международная научная студенческая конференция «Студент и научно-технический прогресс», НГУ (г. Новосибирск, 2005); Всероссийская научно-техническая конференция студентов и молодых ученых «Научная сессия ТУСУР», ТУСУР (г. Томск, 2005, 2006); Всероссийская научная конференция студентов-физиков, АСФ (г. Екатеринбург, 2005, 2006, 2007); Всероссийская научно-практическая конференция «Научное творчество молодежи», Филиал КемГУ (г. Анджеро-Судженск, 2007); Всероссийская конференция «Актуальные проблемы авиации и космонавтики», СИБГАУ (г. Красноярск, 2006); Всероссийская научно-практическая конференция «Проблемы информационной безопасности государства, общества и личности», ТГУ (г. Томск, 2006); Международная научно-практическая конференция «Электронные средства и системы управления», ТУСУР (г. Томск, 2005); Всероссийская научно-практтческая. конференция «Информационные технологии и математическое моделирование» (г. Анжеро-Судженск, 2005).

Результаты исследований докладывались на научных семинарах кафедры автоматизированных систем управления Томского государственного университета систем управления и радиоэлектроники.

Основное содержание диссертации отражено в 14 научных работах (в том числе в 3-х научных статьях (1 в журнале из перечня ВАК), 11 докладах на конференциях различного уровня).

Личный вклад. В диссертации использованы только те результаты, в которых автору принадлежит определяющая роль. Опубликованные работы написаны в соавторстве с сотрудниками научной группы. В совместных работах

диссертант принимал участие в непосредственной разработке алгоритмов, теоретических расчетах и вычислительных экспериментах, в интерпретации результатов. Постановка задачи исследований осуществлялась научным руководителем, к.т.н., с.н.с. Калайдой В.Т.

Внедрение результатов. Результаты работы внедрены в Институте Оптики Атмосферы СО РАН, Томском государственном университете, Томском политехническом университете, Томском государственном университете систем управления и радиоэлектроники.

Структура и объем работы: Диссертация изложена на 110 страницах, содержит 42 рисунка и 7 таблиц, и состоит из введения, трех глав, заключения, и списка используемой литературы из 84 наименований и работ соискателя.

Методы основанные на построении модели лица

Данные методы стараются выявить закономерности и свойства изображения лица неявно, применяя методы математической статистики и машинного обучения. Методы этой категории опираются на инструментарий распознавания образов, рассматривая задачу обнаружения лица, как частный случай задачи распознавания. Изображению (или его фрагменту) ставится в соответствие некоторым образом вычисленный вектор признаков, который используется для классификации изображений на два класса - лицо/не лицо. Самый распространенный способ получения вектора признаков это использование самого изображения: каждый пиксель становится компонентом вектора, превращая черно-белое изображение пхт в вектор пространства Rmm. Недостатком такого представления является чрезвычайно высокая размерность пространства признаков. Достоинство заключается в том, что используя все изображение целиком вместо вычисленных на его основе характеристик, из всей процедуры построения классификатора (включая выделение устойчивых признаков для распознавания) полностью исключается участие человека, что потенциально сни жает вероятность ошибки построения неправильной модели изображения лица вследствие неверных решений и заблуждений разработчика.

Метод главных компонент [36]. Прямое представление черно-белого изображения размера пхт в качестве вектора порождает пространство размерности п х т (яркость каждого пикселя - значение элемента вектора в таком пространстве). То есть изображение сравнительно небольшого разрешения (100x100) порождает пространство размерности 10000. Работать в таком пространстве непросто, поэтому для снижения размерности, применяется метод главных компонент. Метод главных компонент не приводит к существенной потере информативности тренировочного набора объектов (в данном случае -изображений лиц). Он состоит в линейном ортогональном преобразовании входного вектора X размерности N в выходной вектор Y размерности М ( N M). При этом компоненты вектора Y являются некоррелированными и общая дисперсия после преобразования остаётся неизменной. Матрица X состоит из всех примеров изображений обучающего набора. Решив уравнение Л = ФГФ, получается матрица собственных векторов Ф, Z - ковариационная матрица для X, Л - диагональная матрица собственных чисел. Выбрав из Ф подматрицу Фм, соответствующую М наибольшим собственным числам, полу чим, что преобразование у = Ф , где X = х - X - нормализованный вектор с нулевым математическим ожиданием, характеризует большую часть общей дисперсии и отражает наиболее существенные изменения X.

Выбор первых М главных компонент разбивает векторное пространство на главное (собственное) пространство F = {ФІ)І=1, содержащее главные компоненты, и его ортогональное дополнение F = (Ф,) .=д/ ..

Применение метода главных компонент к набору векторов линейного пространства R", позволяет перейти к такому базису пространства, что основная дисперсия набора будет направлена вдоль нескольких первых осей базиса, называемых главными осями (или главными компонентами). Таким образом, основная изменчивость векторов тренировочного набора представляется несколькими главными компонентами, и появляется возможность, отбросив оставшиеся (менее существенные), перейти к пространству существенно меньшей размерности. Натянутое на полученные таким образом главные оси подпространство размерности т«п является оптимальным среди всех пространств размерности т в том смысле, что наилучшим образом (с наименьшей ошибкой) описывает тренировочный набор изображений.

В приложении к задаче обнаружения лиц, метод главных компонент обычно применяется следующим образом. После вычисления главных осей тренировочного набора изображений лиц, вектор признаков тестового изображения проецируется на подпространство, образованное главными осями. Вычисляются две величины: расстояние от проекции тестового вектора до среднего вектора тренировочного набора - Distance in Feature Space (DIFS), и расстояние от тестового вектора до его проекции в подпространство главных компонент -Distance From Feature Space (DFFS). Исходя из этих расстояний, выносится

Алгоритм обучения нейронной сети для ускоренной сходимости обучения

Способность к обучению является фундаментальным свойством мозга. В контексте искусственных нейронных сетей процесс обучения может рассматриваться как настройка архитектуры сети и весов связей для эффективного выполнения специальной задачи. Процесс функционирования нейронной сети зависит от величин синаптических связей, поэтому, задавшись определенной структурой нейронной сети, отвечающей какой-либо задаче, необходимо найти оптимальные значения всех переменных весовых коэффициентов (некоторые синаптические связи могут быть постоянными). Этот этап называется обучением нейронной сети, и от того, насколько качественно он будет выполнен, зависит способность сети решать поставленные перед ней проблемы во время эксплуатации. Обычно нейронная сеть должна настроить веса связей по имеющейся обучающей выборке. Функционирование сети улучшается по мере итеративной настройки весовых коэффициентов. Свойство сети обучаться на примерах делает их более привлекательными по сравнению с системами, которые следу ют определенной системе правил функционирования, сформулированной экспертами.

Для конструирования процесса обучения, прежде всего, необходимо иметь модель внешней среды, в которой функционирует нейронная сеть. Эта модель определяет парадигму обучения. Необходимо понять, как модифицировать весовые параметры сети, то есть какие правила обучения управляют процессом настройки. Алгоритм обучения означает процедуру, в которой используются правила обучения для настройки весов.

В основе всех алгоритмов обучения положен единый принцип - минимизация эмпирической ошибки. Функция ошибки, оценивающая данную конфигурацию сети, задается извне в зависимости от того, какую цель преследует обучение. Но далее сеть начинает постепенно модифицировать свою конфигурацию (состояние всех своих синаптических коэффициентов), таким образом, чтобы минимизировать эту ошибку. В итоге, в процессе обучения сеть все лучше справляется с возложенной на нее задачей.

Базовой идеей всех алгоритмов обучения является учет локального градиента в пространстве конфигураций для выбора траектории быстрейшего спуска по функции ошибки. Функция ошибки, однако, может иметь множество локальных минимумов, представляющих суб-оптимальные решения. Поэтому градиентные методы обычно дополняются элементами стохастической оптимизации, чтобы предотвратить застревание конфигурации сети в таких локальных минимумах.

Для обучения описанной нейронной сети был использован алгоритм обратного распространения ошибки {hackpropagatiori). Этот метод обучения многослойной нейронной сети называется обобщенным дельта-правилом или пра вилом error backpropagation (обратного распространения ошибки). Метод был предложен в 1986 г. Румельхартом, Макклеландом и Вильямсом [63,64]. Это ознаменовало возрождение интереса к нейронным сетям, который стал угасать в начале 70-х годов. Данный алгоритм является первым и основным практически применимым для обучения многослойных нейронных сетей. Выделяются два способа организации этого алгоритма: - пакетное обучение (batch training): на каждой итерации при вычислении функции ошибки сети используется вся доступная обучающая выборка; - пошаговое обучение (incremental training): на каждой итерации для вычисления функции ошибки сети используется один очередной пример из обучающей выборки.

Пакетный способ обучения вполне соответствует классическим алгоритмам локальной оптимизации (в предположении, что целью является минимизация ошибки сети на всей выборке).

Обучение сети начинается с предъявления образа и вычисления соответствующей реакции. Сравнение с желаемой реакцией дает возможность изменять веса связей таким образом, чтобы сеть на следующем шаге могла выдавать более точный результат. Обучающее правило обеспечивает настройку весов связей. Информация о выходах сети является исходной для нейронов предыдущих слоев. Эти нейроны могут настраивать веса своих связей для уменьшения погрешности на следующем шаге.

Когда мы предъявляем ненастроенной сети входной образ, она будет выдавать некоторый случайный выход. Функция ошибки представляет собой разность между текущим выходом сети и идеальным выходом, который необходимо получить. Для успешного обучения сети требуется приблизить выход сети к желаемому, т.е. последовательно уменьшать величину функции ошибки. Это достигается настройкой межнейронных связей. Каждый нейрон в сети имеет свои веса, которые настраиваются, чтобы уменьшить величину функции ошибки.

Инициализация синаптических коэффициентов

В выражении (2.16) параметр rj по сути является мерой точности обучения сети. Чем он больше, тем более грубым будет следующее уменьшение суммарной ошибки сети. Чем он меньше, тем больше времени сеть будет тратить на обучение и тем более возможно ее попадание в окрестность локального минимума ошибки. Поэтому управление величиной шага имеет важное значение для улучшения сходимости обучения нейронной сети.

В настоящее время существует множество различных схем (большинство из них эмпирические) для автоматической настройки скорости обучения [71-75]. Большинство из этих схем уменьшает скорость обучения, когда синаптиче-ский коэффициент «колеблется», и увеличивает его, когда весовой коэффициент следует по относительно устойчивому направлению. Главная проблема с этими методами состоит в том, что они являются не подходящими для онлайн-обучения.

Интуитивно понятно, что выбор индивидуальной скорости обучения для каждого синаптического коэффициента может ускорить сходимость и улучшить качество решения (в зависимости от поверхности функции ошибки, некоторые синаптические коэффициенты могут требовать небольшой скорости обучения, чтобы избежать расхождения, в то время как другие могут требовать большого значения скорости обучения, чтобы ускорить схождение алгоритма).

Поэтому в данной работе каждому синаптическому коэффициенту дана индивидуальная скорость обучения.

Для автоматической подстройки скорости обучения на каждой итерации обучения использовался алгоритм, предложенный в работе [73]. Данный метод основывается на следующих фактах: д2Е - наименьшее собственное значение матрицы Гессе Н ,,= , гораздо dWidWi меньшее чем второе наименьшее собственное значение - после большого количества итераций, вектор параметров w(t) приблизится к минимуму целевой функции по направления минимального собственного вектора матрицы Гессе, как показано на рисунке 2.7.

Как входами, так и выходами нейронной сети могут быть совершенно разнородные величины. Очевидно, что результаты нейросетевого моделирования не должны зависеть от единиц измерения этих величин. А именно, чтобы сеть трактовала их значения единообразно, все входные и выходные величины должны быть приведены к единому масштабу.

Скорость сходимости обучения обычно быстрее, если среднее значение каждой входной переменной по учебному набору близко к нолю. Чтобы видеть это, рассмотрим случай, где все входные значения положительны. Веса к нейрону в первом слое обновлены, значением пропорциональным 5х, где 8 -ошибка для данного нейрона, их- входной вектор (см. уравнение 2.16). Когда все компоненты входного вектора положительны, все коррекции синаптических коэффициентов, которые придут на данный нейрон, будут с тем же самым зна ком. В результате этого эти веса могут только все вместе уменьшиться или все вместе увеличится для данного входного значения. Таким образом, если вектор весовых коэффициентов должен изменить направление, он может сделать это только, делая зигзаги, что является неэффективным и таким образом очень медленным.

Однако, любое изменение среднего значения входных переменных от нуля сместит обновления не в том направлении и таким образом замедлит обучение. Поэтому, необходимо отмасштабировать входные значения так, чтобы среднее число по учебному набору было близко к нолю [70].

Таким образом, в данной работе все входные значения из интервала [0;255] (то есть цвет пиксела от черного до белого) были предварительно от-масштабированы в интервал [-1;+1]. Выводы

1. Предложенная топология свёрточной нейронной сети обеспечивает необходимую надежность и инвариантность к искажениям и зашумлениям входного сигнала, что позволяет создать на ее базе систему выделения сюжетной части изображения.

2. Предложенные модификации процесса обучения, состоящие в использова (2 \ нии функции активации _y = 1.7159tanh — х , стохастического режима обу V3 ) чения и алгоритма подстройки скорости обучения на каждой итерации обеспечивают качественный процесс обучения нейронной сети.

3. Введенные в нейронную сеть модификации в виде добавления в слой С1 до полнительной свёрточной плоскости и использования указанной выше акти вационной функции позволяют ускорить процесс обучения нейронной сети, улучшают ее обобщающие и классифицирующие способности, позволяют использовать данную программную систему для решения практических за дач в системах видеонаблюдения и контроля доступа.

Принцип локализации лица нейронной сетью

Так как алгоритм локализации лица основывается на последовательном сканировании изображения, то именно процесс сканирования является его критическим участком.

При использовании классических нейросетевых архитектур, каждый последующий участок изображения рассчитывается независимо от предыдущих, что негативно сказывается на общем объеме вычислений.

Сверточные нейронные сети имеют преимущество по скорости обработки изображении так как, в них используются общие синаптические коэффициенты. Это дает возможность при сканировании изображения использовать так называемый принцип общих вычислений, как показано на рисунке 3.21.

Для расчета следующего участка свёрточного слоя, можно использовать значения нейронов рассчитанные на предыдущих итерациях, таким образом добиваясь значительно уменьшения объема вычислений.

Это же характерно и для подвыборочных слоев. Таким образом можно не рассчитывать отклик сети на каждый участок изображения, а свернуть всё изображение целиком, что обеспечивает существенное сокращение времени вычислений.

На первом шаге алгоритма локализации шаг равен 4 пикселам. Такой выбор шага дает дополнительное преимущество. В слое С1 смещение между последовательными сканированиям также 4 нейрона. Таким образом при полной свертке изображения, итоговый размер плоскости слоя С1 равен (Г-4)х(Я-4), где И7,Я- ширина и высота исходного изображения соответственно. В слое S2 смещение между последовательными сканированиями равно

двум нейронам, так как данный слой является под выборочным, итоговый размер плоскости слоя равен половине размера плоскости С1.

В слое С2 смещение между последовательными сканированиям равно 2 нейронам. В слое S2 смещение между последовательными сканированиям равно одному нейрону.

В слоях JV7 и N2 технику общих вычислений применить невозможно, так как данные слои содержат простые сигмоидальные нейроны. В результате свертки всего изображения оно уменьшается в четыре раза. Сравнительные данные по объемам вычислений представлены в таблице 3.2. В итоге при использовании принципа общих вычислении, достигается экономия вычислении порядка 40 раз.

На шаге точной локализации шаг сканирования равен 1 пикселу. Таким образом смещение между последовательными сканированиями в слое С1 равно одному нейрону и в слое S1 технику общих вычислений применить нельзя. Но из топологии следует, что каждой плоскости слоя S1 можно сопоставить четыре плоскости с различной стартовой точкой, то есть (0;0), (0;1), (1;0), (1;1), вычисленные с использованием техники общих вычислений. Подобная методика применяется и к последующим слоям.

На рисунке 3.22 показаны результаты процесса свертки целиком входного изображения. Слой С1 свертывает изображения с пятью разными синаптиче-скими масками, таким образом каждая плоскость выделяет свои особенности изображения.

В слое S1 происходит уменьшение масштаба входного изображения, что повышает устойчивость к искажениям и поворотам изображения лица. Полученные слоем S1 особенности объединяются в новые слоем С2. Выходное изображение, то есть матрица откликов нейронной сети, имеет белое пятно, которое соответствует местоположению лица на исходном изображении.

Целью данных исследований является оценка метрологических характеристик разработанной системы идентификации изображений. Оцениваемыми характеристиками являются экспериментальные оценки вероятности определения образа лица Рп и вероятности неправильного определения образа лица Pfr. Экспериментальная оценка вероятности Ргг рассчитывается по формуле: Prr=NjN , (3.1) где Nrr - количество правильных результатов идентификации лиц; N - число лиц на изображениях. Экспериментальная оценка вероятности Pfr рассчитывается по формуле: Pfr=NfrIN (3.2) где N,r - количество неправильных результатов идентификации лиц; N - число лиц на изображениях. Учитывая, что экспериментальная оценка вероятностей производится по конечному числу испытаний, необходимо оценить точность и надежность полученных оценок. Точность характеризуется доверительным интервалом, а надежность - доверительной вероятностью.

Похожие диссертации на Алгоритмы и программная система классификации полутоновых изображений на основе нейронных сетей