Содержание к диссертации
Введение
1 Распознавание человека по изображению лица. состояние вопроса 14
1.1. Постановка задачи 14
1.2. Задача распознавания человека по изображению лица. Использование результатов ее решения 17
1.3. Основные классы решаемых задач 20
1.3.1. Поиск изображения в больших базах данных 21
1.3.2. Задача контроля доступа 22
1.3.3. Задача контроля фотографии в документах 23
1.4. Методы распознавания человека по изображению лица. Сравнительный анализ 25
1.4.1. Метод главных компонент 25
1.4.2. Метод линейного дискриминантного анализа 29
1.4.3. Метод гибких контурных моделей лица 32
1.4.4. Метод сравнения эластичных графов 33
1.4.5. Методы, основанные на геометрических характеристиках лица 37
1.4.6. Метод сравнения эталонов 39
1.4.7. Оптический поток 40
1.4.8. Сравнительный анализ методов распознавания изображений 43
1.5. Коммерческие системы распознавания и приложения 48
1.5.1. Отечественные коммерческие разработки 48
1.5.2. Зарубежные коммерческие разработки 48
1.6. Выводы 53
2 Алгоритм распознавания человека по изображению лица 54
2.1. Необходимость исследования алгоритма распознавания 54
2.2. Технология распознавания человека по изображению лица 55
2.3. Алгоритм эластичного графа 58
2.3.1. Вейвлеты 58
2.3.2. Эластичный граф 60
2.3.3. Понятие джета 61
2.3.4. Представление лица и общее знание о структуре лица 64
2.3.5. Сравнение джетов 66
2.3.6. Функция подобия графов 68
2.3.7. Алгоритм автоматической разметки графа 68
2.3.8. Распознавание 72
2.4. Влияние степени сжатия изображения лица на результат распознавания 75
2.5. Выделение ключевых признаков 81
2.5.1. Необходимость выделения ключевых признаков при распознавании человека 81
2.5.2. Определение пола человека по фронтальному изображению его лица 83
2.5.3. Алгоритмы определения угла поворота лица в
глубину 92
2.6. Выводы 107
3 Методологические принципы построения ИПС распознавания человека по изображению лица 109
3.1. Требования к системе 109
3.2. Хранение данных ПО
3.3. Описание информационного хранилища 113
3.4. Алгоритм сохранения данных 117
3.5. Поиск данных 122
3.5.1. Алгоритм идентификации персоны по двум
изображениям. Алгоритм поиска персоны в базе данных 123
3.5.2. Оптимизация алгоритма поиска персоны в базе данных. Алгоритм поиска персоны в базе данных с использованием пользовательских функций и представления 126
3.5.3. Алгоритм поиска персоны в базе данных с использованием хранимой процедуры 132
3.5.4. Иерархический поиск персоны в базе данных 137
3.6. Сравнительный анализ алгоритмов поиска персоны в базе данных 139
3.7. Выбор функциональной структуры ИПС 145
3.8. Сравнительный анализ функциональных структур ИПС 152
3.9. Выводы 156
4 Разработка, программная реализация и экспериментальная проверка опытного образца ИПС . 157
4.1. Требования, предъявляемые копытному образцу ИПС 157
4.2. Блок-схема организации вычислительного процесса 158
4.3. Средства разработки и тестирования 161
4.4. Библиотека функций для обработки изображений и реализации алгоритма эластичного графа 163
4.5. Структура опытного стенда 166
4.6. Комплексное тестирование опытного образца ИПС 168
4.7. Выводы 172
Заключение 173
Библиографический список
- Задача распознавания человека по изображению лица. Использование результатов ее решения
- Технология распознавания человека по изображению лица
- Влияние степени сжатия изображения лица на результат распознавания
- Описание информационного хранилища
Введение к работе
Актуальность исследования
В последнее время широкое распространение получает технология информационно-поисковых систем распознавания лица с целью идентификации личности. Эта технология идентификации, наряду с технологиями распознавания голоса, наилучшим образом подходит для интеллектуальных сред нового поколения. Подсистемы идентификации личности с использованием технологии распознавания лица могут быть использованы в автоматизированных системах безопасности, например, на государственных пунктах пропуска, в крупных аэропортах, различных общественных местах и пр. с целью идентификации разыскиваемых персон с одновременной передачей соответствующей оперативной информации службам, занимающимся установлением личности.
В настоящее время разрабатывается общегосударственная система сбора и обработки данных о проследовавших через государственную границу РФ лицах. Сентябрьские терракты 2001 года в Соединенных Штатах Америки и последовавшие за этим события заставляют пересмотреть взгляд на проблему автоматической идентификации личности на основе использования фактографической информации, накопленной в специализированных базах данных (далее -
БД).
Поиск и установление личности чаще проводится с использованием конкретных данных о ней (фамилия, имя, отчество, дата рождения, пол, гражданство). Такой вариант поиска имеет большую скорость, но обладает и недостатками. Так, например, если устанавливаемое лицо проходит под разными установочными данными, то только наличие точных установочных данных может помочь найти его в базе данных. Альтернативой приведенному выше варианту поиска может служить метод идентификации личности по её фотографии, фотороботу или штриховому наброску её лица, выполненному художником.
Сложившиеся подходы к идентификации персон по изображениям человеческих лиц практически устоялись. Необходимо совершенствование существующих алгоритмов с целью оптимизации обеспечиваемых ими временных и точностных характеристик поиска за счет использования ключевых признаков, извлекаемых автоматически из изображения персоны (например, пол, наличие бороды, очков, ракурс лица и др.), и, таким образом, повысить скорость и точность поиска.
Дальнейшим развитием систем идентификации личности по изображению человеческого лица может служить создание дополнительной подсистемы выбора из видеоряда, формируемого, например, путем автоматического считывания с видеокамер слежения за окружающей обстановкой, изображений человеческих лиц с последующим использованием этой информации в качестве входной для системы идентификации личности.
Цель и задачи исследования
Основной целью настоящей работы является разработка методов распознавания и построение информационно-поисковых систем специального применения (далее по тексту - ИПС СП), обеспечивающих автоматическую идентификацию личности человека в реальном масштабе времени по изображению его лица.
Достижение поставленной в работе цели диктует необходимость решения ряда следующих основных задач:
разработка «быстрых» алгоритмов распознавания и выделения основных характеристик изображения человеческого лица, обеспечивающих высокую достоверность идентификации объекта поиска;
разработка алгоритма хранения и кодирования вспомогательной информации, характеризующей объект поиска, обеспечивающего приемлемые объемно-временные показатели функционирования ИПС СП;
разработка алгоритма надежной идентификации лиц на основе хранящейся в базе данных ИПС СП информации;
7 - разработка опытного образца ИПС СП, реализующего перечисленные выше алгоритмы с целью проверки на практике правильности сделанных в настоящей работе теоретических выводов, выдачи по результатам опытной эксплуатации ИПС СП рекомендаций по ее дальнейшему совершенствованию.
Методы исследования
Теоретические методы исследования основывались на методах цифровой обработки изображений, распознавания образов, дискретных преобразований и системного анализа. Экспериментальная часть исследования базировалась на анализе результатов обработки цифровых изображений с помощью ЭВМ с последующей их численной и визуальной оценкой. Для программной реализации разработанных алгоритмов и ИПС использовались методы создания программных систем и языки высокого уровня.
Научная новизна полученных результатов
Разработаны методы распознавания, что позволило решить важную прикладную задачу поиска и идентификации человека по изображению его лица в реальном масштабе времени.
Установлена допустимая степень сжатия изображений, подвергающихся обработке в алгоритме эластичного графа, используемом в качестве базового алгоритма распознавания в разработанной ИПС.
Разработан алгоритм определения пола человека, изображенного на фотопортрете. Экспериментально показано, что разработанный алгоритм успешно идентифицирует тип лица человека, изображенного на фотопортрете. Использование указанного алгоритма позволяет сократить время поиска информации в БД.
Разработаны алгоритмы определения угла поворота лица, представленного на изображении, в глубину (ракурс лица), отличающиеся низкими затратами на их численную реализацию и допустимой точностью.
Разработан алгоритм, способы хранения информации, идентифицирующей персону, в реляционной БД с целью уменьшения объема хранимой информации, а также схема информационного хранилища, которая может быть адаптирована для решения задачи распознавания объектов, отличных от человеческих лиц.
Разработаны алгоритмы идентификации и поиска данных о персоне в реляционной БД. Их основными отличиями от существующих алгоритмов являются: работа в условиях неполной априорной информации о персонах (отсутствуют данные о изменениях внешности персоны, её пола и условий съемки), изображенных на сравниваемой паре фотографий; отсутствие признака (атрибута) поиска и необходимость вычисления меры подобия в процессе самого поиска; отсутствие необходимости в предварительном обучении системы; возможность работы в реальном масштабе времени.
Практическая значимость полученных результатов
Разработана и построена ИПС, которая имеет следующие основные отличия: открытость, возможность масштабируемости системы, возможность адаптации к решению задачи распознавания объектов, отличных от человеческих лиц, возможность простого внедрения в качестве подсистемы в системы безопасности и поддержки принятия решений.
Разработанные алгоритмы и методы могут быть эффективно использованы в автоматизированных системах проведения криминалистической фотопортретной экспертизы, а также в автоматических контрольно-пропускных устройствах. Они также могут быть применены в системах обеспечения информационной безопасности (например, при контроле доступа к ЭВМ и отдельным программам, базам данных, криптографическим приложениям, медицинским сведениям, сетевым ресурсам, системам электронной торговли и пр.). Кроме того, предложенные алгоритмы могут быть использованы в целях обнаружения и идентификации различных графических объектов на цифровых изображениях (например, обнаружение определенных объектов на фотоснимках со спутников,
9 идентификация и индексирование видео и фотоматериалов в мультимедийных базах данных).
Результаты диссертационной работы в виде законченной динамически подключаемой библиотеки программ и разработанного программного комплекса ИПС «Персона» внедрены в отдельных разработках ЗАО «Эскорт-Центр» (г. Москва), производящем комплексные системы безопасности, в том числе, программно-аппаратные комплексы для контрольно-пропускных пунктов, эксплуатируемых в системе Федеральной пограничной службы Российской Федерации.
На защиту выносятся следующие положения:
Оценка влияния степени сжатия обрабатываемого изображения на вероятность распознавания;
Алгоритм определения пола человека по фронтальному изображению лица (фотопортрету);
Алгоритм определения угла поворота лица в глубину (ракурс лица), представленного на изображении;
Технология проектирования информационно-поисковой системы распознавания человека по изображению лица;
Технология хранения данных о персоне, включая фотопортрет, в реляционной БД;
Алгоритм хранения и кодирования вспомогательной информации в реляционной БД;
Алгоритмы идентификации и поиска персоны в реляционной БД.
Личный вклад соискателя
Основные результаты и положения, выносимые на защиту, получены автором лично. Научный руководитель принимал участие в обсуждении цели и задач исследования, а также анализе результатов проведенных экспериментов.
10 Апробация работы
Все разработанные автором алгоритмы прошли экспериментальную апробацию на реальных данных, результаты которой подтвердили их работоспособность.
Основные теоретические положения и результаты диссертационной работы докладывались и обсуждались на научной сессии «МИФИ-2003» (г.Москва, 2003 г.), 10-ой Всероссийской межвузовской научно-технической конференции студентов и аспирантов «Микроэлектроника и информатика - 2003» (г.Москва, 2003 г.), IX Международном НТС «Современные технологии в задачах управления, автоматики и обработки информации» (г.Алушта, 2000 г.), XII Международном НТШС «Современные технологии в задачах управления, автоматики и обработки информации» (г.Алушта, 2003г.).
Публикации
По теме диссертационной работы опубликовано 5 печатных работ.
Структура и объем диссертации
Диссертация изложена на 184 страницах, состоит из введения (8 стр.), четырех глав (160 стр.), заключения (2 стр.) и библиографического списка.
ОСНОВНОЕ СОДЕРЖАНИЕ
Во введении обоснована актуальность и практическая значимость темы диссертационной работы, сформулирована цель и определены основные задачи исследования, кратко изложено состояние вопроса в исследуемой предметной области.
В первой главе производится постановка задачи разработки методов распознавания и построения информационно-поисковой системы специального применения, обеспечивающей автоматическую идентификацию личности человека по изображению его лица в реальном масштабе времени.
В первой главе представляет также обзор состояния проблемы «автоматического распознавания человека по изображению лица». В разделе 1.3 эта проблема рассмотрена с позиций решения следующих трех ключевых задач:
обеспечение автоматического контроля удостоверений личности или верификация человека по предъявляемому удостоверению личности;
обеспечение автоматического контроля доступа;
обеспечение идентификации человека по фотографии - поиск в базе данных фотографий людей, похожих на объект поиска.
Определены основные требования к системам указанных типов, выявлены отдельные сложности и препятствия для их реализации, установлено, что задачи автоматического контроля удостоверений личности и поиска фотопортретов в базах данных являются наименее исследованными.
В разделе 1.4 приводится обзор методов и подходов, применяемых с целью идентификации личности по её фотопортретам. Среди таких методов следует отметить метод эластичного графа, метод главных компонент, геометрический подход как наиболее перспективные. Рассмотрена структура и особенности каждого из представленных методов. Проведен сравнительный анализ методов с точки зрения решения основных задач диссертационного исследования, показано, что для их решения наиболее подходящим является метод эластичного графа.
В разделе 1.5. дан обзор существующих отечественных и зарубежных коммерческих систем идентификации личности по её фотопортретам. Установлено, что рассмотренные системы обладают рядом недостатков, таких, например, как высокая цена предлагаемых средств, закрытость, недостаточная прозрачность применяемых методов для разработчика, что затрудняет их применение при разработке систем обеспечения безопасности. Кроме того, часто отсутствует возможность использования рассмотренных систем распознавания в качестве подсистем более сложных систем обеспечения безопасности и поддержки принятия решений.
Вторая глава посвящена исследованию и разработке алгоритма распознавания человека по изображению лица. Необходимость исследования алгоритма распознавания человека по изображению лица приведена в разделе 2.1. Разработан и поэтапно расписан в разделе 2.2 общий алгоритм распознавания человека по изображению лица.
В разделе 2.3. дается подробное описание алгоритма эластичного графа, выбранного в качестве основного алгоритма распознавания для построения информационно-поисковой системы.
Задача распознавания человека по изображению лица. Использование результатов ее решения
В настоящее время всё более широкое распространение получают биометрические системы идентификации человека. Традиционные системы идентификации требуют знания пароля, наличия ключа, идентификационной карточки или иного идентифицирующего предмета, создающего порой пользователям таких систем существенные трудности: идентифицирующий предмет может быть забыт, утерян или скомпрометирован. В отличие от традиционных биометрические системы идентификации основываются на уникальных биологических характеристиках человека, которые трудно подделать и которые однозначно определяют конкретного человека. К таким характеристикам относятся, например, отпечатки пальцев, форма ладони, узор радужной оболочки и изображение сетчатки глаза. Лицо, голос и запах каждого человека так же индивидуальны.
Распознавание человека по изображению лица выделяется среди биометрических систем тем, что, во-первых, не требуется дорогостоящего специального оборудования. Для большинства приложений, использующих метод распознавания человека по изображению его лица, достаточно персонального компьютера средней мощности и обычной видеокамеры.
Во-вторых, не нужен физический контакт идентифицируемого человека с техническими устройствами: нет необходимости к чему-либо прикасаться или специально останавливаться и ждать срабатывания системы. В большинстве случаев достаточно просто пройти мимо или задержаться перед камерой на непродолжительное время.
К недостаткам распознавания человека по изображению лица следует отнести то, что сама по себе такая система не обеспечивает 100%-ой надёжности идентификации. Там, где требуется высокая надёжность, применяют комбинирование нескольких биометрических методов.
На данный момент проблеме распознавания человека по изображению лица посвящено множество работ, однако в целом она ещё далека от разрешения. Основные трудности этого метода идентификации личности состоят в том, чтобы ИПС СП должна распознавать человека по изображению лица независимо от изменения ракурса, условий освещённости при съёмке, а так же при различных изменениях, связанных с возрастом, причёской, гримом и т.д.
Задача распознавания изображений пересекается с задачей распознавания образов [1, 17]. Такие задачи не имеют точного аналитического решения. При этом требуется обеспечить выделение ключевых признаков, характеризующих зрительный образ, определить относительную важность признаков путём выбора их весовых коэффициентов, а также обеспечить учёт взаимосвязей между признаками. Изначально эти задачи выполнялись человеком-экспертом вручную, путём экспериментов, что занимало много времени и не гарантировало качества распознавания.
В новых методах выделение ключевых признаков осуществляется путём автоматического анализа обучающей выборки, но, тем не менее, при этом большая часть информации о признаках задаётся вручную [16]. Для автоматического применения таких анализаторов выборка должна быть достаточно большой и охватывать все возможные ситуации.
Нейросетевые методы предлагают иной подход к решению задачи распознавания образов [35, 46, 47, 73]. Архитектура и функционирование нейронных сетей (НС) имеют биологические прообразы. Веса в нейронной сети не вычисляются путём решения аналитических уравнений, а подстраиваются различными локальными методами (например, разновидностями градиентного спуска) при обучении. Обучаются нейронные сети на наборе обучающих примеров. В процессе обучения НС происходит автоматическое извлечение ключевых признаков, определение их важности и затем построение взаимосвязей между ними. Обученная НС может успешно применять опыт, полученный в процессе обучения, на неизвестные образы за счёт хороших обобщающих способностей. Таким образом, применение нейронных сетей для задачи распознавания человека по изображению лица, является перспективным направлением.
В настоящее время существует ряд коммерческих программных систем распознавания человека по изображению лица, которые обеспечивают распознавание достаточно высокой точности, обладающие, однако, рядом недостатков, среди которых основными являются их закрытость, отсутствующая или недостаточная прозрачность применяемых методов для разработчика. Чаще всего, отсутствует возможность использования систем распознавания в качестве подсистемы в более сложных системах безопасности и поддержки принятия решений.
Технология распознавания человека по изображению лица
Алгоритм распознавания человека по изображению лица является составной и неотъемлемой частью информационно-поисковой системы, разработка которой является целью данного диссертационного исследования. Поэтому необходимо не только изучить сам метод распознавания с целью его дальнейшей программно-аппаратной реализации, но и исследовать вопросы, позволяющие уточнить требования к информационно-поисковой системе, налагаемые выбранным методом распознавания, а также выявить характеристики, позволяющие повысить как качество распознавания отдельного изображения лица человека, так и качество распознавания разрабатываемой системы в целом.
Изучение алгоритма распознавания направлено на решение поставленных задач диссертационного исследования и требует исследования таких вопросов, связанных с алгоритмом распознавания, как:
1) уточнение требований к информационно-поисковой системе, налагаемые выбранным методом распознавания, с точки зрения повышения качества распознавания отдельного изображения и системы в целом, а также с учетом минимизации ресурсов разрабатываемой ИПС, таких как объем памяти, выделяемой для сохранения данных в системе об одной персоне;
2) автоматическое выделение ключевых признаков из изображения лица (например, пол человека, представленного на изображении, угол поворота лица в глубину (ракурс лица) и др.), что позволит не только хранить максимально детализированное описание персоны в системе, но и выполнить более точное распознавание персоны и ее поиск в системе.
Процесс распознавания человека по изображению лица логически делится на следующие основные этапы: 1) первичная обработка и нормализация изображения; 2) выделение из изображения требуемой информации для использования на последующих этапах распознавания, например, координаты лицевых точек, эластичный граф и др.; 3) сравнение выделенной информации с эталоном; 4) вынесение заключения о принадлежности изображения к эталону. Технологический цикл распознавания представлен на рис.2.1. В свою очередь этап первичной обработки и нормализации изображения включает следующие шаги: 1) поиск области лица на изображении; 2) обнаружение центров зрачков на изображении; 3) поворот изображения (если требуется) - центры зрачков должны находиться на горизонтальной прямой; 4) масштабирование (нормализация всех изображений по определенному расстоянию между зрачками); 5) кадрирование (вырезание прямоугольной области лица из изображения, полученного в результате предыдущих этапов обработки; размеры области могут зависеть от расстояния между зрачками); 6) выравнивание яркостных характеристик изображения, т.е. применение различных фильтров, изменяющих контраст, интенсивность и т.д. в зависимости от исходных значений параметров изображения.
На этапе выделения информации из обрабатываемого изображения могут применяться различные методы. Среди известных методов следует выделить использование алгоритма сравнения эластичного графа, метод главных компонент, геометрические методы.
Кроме того, следует отметить необходимость выделения таких характеристик, с помощью которых можно создать характеристическую карту обрабатываемого изображения с последующим сохранением ее в различных информационных хранилищах.
Для сравнения с эталоном и вынесения решения о принадлежности обрабатываемого изображения к эталону применяются методы, основанные на геометрических особенностях лица, нейронные сети.
В последующих разделах описаны результаты проделанной работы по исследованию технологии распознавания изображений лица человека. Будут исследованы такие аспекты, как влияние степени сжатия изображения лица на результат распознавания, а также выполнены исследования возможности автоматического извлечения из изображения лица различных характеристик, в частности, определение угла поворота лица в глубину (определение ракурса) и определение пола человека по изображению его лица.
Исследование построено применительно к алгоритму сравнения эластичного графа. Принцип действия этого алгоритма был коротко описан в первой главе настоящей работы. Теперь рассмотрим особенности этого алгоритма более подробно.
Влияние степени сжатия изображения лица на результат распознавания
Проведенный анализ зависимости качества распознавания от степени сжатия JPEG показывает, что для приемлемого качества распознавания (выше 0,9) могут быть использованы изображения с высокой степенью сжатия по алгоритму JPEG (до 25 %). Изображения с такой степенью сжатия еще могут быть использованы (из достаточной четкости изображения) как в алгоритме распознавания, так и для хранения в различных хранилищах данных, например, в ка 77 честве фотографии персоны (в этом случае важен объем памяти, который занимает запись в базе данных). Так для примера, изображение размером 128x128, сжатое алгоритмом JPEG со степень сжатия 100% занимает объем 13,7 Кб, тогда как тоже самое изображение, сжатое со степенью сжатия 25% занимает объем 1,8 Кб (получаем сокращение объема, как минимум, в 7 раз).
Кроме того, интересно установить, какие из узлов решетки наиболее или наименее чувствительны к изменению степени сжатия JPEG. Для этого необходимо исследовать математическое ожидание и дисперсию значений, которые дают при сравнении соответствующие джеты.
Автором рассмотрены степени сжатия JPEG в диапазоне от 100% до 65%. При этом величины меры подобия для соответствующих джетов лежат в интервале от 0,95 до 1.
Ниже приведена таблица 2.3, характеризующая влияние степени сжатия JPEG на джеты графа, а на графиках рис. 2.13. и 2.14. проиллюстрированы соответственно изменения математического ожидания и среднеквадратического отклонения величины меры подобия для соответствующих джетов.
Как видно из данных графиков, наименьшее СКО зарегистрировано для джетов 5, 6, 7, 10, 11 (надбровные дуги, область глаза), 27,28,29 (область между носом и губами), 32,33,34 (складки губ).
Между тем, наибольшее СКО зарегистрировано для джетов 3 (светлое пространство между глаз), 8, 12 (переносица), 17, 19 (нос), 31, 35 (уголки губ)
Повторный эксперимент, проведенный при размере ячейки 20x15 и начальных координатах (22, 24) (рис. 2.15) показал аналогичные результаты: наибольшее расхождение в значениях мер подобия зарегистрировано в областях с однородным характером - светлое пространство между глаз, лоб.
Однако в областях, где графической информации много (плотность ее высока) и она важна (область глаз, область кончика носа), мера подобия соответствующих джетов остается высокой.
Установленная в работе закономерность позволяет ввести весовой коэффициент W„ в стоимостную функцию меры подобия графов, который характеризует вклад каждого джета в общее определение величины меры подобия. С учетом сказанного функция подобия (см. формулу (2.3)) может быть найдена в соответствии с формулой (2.5), представленной ниже S.(Gu,G ) XW„S ,j )- { - iy , (2.5) где Wn может принимать значения в диапазоне [0, 1].
Результаты сравнительного анализа функций подобия графов без учета весов джетов (2.3) и разработанной функции с учетом весов джетов (2.5) приве дены в таблице 2.4. Для проведения сравнения были использованы несколько вариантов изображений разных персон.
Настройка весов джетов проводилась, в основном, в областях с однородным характером: светлое пространство между глаз, лоб, области фона.
Анализ показал, что использование функции подобия графов с учетом весовых коэффициентов для джетов позволяет повысить вероятность распознавания для отдельных изображений в среднем на 3%, а в некоторых случаях и на 4,5%.
Разработанное дополнение алгоритма эластичного графа позволяет сделать процесс распознавания более гибким, настраиваемым. А, следовательно, повысить вероятность распознавания как одного изображения лица человека, так и системы распознавания в целом. При проектировании системы распознавания человека по изображению лица рекомендуется использовать полученный результат. Настройка весовых коэффициентов должна проводится с учетом размерности обрабатываемых изображений, а также топологии графа.
Описание информационного хранилища
В данном разделе рассмотрим способы и методы хранения информации, полученной в результате проведения процедуры распознавания персоны по входному изображению лица.
В результате процедуры распознавания исходный набор данных можно получить автоматически и полуавтоматически, когда какая-либо часть данных поступает вручную от оператора, либо из внешней системы.
Определим общий (минимальный) набор данных о распознанной персоне, достаточный для сохранения в базе данных и последующего использования при идентификации. Также следует учесть возможность обмена этой информацией с внешними системами.
Общий набор данных можно определить так: - фамилия, имя, отчество персоны; - пол; - наличие дополнительных признаков (наличие бороды, наличие очков, цвет волос, угол поворота в глубину, тип лица и т.д.); - данные о модели; - топология модели; - фотоизображение лица; - информация о документе личности, глобальный идентификатор. «Фамилия, имя, отчество» персоны необходимы для неформального опи сания данных, принадлежащих именно этой персоне. Наличие дополнительных признаков, а также пол персоны требуются, с одной стороны, для расширения поля идентификационных признаков, с другой, для выделения целевой области при поиске информации для идентификации персоны. Данные о модели вклю чают в себе информацию о коэффициентах Габора в узлах графа модели.
С целью хранения информации, содержащейся в графе модели, рассмотрим варианты хранения информации. Вариант 1. Сохранить граф как есть
Предполагается, что топология графа, его узлы, коэффициенты, содержащиеся в узлах (джеты), а также коэффициенты ребер будут сохранены в базе данных, как есть.
В качестве описания такой структуры записи может быть применен любой из известных вариантов записи как структурированной, так и неструктурированной информации. Для примера можно предложить сохранить структуру графа в виде XML-описания, что является на сегодняшний день наиболее современным и удобным способом описания информационных ресурсов, к которым следует отнести и структуру графа.
Такой вариант хранения обладает как преимуществами, так и недостатками. К преимуществам следует отнести его простоту, прозрачность описания, что, безусловно, делает его привлекательным сторонним разработчикам и пользователям информации. Файлы с XML-описаниями могут быть переданы по информационной сети любому заинтересованному потребителю, которым может являться автоматизированные системы идентификации, централизованные и децентрализованные хранилища информации, автоматизированные системы безопасности, системы принятия решений.
К недостаткам такого варианта хранения информации следует отнести его низкую эффективность при выполнении поиска при больших объемах записей. Также сюда следует отнести дополнительные объемы вычислений, которые возникают при обработке файлов с XML-описаниями. Заметим, что при использовании XML-файлов необходимо создавать дополнительные структуры, содержащие индексы. Вариант 2. Хранить в формате реляционной базы данных
С помощью этого варианта предлагается хранить все данные о персоне, требующиеся для хранения, в реляционной СУБД.
С целью описания хранилища такой информации применяются ER-модели, где описаны реляционные таблицы, непосредственно хранящие информацию, а также логические и физические связи между ними.
Данные располагаются в таблицах с соответствующими связями между собой и при необходимости могут быть выгружены из базы данных в любой требуемый формат представления. Для этого может быть применен и язык XML-описания, для последующей передачи информации по каналам связи или обработки иным программным средством.
К преимуществам этого варианта организации хранения данных, в первую очередь, следует отнести все преимущества, предоставляемые современными реляционными СУБД, такие как: - проверка целостности данных; - авторизация доступа; - масштабируемость базы данных; - индексирование данных; - программные средства для выполнения процедур и запросов к базам данных.