Содержание к диссертации
Введение
Глава 1. Методы и системы биометрической идентификации личности по изображению лица 14
1.1. Биометрическая идентификация по изображению лица 14
1.2. Методы идентификации личности по изображению лица 16
1.3. Детекция лица 25
1.4. Методы распознавания лиц 38
1.5. Классификация признаков 42
1.6. Оценка эффективности методов идентификации 43
1.7 Постановка задач исследования 51
Глава 2. Сегментация цвета кожи человека на изображениях 53
2.1. Детекция цвета кожи человека на изображениях 54
2.2. Методика оценки цветового пространства 56
2.3. Сравнительная оценка цветовых пространств 59
Выводы 76
Глава 3. Контуры объектов их выделение и отслеживание 78
3.1. Отслеживание контуров на полутоновых изображениях 79
3.2. Ошибки дискретизации линейных методов выделения границ 83
3.3. Ошибки дискретизации острых изломов границ при отслеживании... 92
3.4. Помехоустойчивость методов выделения границ 96
Выводы 100
Глава 4. Детекция и локализация элементов лица человека на изображении 102
4.1. Отбор контрольных точек лица человека 103
4.2. Выделение признаков по изображению лица человека 105
4.3. Детекция и локализация глаз 108
4.4. Детекция и локализация рта 115
4.5. Детекция и локализация носа 116
Выводы 118
Глава 5. Методы усиления классификаторов 119
5.1. Настройка весов AdaBoost 121
5.2. Построение С4.5 классификаторов 126
Выводы 132
Глава 6. Аппаратно-программный комплекс биометрической идентификации личности по изображению лица 134
6.1. Требования к исходным данным 134
6.2. Требования к аппаратно-программной платформе 136
6.3. Описание аппаратно-программного комплекса 138
6.4. Условия проведения экспериментов 146
6.5. Исследование аппаратно-программного комплекса 147
Выводы 148
Заключение 150
Список литературы
- Детекция лица
- Методика оценки цветового пространства
- Ошибки дискретизации острых изломов границ при отслеживании...
- Детекция и локализация рта
Введение к работе
Актуальность работы. В настоящее время биометрические технологии находят все большее применение во многих прикладных областях и рассматриваются как самый перспективный метод распознавания людей.
Идентификация личности по изображению лица человека, в отличие от других биометрических характеристик человека (отпечаток пальца, форма руки, рисунок радужной оболочки глаза, голос), не требует физического контакта, что значительно расширяет возможности применения. Методы анализа геометрии и структурных особенностей лица перспективны для широкого круга задач. К ним относятся: идентификация личности, оценка эмоционального состояния и мимики, автоматическое распознавание речи по движению губ, отслеживание направления взгляда, создание новых человеко-машинных интерфейсов. Для стандартизации форматов записи биометрических данных, условий получения изображений лиц и параметров цифрового изображения лица разработан ГОСТ Р ИСО/МЭК 19794-5-2006 «Автоматическая идентификация. Идентификация биометрическая. Форматы обмена биометрическими данными. Данные изображения лица».
Идентификация человека по изображению лица является сложной задачей из-за изменчивости лица, как объекта анализа (подвижность, широкий диапазон изменения антропометрических параметров), а также большой вариативности условий и средств получения изображений (параметров освещения, окклюзии лиц другими объектами, изменений ракурса и масштаба лица на изображении, качества видео- и фотосъемки).
Исследования по автоматическому распознаванию лиц проводятся с 60-х годов прошлого века. Количество публикаций по технологиям распознавания лиц ежегодно превышает сотни и продолжает возрастать, однако проблема далеко не решена. Дополнительная информация, содержащаяся в цвете и контурах, во многих работах по идентификации лиц не используется или используется неэффективно.
Считается, что зрительная система разбивает изображение на фрагменты по границам объектов и затем выполняет анализ текстуры внутри фрагментов. Анализ текстуры в системах на основе яркостных изображений целесообразно проводить с привлечением цветовой информации, а для выделения фрагментов использовать методы контурного разложения. Многие теоретические аспекты этих методов недостаточно исследованы. Не оценены особенности представления цвета кожи человека в различных цветовых пространствах. Отсутствует сравнительный анализ операторов выделения границ по помехоустойчивости и ошибкам дискретизации, возникающим при работе по оцифрованным изображениям. Существующие методы отслеживания контуров не применимы к полутоновым изображениям. Невозможность получения слитных контуров объектов простой пороговой обработкой градиентной информации приводит к необходимости использования процедур второго уровня - методов сшивки и уточнения разрозненных выделенных фрагментов
границ. Разработка помехоустойчивого следящего метода разложения по контурам изображений позволит выделить информативные фрагменты со сжатием обрабатываемой информации в десятки раз.
Требуется создание принципиально новых гибридных методов, комбинирующих признаковый и холистический подходы, и учитывающих в своей работе особенности зрительной системы человека. Реализация структуры системы по каскадной и параллельной схемам (экстракция нескольких категорий признаков для одного изображения) позволит существенно сократить вычислительную сложность и повысить эффективность классификации. Холистическая обработка локальных признаков и их ранжирование по степени важности, с учетом цветовой и контурной информации на изображении, позволит компактно представить информационно значимые части лица человека.
Целью диссертационной работы является разработка методов и аппаратно-программных средств анализа цветовой и контурной информации на изображении лица человека для повышения эффективности биометрической идентификации. Для достижения поставленной цели определены следующие задачи:
-
Исследовать возможности сегментации кожи человека на цветных изображениях в различных цветовых пространствах.
-
Разработать метод следящего выделения контуров на полутоновых изображениях.
-
Разработать методы поиска и выделения основных контрольных точек на изображении лица человека по цветовой и контурной информации.
-
Исследовать и повысить эффективность известных методов классификации AdaBoost и С4.5 для решения задач идентификации.
-
Создать аппаратно-программный комплекс для исследования методов идентификации личности по изображению лица на основе цветовой и контурной информации.
Объектом исследования диссертационной работы являются методы и устройства обработки и распознавания изображений.
Предметом исследования являются методы обработки изображений лица человека для идентификации личности.
Методы исследования. Исследования базируются на методах цифровой обработки изображений, теории распознавания образов и методах искусственного интеллекта, аппарате теории множеств и численных методах линейной алгебры. Экспериментальные исследования выполнены с использованием наборов реальных и синтетических изображений. Программное обеспечение разработано с использованием пакета прикладных программ MATLAB.
Научные положения, выносимые на защиту:
-
Цветовое пространство YCbCr при квантовании до 32К градаций цвета позволяет сегментировать элементы кожи человека на изображении с вероятностью более 95 %.
-
Метод следящего контурного разложения по полутоновым изображениям имеет линейную асимптотическую сложность и позволяет получать слитные контура без обработки всего изображениями выполнения-
^cшвлнитeльдьrx_^ШJэф^л^гJIчecjcи2CJЗпepaцшL_---
-
Разработанная методика двойной дискретизации позволила сравнить операторы выделения границ при работе по оцифрованным изображениям и определить оптимальные по точности Sobel и Isotropic.
-
Обработка цветовой и контурной информации изображения лица позволяет точно (до 3 пикселей) выделять контрольные точки глаз, носа и рта человека с вероятностью более 96 %.
-
Применение параллельной структуры системы идентификации личности по изображению лица позволяет достичь точной идентификации по фронтальным изображениям с вероятностью более 98 %, при сохранении размера признакового пространства не более 300 признаков.
Научная новизна полученных результатов заключается в следующем:
-
Предложены критерии и проведено исследование эффективности сегментации кожи человека в различных цветовых пространствах.
-
Разработана методика оценки точности и помехоустойчивости линейных методов выделения границ на изображениях.
-
Разработан метод следящего выделения контуров на полутоновых изображениях, не требующий обработки всего изображения и выполнения дополнительных морфологических операций.
-
Разработаны методы поиска и выделения основных контрольных точек на изображении лица человека по цветовой и контурной информации.
-
Разработаны методы классификации на основе алгоритмов AdaBoost и С4.5, сокращающие время обучения классификатора.
-
Разработана модель параллельной структуры системы идентификации личности по изображению лица и аппаратно-программный комплекс, реализующий модель.
Практическую ценность работы представляют:
-
Метод сегментации кожи человека на цветном изображении.
-
Метод следящего выделения контуров на полутоновых изображениях.
-
Набор методов выделения основных контрольных точек на изображении лица человека по цветовой и контурной информации.
-
Методика ускоренного построения классификатора AdaBoost и С4.5.
-
Аппаратно-программный комплекс идентификации личности по изображению лица.
Внедрение результатов работы. Метод следящего выделения контуров на полутоновых изображениях использован при создании программно-
математического обеспечения для задач оптического зондирования природных сред специалистами отделения НО-6 ООО ФГУП "НІЖ ТОЙ им. СИ. Вавилова" (г. Санкт-Петербург).
Предложенные методы и программное обеспечение использованы при разработке опытного образца биометрической системы контроля доступа, планируемой к внедрению в составе комплексных систем безопасности совместно с ООО "АЛПРО" (г. Санкт-Петербург).
Результаты диссертационной работы внедрены в учебный процесс СПбГЭТУ "ЛЭТИ" в форме материалов для лекций и лабораторных работ по дисциплинам: "Цифровая обработка аудио- и видеосигналов", "Цифровая обработка оптических полей", "Цифровая обработка изображений".
Апробация работы. Основные теоретические и практические результаты диссертации были доложены и получили одобрение на следующих конференциях и семинарах: 8-м открытом российско-немецком семинаре "Распознавание образов и понимание изображений" (РОПИ-8-2011, г. Нижний Новгород, 2011 г.); 8-й и 9-й международных конференциях "Телевидение: передача и обработка изображений" (г. Санкт-Петербург, 2011 - 2012 гг.); 10-й международной конференции "Распознавание образов и анализ изображений: новые информационные технологии" (РОАИ-10-2010, г. Санкт-Петербург, 2010 г.); XV - XVI международных конференциях "Современное образование: содержание, технологии, качество" (г. Санкт-Петербург, 2009 -2010 гг.); 65й, 64-й и 61-й научно-технических конференциях профессорско-преподавательского состава СПбГЭТУ "ЛЭТИ" (2008, 2011, 2012 гг.), научных семинарах кафедры математического обеспечения и применения ЭВМ и кафедры телевидения и видеотехники СПбГЭТУ "ЛЭТИ".
Публикации. По теме диссертации опубликовано 16 научных работ, из них - 5 статей (опубликованные в ведущих рецензируемых журналах и изданиях, определенных ВАК Минобрнауки РФ), 11 работ - в материалах российских и международных научно-технических конференций.
Структура и объем диссертации. Диссертация состоит из введения, шести глав, заключения, списка литературы, включающего 186 наименований, и приложений. Основная часть работы изложена на 170 страницах машинописного текста. Работа содержит 72 рисунка и 16 таблиц.
Детекция лица
В настоящее время идентификация личности приобретает все большую актуальность. Биометрические технологии рассматриваются как самый перспективный подход распознавания людей, который способен заменить аутентификацию и допуск на основе паролей, ПИН кодов, смарт-карт, пластиковых карт, токенов, ключей и т.д. Биометрический подход основан на индивидуальных физических характеристиках (лицо, отпечатки пальцев, геометрия пальцев, геометрия руки, рисунок вен, форма ладони, радужная оболочка глаза, сетчатка, форма ушей, голос и т.д.) и поведенческих особенностях (походка, подпись, динамика нажатия клавиш и т.д.) человека. Биометрические технологии позволяют создать принципиально новые удобные человеко-машинные интерфейсы, сохранив высокий уровень безопасности, так как индивидуальные биологические особенности невозможно подменить или подделать. В качестве биометрической характеристики человека (БХЧ), могут быть использованы любые индивидуальные особенности или их комбинация.
Распознавание изображения лица имеет ряд преимуществ по сравнению с другими биометрическими характеристиками. Большинство биометрических технологий требуют активного участия пользователя для получения биометрических данных (отпечатков пальцев, формы руки, радужной оболочки глаза). Получение данных для распознавания изображений лиц возможно без непосредственного участия пользователя. Данные могут быть получены удаленно, что является преимуществом для применения в сфере безопасности и скрытого контроля, а также не создает задержек в случаях большого потока пользователей. При получении других биометрических характеристик могут возникать трудности, связанные с их спецификой и влияющие на результат распознавания. Технологии, основанные на особен 15 ностях руки или пальцев, подвержены ошибкам при повреждении ткани эпидермиса. Технологии, основанные на сетчатке и радужной оболочке глаза, требуют применения дорогостоящего оборудования и зависят от положения пользователя во время получения данных. Качество распознавания речи зависит от уровня внешнего шума и искажений. Подпись пользователя может быть изменена или подделана. Распознавание лиц полностью бесконтактно и поэтому не носит опасности для здоровья.
Биометрические технологии распознавания лиц охватывают методы и средства, предназначенные для идентификации человека на основе изображения лица. При этом задачи автоматической идентификации человека реализуются в системах распознавания лиц, в виде двух основных режимов распознавания: верификация (сопоставление "один к одному") - проверка соответствия представленного пользователя и предъявленного изображения лица; идентификация (сопоставление "один ко многим") - определение личности пользователя по изображению лица.
Распознавание лиц может быть использовано для смежных областей, таких как определение пола, распознавание эмоций, распознавание и отслеживание черт лица. Распознавание эмоций может использоваться для активного мониторинга состояния больного в медицине, мониторинга усталости или стресса водителей на основе отслеживания глаз. Распознавание лиц может быть использовано совместно с другими биометрическими технологиями такими как: распознавание по голосу, радужной оболочке глаз, отпечаткам пальцев, форме ушей и походке для повышения общего качества распознавания.
Распознавание лиц является частным случаем теории распознавания образов. Для лиц в наиболее часто употребляемом ракурсе (в фас), сложно формализовать различающиеся черты и достичь высокого качества распознавания традиционными методами распознавания образов [120]. Лицо человека подвержено изменениям под влиянием множества факторов, которые могут быть условно разделены на три категории: внутриличностные (возраст, выражение лица, прическа, косметика), межличностные (национальность, пол) и внешние (условия освещения, ракурс, масштаб, параметры изображения) [67].
Конкурсы по оценке состояния области распознавания лиц, проводившиеся за последние несколько лет, такие как FERET [128, 129], FRVT 2000 [29], FRVT 2002 [127] и FAT 2004 [117], подтвердили, что изменения связанные с возрастом, эмоциональным состоянием, условиями освещения и ракурсом являются тремя основными проблемами, возникающими в системах распознавания лиц [49]. Большинство существующих систем распознавания лиц работают удовлетворительно только при условии контролируемых условий [176].
Несмотря на активное развитие техники, повышение быстродействия вычислительных систем и качества изображений, рассмотренные трудности остаются актуальными. Их решение требует создания новых и совершенствования существующих методов и алгоритмов.
Система распознавания лиц может быть построена на основе трех принципов, характеризующих процесс распознавания [157]: перечисление членов класса (каждый класс исходных данных характеризуется перечнем входящих в него образов - членов класса); общность свойств (каждый класс исходных данных характеризуется некоторыми общими свойствами, присущими его членам); кластеризация (в пространстве исходных данных обнаруживается тенденция к образованию кластеров).
Большинство систем построено на основе первых двух принципов [6]. Их построение требует наличия априорной информации о членах классов или их свойств на этапе "обучения" системы. Основной целью таких систем является идентификация или верификация человека на исходном изображении путем сравнения заданного лица с эталоном.
Методика оценки цветового пространства
Детекция на основе цвета кожи человека широко используется для распознавания лиц и человеко-машинного взаимодействия, являясь одним из наиболее эффективных подходов для поиска и выделения лица человека на изображениях [76, 86, 112, 130, 158, 163]. Известно, что для лиц различных рас составляющие цветового тона кожи меняются незначительно. Изменение состояния человека (эмоционального, физического) также слабо влияет на цвет его кожи [84, 148]. Результаты детекции лиц на основе цвета кожи не зависят от расположения и ракурса [113]. Эти факторы обусловили перспективность использования методов выделения цвета кожи человека для биометрической идентификации.
Активное развитие компьютерной графики, колориметрии и дисциплин, связанных с обработкой изображений, обусловило появление большого количества цветовых пространств, линейно или нелинейно связанных между собой. Наибольшее распространение, ввиду своей простоты, получило цветовое пространство RGB, ставшее "де факто" стандартом для обработки и хранения цифровых изображений. Выделение цвета кожи человека может быть выполнено практически в любом цветовом пространстве. Актуальный обзор цветовых пространств и оценка их эффективности для выделения цвета кожи человека широко представлены в литературе [22, 86, 158, 163].
В зависимости от цветового пространства, цвет кожи человека представляется ограниченной областью оттенков [56], имеющей различную размытость и размер. Некоторые цветовые оттенки могут представлять одновременно цвет кожи человека и элементы фона [149]. Предполагается, что изменение цветового пространства сокращает область пересечения и упрощает выделение цвета кожи человека. Независимо от расовой принадлежности и индивидуальных особенностей человека, цвет кожи слабо зависит от яркостной составляющей изображения [174]. Влияние этих факторов на качество детекции цвета кожи, остается недооцененным многими исследователями.
Перспективной задачей является представление методов оценки кластеризующих свойств и сравнение цветовых пространств при решении задачи детекции цвета кожи человека.
В главе рассмотрены особенности выделения цвета кожи человека на изображениях (п. 2.1), формулируются критерии оценки цветовых пространств и качества детекции кожи в этих пространствах (п. 2.2), а также приводятся результаты сравнения известных цветовых пространств и предлагается эффективный алгоритм выделения цвета кожи человека (п. 2.3).
Первым шагом при решении задачи выделения цвета кожи человека на изображениях является выбор цветового пространства. Используются практически все известные типы цветовых пространств [86]: простые, перцепционные, ортогональные, перцепционно унифицированные, а также комбинированные цветовые пространства (например, RGB-H-CbCr [133]). Для рассмотрения в работе, выбраны широко распространенные цветовые пространства разных типов: RGB, HSV, YCbCr и CIE Lab.
Вторым шагом является выбор модели цвета кожи человека (классифицирующей функции). В простейшем случае цветовая модель является бинарной классифицирующей функцией. Результатом классификации может быть как вещественное число, отражающее вероятность принадлежности элемента цвету кожи человека, так и бинарное значение.
Из литературы известны следующие бинарные классификаторы, используемые для решения задачи выделения цвета кожи человека [86]: таблица подстановки (Look up table, LUT), пороговый классификатор (Thresholding), гис-тограммная модель на основе наивного байесовского классификатора (Histogram model with naive bayes classifiers), модель эллиптических границ (Elliptical boundary model), многослойный персептрон (Multilayer perceptron, MLP), ca 55 моорганизующиеся карты (Self organizing map, SOM), байесовская сеть доверия (Bayesian network, BN). Так как цвет кожи человека при контролируемом освещении занимает ограниченное подмножество цветового пространства [56], наиболее простым и часто применяемым методом выделения цвета кожи является пороговый классификатор. Составленная система неравенств для цветовых компонент классифицирует элементы изображения по их соответствию цвету кожи человека. Количество операций при таком подходе соизмеримо с количеством элементов на изображении. Известны методы на основе линейных неравенств, более сложных алгоритмов и нестандартных цветовых пространств [86, с. 1109].
В случае вероятностного подхода классификация пикселя определяется вероятностью его принадлежности к коже, рассчитанной на основе обучающего набора изображений: \ч I ( \ х\ х I кожа) = Lr-r, \S\ Р[х\ не - кожа) = -— -г І v ; \N-S\ где х - цветовой оттенок (например, в цветовом пространстве RGB); Sx - количество элементов, имеющих цветовой оттенок х и соответствующих цвету кожи человека; S - общее количество элементов, соответствующих цвету кожи человека; Nx - общее количество элементов, имеющих оттенок х; N - общее количество элементов. Элемент изображения классифицируется как кожа, если: Р (х I кожа) LJ L- 0? Р(х не - кожа) где 0 - настраиваемый порог отсечения классификатора (0 0 1 ), определяющий форму ROC-кривой классификационной модели (см. п. 1.6.7).
Эффективность классификатора кожи человека определяется его независимостью от внешних факторов: освещённости, расового оттенка кожи, индивидуальных характеристик объекта съёмки и сложности фона. Большинство классификаторов удовлетворяют этим требованиям лишь частично [86]. Метод поэлементной (попиксельной) оценки детектированных областей изображения, количественно характеризующий точность детекции областей кожи человека, представлен далее.
Качество выделения областей кожи человека на изображении зависит от компактности локализации цвета кожи в цветовом пространстве. Для оценки степени локализации в разных цветовых пространствах предложены критерии оценки кластеризующих свойств цветового пространства и качества детекции. С их использованием проведено количественное сравнение выбранных цветовых пространств.
Ошибки дискретизации острых изломов границ при отслеживании...
Система отслеживания контуров позволяет получить координаты отслеживания (контур объектов), многократно уменьшая объем информации для дальнейшей обработки. К достоинствам отслеживания контуров относится полный контроль отслеживания в процессе работы; фиксация момента замыкания контура, перехода в режим зацикливания и т.д.
Разработанный алгоритм отслеживания контуров по полутоновым изображениям основан только на характеристиках детекторов границ и не требует дополнительных морфологических операций.
Автоматическое отслеживание границы становится возможным при вычислении градиента с использованием известных ортогональных операторов (например, Sobel, Prewitt, Isotropic, Kirsh, Robinson). Алгоритм отслеживания характеризуется последовательным продвижением активного элемента на изображении по направлению границы (направление продвижения) с коррекцией ошибок положения на границе (направление фиксации). Продвижение выполняется из некоторой заданной (начальной) точки отслеживания и продолжается до наступления одного из следующих событий: достижения заданного количества шагов алгоритма отслеживания; замыкания контура границы; уменьшения градиента границы до заданного порогового уровня.
Алгоритм отслеживания границы представляется следующей последо вательностью операций с активным элементом: 1. расчет градиента для окрестности текущего активного элемента; 2. оценка направления градиента с дискретностью 45 градусов и расчет направления продвижения активного элемента; 3. расчет градиента окрестности вдоль направления продвижения (-45, +45 градусов) для уточнения направления продвижения; 4. перемещение активного элемента в уточненном направлении.
Для определения направления градиента (шаг 2) рассчитываются составляющие градиента в текущем элементе с использованием двух ортого 80 нальных операторов. За направление границы принимается направление, перпендикулярное градиенту границы по часовой стрелке, где градиент границы - вектор в направлении максимальной скорости изменения яркости "от белого к черному". Перемещение активного элемента при следящем разложении осуществляется в направлении границы.
Для компенсации ошибок отслеживания, обусловленных грубой дискретизацией направления продвижения - на каждом шаге отслеживания дополнительно вычисляется градиент двух элементов окрестности вдоль направления границы (шаг 3). Для уменьшения ошибки положения активного элемента на границе направление отслеживания уточняется по максимальному градиенту.
На рис. 3.1 представлен результат отслеживания острого излома границы с углом 150 градусов. Выделены элементы построенного описания границы и показаны направления градиентов, определенных во время работы.
В результате работы алгоритма формируется массив последовательных координат активного элемента, что соответствует координатному описанию границы, массив изменений координат или массив изменений направлений перемещения в диапазоне [-3-45, +3-45], что соответствует угловому описанию границы и согласуется с методом контурного описания объектов - цепным кодированием Фримена [58].
Рис. 3.1. Поле градиентов контура с изменением направления границы 150 градусов (выделены элементы траектории отслеживания) Для отслеживания всех контуров на изображении операция отслеживания границы выполняется многократно для разных начальных точек, определенных предварительным сканированием изображения оператором выделения границ с заданным шагом или случайным образом. Для исключения слабых границ введена пороговая обработка по значению градиента. Дополнительно, при замыкании контура, выполняется усечение лишних частей границы.
Общий принцип работы алгоритма поиска и отслеживания границ представлен на блок схеме (рис. 3.2, а). На рис. 3.2, б представлена блок-схема алгоритма отслеживания границы для определенного начального элемента. Для проведения экспериментов с алгоритмом создан пакет программ в среде математического моделирования MATLAB.
Детекция и локализация рта
Распознавание человека по его антропометрическим параметрам является первым методом идентификации личности по изображению лица, получившим широкое распространение. Выделение характерных элементов на лице, измерение их параметров и взаимного расположения представляется наиболее компактным и естественным путем описания лица человека в случае контролируемых условий получения изображения, когда не происходит значительных изменений ракурса и освещенности.
Актуальной задачей является отбор необходимого и достаточного количества признаков для идентификации людей по изображению лица, который должен основываться на уникальности этих характеристик, эффективности сбора, а также их инвариантности или малой зависимости от допустимых изменений внешних условий. Соответсвие выбранных характеристик существующим нормативным документам (например, ГОСТ Р ИСО/МЭК 19794-5-2006 [5]), может существенно расширить сферу применимости разработанных алгоритмов.
При анализе лица зрительная система человека принимает решение, основываясь не только на антропометрических данных. Важную роль играют контуры и текстуры лица [3]. В связи с чем, перспективной задачей является разработка методики комбинирования единичных числовых признаков с многомерными наборами признаков для создания общего признакового пространства.
В работе использован только полный фронтальный тип изображения лица, характеризующийся достаточным разрешением для проведения визуальной экспертизы и автоматизированного распознавания путем определения контрольных точек лица, определенных ГОСТ 19794-5-2006.
Среди различных черт лица человека, глаза и рот являются наиболее контрастными и имеют максимальные возможности для распознавания на фронтальных изображениях. Одной из основных характеристик лица человека является расстояние между центрами глаз. Эта величина, постоянная для большинства людей, позволяет осуществлять нормализацию размеров изображений лиц при распознавании и упрощает локализацию других элементов лица, учитывая априорную антропометрическую информацию. Относительная ошибка определения расстояния между центрами глаз на 5 % снижает вероятность правильного распознаванеия вдвое [167].
Взаимное расположение рта и глаз, их геометрические размеры и форма позволяют определить ракурс и положение головы человека во время съемки. На основе информации о взаимном расположении элементов лица могут быть проведены дополнительные высокоуровневые операции по предобработке изображений до процедуры распознавания (например, компенсация теней при точечном освещении, аффинные преобразования для нормализации областей лиц). Эти факторы обусловили перспективность и востребованность именно этих элементов лица человека для детекции и последующего выделения.
Можно выделить несколько направлений исследований, связанных с выделением глаз: распознавание наличия глаза (detection), точная регистрация его позиции на лице (location), отслеживание направления взгляда и сопровождение обнаруженных глаз (tracking). Позиция глаз, направление взгляда обычно оценивается по центру радужной оболочки (зрачка). Перспективные системы основаны на иерархическом подходе и включают в себя три последовательных этапа: обнаружение лица, детекцию черт лица и точную локализацию с фиксацией особенностей. Для систем распознавания лиц людей ключевой задачей является детекция и локализация черт лица человека на изображении для выделения и расчета характерных признаков.
На основе информации об отслеживании точного расположения зрачков глаз, а также формы рта могут быть разработаны интеллектуальные системы человеко-машинного взаимодействия, учитывающие направление взгляда и эмоциональное состояние человека.
Отбор контрольных точек лица выполнен на основе рекомендаций ГОСТ 19794-5-2006 и включает в себя точки глаз - 3.5-3.8, 3.11, 3.12 (рис. 4.1, а); носа (рис. 4.1, б) и рта - 8.3, 8.4 (рис. 4.1, в), а также точки описывающие форму лица -2.1, 10.1, 10.2 (рис. 4.1, г). Вспомогательные контрольные точки, обозначенные знаком (рис. 4.1), определяются дополнительно (не представлены в ГОСТ) и не оказывают влияния на расчет признаков.
Выбранный набор контрольных точек позволяет точно задать расположение основных черт лица, но не содержит детального описания элементов лица. Дополнительно предлагается включить в признаковое пространство контурное описание лица человека - контурное описание подбородка и скул, а также признаки, описывающие текстуры информативно-значимых областей лица (например, области глаз и бровей). Подобное комбинирование признаковой информации позволяет создать репрезентативный набор признаков для описания лица человека. На рис. 4.2 представлены примеры оригинальных изображений, выбранных контрольных точек и предложенный набор критериев в графической форме.