Содержание к диссертации
Введение
1. Синтез и распознавание трехмерных геометрических моделей 11
1.1. Методы анализа фотоизображений лица человека для обнаружения достоверных точек 12
1.2. Методы восстановления объема по одной и нескольким фотографиям 19
1.3. Методы распознавания трехмерных объектов 29
1.4. Выводы и постановка задачи исследования 50
2. Алгоритмы предварительного анализа и выделения достоверных точек 53
2.1. Извлечение областей глаз и губ 54
2.2. Извлечение областей лица и бровей 57
2.3. Распознавание опорных точек 60
3.1. Выравнивание яркости 60
3.2. Масштабирование 60
3.3. Выделение контуров на полутоновых изображениях 61
3.4. Распознавание опорных точек. 64
2.4. Нейросетевой алгоритм локализации уголков глаз 67
2.5. Вычисление и коррекция ракурса с использованием опорных точек 76
2.6. Выводы по главе 79
3. Синтез трехмерных моделей с использованием знаний 80
3.1. Адаптация функционала кривизны поверхности 80
3.2. Синтез полигональной модели лица 85
3.3. Вставка деталей лица и текстурирование трехмерной модели 87
3.4. Выводы по главе 92
4. Идентификация моделей лица 94
4.1. Выделение каркаса полигональной модели 94
4.2. Сравнение каркасных моделей и оценка сходства 95
4.3. Представление и распознавание моделей переменной шириной пульса 98
4.4. Архитектура программной системы 102
4.5. Выводы по главе 110
Заключение 112
Литература 115
Приложение. Акты о внедрении 128
- Методы анализа фотоизображений лица человека для обнаружения достоверных точек
- Извлечение областей глаз и губ
- Адаптация функционала кривизны поверхности
- Сравнение каркасных моделей и оценка сходства
Введение к работе
На протяжении долгого времени человеческое лицо является объектом пристального изучения многих отраслей науки, ведь оно несет в себе важную уникальную информацию о поле, возрасте и эмоциях человека. Именно уникальность лица каждого человека предопределяет возможность его использования и в области распознавания и удостоверения.
Распознавание образов уже признано важной отраслью машинного зрения в рамках теории вычислительных машин и систем. В сфере распознавания образов распознавание лиц выделилось в независимую область для научных исследований. Оказалось, что системы распознавания лиц представляют собой особый интерес для целого ряда применений в таких областях, как системы безопасности или индексация больших мультимедийных баз данных. Все больше и больше разработок в области безопасности сконцентрировано на биометрическом решении для того, чтобы избавиться от PIN кодов и карт, которые могут быть украдены или потеряны. Еще одним преимуществом использования биометрических черт лица является низкая стоимость оборудования, в частности, камеры. Изображения типа фотографий для досье (фас и профиль) приняты и широко используются в качестве официального метода удостоверения многими правительствами и институтами.
Распознавание образов и интерпретация, основанная на знаниях - одна из важнейших задач искусственного интеллекта (Осипов Г.С.). Как следует из анализа области искусственного интеллекта и машинного зрения, важной частью решения задачи распознавания образа является задача его представления. Вследствие быстрого развития технологии создания аппаратного и
программного обеспечения, в компьютерной графике и распознавании образов были сделаны попытки реализовать автоматическое моделирование трехмерного человеческого лица по видео или фотоснимкам, содержащим изображение лица.
Несмотря на разнообразие методов построения и распознавания трехмерной модели, они все еще обладают такими недостатками, как сложность и дорогостоящее внедрение. В связи с этим возникает необходимость в разработке новых подходов, которые упрощают построение трехмерных моделей лиц и делают распознавание более точным.
Для автоматизированного создания трехмерной модели по фотографии необходимым является определение антропометрических точек лица. Большинство существующих систем автоматизированного построения модели головы по фотографиям используют ручное выделение антропометрических точек лица на изображениях.
Объектом исследования являются методы и средства визуализации, трансформации, анализа и обработки видеоинформации для интеллектуальной поддержки процессов принятия управленческих решений в сложных производственных и социальных системах.
Предметом исследования являются методы выделения области лица, его деталей, и особых точек, использующие априорные знания структуры человеческого лица и цвет кожи как признак его присутствия на изображении, алгоритм восстановления формы поверхности лица, с учетом достоверных точек и контуров, метод представления изображения переменной шириной пульса для распознавания лица человека по двум и большему числу цветных фотоизображений.
Цель работы. Снижение требовательности к условиям съемки и повышение эффективности алгоритмов анализа фотоизображений лица человека при сохранении достаточного уровня качества восстановления трехмерных моделей головы и надежности распознавания.
Для достижения поставленной цели необходимо найти простые алгоритмы и модели, такие, чтобы по фотографиям, полученным в обычных условиях бытовой съемки, сохранить приемлемую степень реалистичности трехмерных моделей, достаточную для визуального определения сходства модели с объектом, при сохранении надежности автоматического распознавания. Таким образом, можно выделить следующие задачи исследования:
Исследование методов восстановления формы по изображению и методов распознавания объектов.
Выбор и обоснование методов предобработки изображений, анализа, выделения деталей лица и достоверных точек, нормализации изображений по яркости, масштабу, ракурсу съемки.
Разработка и исследование метода восстановления форма поверхности по двум фотоизображениям (фас и профиль).
Разработка метода распознавания объектов.
Разработка и исследование алгоритмов и программ.
Методы исследования. Теоретические исследования выполнены с использованием методологии системного анализа, теории множеств, теории графов, векторной и матричной алгебры, математической логики, математического моделирования, теории сплайнов.
Достоверность и обоснованность полученных в работе результатов и выводов подтверждается корректностью разработанных математических моделей, их адекватностью по известным критериям оценки в рассматриваемой предметной области, использованием известных положений фундаментальных наук, положительными результатами проведенных экспериментов.
На защиту выносятся результаты исследования применения методов предварительного анализа изображения, выделения антропометрических точек и восстановления формы по изображению для построения трехмерной модели лица и распознавания:
- результаты системного анализа методов синтеза и распознавания объ-
объектов;
методика предварительного анализа и обработки фотоизображений головы человека для подготовки к решению задач восстановления трехмерной модели и распознавания (идентификации) личности по фронтальному и профильному видам, основанная на известных методах обработки растровых изображений и методах, специально созданных под выбранную стратегию;
метод выделения уголков глаз на базе нейронных сетей и многослойного персептрона;
метод адаптации функционала, вычисляющего кривизну поверхности в заданной точке по модели отражения Ламберта, который учитывает кривизну контура профиля, выделенного на профильном виде;
метод синтеза полигональной модели головы путем построчного сканирования фронтального вида адаптированным функционалом кривизны с учетом типовых сечений головы, модифицируемых с помощью достоверных точек лица, найденных на фронтальном и профильном видах;
метод выделения каркаса полигональной модели головы с целью сокращения объема информации, которую требуется хранить в базе геометрических моделей и по которой можно с минимальными потерями качества восстановить полигональную модель, а также с целью повышения быстродействия алгоритма сравнения трехмерных моделей для их идентификации;
метод распознавания объектов, заключающийся в сравнении каркасных моделей путем поиска общей гомоморфной части графов анализируемой и эталонной моделей, позволяющий повысить надежность распознавания благодаря учету параметров вершин и ассоциативных связей между ними;
метод вычисления оценки сходства образов, который автоматически придает больший вес совпадению тех элементов моделей, которые в соответствии с заданной гребенкой признаков идентификации считаются более существенными;
метод распознавания объектов по фотографиям на основе представ-
ления объектов переменной шириной интервалов постоянных приращений углов полигонов;
разработка автоматизированной системы построения трехмерной модели и распознавания по двум фотоизображениям;
результаты экспериментальных исследований и анализа эффективности.
Научная новизна.
Метод адаптации функционала, вычисляющего кривизну поверхности в заданной точке по модели отражения Ламберта, который учитывает кривизну контура профиля, выделенного на профильном виде.
Метод синтеза полигональной модели головы путем построчного сканирования фронтального вида адаптированным функционалом кривизны с учетом типовых сечений головы, модифицируемых с помощью достоверных точек лица, найденных на фронтальном и профильном видах.
Метод распознавания объектов, заключающийся в сравнении каркасных моделей путем поиска общей гомоморфной части графов анализируемой и эталонной моделей, позволяющий повысить надежность распознавания благодаря учету параметров вершин и ассоциативных связей между ними.
Метод распознавания объектов по фотографиям на основе представления объектов переменной шириной интервалов постоянных приращений углов полигонов.
Практическая полезность и реализация.
Полученные в работе методы и алгоритмы анализа фотоизображений лица человека, восстановления поверхностной трехмерной модели и распознавания объекта позволяют повысить качество и надежность процессов построения и распознавания трехмерных моделей лица.
Предложенные методы и средства визуализации, трансформации, анализа и обработки видеоинформации могут найти применение в качестве
средств интеллектуальной поддержки принятия решений в сложных производственных и социальных системах.
3. Созданная программная система может найти применение в криминалистике (построение трехмерного фоторобота, идентификация по фотоснимку в произвольном ракурсе), компьютерной анимации персонажей, а также в производстве - для изготовления скульптурных портретов и барельефов.
Реализация результатов работы. Результаты диссертационной работы внедрены в учебный процесс на кафедре "Автоматизированные системы обработки информации и управления" Ижевского государственного технического университета.
Разработанная программная система SHAM для построения и распознавания моделей головы внедрена в Институте права, социального управления и безопасности Удмуртского государственного университета, в фирмах по разработке и сопровождению информационные технологий "Модуль ИТ" (г.Ижевск), PUZANT YACOUBIAN & SONS (г.Дамаск, Сирия).
Апробация работы. Основные положения диссертационной работы докладывались на 3-х международных конференциях: на IV Международной научно-технической конференции (Ижевск, 29 - 30 мая, 2003 г.) на 14-той Международной Конференции по Компьютерной Графике и зрению Графи-кон-2004 (6-10 сентября 2004 г.); Международном Форуме "Высокие Технологии - 2004" (23-26 ноября 2004 г.). Работа многократно обсуждалась на постоянном семинаре "Системный анализ, управление и обработка информации" кафедр "Автоматизированные системы обработки информации и управления" и "Вычислительная техника" Ижевского государственного технического университета.
Публикации. Результаты работы отражены в научных публикациях, в том числе статей в журналах и сборниках, 3 доклада на научно-технических конференциях.
Структура и объем работы. Диссертационная работа состоит из введения, четырех глав, заключения и приложений. Основной текст изложен на 127 машинописных листах с таблицами и иллюстрациями. Список литературы включает 132 наименования.
В первой главе приводится краткий обзор существующих методов обнаружения лица и особых точек, описываются алгоритмы предварительного анализа и выделения опорных точек, которые необходимы для построения трехмерной модели и распознавания. Также приводится обзор существующих методов построения трехмерной модели лица и головы, выполнен анализ методов, которые классифицированы по признаку использования одной, двух, трех или большего числа фотографий.
Во второй главе описываются алгоритмы предварительного анализа и выделения опорных точек. Сначала производится обнаружение лица и удаление фона, затем на области лица распознаются основные детали лица. Затем, основываясь на результатах предыдущего этапа и данных антропометрической статистики, определяются главные опорные точки для того, чтобы использовать их позже в качестве фиксированных параметров для построения трехмерной модели лица. Некоторые опорные точки используются для определения ракурса и затем для коррекции изображения. В основном, для решения этих задач использованы очевидные и известные методы, которые были модифицированы нами под выбранную стратегию. В частности, предложены шаблоны для поиска на контурах опорных точек (мочки уха, крылья носа, вершина подбородка), динамически деформируемый шаблон для выделения уголков рта, нейросетевой алгоритм для поиска уголков глаз.
В третьей главе основное внимание уделяется синтезу и текстуриро-ванию трехмерных моделей.
В четвертой главе предлагаются методы распознавания (идентификации) трехмерных моделей лица человека, приводится описание программной системы для анализа фотоизображений.
В конце моей работы я хотел бы выразить свою благодарность и уважение моему научному руководителю, доктору наук, профессору Валерию Никоноровичу Кучуганову, которому я благодарен за поддержку, советы и большую роль, которую он сыграл в завершении этой работы, за информацию, литературу и оборудование, которые, благодаря ему, имелись в моем распоряжении, за то, что он делился со мной своим временем и бесценным опытом.
Также я хотел бы выразить свою благодарность моему руководителю из Сирии, доктору наук, профессору Хасану Абулнуру, так как он не только поддерживал меня и помогал, но также многому научил за время моей учебы и работы в Дамасском Университете, и я очень благодарен ему за это.
Я хотел бы также поблагодарить Александра Кучуганова, Олега Чуба-рева и Владимира Харина за их помощь и участие, которые позволили мне закончить эту работу.
Моя искренняя благодарность всем, кто помогал мне в подготовке всего необходимого для защиты, в особенности отделу международных отношений ИжГТУ.
«к
Методы анализа фотоизображений лица человека для обнаружения достоверных точек
Рассмотрим существующие методов обнаружения лица и особых точек лица. Дэвис [33] считает, что в психологической оценке основных выпуклостей деталей лица подбородок является столь же важным, что и рот. Поэтому в ранних системах распознавания человеческого лица подбородок использовался для измерений геометрических пропорций [99]. Модель активных контуров (змеи), предложенная Кассом [57], широко используется как метод отслеживания границы лица. Основные трудности с активным отслеживанием контуров состоят в том, что нужна хорошая начальная оценка, и что активный контур будет всегда сходиться на решении, будь то желательное решение или ложное соответствие. Кроме того, высока стоимость вычислений, и поэтому они являются весьма медленными. Чтобы ускорить обработку, Со-боттка и Питас [107], а также Лэм и Йан [60] для определения границы лица использовали змеевидные модели активных контуров с кривыми типа эллипса или частичных эллипсов.
Поиск соответствия шаблонам также является популярным методом извлечения контура лица. Ланитис [63] предложил гибкую модель, форма и полутоновая структура которой создавались при помощи статистического анализа обучающего набора изображений лиц. Акимото и др. [9] использовали шаблонные модели, чтобы идентифицировать такие детали профиля, как вершину подбородка, рот, кончик носа и переносицу. Контур лица представлена сплайн-кривой, проходящей через основание подбородка, контуры правой и левой щек и пиксели, имеющие более высокую напряженность края, чем заданная пороговая величина. Недостаток поиска соответствия шаблону для извлечения контуров лица, состоит в том, что не принимается во внимание различная внешность объектов. Извлеченный контур лица может иметь отклонения от реального.
Чтобы преодолеть трудность объединения информации края низкого уровня в контур объекта, Хью и др. [53] объединили традиционное определение краев и методы пороговой фильтрации с моделями головы или лица, для того чтобы определить границы лица, а также использовали априорное знание об общей форме головы для организации контуров головы и лица в ясные границы. Трудность для этого метода состоит в том, чтобы определить две конечные точки отрезка.
Мы можем классифицировать исследования геометрии лица человека на две группы, зависящие от человеческого участия: - автоматическое извлечение геометрии по измерениям живого субъекта. Ли и др. [66] использует исследование диапазонов субъекта, и создают модель на основе законов физики, которая пригодна для анимации. В это же время Акимото и др. [9] для создания модели используют фронтальные и профильные изображения субъекта; - определение пользователем новой геометрии лица вручную. Парке [84] задает параметры контроля, которые могут управлять формой лица. Магненат-Тальман и др. [71] описывают более обширный набор локализованных параметров деформации. Патель [85] предлагает набор альтернативных параметров, сходных с параметрами метода [71], но более строго привязанных к структуре головы. Ди-Паола [36] использует набор локализованных объемных деформаций, по 14 добных по действию [71]. Льюис [67] рассматривает использование стохастических шумовых функций как средств деформации естественных объектов, включая лица. Модели, основанные на анализе главных компонентов АПК [118] описывают форму лица как взвешенную сумму ортогональных базисов трехмерных форм, которые называют главными компонентами. Этот базис строится из большого банка примеров, которые взаимно соотносятся друг с другом. Это соответствие очень похоже на то, которое требуется для морфинга изображения [17]. Обычно при АГК лица, почти идентичные тем, которые находятся в банке, представляются взвешиванием усеченного базиса, который включает только несколько сотен наиболее существенных компонентов. Однако, так как компоненты индивидуально сложны и объединяются простым сложением, при помощи альтернативных взвешиваний можно легко закодировать невозможные формы лица. Букштейн [26] описывает эту проблему посредством скрытых переменных, и отмечает, что главные компоненты часто имеют незначительную схожесть с основной взаимозависимой структурой биологических форм, то есть весьма трудно извлечь нелинейные зависимости между различными аспектами формы, используя линейную модель типа АГК. В то же время, нет никакой гарантии, что лица, значительно отличающиеся от имеющегося набора, будут вообще аппроксимированы в достаточной степени. Попытки выполнения автоматического анализа изображений лица, использующего геометрические детали, были впервые предприняты Бледсоу [24]. Впоследствии этой задачей занимался Канаде [55]. Он начал с определения 16 деталей. Затем он проанализировал, меж- и внутриклассовые различия, и выяснил, что использование некоторых параметров было неэффективно. Оставшиеся 13 параметров использовались для задачи распознавания. Однако не всегда точно удавалось найти место расположения деталей. Впоследствии, Йулле, Халиман, и Кохен [125] использовали деформи 15 руемые шаблоны для обнаружения деталей лица, в частности глаз и губ. Использовались функции внешней энергии впадин, пиков, краев, и интенсивности изображения. Эти внешние изображения вычисляются по первоначальному изображению интенсивности. Внутренняя энергия, состоящая из параметров шаблона динамически взаимодействует с внешней энергией. Наилучшее совпадение происходит, когда минимизировано уравнение общей энергии (состоящий из внутренней и внешней энергии).
Следуя подходу [115], Шаклетон и Уэлш [103] продемонстрировали шаги локализации деталей для обнаружения глаза, добавив сначала параметры шаблона для областей увеличенных белков глаз. Как только найден глаз, выполняется его геометрическая нормализация в процессе подготовки к этапу распознавания. Данный этап распознавания использует подход собственного анализа Тюрка и Пентланда [116], а также Кирби и Сировича [58]. Вклад метода Шаклетона и Уэлша состоит в том, что большая часть фона устраняется и для распознавания рассматривается только интересующая нас деталь, в данном случае глаз.
Извлечение областей глаз и губ
Контур лица создает первое представление о форме лица и личности человека. По важности он следует за глазами, носом, бровями и превосходит подбородок, губы и рот. Поэтому контур лица считается важным признаком человеческого лица, хотя в ранних методах распознавания, он представлялся в качестве детали. Более того, выявление контура лица помогает определить особые точки лица.
Проведенные нами исследования популярных программ-векторизаторов, показали, что наибольшее количество плохо прорабатываемых участков линейных или полутоновых изображений появляется в тех областях, где искомые линии образуют пересечения и острые углы, близко подходят друг к другу или меняют свою ширину. Еще больше разнообразных помех возникает при обработке фотографий естественных объектов, имеющих трехмерную природу. При этом искомые объекты могут располагаться на затененных участках, что осложняет выполнение векторизации [2, 6].
В данной работе основное внимание уделено качеству векторизации контрастных и полутоновых фотоизображений, содержащих до 256 градаций серого цвета. Для обработки изображений были использованы специальные анализирующие фильтры размерами 3x3 и 5x5 пикселей. Процесс анализа носит итерационный характер и осуществляется в три этапа: 1. Поиск особых точек. 2. Отслеживание линий, связывающих особые точки. 3. Настройка фильтров по характеру анализируемой окрестности. Поиск особых точек. Выделим из множества артефактов наиболее харак терные ситуации, в дальнейшем - особые точки (ОТ): 1. Разветвление - точка, из которой исходит три или более ветвей. Например: точка пересечения двух линий имеет четыре исходящих ветви. 2. Острый угол - точка с двумя исходящими ветвями, угол между которыми составляет не более 90. 3. Конец ветви - точка с одной исходящей ветвью. В процессе построчного сканирования изображения с помощью специального анализирующего фильтра, как правило, в области сближения, пересечения или окончания линий выделяется не одна, а некоторое связное подмножество особых точек, которые образуют артефактную зону. Величина этой зоны зависит от ширины линий и размеров анализирующего фильтра (3x3, 5x5 и т.д.). Отбраковка лишних ОТ в артефактной зоне позволяет не только снизить количество "шумовых" отрезков, но и повысить качество аппроксимации контуров отрезками прямых и дуг для получения геометрического и топологического описания изображения.
Далее осуществляется оптимизация особой точки путем рекурсивного поиска наилучшей ОТ в зоне артефактов, в процессе которого из любой найденной ОТ происходит смещение на шаг h=1 по направлениям исходящих ветвей и, если новая ОТ имеет меньшую среднюю яркость в своей окрестности, то рекурсивно вызывается данная процедура. В результате этого процесса все связное подмножество ОТ заменяется одной точкой, имеющей наиболее темную окрестность.
Отслеживание линий, связывающих особые точки. Предварительное выделение особых точек помогает повысить достоверность траектории, а значит более точно определить геометрические характеристики объекта. Если в процессе слежения мы вошли в зону артефактов, то выполняется процедура "захват" ОТ, которая осуществляет скачкообразный переход в уточненную ОТ.
Настройка анализирующих фильтров по характеру окрестности. Если на черно-белых (двухградационных) или цветных изображениях для выделения контуров объектов достаточно отслеживать смену цвета, то на полутоновых фотоизображениях, содержащих 256 оттенков серого, линии определяются переходом уровня цвета в несколько градаций яркости. Во многих случаях контуры размыты в поперечнике, а по длине плавно сходят на "нет", сливаясь с фоном. Поэтому при приближении траектории слежения к ОТ типа "конец ветви" величина порога динамически уменьшается до минимума, пока не будет найдено продолжение ветви.
Заключительным этапом векторизации является аппроксимация отслеженных последовательностей точек отрезками прямых и дуг, в ходе которой автоматически уточняются параметры отрезков по расстоянию (в пикселях) от фактического контура.
Адаптация функционала кривизны поверхности
В данной главе рассмотрены два способа распознавания трехмерных моделей головы человека. Описана программная система построения двухмерных и трехмерных моделей. 1. Описан метод выделения каркаса полигональной модели головы с целью сокращения объема информации, которую требуется хранить в базе геометрических моделей (БГМ) и по которой можно с минимальными потерями качества восстановить полигональную модель, а также с целью повышения быстродействия алгоритма сравнения трехмерных моделей для их идентификации. 2. Предложен метод распознавания объектов, заключающийся в сравнении каркасных моделей путем поиска общей гомоморфной части графов анализируемой и эталонной моделей, позволяющий повысить надежность распознавания благодаря учету параметров вершин и ассоциативных связей между ними. Сокращение перебора объектов из базы данных достигается за счет отбрасывания неудовлетворительных моделей на основе соотношений между антропометрическими точками, которые выделены на этапе предварительного анализа (глава 2). 3. Предложен метод вычисления оценки сходства образов, который автоматически придает больший вес совпадению тех элементов моделей, которые в соответствии с заданной гребенкой признаков идентификации считаются более существенными. 4. Предложен метод распознавания объектов по фотографиям на основе представления объектов переменной шириной интервалов постоянных приращений углов полигонов. 5. Выполнен анализ эффективности метода представления объектов переменной шириной интервалов постоянных приращений углов полигонов (метод ПШП). 5.1. Хранение в памяти. Поскольку мы собираемся сохранять вектора определенных узлов трехмерной модели лица в графической базе данных, размер данных будет уменьшен как минимум наЗЗ% (от 43 до 29 килобайт для каждой модели), в зависимости от области применения. 5.2. Коммуникации и реализация аппаратных средств. Представление методом ПТТГП позволяет просто и эффективно реализовывать распознавание в конфигурации аппаратных средств (например в чипах FPGA), свободно посылать данные через среды коммуникации, легко и эффективно и синхронизировать данные между передающим устройством и устройством для приема данных без необходимости посылать информацию о такте. Устойчивость метода к импульсным помехам и флуктуационным помехам показана в работе. 5.3. Распознавание. Результаты эксперимента на 252 изображениях дали надежность распознавания от 99,8% до 88,28% при изменении освещенности от нормальной до ±10% и от 99,8% до 61,11% при изменении ракурса от фронтального до ±10 по всем осям координат. 6. Описана архитектура программной системы построения и анализа модели лица, разработанной на основе предложенных в данной работе методов и алгоритмов, которая может найти применение в криминалистике (построение трехмерного фоторобота, идентификация по фотоснимку в произвольном ракурсе), компьютерной анимации персонажей, а также в производстве - для изготовления скульптурных портретов и барельефов. На данном этапе созданная программная система не является законченным "коммерческим" продуктом. Она представляет собой комплекс для исследования методов и режимов обработки растровых и векторных фотоизображений и трехмерных моделей головы, в котором можно работать как в интерактивном, так и в автоматическом режимах. В работе получены следующие основные выводы и результаты: 1. Методы выделения достоверных (опорных, антропометрических) точек основаны на эвристических алгоритмах и, благодаря их узкой специализации, вполне успешно справляются со своими задачами. Выбор тех или иных эвристик зависит от цели и стратегии решения общей задачи, поставленной перед разработчиками. 2. Не смотря на разнообразие методов построения трехмерной модели, они все еще обладают такими недостатками, как сложность и дорогостоящее внедрение. В связи с этим возникает необходимость в разработке новых подходов, которые упрощают построение трехмерных моделей лиц и делают распознавание более точным. 3. Методы распознавания трехмерных объектов: статистические; на основе линейно-дискриминантного анализа; на основе скрытых моделей Маркова; нейросетевые и др. можно разбить на два основных класса: по антропометрическим точкам и признакам, описывающим характерные особенности деталей лица; по поверхностной (трехмерной) модели. Первые, как правило, жестко привязаны к системе выделяемых признаков, другие - предъявляют высокие требования к аппаратуре и условиям съемки.
Сравнение каркасных моделей и оценка сходства
Методы выделения достоверных (опорных, антропометрических) точек основаны на эвристических алгоритмах и, благодаря их узкой специализации, вполне успешно справляются со своими задачами. Выбор тех или иных эвристик зависит от цели и стратегии решения общей задачи, поставленной перед разработчиками. 2. Не смотря на разнообразие методов построения трехмерной модели, они все еще обладают такими недостатками, как сложность и дорогостоящее внедрение. В связи с этим возникает необходимость в разработке новых подходов, которые упрощают построение трехмерных моделей лиц и делают распознавание более точным. 3. Методы распознавания трехмерных объектов: статистические; на основе линейно-дискриминантного анализа; на основе скрытых моделей Маркова; нейросетевые и др. можно разбить на два основных класса: по антропометрическим точкам и признакам, описывающим характерные особенности деталей лица; по поверхностной (трехмерной) модели. Первые, как правило, жестко привязаны к системе выделяемых признаков, другие - предъявляют высокие требования к аппаратуре и условиям съемки. 4 Предложены шаблоны для поиска на контурах опорных точек типа: мочки уха, крылья носа, вершина подбородка. 5 Предложен метод выделения уголков рта с помощью динамически деформируемого шаблона. 6 Предложен метод выделения уголков глаз на базе нейронных сетей и многослойного персептрона. 7. Опорные точки, выделенные на фронтальном и профильном видах позволяют определить пространственное положение объекта и его деталей, а также вычислить соотношения между антропометрическими точками. Эти соотношения необходимы для этапа предварительного распознавания личности. 8. Предложен метод адаптации функционала, вычисляющего кривизну поверхности в заданной точке по модели отражения Ламберта, который учитывает кривизну контура профиля, выделенного на профильном виде. 9. Разработан метод синтеза полигональной модели головы путем посточного сканирования фронтального вида адаптированным функционалом кривизны с учетом типовых сечений головы, модифицируемых с помощью достоверных точек лица, найденных на фронтальном и профильном видах. 10. Описан способ присоединения к модели типовых деталей головы, параметризуемых по соотношениям между достоверными точками, основанный на булевских операциях над полигональными моделями. 11. Описан способ текстурирования модели головы исходными ортогональными фотоизображениями с целью повышения реалистичности модели. 12. Описан метод выделения каркаса полигональной модели головы с целью сокращения объема информации, которую требуется хранить в базе геометрических моделей и по которой можно с минимальными потерями качества восстановить полигональную модель, а также с целью повышения быстродействия алгоритма сравнения трехмерных моделей для их идентификации. 13. Предложен метод распознавания объектов, заключающийся в сравнении каркасных моделей путем поиска общей гомоморфной части графов анализируемой и эталонной моделей, позволяющий повысить надежность распознавания благодаря учету параметров вершин и ассоциативных связей между ними. Сокращение перебора объектов из базы данных достигается за счет отбрасывания неудовлетворительных моделей на основе соотношений между антропометрическими точками, которые выделены на этапе предварительного анализа. 14. Предложен метод вычисления оценки сходства образов, который автоматически придает больший вес совпадению тех элементов моделей, которые в соответствии с заданной гребенкой признаков идентификации считаются более существенными. 15. Предложен метод распознавания объектов по фотографиям на основе представления объектов переменной шириной интервалов постоянных приращений углов полигонов. 16. Выполнен анализ эффективности метода представления объектов переменной шириной интервалов постоянных приращений углов полигонов. 17. Описана архитектура программной системы построения и анализа модели лица, разработанной на основе предложенных в данной работе методов и алгоритмов, которая может найти применение в криминалистике (построение трехмерного фоторобота, идентификация по фотоснимку в произвольном ракурсе), компьютерной анимации персонажей, а также в производстве - для изготовления скульптурных портретов и барельефов.