Содержание к диссертации
Введение
1 Методы автоматической идентификации личности человека по изображению лица 11
1.1 Обзор существующих методов 11
1.2 Классификация признаков, используемых при автоматической сегментации изображения 1.2.1 Геометрические признаки 16
1.2.2 Топологические признаки 20
1.2.3 Вероятностные признаки 22
1.2.4 Спектральные признаки 23
1.2.5 Цветовые признаки 27
1.3 Методы обработки и анализа изображений в задачах машинного зрения 29
1.3.1 Метод главных компонет 29
1.3.2 Линейный дискриминантный анализ 33
1.3.3 Гибкие контурные модели 34
1.3.4 Сравнение эластичных графов 35
1.3.5 Методы, основанные на геометрических признаках лица 38
1.3.6 Скрытые марковские модели
1.4 Оценка эффективности применения алгоритмов машинного зрения в системе видеонаблюдения 44
1.5 Постановка задач исследования 47
2 Метод сегментации изображения лица человека по цветовому признаку 48
2.1 Анализ особенностей цвета кожи человека 48
2.2 Дополнительные признаки, характеризующие область лица: волосы, глаза, зубы 50
2.3 Алгоритм классификации пикселей 51
2.4 Определение границ объектов, попавших в область переднего плана 56
2.5 Графы смежности областей изображения
2.6 Селекция выделенных областей по геометрическим признакам 59
2.7 Метод оценки эффективности использования цветовых пространств для сегментации по цветовому признаку 60
2.8 Разработка специализированного цветового пространства 73
2.9 Выбор цветового пространства 79
2.10 Выводы 81
3 Метод распознавания личности человека по изображению лица на основе скрытых марковских моделей 83
3.1 Выбор структуры СММ 86
3.2 Выбор оптимальных признаков, формирующих алфавит скрытой марковской модели 92
3.3 Обучение СММ 100
3.4 Алгоритм поиска соответствий в базе данных 108
3.5 Выбор оптимальных параметров СММ для решения задачи распознавания личности 108
3.6 Выводы ПО
4 Моделирование разработанных алгоритмов 112
4.1 Средства разработки 112
4.2 Требования к аппаратно-программной платформе 114
4.3 Требования к исходным данным 115
4.4 Описание аппаратно-программного комплекса 115
4.5 Оценка полученных результатов 122
4.6 Перспективы развития системы
4.6.1 Реализация на языке высокого уровня 123
4.6.2 Отслеживание перемещения 130
4.7 Выводы 133
Заключение 134
Список сокращений 136
Список литературы
- Спектральные признаки
- Оценка эффективности применения алгоритмов машинного зрения в системе видеонаблюдения
- Выбор оптимальных признаков, формирующих алфавит скрытой марковской модели
- Требования к аппаратно-программной платформе
Введение к работе
Актуальность темы. Возросший за последнее время уровень социальной напряженности в связи с непрекращающейся угрозой террористических атак усиливает роль технических средств видеоконтроля, устанавливаемых в местах повышенной концентрации людей (стадионы, станции метро, вокзалы и т.п.). В настоящее время системы видеонаблюдения применяются преимущественно для фиксации происходящих событий с целью обеспечения проведения возможных следственных действий. Актуальным является использование систем видеонаблюдения также для осуществления превентивной функции, заключающейся в своевременном автоматическом выявлении находящихся в розыске лиц, ранее причастных к организации беспорядков, порче общественного имущества и т.п. Особую роль для реализации подобных систем играют способы распознавания личности по изображению лица человека.
Существующие подходы к решению задачи установления личности человека по изображению лица во многом были сформированы в 80-х годах прошлого века. Несмотря на большое количество ежегодно выходящих посвященных данной теме публикаций, решение указанной задачи по-прежнему требует совершенствования аппаратных и программных средств с целью улучшения временных и вероятностных характеристик процесса идентификации.
Наиболее полный обзор существующих алгоритмов анализа и распознавания изображений в системах технического зрения приводится в работах таких ученых, как Дуда Р., Харт П., Шапиро Л., Стокман Д., Форсайт Д., Понс Ж., Прэтт У, Розенфельд А., Федотов Н.Г., Сальников И.И. и др.
Отличительной особенностью сложившегося подхода к распознаванию изображений является использование единого признака как для сегментации изображения на составляющие объекты, так и для последующей классификации объектов, следствием чего, как правило, оказываются высокая вычислительная сложность алгоритмов распознавания и наличие жестких ограничений на условия формирования изображений. По этой причине для решения практических задач требуется создание новых методов, основанных на анализе целого ряда дополняющих друг друга признаков, таких как цвет, форма, взаимное расположение выделенных объектов и их составных частей и т.п.
Кроме того, следует принимать во внимание непрерывное совершенствование методов анализа изображений, повышение быстродействия испульзуемых для этой цели технических средств, а также возможности увеличения числа процессоров вычислительной системы и распараллеливания вычислительных процессов.
Современные видеокамеры наружного наблюдения позволяют получить цветное изображение размером 1920x1080 пикселей и более с частотой порядка 25-30 кадров в секунду. Столь высокие характеристики дают основание пересмотреть ранее сформировавшиеся подходы к задаче распознавания лиц в системах, основанных на применении видеокамер наблюдения.
Цвет является мощным средством распознавания и различения объектов на изображении. Несмотря на это, в существующих методах и алгоритмах рас-
познавания лица человека ему, как правило, отводится второстепенная роль, либо его значение вовсе не учитывается. Причиной этого является то, что до недавнего времени видеокамеры наблюдения, работающие в цветном режиме, были мало распространены из-за невысокой светочувствительности и низкой контрастности получаемого изображения. Современный уровень развития техники снимает подобные ограничения.
Как показывают эксперименты, цвет кожи разных людей локализуется в рамках небольшой ограниченной области цветового пространства. Даже при рассмотрении цветов кожи людей различной расовой принадлежности не наблюдается существенного увеличения цветового разброса. Исследования в данной области свидетельствуют о том, что основное отличие заключается не в оттенке цвета, а в его яркости, что позволяет использовать характерный цвет кожи как признак для распознавания лиц.
Метод распознавания лиц, основанный на анализе цветовых признаков, позволяет всего за один проход по изображению выделить области, содержащие лица людей. Однако он не может ответить на вопрос, кому эти лица принадлежат. Для решения задачи распознавания необходимо использовать методы, в большей степени учитывающие персонифицированные признаки, нежели общеклассовые. Для этих целей хорошо подходят алгоритмы, основанные на применении скрытых марковских моделей (СММ).
Как устойчивый распознаватель с большим количеством настраиваемых параметров метод на основе СММ позволяет в полной мере учесть особенности изображения лица, уменьшить влияние таких факторов, как освещение, искажения перспективы, искажения, связанные с использованием широкоформатных объективов и пр. Помимо этого существует возможность учесть двумерную структуру изображения, тем самым исключая возможность ошибочной классификации области глаз как области рта и т.п.
На сегодняшний день теория СММ составляет основу индустриального стандарта для приложений, осуществляющих распознавание речи. СММ успешно применяются для решения задач распознавания рукописного текста и биоинформатики. Возможность применения СММ в задачах идентификации личности человека проработана в значительно меньшей степени. Отчасти это объясняется наличием уже устоявшихся, проверенных временем алгоритмов, отчасти - сложностью выбора оптимальных с точки зрения идентификации личности параметров СММ, требующего проведения теоретических изысканий, разработок и экспериментальных исследований.
В этой связи, тема диссертационного исследования, посвященная распознаванию изображения лица человека по цветовым признакам с целью идентификации его личности для применения в системах видеонаблюдения, является актуальной.
Цель настоящей работы состоит в совершенствовании методов автоматизированной идентификации личности при анализе изображений в системах видеонаблюдения и повышении на этой основе уровня безопасности людей в местах их массового скопления.
Для достижения поставленной цели сформулированы следующие задачи:
-
разработка метода и алгоритма кодирования цветного изображения для сегментации по цветовым признакам с целью выделения областей, содержащих информацию о лице человека;
-
обоснование и разработка математической модели описания отличительных особенностей изображения лица на основе скрытой марковской модели, а также выбор признаков, формирующих алфавит наблюдаемой последовательности признаков;
-
разработка метода и алгоритма выделения ключевых признаков, характеризующих представленное на изображении лицо;
-
разработка алгоритма поиска в базе данных соответствий выделенных признаков анализируемого изображения эталонным признакам.
Объектом исследования в диссертационной работе являются системы автоматического установления личности по изображению лица, поступающему с видеокамер наблюдения.
Предметом исследования являются методы и алгоритмы для систем технического зрения, позволяющие выделять характерные признаки изображения лица человека, сохранять их в базе данных, а также производить поиск соответствий признаков анализируемого изображения эталонам.
Методы и средства исследования. При решении поставленных задач использовались положения теории распознавания образов, теория систем технического зрения, методы математического анализа, теория цветового кодирования изображений, методы цифровой обработки сигналов и интегрированные среды разработки программ.
Научная новизна работы. Новыми являются следующие научные результаты.
-
Разработан новый метод сегментации изображения, основанный на применении специализированного цветового пространства, реализующий алгоритмы выделения областей по цветовым признакам объектов, позволяющие выявить элементы изображения кожи человека с высокой степенью точности.
-
Математическая модель описания изображения лица человека с выявлением отличительных признаков на основе скрытой марковской модели с псевдодвумерной структурой, позволяющая распознать человека по изображению лица.
-
Метод выделения ключевых признаков, характеризующих изображение лица, на основе алгоритмов динамического программирования.
-
Алгоритм поиска соответствий выделенных признаков изображения эталонным признакам в базе данных, основанный на определении вероятности генерирования наблюдаемой кодовой последовательности каждой из имеющихся скрытых марковских моделей с помощью алгоритма прямого хода.
Практическая значимость работы заключается в том, что применение разработанных методов и алгоритмов позволяет увеличить вероятность правильного распознавания изображения лица человека по цветовым признакам и идентификации личности человека по его изображению в системах видеонаб-
людения и на этой основе повысить уровень безопасности людей в местах их массового скопления.
Реализация и внедрение результатов работы. Разработанные методы и алгоритмы выделения лица на изображении человека в системах видеонаблюдения использованы в разработках центра по охране объектов органов государственной власти и правительственных учреждений г. Москвы ФГКУ УВО ГУ МВД России по г. Москве, а также применяются в учебном процессе при обучении студентов по направлению подготовки 230100 - «Информатика и вычислительная техника» в Пензенском государственном технологическом университете в рамках дисциплин «Системы искусственного интеллекта» и «Системы технического зрения».
Достоверность и обоснованность научных положений и выводов подтверждается корректностью допущений и ограничений при выводе математических выражений, согласованностью основных теоретических положений диссертации с практической реализацией предложенных решений, а также с результатами вычислительных экспериментов.
Положения, выносимые на защиту:
-
метод и алгоритм сегментации изображения, основанный на применении специализированного цветового пространства, позволяющий выделить область лица на изображении человека по цветовым признакам;
-
математическая модель процесса выделения отличительных признаков изображения лица, основанная на теории скрытых марковских моделей, позволяющая распознать изображение лица человека;
-
метод выделения ключевых признаков, характеризующих изображение лица человека;
-
алгоритм поиска соответствия признаков лиц эталонным признакам в базе данных, основанный на определении вероятности генерации наблюдаемой последовательности каждой из имеющихся скрытых марковских моделей.
Апробация работы. Основные положения и результаты диссертационного исследования докладывались и обсуждались на ежегодной Всероссийской научно-технической конференции «Современные методы и средства обработки пространственно-временных сигналов» (г. Пенза, 2010, 2012, 2013 гг.), на III научной конференции аспирантов и молодых ученых (г. Пенза, 2010 г.), на IV Международной электронной научной конференции студентов и аспирантов «Студенческий научный форум» (2012 г.).
Публикации. По результатам исследований опубликовано 9 печатных работ, из них 3 - в изданиях, рекомендованных ВАК.
Личный вклад автора. Основные изложенные в диссертации новые результаты получены лично автором. В работах, опубликованных в соавторстве, автору принадлежат: в [3] - вывод уравнений и проведение экспериментальной части исследования; в [4] - разработка алгоритмов; в [5] - выбор группы цветовых пространств и проведение их сравнительного анализа; в [7] - вывод формул для представления кодов цвета в полярной системе координат и разработка алгоритма сегментации.
Структура и объем работы. Диссертация состоит из введения, четырех разделов, основных результатов и выводов по работе, списка литературы из 95 наименований и приложения. Работа изложена на 145 страницах основного текста, включающего 66 рисунков и 6 таблиц.
Спектральные признаки
Название этой группы признаков отражает характер модели, используемой для описания функции яркости на изображении. А именно, на функцию яркости смотрят как на реализацию случайного процесса или процессов (для цветных изображений) [21]. В этом случае признаками изображения являются числовые характеристики случайного процесса. К наиболее часто используемым относятся: - яркостные характеристики, такие как гистограмма распределения значений яркости на изображении, начальные и центральные гХк моменты функции яркости М/с = E{fk(n)},Vk = E{(f(.n) -ц,) }, (1.9) где уік = yLf - среднее значение функции яркости на изображении; - текстурные характеристики изображения, к которым относятся характеристики случайного процесса, определяющие его корреляционные свойства, такие как коэффициент корреляции на изображении, корреляционная функция изображения и др.; - характеристики пространственного спектра изображения, к которым относятся отсчеты его энергетического спектра; - признаки стохастической геометрии. Данные признаки характеризуют случайные величины, связанные с наступлением каких-либо геометрических событий. Наиболее часто используемой схемой их генерации является случайное бросание прямой линии на плоскость изображения и вычисление некоторых характеристик, связанных с событием пересечения этой линией области объекта. Например, это может быть число пересечений объекта линией, максимальная или минимальная длина отрезка линии, содержащейся в объекте, суммарная длина отрезков линии, находящихся в области объекта, и т.д. (рисунок 1.7). Вероятностные характеристики таких случайных величин некоторым образом описывают форму объекта. Причем, в силу случайности положения линии, достигается инвариантность к смещениям и поворотам изображения. Несомненным достоинством таких признаков являются относительно высокая помехоустойчивость, и возможность достаточно просто автоматизировать процесс наращивания числа таких признаков [22].
В то же время, несмотря на целый ряд преимуществ, признаки стохастической геометрии редко используются в распознавании изображений. Связано это, в основном, с двумя причинами: высокой вычислительной сложностью расчета признаков; отсутствием явной геометрической интерпретации получаемых значений признаков.
Характер функций W, называемых ядрами преобразования, может быть достаточно произвольным. Наиболее типичными являются следующие ядра и соответствующие им преобразования: 1) разложение Карунена-Лоэва [24]. Пусть для описания функции яркости исходного изображения используется модель дискретного случайного поля f(ni,n2) с нулевым математическим ожиданием и известной корреляционной функцией Л(т1,т2,л1,п2) = M[f(m1,m2)f(nlln2)l (і.ц) Тогда ядро преобразования Карунена-Лоэва имеет следующий вид: W(nltn2,m1,m2) = Ч/ТПііт2(п1,п2), Q 12) где хі тп1,т2(.пі п2) собственные векторы корреляционной матрицы R(rn1,m.2,n1,n2), вычесляемые из следующего соотношения: Nx-1 JV2-1 2 .тгСп Пг)/? !, , ) =Amim2 f/mi m2(/c1,fc2)l (1.13) ПІ=0 n2=0 где Яті7П2 - собственные значения корреляционной матрицы R(m1,m2,n1,n2), равные дисперсиям соответствующих признаков. Основным достоинством разложения Карунена-Лоэва является наличие ряда свойств оптимальности рассчитываемых признаков. А именно: - концентрация мощности (дисперсии) в минимально возможном числе признаков; - минимальная среднеквадратичная погрешность восстановления исходного изображения при заданном числе признаков; - некоррелированность, а в случае нормального распределения яркости исходного изображения и независимость, рассчитываемых признаков.
Отмеченные свойства позволяют решить задачу выбора минимального набора признаков при заданной погрешности распознавания/классификации [25].
Главным недостатком признаков Карунена-Лоэва является отсутствие быстрых алгоритмов их формирования. Кроме того, для получения оптимальных результатов необходимо точное знание корреляционной функции исходного изображения. Определенную сложность представляет также проблема нахождения собственных векторов и собственных значений корреляционных матриц больших размеров. Так при размерах исходного изображения Ntx N2 в общем случае необходимо решать проблему собственных значений для матрицы размером N±N2 х ВД [24]; 2) фуръе-преобразование (Фурье-признаки изображения) имеет вид W{nltn2tm2tm2) = е n Ni Nz \ (1.14) Данное преобразование позволяет получить спектр изображения, характеризующий его на различных пространственных частотах. К достоинствам Фурье-признаков относятся существование быстрых алгоритмов их формирования - БПФ, полноту описания изображения (преобразование обратимо), помехоустойчивость. К недостаткам - отсутствие инвариантности к целому ряду геометрических преобразований, в том числе к преобразованиям подобия; 3) косинусное преобразование [26] имеет вид W(nlln2lm1,m2) = 8(m2-n1cos(m1)-nzsin(miy). (1.15) Суть преобразования - перевести линейные объекты, присутствующие на изображении f(nltn{), в точечные объекты в пространстве признаков - в образ д(т1)т2). Действительно, для непрерывного аналога преобразования линия, задаваемая в координатах входного изображения (xlt х2) уравнением 2 = ! costfj + х2 sintfi) (і Л 6) перейдет в точку (fi,f2) на изображении образа. При этом параметры и f2 играют роль угла наклона прямой и расстояния от начала координат (f2), как показано на рисунке 1.8.
Оценка эффективности применения алгоритмов машинного зрения в системе видеонаблюдения
Люди различаются не только по цвету кожи, но и по цвету волос, глаз и зубов. Цвета волос образуют непрерывный ряд от белого через желтый, оранжевый, красный и коричневый к черному. Волосы отличаются не только по цвету, но и по структуре и по блеску. Окраска волос обеспечивается наличием одного или двух пигментов. Белые волосы имеют такой цвет вследствие того, что в них практически отсутствуют пигменты, а содержатся лишь бесцветные диффузно рассеивающие свет вещества. Цвет черных волос объясняется наличием большого количества пигмента при наличии гладкой блестящей поверхности. Волосы, которые кажутся черными, часто в проходящем свете оказываются красными.
Цвет глаз объясняется наличием или отсутствием только одного селективного поглощающего пигмента, а также различного количества единственный цвет, который виден, является голубым рассеянным светом. В зависимости от расы и степени пигментации цвет остальной поверхности кожи меняется от красного до желто-оранжевого, желтого, или коричневого. Ввиду наличия внешней диффузно отражающей поверхности с находящимся под ней голубым рассеивающим слоем и желтым пигментом видимый цвет кожи сильно зависит от размера, формы и положения источника света. Как правило, сильный параллельный пучок света глубоко проникает в кожу. Кожа при этом кажется прозрачной. Однако, если свет идет от большого диффузного источника, такой эффект почти пропадает. При жирной коже внешняя диффузная поверхность заменяется гладкой отражающей поверхностью, не добавляющей белого света, вследствие чего цвет становится значительно более насыщенным. По мере того как человек стареет, кожа становится все менее прозрачной и свет под внешним слоем кожи все больше рассеивается. Если это учитывать, становится ясным, что термин «цвет тела» относится к широкой области цветов и включает в себя представление о том, как эти цвета переходят один в другой.
Люди различаются не только по цвету кожи, но и по цвету волос, глаз и зубов. Цвета волос образуют непрерывный ряд от белого через желтый, оранжевый, красный и коричневый к черному. Волосы отличаются не только по цвету, но и по структуре и по блеску. Окраска волос обеспечивается наличием одного или двух пигментов. Белые волосы имеют такой цвет вследствие того, что в них практически отсутствуют пигменты, а содержатся лишь бесцветные диффузно рассеивающие свет вещества. Цвет черных волос объясняется наличием большого количества пигмента при наличии гладкой блестящей поверхности. Волосы, которые кажутся черными, часто в проходящем свете оказываются красными.
Цвет глаз объясняется наличием или отсутствием только одного селективного поглощающего пигмента, а также различного количества рассеянного голубого света. Этот пигмент имеет коричневый цвет. Рассеянный свет появляется вследствие неоднородности структуры. Ряд цветов от светло-голубого до серого образуется за счет различия в количестве рассеянного света при отсутствии пигмента. Все другие цвета получаются при различном количестве коричневого пигмента и разном соотношении рассеянного голубого света. Ввиду того что рассеянный свет играет важную роль, цвет некоторых глаз заметно меняется при изменении условий освещения, в особенности цвет серо-зеленых глаз.
У редко встречающихся альбиносов, у которых пигменты отсутствуют, глаза иногда кажутся розовыми благодаря красному свету, отраженному кровеносными сосудами внутри глаз. Подобный темно-красный цвет может быть иногда виден в глазах всех людей, если свет проникает через зрачок таким образом, что становится виден внутренний красный слой глазного яблока. У одних людей это заметить легче, у других - труднее. Такое различие может быть вызвано разницей в отражении света внутренней поверхностью глаза.
Цвет зубов может меняться в более широком диапазоне, чем обычно полагают. Он меняется от темно-желтого через белый до голубовато-белого.
Одним из наиболее простых способов отнесения пикселя к тому или иному классу по цветовому признаку, является использование гистограммы и пороговых значений [58]. В простейшем случае выбирается одно пороговое значение S. Все пиксели с яркостью больше, или равной S становятся пикселями переднего плана, а остальные - фоновыми. Эта операция называется верхней пороговой бинаризацией. Так же возможна нижняя пороговая бинаризация. На практике чаще применяется операция пороговой бинаризации по диапазону, когда указывается два пороговых значения — верхнее S] и нижнее So. Пиксели с цветом находящимся в диапазоне между пороговыми значениями выбираются в качестве пикселей переднего плана [59]. Определить пороги можно на основании гистограммы изображения, содержащего пиксели, относящиеся только к искомому классу (рисунок 2.2).
Выбор оптимальных признаков, формирующих алфавит скрытой марковской модели
СММ - статистическая модель, имитирующая работу процесса, похожего на Марковский процесс с неизвестными параметрами, позволяющая выявить неизвестные параметры на основе наблюдаемых. Основное применение СММ получили в области распознавания речи, рукописного текста и биоинформатике. СММ [45] могут применяться для определения прошлого или будущего события в последовательности событий. Более того можно получить ответ на вопрос какова вероятность наблюдения последовательности событий, учитывая взаимосвязь предшествующих наблюдений.
Для определения СММ необходимо задать следующие элементы [45]: - общее количество состояний в модели - N Несмотря на то, что состояния в СММ являются скрытыми, во многих случаях есть соответствие между состоянием модели и реальным состоянием процесса. Для обозначения множества состояний модели используется запись 5 = {SltS2, ...,Sn}, а состояние модели в момент времени t обозначается qt; — количество различных символов наблюдения М, которые могут порождаться моделью, т.е. размер дискретного алфавита. Символы наблюдения соответствуют физическому выходу моделируемой системы. Алфавит наблюдаемой последовательности обозначается как V = {v1,v2,...,vM}; (3.1) - распределение вероятностей переходов между состояниями (матрица переходных вероятностей) A = {aij}, (3.2) где aij=P[qt+1=Sj\q,=Sh 1 і, j N, то есть это вероятность того, что система, находящаяся в состоянии 5/ перейдет в состояние S/, - распределение вероятностей появления символов наблюдения в состоянии/ B = {bj(k)}, (3.3) где b/k)=P{ik\qt=Sj}, 1 j N, \ к М. bj(k) - вероятность того, что в момент времени t, система, находящаяся в /-ом состоянии выдаст к-ът символ в наблюдаемую последовательность; - начальное распределение вероятностей состояний: 7І = {ТГІ}, (3.4) где 7ri=P[q1=Sl], 1 і N, то есть вероятность того, что St - это начальное состояние модели.
В общем случае каждое состояние модели может быть достигнуто за один шаг из любого другого состояния. Такая модель называется эргодической. Каждая переходная вероятность ау эргодической СММ строго положительна. На практике, моделируемый сигнал может не отвечать данному требованию. За годы использования СММ в системах распознавания было разработано множество топологий и конфигураций, в результате чего встает вопрос выбора оптимальной структуры СММ применительно к задаче установления личности человека по изображению его лица. Оценим возможность применения «лево-правой» и псевдодвумерной моделей в задаче распознавания изображения [78].
Последовательность состояний в «лево-правой» модели обладает тем свойством, что с увеличением времени индекс состояния также увеличивается, или остается неизменным, иными словами, состояния переходят из одного в другое слева направо [47].
Глядя на лицо человека, можно выделить ряд вертикальных областей: волосы, лоб, брови, глаза, нос, рот и подбородок (рисунок 3.3). При этом области следуют строго друг за другом, пропуск или изменение порядка следования областей, если человек не обладает ярко выраженными физическими отклонениями, невозможно. В роли начальной области всегда выступают «волосы», в роле конечной - «подбородок». На основании сказанного можно заключить, что «лево-правая» модель хорошо согласуется с задачей описания структуры лица.
Поскольку в «лево-правой» модели не разрешены переходы в состояния, индекс которых меньше индекса текущего состояния, основное свойство всех «лево-правых» СММ выражается через значения переходных вероятностей следующим образом: аи = О, j L (3.5) Кроме того, поскольку последовательность состояний должна начинаться в состоянии 1, а заканчиваться в состоянии N, начальное распределение вероятностей состояний обладает свойством rO, і 1 . щ -{lt i = r (3.6) Для того чтобы избежать значительных скачков в индексах состояний при использовании «лево-правых» моделей на переходные вероятности, как правило, налагаются дополнительные ограничения, вида ац = 0, j і + Д. (3.7) Переходные вероятности для последнего состояния «лево-правой» модели определяются следующим образом: (3.8) aNi = О, і N. Таким образом, «лево-правая» модель хорошо согласуется с задачей распознавания человеческого лица. Обработка изображения в системах распознавания производится слева-направо, сверху-вниз, что гарантирует переход только между соседними состояниями [79]. Волосы Лоб Брови Глаза Нос Рот Подбородок
Пример разбиения лица на семь последовательных частей Произведем оценку производительности и качества работы двух «лево-правых» моделей, отличающихся количеством состояний. Первая модель будет содержать семь состояний: «волосы», «лоб», «брови», «глаза», «нос», «рот», «подбородок». Во второй модели область бровей будет объединена с областью глаз, а область рта с областью подбородка, это дает возможность получить начальные значения СММ путем разбиения изображения на пять равных частей (рисунок 3.4). Волосы
Эксперименты показали, что модель с семью состояниями показывает лучший результат по сравнению с моделью, состоящей из пяти состояний, но только для изображений, полученных в стационарных условиях, так как она более чувствительна к поворотам изображения и перспективным искажениям, связанным со спецификой установки камер, применяемых в системах видеонаблюдения. Учитывая этот факт, а также то, что обработка модели содержащей только пять состояний, требует меньше времени, в дальнейшем будем
Требования к аппаратно-программной платформе
Система MATLAB разрабатывалась достаточное время и в первую очередь ориентирована на удобное и эффективное использование, а не на высокую производительность. Этим объясняются многие принятые при создании MATLAB решения. Язык MATLAB является интерпретируемым, а не компилируемым языком. С одной стороны, это позволяет производить вычисления и сразу анализировать получаемые результаты. С другой стороны, это заметно снижает производительность системы [88].
Для того, что бы оценить возможный прирост производительности от использования одного из распространенных языков программирования высокого уровня проведем несколько простых экспериментов. В процессе установления личности основной задачей является обработка множества матриц большого размера. Используем данный факт для формирования набора тестовых программ [89, 90]: - во-первых, оценим скорость обращения к данным. Для этого объявим матрицу размером 5000x5000x3, присвоим ее элементам случайные значения, после чего оценим скорость переприсвоения элементов, производимого следующим образом:
При реализации вычислений на языке Python применялась библиотека NumPy добавляющая поддержку больших многомерных массивов и матриц, вместе с большой библиотекой высокоуровневых математических функций для операций с этими массивами. NumPy пытается решить эту проблему для большого количества вычислительных алгоритмов, обеспечивая поддержку многомерных массивов и множество функций и операторов для работы с ними. Поскольку Python - интерпретируемый язык, математические алгоритмы работают в нём гораздо медленнее, чем в таких языках, как С и Java. NumPy решает эту проблему для большого количества вычислительных алгоритмов, обеспечивая поддержку многомерных массивов и множество функций и операторов для работы с ними. Таким образом, любой алгоритм, который может быть выражен в основном как последовательность операций над массивами и матрицами, работает так же быстро, как эквивалентный код, выполняемый в MATLAB, что наглядно демонстрируют результаты третьего эксперимента. Таким образом, связку Python и NumPy можно рассматривать как хорошую свободную альтернативу MATLAB. Внутренне как MATLAB, так и NumPy основаны на библиотеке LAPACK, предназначенной для решения основных задач линейной алгебры [91].
Анализируя полученные результаты, можно сделать вывод о том, что для повышения быстродействия системы, наиболее целесообразно выполнить переход от использования MATLAB к использованию компилируемого языка высокого уровня С или C++. В рамках проведенной работы была выполнена реализация подпрограммы сегментации на языке С с применением библиотеки компьютерного зрения OpenCV. С — стандартизированный процедурный язык программирования, характеризуемый высокой эффективностью. Он является самым популярным языком для создания системного программного обеспечения. Его также часто используют для создания прикладных программ. Для языка С характерны лаконичность, стандартный набор конструкций управления потоком выполнения, структур данных и обширный набор операций [92].
OpenCV (Open Computer Vision) - библиотека компьютерного зрения с открытым исходным кодом, предоставляющая набор типов данных и численных алгоритмов для обработки изображений алгоритмами компьютерного зрения. Библиотека OpenCV написана на языке высокого уровня (C/C++) и содержит алгоритмы для: интерпретации изображений, калибровки камеры по эталону, устранения оптических искажений, анализа перемещения объекта и т.д. [93].
В результате, благодаря использованию компилируемого языка С, прирост быстродействия подсистемы сегментации изображения составил порядка 36%. Достичь еще большего увеличения производительности возможно в случае аппаратной реализации алгоритма сегментации на базе ПЛИС [94]. Так как предложенный алгоритм сегментации позволяет производить одновременную обработку всех пикселей изображения, зная разрешающую способность применяемой камеры, возможно создание устройства, которое всего за несколько микросекунд сформирует резльтирующее изображение. Таким образом можно будет достичь минимально возможной задержки изображения в системе распознавания.
Далее приводятся экранные формы разработанного программного средства. На рисунке 4.4 приведено изображения главного окна с открытой фотографией группы детей. Программа позволяет просматривать изображение в поканальном режиме для цветового пространства RGB и разработанного специализированного цветового пространства (рисунок 4.5). Реализована возможность построения гистограммы изображения (рисунок 4.6). Доступны функции выделения областей по цветовому признаку (рисунок 4.7) и анализа