Введение к работе
Актуальность работы.
Современный уровень информатизации, кибернетики и роботостроения требует целенаправленного развития систем компьютерного зрения как одного из важных механизмов обеспечения эффективного взаимодействия техники с человеком. Одним из важнейших направлений компьютерного зрения является задача автоматизированного распознавания образов. Успешное решение задачи необходимо для разработки и производства систем, способных интеллектуально оценивать внешнюю среду и выполнять в ней те или иные действия.
Задача распознавания образов имеет общий характер. Во-первых, потому что распознаваемый объект может иметь различную природу: человек, животное, машина, механизм, строение и т.д. Во-вторых, потому что область применения этой задачи весьма обширна: военное дело, кибернетика, работа спецслужб, автоматизированная обработка информации и т.д. И, в-третьих, потому что у человека алгоритм распознавания объектов универсален и основан на сравнении воспринимаемого объекта с образами, извлекаемыми из памяти.
В рамках настоящей работы разрабатываются методы и модели автоматизированного распознавания образов исследуемые в частной задаче: распознавание лиц людей для их идентификации. Методы и модели проверяются на двух различных задачах: распознавание лиц и распознавание промышленных изделий. В силу общности задачи распознавания образов для распознавания лиц не исследуется структура образа. А производится попарное сравнение образа с набором шаблонов (эталонов) в рамках предлагаемой неадаптивной модели при помощи специализированных методов. Разрабатываемые алгоритмы и методы носят общий характер. И могут применяться для распознавания широкого круга объектов.
В связи с актуальностью проблемы в настоящее время ВлГУ по заказу Федерального агентства по науке и инновациям проводит исследования в рамках опытно-конструкторской работы по теме «Разработка технических средств распознавания образов по анализу видеоизображения для автоматизации работы оператора» (Государственный контракт №02.524.11.4010). Разрабатывается опытный образец и технологическая документация для промышленного производства программно-аппаратного комплекса обнаружения, слежения и распознавания людей.
Одной из ключевых подсистем комплекса является подсистема распознавания образов, успешное алгоритмическое решение которой является необходимым условием для целесообразности и возможности производства комплекса.
Важным условием Федерального агентства является требование успешности распознавания при наличии в системе только по одной фотографии-эталону для каждого разыскиваемого человека. Таким образом, комплекс должен работать в условиях ограниченного количества информации в рамках
проблемы одного эталонного изображения. Это требование вполне согласуется с архитектурой предлагаемой модели, использующей принципы попарного сравнения
Цель работы заключается в разработке математических моделей, алгоритмов и методов для повышения достоверности распознавания образов в условиях ограниченного количества информации (при наличии в системе только одного эталона для каждого распознаваемого образа). Конечным результатом работы является алгоритмическая база для производства систем распознавания.
Методы исследования
Достоверность полученных в работе результатов обеспечивается применением методов системного анализа, теории распознавания образов, теории множеств, теории алгоритмов, теории вероятности, математической статистики и подтверждены результатами экспериментов, проведенных с помощью специально созданного программного обеспечения.
Научная новизна
Научную новизну работы определяют следующие положения: 1. Предложена модель системы распознавания образов, позволяющая совместно использовать несколько методов распознавания различного типа. Главными особенностями системы являются:
Система является неадаптивной. Она не адаптирована для распознавания какого-то конкретного типа объектов. И может применяться для распознавания различных образов.
Система распознавания имеет модульную структуру. Что позволяет расширять или улучшать систему путем добавления, исключения или замены подсистем верхнего уровня.
Взаимодействие подсистем верхнего уровня основано на сотрудничестве: система принимает решение о наличии распознаваемого образа в эталонной базе, если хотя бы одна из подсистем определила такое соответствие.
Взаимодействие подсистем нижнего уровня основано на конкуренции. Для принятия подсистемой верхнего уровня решения о наличии в базе распознаваемого образа необходимо чтобы все подсистемы нижнего уровня, входящие в нее, определили ближайшим соседом одинаковое эталонное изображение.
В качестве подсистем нижнего уровня может использоваться любой алгоритм, использующий принцип ближайшего соседа и реализующий попарное сравнение распознаваемого изображения с эталонными.
Система может использовать большое количество разнообразных алгоритмов, что позволяет исследовать изображения различными методами. И таким образом более полно использовать ограниченную информацию, содержащуюся в одном изображении.
2. Предложен метод каскадного применения процедур преобразования рас
познаваемого изображения по схеме: построение производной карты -
сканирование волновым пакетом. Метод позволяет:
использовать для распознавания различные производные карты исходного изображения;
уменьшить количество хранимых в системе данных и как следствие ускорить поиск в них.
3. Предложен алгоритм распознавания, использующий порядковые гисто
граммы. Алгоритм учитывает мелкотекстурные особенности изображения
распознаваемого объекта. И может использоваться для правильного рас
познавания образов, отличающихся по ракурсу от имеющихся в системе.
Практическая ценность, реализация и внедрение результатов
Разработанные в настоящей работе алгоритмы и методы повышают достоверность распознавания образов в условиях ограниченного количества информации и могут использоваться в качестве алгоритмической базы для производства систем распознавания объектов.
Разработанные в диссертации принципы, алгоритмы, математические модели и программные средства легли в основу подсистемы распознавания в рамках выполнения госбюджетной опытно-конструкторской работы «2009-04-2.4-15-03» по теме: «Разработка технических средств распознавания образов по анализу видеоизображения для автоматизации работы оператора».
Разработанная система реализована и успешно функционирует на опытном образце комплекса. Это обстоятельство делает целесообразным и возможным промышленное производство данного комплекса.
Головной исполнитель ОКР Владимирский государственный университет имени Александра Григорьевича и Николая Григорьевича Столетовых признал эффективность разработанной системы распознавания для серийного производства комплекса.
Комплекс демонстрировался на международном салоне «Комплексная безопасность 2011» во Всероссийском выставочном центре. Его эффективность была отмечена дипломом салона и медалью ВВЦ.
Соисполнитель ОКР, Федеральное казенное предприятие "Государственный лазерный полигон "Радуга" предоставил заключение о целесообразности применения системы распознавания, разработанной в настоящей работе, для использования ее в составе разрабатываемого комплекса.
Институт проблем лазерных и информационных технологий РАН (ИП-ЛИТ РАН) предоставил заключение о возможности применения разработанной системы в промышленном производстве комплексов распознавания.
Апробация работы
Основные результаты работы докладывались на следующих научно-технических и научно-практических конференциях:
XVII Всероссийская научно-методическая конференция «Телематика-
2010», Санкт-Петербург, 21-24 июня 2010 г.
II Международная научно-практическая конференция «Прогрессивные технологии и перспективы развития», Тамбов, 5 ноября 2010 г.
Международная научная конференция «Технические науки: проблемы и перспективы», Санкт-Петербург, март 2011 г.
Международный салон «Комплексная безопасность 2011», Москва, ВВЦ, 17-20 мая 2011 г.
Семинар кафедры Информационных систем Муромского института ГОУ ВПО «Владимирский государственный университет имени Александра Григорьевича и Николая Григорьевича Столетовых», Муром, 24 мая 2011 г.
На защиту выносятся следующие положения:
Система распознавания образов, позволяющая совместно использовать несколько алгоритмов распознавания различного типа.
Набор алгоритмов, обеспечивающих работоспособность, предложенной системы.
Результаты экспериментов по распознаванию лиц предложенной системой.
Публикации
Основные результаты работы представлены в 9 публикациях, в том числе в 3 статьях журналов из перечня ВАК и одной монографии, а также в научно-технических отчетах ОКР, выполненных по заданию Федерального агентства по науке и инновациям.
Объем и структура диссертации