Электронная библиотека диссертаций и авторефератов России
dslib.net
Библиотека диссертаций
Навигация
Каталог диссертаций России
Англоязычные диссертации
Диссертации бесплатно
Предстоящие защиты
Рецензии на автореферат
Отчисления авторам
Мой кабинет
Заказы: забрать, оплатить
Мой личный счет
Мой профиль
Мой авторский профиль
Подписки на рассылки



расширенный поиск

Сопровождение и распознавание объектов на телевизионных изображениях Ганин, Александр Николаевич

Диссертация, - 480 руб., доставка 1-3 часа, с 10-19 (Московское время), кроме воскресенья

Автореферат - бесплатно, доставка 10 минут, круглосуточно, без выходных и праздников

Ганин, Александр Николаевич. Сопровождение и распознавание объектов на телевизионных изображениях : диссертация ... кандидата технических наук : 05.12.04 / Ганин Александр Николаевич; [Место защиты: Моск. гос. техн. ун-т радиотехники, электроники и автоматики].- Ярославль, 2013.- 149 с.: ил. РГБ ОД, 61 13-5/1628

Введение к работе

Актуальность темы. Миллиарды камер охранного телевидения - неотъемлемая часть современного цивилизованного мира. Изображения сменяют друг друга на мониторах, многочисленные операторы обеспечивают безопасность в аэропортах, на вокзалах и в других общественных местах. Видеонаблюдение сегодня считается едва ли не самым главным техническим инструментом обеспечения безопасности. Важнейшую роль в современных системах охранного телевидения играют алгоритмы цифровой обработки изображений и компьютерного зрения, позволяющие контролировать тысячи видеоканалов в режиме реального времени.

Для построения современных систем охранного телевидения характерны следующие основные проблемы и задачи:

обнаружение объекта интереса на сложном изменяющемся фоне;

измерение пространственных параметров и оценка динамических параметров объектов по наборам последовательных кадров;

сопровождение объектов;

классификация и распознавание динамических объектов.

Среди объектов для распознавания и классификации наиболее развитой и актуальной задачей является детектирование и классификация человеческих лиц. В настоящее время эта задача находит применение в различных сферах человеческой деятельности (в первую очередь, в системах безопасности). Сферами применения распознавания лиц являются, например, системы охранного телевидения, сравнение фотографий на паспортах или водительских удостоверениях, контроль доступа к безопасным компьютерным сетям и оборудованию в учреждениях, наблюдение за аэропортами и вокзалами для предотвращения террористических актов и др. В большинстве практических ситуаций анализ входного изображения должен осуществляться в режиме реального времени. Современные алгоритмы позволяют детектировать лицо человека на реальных видеоизображениях со сложным фоном с вероятностью, превышающей 90%. Среди них самым известным является алгоритм на основе бустинга, предложенный P. Viola и M. Jones в 2001 г.

Целью задачи сопровождения (трекинга) является установление соответствия между различными объектами или частями в последовательности кадров и нахождение траекторий объектов, а также вычисление их динамических характеристик, таких как скорость и направление движения. Сопровождение объектов в большинстве практических приложений требуется осуществлять также в режиме реального времени.

Одним из важнейших направлений компьютерного зрения является задача автоматизированного распознавания объектов. Успешное решение этой задачи необходимо для разработки и производства систем, способных интеллектуально оценивать внешнюю среду и выполнять в ней те или иные действия. Однако в реальных системах охранного телевидения задачу распознавания объектов приходится решать в условиях наличия искажений, связанных с помехами в радиотехнических устройствах и сжатием двумерного сигнала. Поэтому для эффективного решения поставленной задачи требуется применение специализированных алгоритмов цифровой обработки изображений. Среди них можно выделить нелинейные алгоритмы фильтрации и восстановления изображений, вейвлет-обработку, системы, построенные на нечеткой логике, генетических алгоритмах, нейронных сетях.

В области разработки алгоритмов цифровой обработки телевизионных изображений внесли вклад как отечественные ученые - Ю.Б. Зубарев, М.И. Кривошеев, В.П. Дворкович, А.В. Дворкович, М.К. Чобану, А.С. Крылов, Ю.С. Бехтин, Ю.С. Радченко, А.Л. Приоров, так и зарубежные - R. Gonzalez, R. Woods, А. Bovik, Y. Neuvo, J. Astola, К. Egiazaryan, М. Nikolova.

Первые работы по распознаванию динамических объектов были опубликованы еще в конце 1980-х гг. Следует отметить особый вклад советских и российских ученых, занимающихся в данной области, таких как Ю.И. Журавлев, Ю.В. Гуляев, В.А. Сойфер, А.И. Галушкин, В.Н. Вапник, Н.Г. Загоруйко,

    1. А. Потапов. В области анализа-синтеза алгоритмов сопровождения объектов и оценки параметров их движения на видеоизображениях выделяются работы Б.А. Алпатова, П.В. Бабаяна, М.Н. Фаворской, Ю.В. Визильтера, Е.В. Медведевой,

    2. Lucas, Т. ^nade.

    На сегодняшний день достигнуты значительные успехи при построении систем видеоаналитики, систем аутентификации личности по изображениям. Однако существуют нерешенные проблемы при распознавании динамических образов из-за сложности и многообразия поведения объектов реального мира. Существует класс задач, где особую важность приобретает информация о структуре и движении объектов сцены (видеонаблюдение в закрытых помещениях, в местах большого скопления людей, управление движением робототехнических комплексов, наблюдение за движением транспортных средств и т.д.).

    Так, например, для задач сопровождения объектов на современном этапе развития представляет интерес обработка следующих практических ситуаций:

    изменение изображения или освещенности сцены;

    наличие шума камеры;

    присутствие объектов, изменяющих свою форму;

    временное исчезновение объектов интереса, возникающее из-за перекрытия их другими объектами;

    наличие нескольких одновременно движущихся объектов с близкими характерными признаками и пересекающимися траекториями.

    Для задач распознавания объектов актуальным остается поиск алгоритмов, работающих в режиме реального времени и позволяющих идентифицировать объект в условиях наличия помех на телевизионных изображениях. Поэтому на современном этапе развития науки и техники разработка и анализ алгоритмов сопровождения и распознавания объектов на телевизионных изображениях представляют собой актуальную задачу.

    Основной целью работы является разработка, усовершенствование и исследование новых алгоритмов сопровождения и распознавания объектов на видеоизображениях в условиях наличия искажений и помех, обусловленных практическими требованиями для функционирования систем охранного телевидения.

    Объектом исследования являются алгоритмы сопровождения и распознавания объектов, применяемые в радиотехнических системах обработки и анализа изображений и современных системах телевидения.

    Предметом исследования являются модификация и разработка алгоритмов, с целью повышения эффективности функционирования видеоинформационных систем охранного телевидения.

    Задачи диссертационной работы:

    разработка алгоритмов сопровождения объектов на телевизионных изображениях в условиях наличия специфических искажений и помех;

    разработка методики объективного сравнения различных алгоритмов сопровождения объектов по видеоданным;

    разработка комбинированного алгоритма обработки изображения, зашумленного белым гауссовским шумом, сочетающего нелинейную фильтрацию на основе адаптивного дискретного косинусного преобразования и алгоритм распознавания лиц;

    усовершенствование работы алгоритма распознавания объектов на основе локальных бинарных паттернов с использованием дополнительной информации о цвете объекта.

    Методы исследования. При решении поставленных задач использовались современные методы цифровой обработки изображений, компьютерного зрения, распознавания образов, математического анализа, теории вероятностей и математической статистики. Для практической реализации алгоритмов применялись современные численные методы и методы объектно-ориентированного программирования на языке С#.

    Научная новизна полученных результатов

    В рамках данной работы получены следующие новые научные результаты:

    разработаны новые алгоритмы сопровождения объектов на видеоданных, показывающие свою эффективность в условиях наличия искажений и помех;

    разработан комбинированный алгоритм обработки телевизионного изображения, зашумленного аддитивным белым гауссовским шумом, на основе нового алгоритма нелинейной фильтрации и алгоритма распознавания лиц;

    разработана модификация алгоритма распознавания объектов на телевизионных изображениях на основе локальных бинарных паттернов с использованием дополнительной информации о цвете.

    Практическая значимость полученных результатов

    Разработана методика объективного сравнения различных алгоритмов сопровождения объектов по видеоданным.

    Проведен анализ работы алгоритмов сопровождения объектов на видеоданных при наличии искажающих факторов и предложены модификации, позволившие повысить уровень сопровождения в среднем на 5-10%.

    Разработаны модификации алгоритма распознавания лиц путем использования информации о цвете и предварительной нелинейной цифровой фильтрации, позволившие увеличить результат верного распознавания на

    10-20% в условиях наличия искажений, связанных с помехами в радиотехнических устройствах и сжатием двумерного сигнала.

    4. Разработан критерий качества функционирования систем определения числа объектов на видеоданных для решения ряда практических задач в области современных систем охранного телевидения.

    Разработанные методы и алгоритмы требуют для их практической реализации относительно небольших вычислительных ресурсов, что позволяет использовать их для обработки телевизионных изображений в системах реального масштаба времени.

    Результаты работы внедрены в соответствующие разработки ООО «А-ВИЖН», г. Ярославль, ООО «ЛВЛ Инжиниринг», Московская обл. Отдельные результаты диссертационной работы внедрены в учебный процесс ЯрГУ им. П.Г. Демидова в рамках дисциплин «Цифровая обработка изображений», «Компьютерное зрение», а также в научно-исследовательские работы при выполнении исследований в рамках гранта РФФИ №10-08-01186. Получено свидетельство на программный продукт, зарегистрированное в Реестре программ для ЭВМ.

    Достоверность полученных научных результатов обусловлена применением адекватного математического аппарата, подтверждается их согласованностью с результатами проведенного компьютерного моделирования и сопоставлением полученных результатов с научными данными, известными из российской и зарубежной литературы.

    Апробация работы. Результаты работы докладывались и обсуждались на следующих научно-технических конференциях и семинарах:

    1st IEEE International Conference on Circuits and Systems for Communications (ICCSC'02), Sankt Petersburg, 2002.

    4-я, 13-15-я международные конференции «Цифровая обработка сигналов и ее применение», Москва, 2002, 2011-2013.

    67-я научная сессия, посвященная Дню радио, Москва, 2012.

    18-я международная научно-техническая конференция «Радиоэлектроника, электротехника и энергетика», Москва, 2012.

    14-я всероссийская научно-техническая конференция «Нейроинформатика», Москва, 2012.

    10-я всероссийская научная конференция «Нейрокомпьютеры и их применение», Москва, 2012.

    2-я всероссийская научная конференция молодых ученых с международным участием, Рыбинск, 2012.

    International MultiConference of Engineers and Computer Scientists (imaging engineering section), Hong Kong, 2013.

    Публикации. По теме диссертации опубликовано 22 научные работы, из них 2 статьи в журналах, рекомендованных ВАК, учебное пособие, 17 докладов на научных конференциях, свидетельство о регистрации программы для ЭВМ.

    Структура и объем работы. Диссертация состоит из введения, четырех разделов, заключения, списка использованных источников, содержащего 96 наименований. Она изложена на 149 страницах машинописного текста, содержит 62 рисунка и 5 таблиц.

    Похожие диссертации на Сопровождение и распознавание объектов на телевизионных изображениях