Электронная библиотека диссертаций и авторефератов России
dslib.net
Библиотека диссертаций
Навигация
Каталог диссертаций России
Англоязычные диссертации
Диссертации бесплатно
Предстоящие защиты
Рецензии на автореферат
Отчисления авторам
Мой кабинет
Заказы: забрать, оплатить
Мой личный счет
Мой профиль
Мой авторский профиль
Подписки на рассылки



расширенный поиск

Разработка и анализ алгоритмов детектирования и классификации объектов на основе методов машинного обучения Голубев, Максим Николаевич

Диссертация, - 480 руб., доставка 1-3 часа, с 10-19 (Московское время), кроме воскресенья

Автореферат - бесплатно, доставка 10 минут, круглосуточно, без выходных и праздников

Голубев, Максим Николаевич. Разработка и анализ алгоритмов детектирования и классификации объектов на основе методов машинного обучения : диссертация ... кандидата технических наук : 05.12.04 / Голубев Максим Николаевич; [Место защиты: Владимир. гос. ун-т им. Александра Григорьевича и Николая Григорьевича Столетовых].- Ярославль, 2012.- 211 с.: ил. РГБ ОД, 61 12-5/2866

Введение к работе

Актуальность темы. Современный уровень научно-технического развития требует целенаправленного развития систем компьютерного зрения как одного из важных механизмов обеспечения эффективного взаимодействия техники с человеком. Одним из важнейших направлений компьютерного зрения является задача автоматизированного распознавания образов. Успешное решение задачи необходимо для разработки и производства систем, способных интеллектуально оценивать внешнюю среду и выполнять в ней те или иные действия.

Однако в реальных системах задачу распознавания объектов приходится решать в условиях наличия искажений, связанных с помехами в радиотехнических устройствах и сжатием двумерного сигнала. Поэтому для эффективного решения поставленной задачи требуется применение специализированных алгоритмов цифровой обработки изображений (ЦОИ), которая широко используется в системах телекоммуникаций, радио- и гидролокации, сейсмологии, робототехнике, радиоастрономии, медицине.

В настоящее время для устройств цифровой обработки изображений, характерно постоянное возрастание объема обрабатываемой информации, повышение требований к качеству обработки, работа в сложной сигнально-помеховой обстановке. Все это стимулирует появление новых методов и более сложных алгоритмов, используемых в системах ЦОИ. Среди них можно выделить нелинейные алгоритмы фильтрации и восстановления изображений, вейвлет-обработку, системы, построенные на нечеткой логике, генетических алгоритмах, нейронных сетях. Однако влияние таких алгоритмов на решение последующей задачи распознавания объектов на изображении изучено на сегодняшнем этапе развития данной области весьма слабо.

Основополагающие работы в области теории распознавания и классификации связаны с именами таких известных зарубежных ученых, как Нейман Дж., Пирсон К., Вальд А., Розенблат Ф. и др. Большой вклад в развитие теории распознавания и классификации внесли советские и, в последующем, российские ученые: Айзерман М.А., Браверман Э.М., Розоноэр Л.И. (метод потенциальных функций), Вапник В.Н., Червоненкис А.Я. (статистическая теория распознавания, метод «обобщенный портрет»), Ивахненко А.Г. (метод группового учета аргументов), Журавлев Ю.И., Галушкин А.И.

Среди объектов для распознавания и классификации наиболее развитой и актуальной задачей является детектирование и классификация человеческих лиц. В настоящее время эта задача находит применение в различных сферах человеческой деятельности (в первую очередь, в системах безопасности). Сферами применения распознавания лиц являются, например, системы охранного телевидения, сравнение фотографий на паспортах или водительских удостоверениях, контроль доступа к безопасным компьютерным сетям и оборудованию в учреждениях, верификация пользователя при проведении финансовых транзакций, наблюдение за аэропортами и вокзалами для предотвращения террористических актов и многие другие. Во всех этих приложениях требуется корректно устанавливать личность, как по отдельному статическому изображению лица, так и на видеопоследовательности. В большинстве

практических ситуаций анализ входного изображения должен осуществляться в режиме реального времени.

Для построения полностью автоматизированных технических систем для распознавания лиц, которые будут анализировать информацию, содержащуюся в изображении лица, требуются робастные и эффективные алгоритмы выделения лиц, учитывающие наличие возможных помех и искажений. Это очень сложная задача, поскольку лицо является неоднородным объектом и обладает высокой степенью изменчивости размера, формы, цвета и текстуры. Поскольку большинство изображений, с которыми работают такие системы, являются цветными, то задача детектирования на таких изображениях может быть решена более уверенно, если использовать информацию из всех цветовых каналов. Кроме того, для увеличения надежности процесса распознавания может быть использована такая дополнительная информация, как возраст, пол, расовая принадлежность, выражение лица.

Основной целью работы является разработка и исследование новых алгоритмов детектирования и классификации объектов на полутоновых и цветных изображениях в условиях наличия искажений, связанных с помехами в радиотехнических устройствах.

Для достижения указанной цели в диссертационной работе решаются следующие задачи:

разработка алгоритмов детектирования лиц на полутоновых изображениях в условиях сложной сигнально-помеховой обстановки;

усовершенствование работы алгоритмов детектирования лиц с использованием информации о цвете;

разработка новых алгоритмов тендерной классификации по цифровому изображению лица для решения ряда практических задач в области современных систем телевидения.

Объектом исследования являются алгоритмы детектирования и классификации объектов, применяемые в радиотехнических системах распознавания изображений и современных системах телевидения.

Предметом исследования являются модификация, оптимизация и разработка алгоритмов на основе методов машинного обучения с целью эффективного решения задач распознавания.

Методы исследования. При решении поставленных задач использовались современные методы цифровой обработки изображений, распознавания образов, машинного обучения, математического анализа, теории вероятностей. Для практической реализации алгоритмов применялись современные численные методы и методы объектно-ориентированного программирования на языке С#.

Научная новизна

В рамках данной работы получены следующие новые научные результаты:

  1. Разработаны новые алгоритмы детектирования лиц на полутоновых изображениях в условиях сложной сигнально-помеховой обстановки.

  2. Разработана модификация алгоритмов детектирования лиц с использованием информации о цвете.

3. Разработан новый алгоритм тендерной классификации по изображению лица на основе адаптивных признаков и метода опорных векторов. Практическая значимость

  1. Проведен анализ работы алгоритмов детектирования лиц при наличии искажающих факторов и предложены рекомендации по их устранению, позволившие повысить уровень выделения в среднем на 20-30%.

  2. Разработаны модификации алгоритма детектирования лиц на базе бустинга путем использования информации о цвете, позволившие снизить уровень ложных срабатываний более чем в 2 раза.

  3. Разработан и исследован алгоритм тендерной классификации на основе адаптивных признаков и метода опорных векторов для решения ряда практических задач в области современных систем телевидения. Результаты работы внедрены в соответствующие разработки

ООО «А-ВИЖН», ОАО «СеверТрансКом», г. Ярославль. Отдельные результаты диссертационной работы внедрены в учебный процесс ЯрГУ им. П.Г. Демидова в рамках дисциплин «Цифровая обработка изображений» и «Компьютерное зрение», а также в научно-исследовательские работы при выполнении исследований в рамках гранта «Развитие нелинейной теории обработки сигналов и изображений в радиотехнике и связи» (Программа «Развитие научного потенциала высшей школы (2009-2010 годы)», №2.1.2/7067). Все результаты внедрения подтверждены соответствующими актами.

Достоверность полученных научных результатов обусловлена применением адекватного математического аппарата, подтверждается их согласованностью с результатами проведенного компьютерного моделирования и сопоставлением полученных результатов с научными данными, известными из российской и зарубежной литературы.

Апробация работы. Результаты работы докладывались и обсуждались на следующих научно-технических конференциях и семинарах:

65-66-я научные сессии, посвященные Дню радио, Москва, 2010-2011.

Международная научно-техническая конференция «Проблемы автоматизации и управления в технических системах», Пенза, 2009.

15-я международная научно-техническая конференция «Радиоэлектроника, электротехника и энергетика», Москва, 2009.

11-12 и 14-я международные конференции «Цифровая обработка сигналов и ее применение», Москва, 2009-2010, 2012.

Двадцатая международная конференция по компьютерной графике и зрению «ГрафиКон'2010», Санкт-Петербург, 2010.

13-14-я всероссийская научно-техническая конференция «Нейроинформатика», Москва, 2011-2012.

9-10-я всероссийская научная конференция «Нейрокомпьютеры и их применение», Москва, 2011-2012.

Публикации. По теме диссертации опубликовано 17 научных работ, из них 2 статьи в журналах, рекомендованных ВАК («Проектирование и технология электронных средств», «Радиотехника») и 15 докладов на научных конференциях. Получено свидетельство о государственной регистрации программ для ЭВМ.

Структура и объем работы. Диссертация состоит из введения, пяти разделов, заключения, списка использованных источников, содержащего 247 наименований, и 1 приложения. Она изложена на 206 страницах машинописного текста, содержит 68 рисунков и 22 таблицы.

Основные научные положения и результаты, выносимые на защиту:

  1. Алгоритмы детектирования лиц на полутоновых изображениях в условиях сложной сигнально-помеховой обстановки.

  2. Модификации алгоритмов детектирования лиц с использованием информации о цвете.

  3. Алгоритм тендерной классификации на основе адаптивных признаков и метода опорных векторов.

Похожие диссертации на Разработка и анализ алгоритмов детектирования и классификации объектов на основе методов машинного обучения