Введение к работе
Актуальность темы. Среди прикладных задяч обрэоотки информации существенное место занимают задачи распознавшая, в кото рых исходная информация представляется з виде и^обр.иь.ений. Проблема распознавания изображений возникает во мноіих практических приложениях. Среди них можно выделить: технологический контроль и обнаружение неисправностей, слежение за подвижными объектами, обработка зрительной информации в системах управления роб-уо~ех-нических комплексов, поиск изображений по сі.'ержа':цо, о6ря(.ст{а аэрокосмических изображений, обработка медиі ->-,ъ.чи.'" ізобоал.^нии
В последние два десятилетия особую актуайжоси г у.:,.:'..v.-.r^ :-а-дачи распознавания, сложность хоторых обуслов ієна необходимостью удовлетворения требований обработка сверхбольших (более 10 элементов) выборок изображений в режиме реального времени. В результате исследований, направленных на создание систем распознавания изображений, удовлетворяющих указанным требованиям, сформировался новый подход к задачам распознавания. В его сено.їе тежит переход от функционального представления изображения к представлению изображения в виде набора векторов признаков. При этом для построения модели изображения используются методы поиска контрольных точек изображений и инвариантные признаки.
Методы, основанные на рассматриваемом подходе, обладают двумя важными достоинствами: во-первых, отсутствием ограничений на свойства изображений, что позволяет применять однотипные методы в рамках существенно различных приложений; во-вторых, возможностью декомпозиции задачи распознавания на задачи поиска контрольных точек, вычисления признаковых представлений этих точек и их сопоставления, что позволяет синтезировать методы распознавания из независимых алгоритмов решения указанных подзадач. В то же время, исследования последних лет показали, что основным недостатком методов рассматриваемого класса является их вычислительная трудоемкость, измеряемая процессорным временем и объемом оперативной памяти, необходимыми для решения задач. Рядом авторов отмечаются трудности, возникающие в задачах распознавания в реальном времени и задачах обработки большого числа изображений.
Появление необходимых по производительности аппаратных решений является индикатором возможности решения задачи повышения оперативности распознавания изображений. Потребность в высокопроизводительных методах распознавания изображений обусловлена также тенденцией к «интеллектуализации» робототехники и средств автоматизации производства. Не менее важную роль здесь играет возрастание объема и разнообразия визуальной информации, связанное
CY--
с развитием микроэлектроники и средств передачи информации. В отчете, опубликованном корпорацией International Data Corporation в 2009 году, указывается, что прирост числа хранимых цифровых изображений составляет 24% в год. К концу 2010 года общее количество изображений, полученных с помощью мобильных устройств, по данным Infotrends на 2006 год составит 228 миллиардов.
Указанные тенденции подчеркивают важность разработки эффективных программных и аппаратных средств автоматического распознавания сверхбольших выборок изображений.
Анализ современных методов распознавания изображений на основе сопоставления контрольных точек позволяет сформулировать две основные причины их высокой вычислительной сложности. Задачи поиска контрольных точек, вычисления их признаковых представлений и их сопоставления решаются изолировано от анализа свойств объемлющей выборки изображений, что приводит к неоправданной избыточности наборов признаков изображений. Применяемые методы сопоставления признаков оказываются не достаточно эффективными в задачах обработки сверхбольших выборок изображений.
В связи с изложенным возникает проблема разработки таких математических методов распознавания изображений, на основе которых могут быть реализованы относительно простые вычислительные алгоритмы, обеспечивающие требуемые высокую скорость и качество распознавания в задачах обработки сверхбольших выборок.
Научная задача, решаемая в исследовании, состоит в сокращении времени распознавания сверхбольших выборок изображений.
Целью исследования является разработка метода распознавания изображений на основе математического моделирования свойств изображения, являющегося элементом сверхбольшой выборки.
Задачи исследования.
-
Построение математической модели выборки изображений.
-
Создание математической модели изображения, являющегося элементом сверхбольшой выборки.
-
Синтез метода распознавания сверхбольших выборок изображений на основе разработанных моделей.
-
Разработка программного обеспечения распознавания изображений, реализующего предложенный метод.
-
Экспериментальный анализ эффективности использования предложенного метода распознавания изображений.
Объект исследования. Системы обработки изображений, предназначенные для решения задач распознавания сверхбольших выборок изображений.
Предмет исследования. Математическое и программное обеспечение систем распознавания изображений на основе сопоставления контрольных точек: математические модели изображения, методы поиска и описания контрольных точек изображения.
Методы исследования. Методы системного анализа, математического моделирования, обработки изображений, распознавания образов, цифровой обработки сигналов, теории графов, комбинаторного анализа, информационного поиска.
Научная новизна.
-
Разработана математическая модель сверхбольшой выборки изображений, в соответствии с которой выборка моделируется множеством кластеров значений признаков, вычисленных для изображений, входящих в выборку.
-
Синтезирована математическая модель изображения, в соответствии с которой изображение представляется набором признаков, наиболее информативных для заданной выборки.
-
Разработаны эффективные алгоритмы сопоставления изображений, кластеризации выборки изображений и поиска изображений выборки по эталону, вычислительная сложность которых не зависит от свойств изображений.
-
Модифицирован метод быстрых устойчивых признаков, применяемый для вычисления значений признаков. Метод дополнен процедурой, обеспечивающей необходимую инвариантность значений признаков относительно аффинных преобразований плоскости изображения.
Практическая значимость исследования.
-
Использование разработанной модели изображения позволяет синтезировать методы распознавания изображений, вычислительная сложность которых не зависит от свойств изображений.
-
Разработанный метод кластеризации выборки изображений обеспечивает 50-кратное повышение скорости распознавания изображений сверхбольших выборок при изменении показателей точности и полноты кластеризации в пределах 5%.
-
В результате использования предложенного метода сопоставления изображений при обработке изображений, полученных системой технического зрения мобильного робота в натурных экспериментах по автономной навигации в неизвестной заранее среде, достигается сокращение ошибок распознавания на 20% при одновременном повышении средней скорости обработки кадра в 4.4 раза.
Достоверность и обоснованность полученных результатов обеспечиваются корректным применением методов исследования. Корректность функционирования программного обеспечения, реализующего метод распознавания сверхбольших выборок изображений, подтверждена в процессе модульного и нагрузочного тестирования. Результаты вычислительных экспериментов согласуются с известными в литературе результатами.
Личный вклад автора. Все результаты диссертационного исследования получены автором лично.
Апробация результатов исследования. Основные результаты диссертации докладывались и обсуждались на следующих научно-технических конференциях и семинарах: 19th International Conference On Computer Graphics and Vision, GraphiCon (Москва, 2009); 9th International Conference on Epigenetic Robotics (Venice, Italy, 2009); «Актуальные проблемы информационно-компьютерных технологий, ме-хатроники и робототехники» в рамках конференции «Экстремальная Робототехника 2009» и школы-семинара «Адаптивные и интеллектуальные роботы» (пос. Дивноморское, Геленджик, 2009); на Российском Семинаре по Оценке Методов Информационного Поиска РО-МИП (Дубна, 2008; Петрозаводск, 2009); на научной конференции факультета ПМ-ПУ СПбГУ (Санкт-Петербург, 2009 гг.); в 2007-2010 гг. на семинарах кафедры компьютерного моделирования и многопроцессорных систем и кафедры технологии программирования факультета ПМ-ПУ СПбГУ, на семинаре «Нейроинформатика» мате-матико-механического факультета СПбГУ, на семинаре Центрального научно-исследовательского и опытно-конструкторского института робототехники и технической кибернетики, на семинаре «Искусственный интеллект: от методологии к инновациям» Санкт-Петербургского государственного университета информационных технологий, механики и оптики.
Публикации. Материалы диссертации опубликованы в 8 статьях, из которых одна опубликована в журнале, входящем в список ВАК ведущих рецензируемых изданий. Список опубликованных работ приведен в конце автореферата.
Структура и объем работы. Диссертация состоит из введения, четырех глав, общих выводов, списка литературы из 203 наименований. Работа изложена на 110 страницах машинописного текста, содержит 11 рисунков, 4 таблицы и одно приложение.