Электронная библиотека диссертаций и авторефератов России
dslib.net
Библиотека диссертаций
Навигация
Каталог диссертаций России
Англоязычные диссертации
Диссертации бесплатно
Предстоящие защиты
Рецензии на автореферат
Отчисления авторам
Мой кабинет
Заказы: забрать, оплатить
Мой личный счет
Мой профиль
Мой авторский профиль
Подписки на рассылки



расширенный поиск

Модель и методы распознавания объектов на изображениях в виде скалярных полей Чечель, Андрей Олегович

Диссертация, - 480 руб., доставка 1-3 часа, с 10-19 (Московское время), кроме воскресенья

Автореферат - бесплатно, доставка 10 минут, круглосуточно, без выходных и праздников

Чечель, Андрей Олегович. Модель и методы распознавания объектов на изображениях в виде скалярных полей : диссертация ... кандидата технических наук : 05.13.01 / Чечель Андрей Олегович; [Место защиты: С.-Петерб. гос. ун-т телекоммуникаций им. М.А. Бонч-Бруевича].- Санкт-Петербург, 2013.- 145 с.: ил. РГБ ОД, 61 14-5/297

Введение к работе

Диссертационная работа посвящена исследованию процессов распознавания графических объектов. Предлагается использовать концепцию представления графической информации в виде скалярных полей (полевой модели) для построения систем распознавания, использующих анализ структурной составляющей обрабатываемых фрагментов. Такой подход позволяет повысить помехоустойчивость системы распознавания. В диссертационной работе созданы модель и методы идентификации искаженных графических объектов, исследованы способы повышения производительности процесса распознавания. Результаты использованы в разработке программной системы, выполняющей идентификацию объектов, классификацию символьной информации, видеотрекинг объектов.

Актуальность исследования. Системы распознавания графической информации являются важными компонентами вычислительных устройств, применяемых в различных областях гражданской и военной техники. Данной теме посвящено много научных трудов, затрагивающих философские, психологические и нейрофизиологические вопросы. В наши дни актуальность вопроса повышается, исследования получают практическую реализацию: в медицинском оборудовании, портативных устройствах, автоматических системах контроля, в сфере робототехники.

Большое влияние на формирование алгоритмической базы для систем распознавания оказали работы таких ученых, как Ф. Розенблатт, Г. Фримен, К.С. Фу, Р. Гонсалес, Я.А. Фурман. На данный момент предложено множество подходов к реализации систем распознавания графической информации. Среди них можно выделить методы, основанные на теории принятия решений (использование классификаторов, нейронных сетей); алгоритмы, использующие сегментацию и кластеризацию; структурный подход, включающий методы контурного анализа.

Анализ структурной составляющей фрагментов изображения сочетает в себе двоякую характеристику: с одной стороны, задача построения контуров графических объектов может быть решена достаточно эффективно, но вместе с этим, методы контурного анализа являются достаточно сложными в реализации, что обуславливается большим объемом информации,

подвергающейся морфологическому анализу. Данное обстоятельство является одной из главных причин проявленного научного интереса автора диссертационной работы к изучению и исследованию путей реализации системы распознавания, основанной на представлении изображений в виде скалярных полей.

Цель диссертационного исследования - улучшение характеристик идентификации объектов на основе представления изображений в виде скалярных полей.

Для достижения цели исследования в диссертационной работе были поставлены и решены следующие задачи:

разработка модели графического объекта на основе разложения изображения на «высокочастотную» и «низкочастотную» составляющие;

разработка статического метода идентификации объектов на изображениях в виде скалярных полей;

разработка динамического метода локализации объектов для применения в системах обработки видеосигнала;

программная реализация предложенного подхода, получение экспериментальных оценок, сравнение результатов с известными подходами.

Объектом исследования в данной диссертационной работе являются изображения и содержащиеся на них графические объекты.

Предмет исследования - распознавание объектов на основе классификаторов, модели представления графической информации, методы и алгоритмы сегментации, морфологическая обработка, методы обработки видеоряда, видеотрекинг объектов.

Методы исследования базируются на системном анализе, теории множеств, теории вероятностей, интегральном и дифференциальном вычислении, методах цифровой обработки сигналов, системного программирования, параллельной обработки данных. Кроме того, методологической базой исследования послужили работы Болтова Ю.Ф., Красильникова Н.Н., Гонсалеса Р., Фу К., Фурмана Я.А., а также концепция графического интерпретатора на основе полевой модели, разработанная на кафедре ЦВТиИ Санкт-Петербургского государственного университета телекоммуникаций им. проф. М.А. Бонч-Бруевича.

Научная новизна исследования диссертационной работы заключается в следующем:

предложена модель представления графических объектов в виде совокупности сигнатур контуров, отличающаяся высокой скоростью обработки и устойчивостью к наличию искажений;

разработан статический метод идентификации объектов на изображениях, представленных в виде скалярных полей;

предложен алгоритм определения смещения начальных точек цепных кодов, позволяющий сократить требуемую вычислительную мощность для процедуры вычисления коэффициента подобия двух контуров;

разработан динамический метод локализации для систем обработки видеосигнала, позволяющий выполнять видеотрекинг объектов в режиме реального времени.

Практическая значимость работы выражается в следующем:

разработанные алгоритмы и программное обеспечение могут быть использованы для решения задач идентификации в составе медицинского оборудования, дактилоскопических систем, программно-аппаратных комплексов слежения и регистрации объектов;

предложен метод идентификации символьной информации в рамках разработанного программного обеспечения для применения в системах оптического распознавания символов;

выполнена программная реализация системы видеотрекинга объектов, в основе которой лежит структурный анализ, построенный на концепции представления изображений в виде скалярных полей.

Внедрение результатов. Основные результаты получены автором на кафедре ЦВТиИ Санкт-Петербургского государственного университета телекоммуникаций им. проф. М.А. Бонч-Бруевича, в научно-исследовательской работе «Обработка графической информации на основе полевой модели для телекоммуникационных приложений. Концепция, математические построения, алгоритмы и программные оболочки» (гос. per. № 01201067398, 2010 г).

Разработанная программа «ChRecognizer» имеет свидетельство о государственной регистрации (№ 2013614251, 25.04.2013 г.).

Разработанные алгоритмы обработки видеосигнала и распознавания графических объектов использованы в системе обработки видеоконференций и докладов ООО «ЭПАМ Систэмз» (акт внедрения от 23.05.2013 г.).

Положения, выносимые на защиту:

модель графического объекта на основе одномерных функций сигнатур контура;

статический метод идентификации графических объектов на изображениях, представленных в виде скалярных полей;

алгоритм определения смещения начальных точек цепных кодов для задачи определения подобия контуров;

динамический метод локализации графических объектов для задач обработки видеосигнала.

Апробация работы: научные положения и практические результаты
диссертационной работы докладывались и обсуждались на четырех
всероссийских и международных научно-технических конференциях: 18-й, 19-й
и 20-й Международной научно-технической конференции «Современное
телевидение» (Москва, 2010-2012); 64-й Международной научно-технической
и научно-методической конференции «Актуальные проблемы

инфотелекоммуникаций в науке и образовании» (СПб, 2012); а также на: 62-й и 63-й научно-технической конференции профессорско-преподавательского состава научных сотрудников и аспирантов СПбГУТ (СПб, 2010, 2011)

Публикации: материалы, отражающие основное содержание работы, опубликованы в трех статьях в изданиях, рекомендованных ВАК Министерства образования и науки РФ, а также в восьми статьях в других научных журналах и сборниках трудов российских и международных конференций. Разработанная программа «ChRecognizer» имеет свидетельство о государственной регистрации.

Структура и объем работы. Диссертационная работа состоит из введения, трех разделов, заключения, списка литературы (98 наименований) и двух приложений. Диссертационная работа содержит 145 страниц, включая 6 таблиц и 48 рисунков.

Похожие диссертации на Модель и методы распознавания объектов на изображениях в виде скалярных полей