Введение к работе
Актуальность работы. Большинство промышленных роботов, используемых в настоящее время на предприятиях многих стран, работает по жесткой программе, что требует предварительной организации полной упорядоченности рабочей зоны робота.
При выпуске изделий малыми и средними сериями, применение жестко-программированных роботов сопряжено значительными трудностями. Поэтому в нашей стране и за рубежом большое внимание уделяется проблеме создания и применения в промышленных условиях адаптивных роботов, снабженных средствами очувствления и способных на основе сенсорной информации в реальном масштабе времени корректировать свои действия в соответствии с изменением условий рабочей зоны. Одно из главных мест в структуре адаптивного робота занимает система технического зрения (СТЗ). Работа СТЗ, в первую очередь, связана с обработкой и анализом визуальной информации, т.е. изображения рабочей зоны (сцены).
Вопросам обработки визуальной информации с помощью ЭВМ д литературе уделяется достаточно много внимания. Однако специфика робототехничес-ких задач, требующих обработки большого объема информации в реальном времени при реализации вычислительных процессов на доступных и сравнительно недорогих микроЭВМ затрудняет использование традиционных методов цифровой обработки и анализа изображений, для которых ограничения на объем памяти и время обработки не является столь жесткими как в СТЗ.
Уменьшение объема видеоинформации осуществляется в СТЗ, в основном, путем бинаризации полутоновых изображений, т.е. путем представления многоградационного изображения в виде двухградационного. Анализ бинарного изображения проще чем анализ полутонового и можно осуществить достаточно быстро. Кроме того, признаки (топологические, метрические и т.д.) объекта легче определить на его бинарном изображении. Поэтому подавляющее большинство СТЗ обрабатывает и анализирует бинарные изображения объектов.
В функции СТЗ во многих производственных задачах входит выполнение операции определения типа объекта, его положения и ориентации. Выполнение этих операций решается успешно, когда объект находится на фиксированном расстоянии от видеодатчика СТЗ, т.е. анализ изображений производится при их постоянном масштабе. В данном случае для надежного распознавания объекта достаточно иметь набор его признаков, инвариантных переносу и повороту, на рабочем поле СТЗ. Задача определения типа объекта, его положения и ориентации при переменном масштабе пока не нашли своего удовлетворительного решения.
В связи с этим систематизация существующих, разработка новых и оценка их инвариантности к переносу, повороту и изменению масштаба (ППМ) признаков является актуальной задачей для формирования алгоритмического обеспечения надежного распознавания объектов на основе их бинарных изображений в СТЗ.
Целью диссертационной работы является разработка алгоритмов выделения и способа формирования широкого набора базовых и инвариантных к ППМ признаков объектов и изображений с ними для СТЗ.
Исходя из цели работы задачами исследования являются:
1. Анализ состояния проблемы выделения различных характеристик объектов в СТЗ и формирования на их основе инвариантных к ППМ признаков распознавания.
2. Разработка способа декомпозиции исходного изображения, позволяющего формировать достаточно широкий набор базовых признаков объектов и изображений с ними.
3. Разработка и исследование алгоритмов выделения признаков объектов при их линейчатом и силуэтном представлении.
4. Разработка и исследование способа формирования инвариантных к ППМ признаков объектов и изображений с ними.
5. Разработка набора наиболее стабильных инвариантных к ППМ признаков объектов и изображений с ними.
6. Практическое применение разработанных алгоритмов, способов для вычисления различных характеристик реальных объектов, анализируемых в СТЗ.
Методы исследования. В работе использованы методы теории множеств, дискретной математики, математической статистики и цифровой обработки изображений.
Научная новизна. В процессе проведенных исследований разработаны:
— способ декомпозиции исходного изображения объекта на три простых, каждый из которых содержит один вид представления исходного;
— алгоритм выделения и подсчета особых точек кривых, позволяющий определять: точки локальных максимумов, минимумов, их координаты и их количество; точки перегиба, их координаты и количество; длины вогнутых и выпуклых участков и их количество;
— алгоритм определения длины и ширины объектов;
— алгоритм определения степени вложенности объектов;
— методика формирования набора инвариантных к ППМ признаков объектов и изображений с ними;
— набор наиболее стабильных инвариантных к ППМ признаков объектов и изображений с ними.
Практическая ценность работы. Включенные в диссертацию результаты получены автором при выполнении госбюджетной НИР № 340/98. Результаты работы позволяют:
1. Осуществлять анализ изображений объектов в СТЗ с использованием различных технологических схем.
2. Формировать множество наборов базовых и инвариантных к ППМ признаков объектов, содержащие разное количество как однотипных, так и разнотипных признаков.
3. Моделировать весь процесс анализа и отбора базовых и производных признаков объектов в поле зрения СТЗ.
Реализация результатов исследования. Разработанные алгоритмы й система программ внедрены в производство, о чем свидетельствуют акты, приведенные в приложении к диссертации.
Апробация работы. Материалы диссертации работы докладывались и обсуждались на научных конференциях преподавателей МИВлГУ (г. Муром, 2003-2006 гт.), на Международной научно-технической конференции «Проблемы передачи и обработки информации в сетях и системах телекоммуникаций» (г. Рязань, 2004, 2005 г.г.).
Публикации. Основные результаты диссертации опубликованы в 22 работах, в том числе 1 монография и 14 статей.
Структура и объем работы. Диссертация состоит из введения, пяти разделов, заключения, списка литературы из 202 наименований и приложения. Общий объем работы составляет 173 страницы, 86 рисунков, 22 таблицы.
На зашиты выносится:
1. Способ декомпозиции изображений объектов, позволяющий существенно упростить задачу выделения и расширения набора базовых и инвариантных к ППМ признаков.
2. Методика формирования набора инвариантных к ППМ признаков объектов и изображений с ними.
3. Алгоритмы выделения особых точек кривых и определения вложенности объектов и их длины и ширины.
4. Результаты исследований и практического применения способов, алгоритмов и системы программ при решении задач анализа реальных объектов различных типов.