Содержание к диссертации
Введение
ГЛАВА 1. Анализ методов и устройств распознавания изображений объектов 11
1.1. Методы, основанные на анализе контура объекта 11
1.2. Нейросетевые методы 13
1.3. Методы, основанные на сравнении с эталоном
1.4. Методы распознавания сложных стерео- и мультиизображений в реальном времени 27
1.5. Оптико-электронные устройства для распознавания изображений объектов 30
ГЛАВА 2. Математическая модель распознавания изображений объектов с использованием трехмерных векторных эталонов 39
2.1. Математическая модель ввода изображения распознаваемого объекта40
2.1.1. Функция определения габаритного контейнера 44
2.1.2. Функция масштабирования изображения 45
2.1.3. Функция кодирования изображения 47
2.2. Математическая модель представления эталонов MDL 49
2.2.1. Функция выбора эталонов ,; 54
2.2.2. Функция получения изображения проекции эталона
2.3. Функция определения весовых коэффициентов 56
2.4. Функция определения входных данньгх 57
2.5. Математическая модель распознавания на основе весовых коэффициентов и входных данных 58
2.6. Обобщенный алгоритм работы оптико-электронного устройства распознавания изображений объекта з
ГЛАВА 3. Анализ характеристик и синтез быстродействую щего оптико-электронного устройства распознавания изображений объектов на основе трехмерных векторных эталонов 62
3.1. Достоверность распознавания объектов 62
3.2. Синтез метода и алгоритмов распознавания 69
3.2.1. Алгоритмы формирования эталонов 69
3.2.2 Алгоритмы формирования предварительных признаков 71
3.2.3. Синтез алгоритма распознавания изображений 76
3.3. Синтез быстродействующего оптико-электронного устройства распознавания изображений объектов на основе трехмерных векторных эталонов 79
3.3.1 Структурно-функциональная схема и описание принципов работы79
3.3.2. Повышение быстродействия устройства оптико-электронного устройства распознавания изображений объектов 86
3.3.3. Анализ быстродействия оптико-электронного устройства распознавания изображений объектов на основе трехмерных векторных эталонов
3.4. Инженерная методика определения параметров устройства и количества параллельных модулей идентификации объекта 100
ГЛАВА 4. Экспериментальные исследования высокоточного оптико-электронного устройства распознавания изображений объектов на основе трехмерных векторных эталонов 102
4.1. Аппаратногпрограммный комплекс для проведения испытаний высокоточного оптико-электронного устройства распознавания изображений объектов на основе трехмерных векторных эталонов 102
4.2. Методика проведения экспериментальных исследований 104
4.3. Экспериментальное определение основных характеристик быстродействующего оптико-электронного устройства распознавания изображений объектов на основе трехмерных векторных эталонов 109
4.3.1. Оценка достоверности 112
4.3.2. Оценка быстродействия 117
4.3.3. Расчет количества параллельных модулей иденти-фикации 120
4.3.4. Оценка дополнительных характеристик 121
Заключение 127
Список использованных источников
- Методы, основанные на сравнении с эталоном
- Функция масштабирования изображения
- Синтез метода и алгоритмов распознавания
- Экспериментальное определение основных характеристик быстродействующего оптико-электронного устройства распознавания изображений объектов на основе трехмерных векторных эталонов
Введение к работе
Актуальность работы. Ускорение темпов производства на основе автоматизации и роботизации технологических процессов является одним из приоритетных направлений развития приборостроения и вычислительной техники в настоящее время. Оптико-электронные устройства (ОЭУ), являющиеся неотъемлемым элементом систем управления, находят все большее применение в различных областях деятельности человека, начиная от производства и заканчивая процессом обработки данных. Основной функцией оптико-электронных устройств является распознавание объектов и измерение их параметров. Для большинства прикладных задач на практике имеется необходимость анализа и распознавания трехмерных объектов, в связи с чем, распознавание изображений объектов приобретает еще большую актуальность.
Решение задачи распознавания характеризуется рядом сложностей, связанных с положением объекта в пространстве. В связи с этим целесообразно применение методов, позволяющих производить распознавание объектов инвариантно к положению и ориентации в пространстве, а также обладающих высокой скоростью обработки данных.
Существует множество методов распознавания произвольно расположенных объектов, однако большинство из них имеет существенные ограничения. Так, например, существуют сложности в решении задачи идентификации объектов, отличающихся визуально незначительно и имеющих схожие ракурсы. Кроме того имеется зависимость достоверности распознавания от положения объекта в пространстве, что для произвольно расположенного объекта может приводить к его ошибочному распознаванию.
Оптико-электронные устройства, предназначенные для распознавания трехмерных объектов, как правило, основаны на анализе двух и более изображений объекта в различных ракурсах. Недостатками подобных устройств являются следующие: сложность аппаратуры, необходимость точной калибровки ОЭУ, значительная вычислительная сложность, которая может приводить к длительному времени распознавания.
Наряду с этим известны методы распознавания трехмерных объектов, основанные на анализе единственного изображения объекта. Подобные методы требуют значительных вычислительных ресурсов для реализации, большого объема памяти для хранения проекций эталонного объекта в различных ракурсах. Кроме того пространство используемых признаков зачастую не позволяет рационально сформировать базу эталонов, что приводит к существенным затратам памяти и длительному процессу поиска, отрицательно сказывающимся на быстродействии ОЭУ. Большинство существующих методов имеют узкий спектр применения, связанный с ограничениями, накладываемыми при реализации, такими, как аппаратная база, масса, габариты устройства и временные показатели скорости обработки данных.
Таким образом, существует объективная необходимость создания новых методов распознавания и ОЭУ, позволяющих решить задачу распознавания трехмерного объекта, снизить вычислительную сложность, повысить достоверность распознавания и скорость обработки данных.
В этой связи актуальной научно-технической задачей является разработка метода и устройств распознавания объектов, позволяющих повысить достоверность распознавания и обеспечить быстродействие ОЭУ.
Перспективным подходом к решению этих задач является применение трехмерных векторных изображений в качестве эталонов, позволяющих в сочетании с дополнительными признаками предварительного анализа повысить достоверность и увеличить скорость распознавания за счет инвариантности к положению объекта в
пространстве и сокращения затрат времени за счет использования параллельных вычислений.
Диссертационная работа выполнена в рамках фундаментальных исследований с госбюджетным финансированием, которые велись и ведутся в Курском государственном техническом университете (госбюджетная НИР: 1.1.05 "Исследование теоретических основ, методов и алгоритмов повышения качества обработки изображений в системе технического зрения" (№ гос. регистрации 01200508819, 2005 г.).
Цель работы: разработка метода распознавания изображений объектов, основанного на использовании трехмерных векторных эталонов и быстродействующего оптико-электронного устройства, характеризующегося повышенной достоверностью и инвариантностью к аффинным преобразованиям объекта.
Задачи исследования, решаемые в работе:
Сравнительный анализ существующих методов и устройств распознавания изображений и обоснование необходимости создания комбинированных методов с повышенной достоверностью и быстродействующих устройств распознавания объектов.
Разработка математической модели распознавания изображений объектов на основе трехмерных векторных эталонов.
Создание метода инвариантного к аффинным преобразованиям в пространстве и алгоритмов распознавания изображений объектов, содержащих блоки, которые допускают аппаратную-ориентацию.
Разработка структурно-функциональной схемы и быстродействующего оптико-электронного устройства распознавания изображений трехмерных объектов.
Новыми научными результатами, выносимыми на защиту, являются:
1. Математическая модель распознавания объекта на основе трехмерных векторных
эталонов, обеспечивающая инвариантность к положению объекта в пространстве и
отличающаяся применением специализированной структуры данных описания
эталонов.
2. Алгоритмы распознавания объектов и формирования трехмерных векторных эталонов,
обеспечивающие уменьшение емкости памяти, необходимой для хранения эталонов, и
возможность применение конвейерной обработки данных.
Метод распознавания изображений трехмерных объектов, обеспечивающей возможность реализации, как на программном, так и на аппаратном уровне, и позволяющий сохранить высокую достоверность распознавания при высокой скорости обработки данных за счет использования трехмерных векторных эталонов.
Структурно-функциональная схема оптико-электронного устройства распознавания объектов с конвейерной обработкой данных, особенностью которой является разработка и введение специализированных вычислительных устройств, реализующих параллельную, конвейерную обработку данных и обеспечивающих повышение быстродействия оптико-электронного устройства.
Объект исследования - оптико-электронные устройства распознавания изображений трехмерных объектов.
Предмет исследования - методы, алгоритмы и оптико-электронные устройства обработки и распознавания изображений.
Методы исследования. В работе использованы методы цифровой обработки сигналов и изображений, математического моделирования, распознавания изображений объектов и анализа дискретных изображений, методы проектирования устройств ЭВМ.
Практическая ценность работы состоит в том, что ее результаты являются основой для разработки широкого класса оптико-электронных устройств распознавания
трехмерных объектов по единственному изображению. Применение подобных устройств возможно в следующих системах: системах контроля качества продукции, автоматизированных манипуляторах, робототехнике, системах наведения.
Разработанный метод распознавания характеризуется гибкостью и возможностью реализации, как на программном, так и на аппаратном уровне, что обеспечивает широкий спектр областей использования. Особенностью метода является наличие ряда параметров, обеспечивающих баланс достоверности распознавания, производительности и аппаратных затрат в зависимости от условий применения.
Результаты диссертационной работы внедрены на предприятиях ООО «СМИ-Линк г. Курск», ОГУ СМЭП Курской области и используются в учебном процессе Курского государственного технического университета по учебным дисциплинам «Структурно-топологическое проектирование ЭВМ», «Основы теории распознавания образов».
Апробация работы. Основные положения диссертационной работы докладывались и получили положительную оценку на Международных и Российских конференциях: Всероссийская конференция по проблемам информатики, физики и химии (г. Москва РУДЫ 2005); Оптико-электронные приборы и устройства в системах распознавания образов, обработки изображений и символьной информации «Распознавание 2005» (г. Курск, Курский государственный технический университет 2005 г.); «Молодежь и XXI век: 2005, 2006, 2007» (г. Курск, Курский государственный технический университет 2005, 2006, 2007 гг.), а также на научно-технических семинарах кафедры «Вычислительно техники» с 2005 по 2009 годы.
Публикации. Основные результаты выполненных исследований и разработок опубликованы в 14 печатных работах, в том числе в 7 статьях. Среди них: 3 статьи, опубликованные в рецензируемых научных журналах, входящих в перечень журналов и изданий, рекомендуемых ВАК, а также 3 патента Российской Федерации.
Личный вклад автора. В работах, опубликованных в соавторстве, лично соискателем предложены: в [1] - метод распознавания изображений объектов с использованием трехмерных векторных эталонов и программа для его реализации; в [2] -метод распознавания символьной информации автомобильного бортового компьютера; в [6] - способ калибровки системы технического зрения распознавания номеров игровой рулетки; в [3,4,7,5] - устройство для инвариантного к аффинным преобразованиям распознавания изображений на основе трехмерных векторных эталонов; в [8] - способ распознавания одно - двухзначных чисел; в [9] - использование трехмерных эталонов в задаче распознавания; в [10] - программа распознавания образов, использующая векторные эталонные изображения.
Структура и объем работы. Диссертационная работа состоит из введения, четырех глав, заключения, списка литературы, включающего 87 наименований, изложена на 138 страницах и поясняется 36 рисунками и 16 таблицами.
Методы, основанные на сравнении с эталоном
В настоящее время получение пространственных данных возможно с помощью систем стерео- и мультизрения, в том числе и со структурированной подсветкой. Как правило, с любой трехмерной сценой связано несколько наборов дальнометрических данных, соответствующих различным положениям измерителя (сторонам сцены). Основным этапом реконструкции является их совмещение (сшивание), то есть нахождение наилучшего пространственного преобразования одного набора к другому. Для этого необходимо установить соответствия (найти похожие элементы) между пространственными данными, принадлежащими одной и той же трехмерной сцене.
Реконструкция и распознавание объектов в системах компьютерного зрения представлена в [33]. Для решения задачи поиска соответствий между различными трехмерными моделями данные должны быть, представлены в инвариантной и компактной форме, отражающей геометрию объекта. Один из возможных подходов состоит в сопоставлении в каждой вершине (точке) модели набора данных об относительных координатах всех вершин, лежащих в ее некоторой окрестности. В работе [34] предложено каждой вершине, которую мы будем называть опорной, сопоставить цилиндрическую систему координат, направление оси которой задается нормалью в опорной точке, и некоторую окрестность точек (вершин) модели. Набор цилиндрических координат (без полярного угла) точек этой окрестности, представленный в виде двухмерной матрицы, образует так называемое спиновое изображение. Сравнение спиновых изображений, например, с помощью коэффициента линейной корреляции, позволяет находить соответствующие точки на парах моделей. Наличие нескольких похожих областей приводит к ошибкам, являющимся следствием весьма упрощенного представления.
В настоящей работе предлагается от двухмерных спиновых изображений перейти к трехмерным, представляющим собой трехмерную матрицу, две размерности которой соответствуют цилиндрическим координатам без полярного угла, а третья - углу между нормалями в текущей и опорной вершинах. Совокупность трехмерных спиновых изображений, построенных в каждой вершине, представляет собой инвариантное представление, отражающее свойства симметрии поверхности.
Для решения задачи распознавания трехмерных моделей необходимо построить трехмерные спиновые изображения для набора шаблонов и исследуемого объекта, последующее сравнение позволяет найти необходимое соответствие. Последующая трехмерная реконструкция осуществляется в несколько этапов: находятся соответствующие сканы и необходимое преобразование; с помощью ранее модифицированного нами и реализованного алгоритма ICP [35] осуществляется точное совмещение сканов; формируется единая модель объекта.
Для распознавания объектов по трехмерным моделям используется процедура совмещения почти в неизменном виде. С одной стороны, необходим набор уже готовых моделей из базы шаблонов, а. с другой -реконструированная поверхность неизвестного объекта, которую последовательно совмещаем со всеми моделями-шаблонами. Если совмещение поверхности объекта и какого-то шаблона пройдёт успешно, то это означает, что данная поверхность принадлежит классу объектов, которому соответствует эта модель. Очевидным недостатком описанного метода являются сложность формирования базы эталонов и сложный математический аппарат, который отрицательно скажется на скорости работы системы при реализации.
Рассматриваемые в статье [36] методы распознавания сложных стерео и мультиизображений в реальном времени анализируют окружающее пространство, выделяют окружающие объекты, классифицируют их и оценивают уровень их важности для решаемой системой задачи. Особенностью данной задачи является как выделение в видеоизображении объектов, так и их классификация, и собственно оценка (рейтинг) их важности. Выделение, сопровождение и классификация недетерминированных объектов в реальной обстановке с перекрытием движущихся объектов препятствиями в условиях изменяющихся фона и условий освещенности, при наличии помех возможно при нейросетевой обработке мульти-изображений. Мультиизображения (ЗО-сцены, разнесенные во времени и/или пространстве) с высоким разрешением позволяют измерять статические и динамические параметры объектов (размеры, координаты, скорости, траектории движения) и более надежно выделять подозрительные объекты в ЗБ-сцене.
Рассматриваемый в данной статье нейросетевой метод распознавания также базируется на предварительном обучении нейронной сети понятиям (классам изображений объектов) с последующей идентификацией и отслеживанием нужного объекта путём параллельной обработки видеоинформации в реальном времени [37,38].
Авторами разработаны методики и математический аппарат, позволяющие редуцировать сложность нейросети путем построения иерархической нейросети («гиперсети») как совокупности адаптивно-связанных нейросетей и ее предобучение [4]. Авторами также разработаны технологии разделения нейросетей на потоковые вычисления, реализуемые на базе FPGA, и сложные вычисления, реализуемые на MCPU, в результате чего аппаратные средства используются оптимально, улучшаются зо стоимостные, массогабаритные и энергетические характеристики системы [39].
Предлагаемые нейросетевые и мультиагентные технологии реализованы в программно-аппаратном комплексе, состоящем из сенсоров -телекамер, радио и ИК средств наблюдения, расположенных в зонах контроля, и нейросетевых вычислителей, обрабатывающих сигналы сенсоров, обнаруживающих и оценивающих уровень оценки важности-наблюдаемых объектов для решения поставленной целевой задачи. Например, для систем безопасности важным является оценка уровня террористической угрозы наблюдаемых объектов. При превышении порогового уровня такой оценки информация и изображение подозрительного объекта передается оператору, который принимает решение игнорировать оценку или принять адекватные меры. В автоматическом режиме комплекс может принять необходимые меры самостоятельно. Обработка производится вычислителем комплекса каждый кадр (25 раз в секунду).
Недостатками предложенных методов систем распознавания стерео- и мультиизображний является необходимость получения не менее двух кадров с разных ракурсов, техническая сложность реализации: использование подвижной системы видеокамер или использование не менее двух видеокамер одновременно. Необходимость решения задачи сопоставления ракурсов изображений. Погрешности при восстановлении трехмерных координат. Необходимость перебора большого количества параметров предъявляет жесткие требования к ресурсам вычислительной системы, используемой для распознавания.
Функция масштабирования изображения
Далее производится построение модели на базе топологии Т. Затем осуществляется построение модели посредством соединения полученных точек на базе топологии Т. Применяется математический аппарат построения перспективной трехмерной модели объекта. Получаем двухмерный массив, элементами которого являются яркостные составляющие каждого дискретного элемента изображения.
Далее производится выделение габаритного контейнера, приведение изображения к размерности, кратной 11, и кодирование.
Посредством вышеуказанных преобразований получаем матрицу 02(п2,т2), представляющую собой проекцию изображения эталонного объекта. Размерность получается за счет применения масштабирования.
Функция получения изображения проекции эталона имеет вид: Fnii(MDL, FB3) = = f(MDL,f(f(MDL,f(FBH,q),q,),f(MDL,f(f(FBfnq)),q2))) (2.31) Для выполнения распознавания необходимо определить весовые коэффициенты каждой зоны матрицы 02 (п2, т2), а также вычислить входные данные. В основу метода идентификации положен принцип организации нейронных сетей типа Персептрон [55].
Каждая из 121 зоны матрицы 02(п2,т2) заполнена определенным количеством элементов, отличных от фона на значение q. Общее количество элементов, удовлетворяющих вышеуказанному условию, принимается за единицу.
Вес зоны объект является отношением элементов отличных от фона на значение q, находящимся внутри, к общему количеству этих элементов во всей матрице 02(п2,т2). Таким образом, суммарный вес всех зон будет равен единице. Построение матрицы весов представляет собой подсчет количества элементов, отличных от цвета фона, в каждой зоне матрицы 02(п2,т2):
Функция определения весовых коэффициентов имеет вид: Рвк(Рпи,Чі)= = f(f(MDL,f(f(MDL,f(FB[I,q),ql),f(MDL,f(f(FBI„q)),q2mq) (2.33) Помимо весовых коэффициентов необходимо определить входные данные, которые представляют собой матрицу размерностью 11x11, содержащую информацию о соответствии элементов 0,(и2,/и2) и 02(п2,т2)в каждой из 121 зоны.
Данная функция определяет разносную составляющую в исходном изображении и изображении проекции эталона.
Построение входной матрицы Х(11,11) выполняется посредством анализа исходных ма.тряцыО,(п2,т2) и 02(п2,т2), имеющих 121 зону, каждая зона размерностью х . Вводится параметр q3, задающий порог .11 П. разности элементов матриц 0}(п2,т2) и 02(п2,т2). Формирование элементов матрицы X производится следующим образом: і=ЦІ m2 .n2 ТРИ I 11 11 Sm /=u=, (2.34) Px 1, ЄСЛМ 11 11 11 11 О, иначе q3 п2,т2 Sm= ftc2; (l, если От.. a гдеРх2 = { 2,J 1 [ 0,иначе Функция определения входных данных имеет вид FBM(FMIII, F3H,q})= (2.35) f(f(f(Fm,q))J(MDLJXf(MDL,f(Fm,q),q f(AWL,f(f(FB[t,g)),q2))),q3) Далее выполняется непосредственно распознавание с использованием описанных выше данных.
Имеется матрица весов W и матрица входных значений X. Необходимо вычислить поэлементно произведения данных матриц, затем просуммировать все элементы результирующей матрицы.
Сравнивая полученное значение с установленным порогом, принимается решение о принадлежности изображения объекта к классу текущего эталона.
Если Е qA, то объект считается распознанным, в противном случае производится очередная итерация, и процесс распознавания повторяется для очередной проекции эталона, удовлетворяющей предварительным условиям.
Математическая модель распознавания на основе весовых коэффициентов и входных данных имеет вид: FP(FB FBA,q4)=F{f{MDLJ{f{MDLJ{FDII,q),qx)J{MDLJ{f{FBll,q)),qJ)),q), /(/(/( )) /( 4/(/(MDZ,/(FM,?) gJ,/(/V/m,/(/( „ )), ))),g3), q4). (2.37) Таким образом, спроектированная математическая модель оптико-электронного устройства распознавания образов на основе трехмерных векторных эталонов позволяет распознать изображение трехмерного объекта.
Распознавание объекта выполняется в два этапа: формирование трехмерных векторных эталонов и собственно распознавание (рис. 2.4, 2.5). Первый этап включает в себя формирование трехмерной модели, либо ее конвертирование из распространенного графического формата. Помимо этого определяется необходимое количество проекций трехмерной модели и расчет признаков каждой из них. Признаки формируются посредством построения плоской проекции трехмерной модели с заданными углами поворота по трем осям относительно плоскости проецирования. Признаками являются соотношение сторон габаритного контейнера (прямоугольника, описанного вокруг изображения объекта) и код проекции, математическая модель построения которого описана выше.
Распознавание выполняется поэтапно. На первом этапе осуществляется ввод изображения, затем определяются первичные признаки изображения объекта. Далее производится определение наличия проекций эталонов, имеющих схожие первичные признаки. При наличии соответствующего эталона выполняется построение соответствующей проекции и вычисление матрицы весовых коэффициентов и матрицы входных данных. На базе полученных данных принимается решение о принадлежности распознаваемого объекта к определенному классу эталона.
Синтез метода и алгоритмов распознавания
Достоверность распознавания определяется максимальным значением погрешности при заданном количестве изображений. Данный параметр зависит от информативных признаков объекта и погрешности метода. Зачастую используются эвристические методы и критерии, которые базируются на основополагающей в распознавании образов гипотезе компактности: увеличение расстояния между классами улучшает их разделимость. Рациональными считаются те признаки, которые максимизируют это расстояние. Таким образом, достоверность обусловлена расстоянием между классами объектов и особенностями метода распознавания.
Целесообразность использования подобных критериев обусловлена следующими обстоятельствами. Известно [56], что наиболее обоснованной и естественной из всех критериев информативности признаков является оценка ошибки классификации, поставленная в соответствие всем наборам признаков, сформированным на основе исходной системы переменных. Преимущество такого определения критерия информативности состоит в том, что основанием служит задача распознавания: в результате выбора какого-либо набора признаков дается непосредственная количественная оценка информативности данного набора, связанная с качеством классификации. Однако реализация такого подхода к оцениванию информативности признаков требует выполнения значительного объема сложных вычислений.
Другая группа критериев, используемых для оценки качества признаков или их наборов, основанная на статистике и теории информации, включает критерии, основанные на мерах расстояния, информационные критерии, а также критерии, базирующиеся на мерах вероятностной зависимости.
Результаты подробного анализа этих критериев приведены в [57], поэтому здесь отметим лишь, что все они, за исключением дивергенции (расстояние Бхаттачари, Матуситы и Фукунаги-Криля), имеют сложный аналитический вид. Как отмечено в [54], большинство критериев этой группы в параметрическом случае использовать неудобно (их расчеты требуют многократного интегрирования), а в параметрическом — оценки вероятности ошибочной классификации получаются смешанными. В виду этого использование для выбора информативных признаков весьма затруднено.
В отличие от критериев, основанных на статистике и теории информации, эвристические критерии являются более простыми. Причем несмотря на простоту, эвристические критерии в ряде случаев могут быть оптимальными [54].
В свою очередь достоверность метода определяется наличием шумов на исходном изображении и погрешностью аналогово-цифрового преобразования.
Максимальная погрешность аналого-цифрового преобразования равна [58] emax = log2N,/2, (3.1) где N/ - количество уровней дискретизации яркости. Среднее квадратическое отклонение [59] аналого-цифрового преобразования по уровню яркости равно єско= — ІГ- (3-2) где (т - среднее квадратическое отклонение функции 1 (х у), b — разрядность двоичного кода, используемого для кодирования уровня яркости. Вследствие искажения яркости 1ге пиксела на случайную равномерно распределенную в диапазоне [0, Єщах] величину є результирующая яркость 1п пиксела изображения примет значение In = Ire + Є Для оценки расстояния между классами эталонных объектов применяется кластерный анализ [60]. Критерий качества кластеризации в той или иной мере отражает следующие неформальные требования: а) внутри групп объекты должны быть тесно связаны между собой; б) объекты разных групп должны быть далеки друг от друга; в) при прочих равных условиях распределения объектов по группам должны быть равномерными.
Требования а) и б) выражают стандартную концепцию компактности классов разбиения; требование в) состоит в том, чтобы критерий не навязывал объединения отдельных групп объектов.
Узловым моментом в кластерном анализе считается выбор метрики (или меры близости объектов), от которого решающим образом зависит окончательный вариант разбиения объектов на группы при заданном алгоритме разбиения.
Исходя из того, что непосредственно на достоверность распознавания влияет используемый набор признаков, проведем анализ используемых в предложенной математической модели набора признаков, позволяющих обеспечить идентификацию объекта. 1. Соотношение сторон габаритного контейнера проекции векторной модели эталона имеет числовую характеристику AG, определяемую как нормированную в диапазоне [0,1] разность отношений сторон габаритного контейнера проекций эталона. 2. Соотношение кодов изображений представляет собой количество различных элементов матриц кодов для разных проекций эталонов. Определяется по формуле
Экспериментальное определение основных характеристик быстродействующего оптико-электронного устройства распознавания изображений объектов на основе трехмерных векторных эталонов
Приведенные диаграммы показывают, что модификация базы с использованием дополнительного пространства признаков и предварительного анализа при распознавании дает существенную экономию машинного времени, тем самым существенно повышает быстродействие оптико-электронного устройства распознавания.
Сравним полученные в ходе эксперимента результаты, представленные на рисунке 4.6, и рассчитанные значения среднего времени вычисления класса оптико-электронным устройством. Для этого выполним расчет временных затрат при аппаратной реализации по формуле (3.20).
Значение N вычисляется исходя из статистики, полученной в ходе эксперимента: количество испытаний равно 301, общее количество обращений к базе эталонов равно 2018, общее количество проекций эталонов в базе 473, таким образом, необходимо вычислить процентное соотношение среднего количества обращений к количеству проекций эталонов. Среднее количество обращений 2018/301=6,7 означает, что при распознавании в среднем перебирается 7 проекций эталонов, это достигнуто благодаря применению дополнительных признаков (3.7). В этом случае N будет рассчитано следующим образом: N- (2018/301)/473=0,014.
Значение коэффициента Е представляет собой отношение количества испытаний к количеству операций фиксирования результата. В нашем случае было произведено 806 операций записи, таким образом :Е=301/806=0,3 7.
Подставив полученные значения в формулу (3.20), выполним теоретический расчет среднего времени распознавания объекта:
Тобр= Тви+ 7/раеи=14мс+ Трасп =3.8+473-0.014(0,04 + 5,24+0,019 + 0,37-0,11)+ 3.3 =7.1+473-0.014-5.689= 42.46 мс.
Как видно из рисунка 4.6. практическое среднее время распознавания объекта составляет Г0ф„=41.59 мс. Полученные результаты свидетельствуют, что отклонение в расчетах оказалось минимальным. Далее произведем теоретический расчет зависимости быстродействия от количества параллельных модулей идентификации для указанных характеристик устройства.
Расчет производится согласно методике, описанной в главе 3 п. 3.5., результаты сведены в таблицу 4.6. Для наглядности построенная гистограмма (рис. 4.8).
Проведенный анализ показывает, что для работы устройства требуется наличие 2-4 параллельных модулей идентификации, дальнейшее увеличение количества очевидного прироста в быстродействии не дает.
Проведем оценку дополнительных характеристик разработанного оптико-электронного устройства распознавания изображений объектов на основе трехмерных векторных эталонов.
Для анализа характеристик ОЭУ было проведено моделирование на базе персонального компьютера. Разработано 10 моделей при использовании редактора трехмерной векторной графики 3D Мах [86], получена база эталонов описанным методом. Для проведения эксперимента в качестве входного изображения были использованы проекции, полученные средствами редактора трехмерной векторной графики.
Дополнительно для оценки влияния на достоверность разрешения изображения, сложности форм и количества объектов в базе был проведен эксперимент, основанный на использовании графических редакторов для получения входного изображения.
Произведем оценку влияния на достоверность распознавания количества эталонов в базе (рис. 4.9). эталоны 0,99 0,98 - 0,97 - 0,96 , 0,94 - 0,93 - Количество 0,92 . , . , і объектов в базе 12 3 4 5 6 7 8 9 10 Рисунок 4.9. Влияние количества эталонов на достоверность распознавания 122 Таблица 4.7. Влияние количества эталонов на достоверность распознавнаия № п.п. Достоверность распознавания Кол-во испытаний Наименование объекта 1 0,998 100 Шар 2 0,997 100 Куб 3 0,987 100 Пирамида 4 0,967 100 Самолет 5 0,965 100 Диск 6 0,957 100 Цилиндр 7 0,956 100 Танк 8 0,951 100 Автомобиль 9 0,95 100 Стрелка 10 0,949 100 Чайник Как видно из полученных данных, достоверность обратно пропорционально зависит количеству эталонов в базе, причем, чем сложнее форма объекта, тем меньше его влияние на достоверность при добавлении в базу. Это объясняется тем, что геометрические примитивы имеют большое количество схожих ракурсов, что отрицательно сказывается при идентификации.