Электронная библиотека диссертаций и авторефератов России
dslib.net
Библиотека диссертаций
Навигация
Каталог диссертаций России
Англоязычные диссертации
Диссертации бесплатно
Предстоящие защиты
Рецензии на автореферат
Отчисления авторам
Мой кабинет
Заказы: забрать, оплатить
Мой личный счет
Мой профиль
Мой авторский профиль
Подписки на рассылки



расширенный поиск

Методы и алгоритмы определения пространственных характеристик стационарных объектов при навигации мобильного робота с монокулярной системой технического зрения Бабич, Андрей Михайлович

Методы и алгоритмы определения пространственных характеристик стационарных объектов при навигации мобильного робота с монокулярной системой технического зрения
<
Методы и алгоритмы определения пространственных характеристик стационарных объектов при навигации мобильного робота с монокулярной системой технического зрения Методы и алгоритмы определения пространственных характеристик стационарных объектов при навигации мобильного робота с монокулярной системой технического зрения Методы и алгоритмы определения пространственных характеристик стационарных объектов при навигации мобильного робота с монокулярной системой технического зрения Методы и алгоритмы определения пространственных характеристик стационарных объектов при навигации мобильного робота с монокулярной системой технического зрения Методы и алгоритмы определения пространственных характеристик стационарных объектов при навигации мобильного робота с монокулярной системой технического зрения Методы и алгоритмы определения пространственных характеристик стационарных объектов при навигации мобильного робота с монокулярной системой технического зрения Методы и алгоритмы определения пространственных характеристик стационарных объектов при навигации мобильного робота с монокулярной системой технического зрения Методы и алгоритмы определения пространственных характеристик стационарных объектов при навигации мобильного робота с монокулярной системой технического зрения Методы и алгоритмы определения пространственных характеристик стационарных объектов при навигации мобильного робота с монокулярной системой технического зрения Методы и алгоритмы определения пространственных характеристик стационарных объектов при навигации мобильного робота с монокулярной системой технического зрения Методы и алгоритмы определения пространственных характеристик стационарных объектов при навигации мобильного робота с монокулярной системой технического зрения Методы и алгоритмы определения пространственных характеристик стационарных объектов при навигации мобильного робота с монокулярной системой технического зрения Методы и алгоритмы определения пространственных характеристик стационарных объектов при навигации мобильного робота с монокулярной системой технического зрения Методы и алгоритмы определения пространственных характеристик стационарных объектов при навигации мобильного робота с монокулярной системой технического зрения Методы и алгоритмы определения пространственных характеристик стационарных объектов при навигации мобильного робота с монокулярной системой технического зрения
>

Диссертация - 480 руб., доставка 10 минут, круглосуточно, без выходных и праздников

Автореферат - бесплатно, доставка 10 минут, круглосуточно, без выходных и праздников

Бабич, Андрей Михайлович. Методы и алгоритмы определения пространственных характеристик стационарных объектов при навигации мобильного робота с монокулярной системой технического зрения : диссертация ... кандидата технических наук : 05.13.17 / Бабич Андрей Михайлович; [Место защиты: Пенз. гос. технол. акад.].- Пенза, 2013.- 159 с.: ил. РГБ ОД, 61 14-5/532

Содержание к диссертации

Введение

ГЛАВА 1. Обзор современного состояния моделей и методов, используемых в системах навигации мобильных роботов 13

1.1 Методы, используемые при разработке систем навигации мобильных роботов 13

1.2 Основные подходы к определению искусственного интеллекта, используемые при решении задач навигации мобильных роботов 18

1.3 Модели систем распознавания, используемые в монокулярных системах технического зрения 29

1.4 Формальные языки описания систем 32

1.5 Мобильные роботы 36

1.6 Выводы по главе 1 41

ГЛАВА 2. Методика определения пространственных характеристик объекта с учётом состояния среды и автономного мобильного робота 43

2.1 Определение и постановка задачи 43

2.2 Распознавание формы поверхности объекта по затенению 47

2.3 Определение локальной ориентации поверхностей путём анализа искажения ракурса текстуры объекта 51

2.4 Распознавание формы поверхности по степени размытия объекта при изменении фокуса видеокамеры 55

2.5 Распознавание формы поверхности при взаимном перемещении объекта и видеокамеры 58

2.6 Сопоставление рассматриваемых методов 63

2.7 Выводы по главе 2 67

ГЛАВА 3. Метод определения пространственных характеристик выделенного стационарного объекта монокулярной системой технического зрения мобильного робота 68

3.1 Общая задача определения пространственных характеристик выделенного стационарного объекта монокулярной системой технического зрения 68

3.2 Решение подзадачи определения типа зависимостей, хранящихся в базе данных 71

3.3 Решение подзадачи определения интерполирующей функции входных данных и определения соответствия между полученной информацией и информацией в базе данных 80

3.4 Решение подзадачи определения пространственных характеристик объекта и формирования управляющего воздействия для корректировки курса 90

3.5 Использование нейросетевой адаптивной модели для определения пространственных характеристик выделенного стационарного объекта и управления мобильной платформой 96

3.6 База данных разработки системы технического зрения 100

3.7 Применение нечёткой математики 107

3.8 Выводы по главе 3 117

ГЛАВА 4. Экспериментальная проверка работоспособности разработанного метода 119

4.1 Моделирование работы разработанного алгоритма средствами 3D Studio Мах и среды Matlab 119

4.2 Разработка аппаратной части экспериментального стенда 126

4.3 Разработка программной части экспериментального стенда 130

4.4 Практическое использование 136

4.5 Выводы по главе 4 138

Основные результаты и выводы 140

Список сокращений и аббревиатур 142

Список литературы

Введение к работе

Актуальность темы исследования. На сегодняшний день автономные мобильные роботы и роботы, управляемые дистанционно, находят всё более широкое применение в таких областях как исследование космического пространства и океанских глубин, опасные производства, устранение последствий техногенных катастроф. Основным требованием, предъявляемым к таким роботам, является их точная ориентация в процессе перемещения в пространстве относительно неподвижных препятствий и подвижных объектов.

Одной из важных задач, решаемых в процессе перемещения мобильного робота, является определение его текущих координат. Для решения этой задачи необходимо предусматривать ввод и обработку визуальной информации об окружающей среде, полученной при навигации робота с помощью систем технического зрения.

Работа систем технического зрения, использующих несколько видеокамер, основана на сопоставлении изображений внешней среды, полученных с двух и более пространственно разнесенных точек мобильного робота. Благодаря пространственному разделению полученных изображений в подобных системах технического зрения определяется необходимая информация о пространственных характеристиках объекта.

Системы технического зрения, использующие одну расположенную на мобильном роботе видеокамеру, располагают единственным изображением и не получают информацию об объёме и удалении окружающих объектов, поэтому их использование предполагает наличие априорных сведений об окружающем их пространстве. Однако получение данных о пространственных характеристиках окружающих объектов также возможно за счёт сопоставления изображений, полученных в различные моменты времени при изменении взаимного положения наблюдателя и объектов (т.е. при наблюдении системой окружающего пространства и отслеживании изменений получаемых визуальных характеристик объектов с течением времени).

При определении навигационной системой местонахождения мобильного робота в пространстве и направления его перемещения требуется определять расстояния до подвижных и неподвижных объектов. Во многих случаях практического использования мобильных роботов оказывается достаточным определять расстояние до неподвижных объектов.

При проектировании мобильного робота, как и других мобильных устройств, особое внимание уделяется снижению массогабаритных показателей базирующихся на них приборов, в том числе и относящихся к системе технического зрения. Однако требования надежности и жизнестойкости вынуждают предусматривать в системе технического зрения специальную отдельную видеокамеру для определения дистанции до неподвижных объектов.

В работах научных коллективов ОАО «НИКФИ», группы «Транзас», Massachusetts Institute of Technology, Canadian Aviation Electronics, Defense Advanced Research Projects Agency, а также отечественных и зарубежных ученых Овечкиса Ю.Н., Роганова В.P., Roberts L., посвященных моделированию

визуально наблюдаемых трёхмерных объектов с качеством, достаточным для профессиональной тренировки глазомера наблюдателя, показана возможность использования безочковых одноканальных систем визуализации. По сравнению с системами визуальной ориентации на основе нескольких видео датчиков монокулярные системы обладают простотой, надежностью, их применение позволяет сократить производственные и эксплуатационные расходы. Однако многие вопросы, связанные с получением и обработкой визуальной информации в процессе управления движением автономного мобильного робота, использующего монокулярную систему навигации для определения дистанции до выделенных объектов в условиях помех и искажений изображений, остаются недостаточно проработанными. Это не позволяет расширить масштабы практического применения таких систем. В этой связи тема диссертационного исследования является актуальной.

Объектом исследования являются методы навигации мобильных роботов, оборудованных монокулярной системой технического зрения.

Предмет исследования - математические и имитационные модели процессов навигации и определения дистанции до выделенного стационарного объекта с использованием монокулярной системы технического зрения.

Целью диссертационной работы является повышение надежности и помехоустойчивости систем технического зрения автономных мобильных роботов при определении пространственных характеристик стационарных объектов в процессе навигации.

Для достижения поставленной цели сформулированы и решены следующие задачи.

  1. Разработка методики определения пространственных характеристик объекта с учетом условий окружающей среды и состояния автономного мобильного робота, оборудованного монокулярной системой технического зрения.

  2. Выявление критериев сопоставления динамических визуальных данных монокулярной системы технического зрения мобильного робота с пространственными характеристиками хранимых образов стационарных объектов.

  3. Разработка метода определения пространственных характеристик выделенного стационарного объекта и алгоритмов расчета отклонения робота от заданного курса для формирования управляющего воздействия по корректировке его курса.

  4. Разработка модели процесса автоматической локализации и определения пространственных характеристик наблюдаемого выделенного стационарного объекта по ряду разнесенных во времени его образов, обеспечивающей устойчивую работу монокулярной системы технического зрения в условиях помех и искажений изображений.

Методы исследований. Для решения поставленных задач использовались основные положения теории подобия и моделирования, методы цифровой обработки изображений, методы теории нейронных сетей, моделирование в средах 3D Studio Max, Matlab с использованием объектно-ориентированного языка программирования C++.

Научная новизна полученных результатов.

  1. Разработана методика определения пространственных характеристик объекта, отличающаяся анализом условий среды и состояния автономного мобильного робота, оборудованного монокулярной системой технического зрения, и комплексным подходом, что обеспечивает повышение помехоустойчивости системы технического зрения.

  2. Разработан метод определения пространственных характеристик выделенного стационарного объекта на основе анализа последовательности изображений, полученных при помощи монокулярной системы технического зрения мобильного робота.

  3. Разработан метод автоматической коррекции курса мобильного робота во время движения, отличающийся возможностью определения пространственных характеристик выделенного стационарного объекта и вычисления по изменяемым во времени входным данным угла отклонения от заданного курса.

  4. Разработана нейросетевая адаптивная модель автоматического определения пространственных характеристик наблюдаемого выделенного стационарного объекта по его изменяющимся во времени изображениям, отличающаяся использованием двух независимых подсистем нейронных сетей, обеспечивающая устойчивую работу монокулярной системы технического зрения в условиях помех и искажений изображений.

Практическая значимость работы.

Разработанная методика определения пространственных характеристик объекта позволяет расширить возможности использования монокулярных систем технического зрения за счёт совместного использования методов определения пространственных характеристик с учетом условий окружающей среды и состояния автономного мобильного робота.

Использование нейросетевой адаптивной модели дает возможность определять пространственные характеристики выделенного стационарного объекта и корректировать курс автономного мобильного робота с точностью, достаточной для движения мобильного робота по заданной траектории при наличии помех.

Внедрение результатов работы.

Результаты теоретических и экспериментальных исследований использованы в ООО «ВидеоЗ» (информационно-ресурсный центр по Пензенской области программы «Робототехника: инженерно-технические кадры инновационной России») для разработки программ перемещения мобильных роботов класса ПРОФИ, в ООО «Новые технологии» при решении задач автоматизированной загрузки пиролизных печей, в ОАО «НИИ «Рубин» при решении задач определения расстояний до выделенных объектов, а также внедрены в учебный процесс кафедры «Информационные компьютерные технологии» Пензенского государственного технологического университета, что подтверждено соответствующими актами.

Обоснованность и достоверность полученных результатов обеспечивается корректным выбором основных допущений и ограничений, обоснованием

критериев и показателей эффективности использования нейросетевых методов для определения расстояния до выделяемых объектов с использованием монокулярной системы ввода визуальной информации, подтверждается результатами имитационного моделирования и экспериментальными данными, полученными при испытаниях опытного образца мобильного робота. На защиту выносятся.

  1. Методика определения пространственных характеристик объекта с учетом условий получения исходных изображений и состояния автономного мобильного робота, оборудованного монокулярной системой технического зрения.

  2. Метод определения пространственных характеристик выделенного стационарного объекта по его изменяющимся визуальным характеристикам.

  3. Метод вычисления угла отклонения от заданного курса по изменяющимся во времени исходным данным для формирования управляющего воздействия по корректировке курса.

  4. Нейросетевая адаптивная модель процесса автоматической локализации и определения пространственных характеристик наблюдаемого выделенного стационарного объекта по совокупности разнесенных во времени его образов.

Личный вклад автора. Приведённые результаты получены автором самостоятельно. В работах, выполненных в соавторстве, лично автору принадлежит: в [1] - разработка математической модели и выполнение расчетов, в [7, 8] - систематизация подходов и обработка численных данных, в [10] - участие в разработке базового исследовательского модуля, в монографии [6] автору принадлежит глава 6.

Апробация работы. Материалы диссертационной работы докладывались и обсуждались на следующих конференциях: VI, VIII Всероссийских научно-технических конференциях «Современные методы и средства обработки пространственно-временных сигналов» (Пенза, 2008, 2010); Международном молодёжном научно-техническом форуме-олимпиаде по приоритетным направлениям развития Российской Федерации (Москва, 2010); Международных научно-технических конференциях «Проблемы автоматизации и управления в технических системах» (Пенза, 2011, 2013); XIX Международной научно-технической конференции «Радиолокация, навигация, связь» (Воронеж, 2013).

Публикации. По теме диссертации опубликовано 12 печатных работ, из них 5 - в изданиях, входящих в перечень ВАК, автору принадлежит глава в коллективной монографии.

Структура и объём диссертации. Работа состоит из введения, 4 разделов, основных результатов и выводов по работе, библиографического списка из 139 наименований и приложения. Текст изложен на 154 страницах, содержит 6 таблиц и 49 рисунков.

Модели систем распознавания, используемые в монокулярных системах технического зрения

При отнесении того или иного конкретного языка моделирования к определенному типу необходимо сначала определить какой типом механизма системных часов используется (непрерывный, комбинированный или дискретный).

В случае использования непрерывного представления системы, для установления связи между эндогенными и экзогенными переменными модели составляются уравнения (например дифференциальные). Дифференциальные уравнения могут быть также использованы для получения характеристик системы (язык MIMIC). В случае если экзогенные переменные модели принимают дискретные значения, уравнения являются разностными (язык DYNAMO).

Комбинированным представлением системы называется вид типовой схемы, в которой участвуют как непрерывные, так и дискретные величины. В качестве примера языка, использующего такой подход можно привести язык GASP, построенный на основе языка FORTRAN. Дискретные языки имитационного моделирования можно разделить на несколько принципиально различных групп: 1. Языки, ориентированные на события. Данный тип языков предполагает наличие списка событий, разделяющих моменты начала выполнения операций. 2. Языки, ориентированные на действия. Главное отличие данного типа языков от языка событий заключается в том что после пересчёта системного времени непрерывно производится просмотр действий с целью проверки выполнения условий начала или окончания какого-либо действия. 3. Языки, ориентированные на процессы. Под процессом понимается последовательность событий, связь между которыми устанавливается с помощью набора специальных отношений. Моделирующая программа организуется в виде набора описаний процесса каждый из которых описывает один класс. Описание процесса функционирования устанавливает атрибуты и активности всех процессов. Синхронизация операций во времени реализуются также с помощью списка будущих событий, который содержит точку возобновления конкретного процесса (точка прерывания) [61]. 4. Языки, ориентированные на транзакты. Такие языки применяются для описания пространственного движения динамических объектов, называемыми транзактами и представляют собой элементы потока. В процессе имитации транзакты создаются и уничтожаются. Функцию каждого из них можно представить как движение через модель Мт с поочередным воздействием на ее блоки.

ЯОН обычно очередь предоставляют программисту-разработчику модели Мм большие возможности и гибкость при разработке, отладке и использовании модели. Обычно эта гибкость достигается ценой больших усилий, затрачиваемых на разработку алгоритма поведения и программирования модели. Отсчет системного времени и контроль за ходом вычислений существенно усложняют всю систему и организацию выполнения операций.

Известны и хорошо зарекомендовали себя, многоцелевые языки общего назначения разработаны для решения задач практически из любой области. Учитывая, что создание искусственного интеллекта требует решения множества различных задач (например, математическая обработка изображений, логические вычисления, опрос датчиков, взаимодействие с электроникой), то универсальность многоцелевых ЯОН может явиться ключевой особенностью при выборе языка программирования для создания искусственного интеллекта мобильных роботов.

Среди прочих многоцелевых ЯОН следует выделить Lab VIEW и C++. Lab VIEW разработан для организации взаимодействия с измерительной и управляющей аппаратурой, что является одной из основных задач при проектировании робота. В отличие от других текстовых языков, таких как С, Pascal и др., где программы составляются в виде строк текста, в Lab VIEW программы создаются в виде графических диаграмм, подобных обычным блок-схемам [62], [63]. В то же время LabVIEW в большей степени ориентирован на АСУ ТП и АСНИ, в чём уступает более гибкому C++. В настоящее время язык LabVIEW является основопологающим средством, используемым при программировании мобильных роботов разрабатываемых по программе «Робототехника - инженерно-технические кадры инновационной России», нацеленной на вовлечение школьников и молодёжи в решение различных задач прикладного использования роботов.

Распознавание формы поверхности по степени размытия объекта при изменении фокуса видеокамеры

Рассмотрим ещё раз основные сложности и недостатки использования рассмотренных методов. При определении формы из затенения характерны два основных недостатка: 1) Сложности связанные с освещением объекта. В случае наличия в рассматриваемой сцене объекта достаточно сложной формы, отдельные части которого отбрасывают тень на участок его поверхности, осложняется вычисление вектора падающего света. Похожие трудности появляются при распознавании поверхности в области полной тени при подсветке рассеянным фоновым излучением, а также поверхности с неизвестными параметрами излучения подсветки. 2) Сложности связанные с визуальными характеристиками объекта. Рассматриваемый объект должен обладать чётко выраженными визуальными параметрами (текстура, отражательные свойства, прозрачность), определяемыми материалом объекта. Существует ряд случаев, когда из-за особенностей материала, вычисление вектора падающего света L становится невозможным. Прежде всего, это распознавание поверхности полупрозрачных материалов, материалов с различной шероховатостью и пигментацией, а также близких объектов с одним материалом.

Для методов определения формы из текстуры основным недостатком является наличие хорошо выраженного и выделяемого шаблона текселей. Кроме того, при помощи данного метода при отсутствии каких-либо других технических средств невозможно определить размер объекта и его удаление от наблюдателя.

Методы определения формы объекта из фокуса предъявляют повышенные требования к точности оптики, кроме того, серьёзным недостатком такого метода является высокая чувствительность к помехам.

К главным недостаткам методов, определяющих форму из движения можно отнести увеличение сложности вычислений при увеличении количества точек наблюдений. Кроме того, внесение помех хотя бы в одно изображение или полная его потеря, негативно сказывается на работе всей системы в целом. В случае использования многих точек наблюдения, помехи могут быть скорректированы (что потребует дополнительных вычислительных ресурсов), однако при сопоставлении малого количества снимков работа СТЗ может быть нарушена.

Таким образом, рассматриваемые методы можно подразделить на две основные группы: требующие и не требующие жёстких условий внешней среды (Таблица 2.1). Таблица 2.1 Сравнение методов определения формы объекта монокулярными СТЗ Жесткая привязка к условиям внешней среды Отсутствие жёсткой привязки к условиям внешней среды Форма из затенения Форма из текстуры Форма из фокуса Форма из движения Строго определённые параметры освещения; Требования к визуальным параметрам объекта; Наличие хорошо выраженного и выделяемого шаблона текселей; Наличие дополнительных средств определения дальности; Требования к точности оптики; Отсутствие помех; Наличие достаточных вычислительных ресурсов при увеличении количества точек наблюдения и для коррекции ошибок;

Исходя из выявленных свойств методов определения пространственных характеристик, которые были проанализированы выше, можно уточнить и упростить задачу (2.2) и методику ее решения (2.3) - (2.8).

Как было определено, всего существует 4 основных метода определения пространственных характеристик объекта. Таким образом, q=4 и множеством методов М будем считать множество М ={т\, т2, т3, та}, где тх - метод «Форма из затенения», т2 - метод «Форма из текстуры», т3 - метод «Форма из фокуса», та, - метод «Форма из движения». Смотри таблицу 2.1.

Причем метод «Форма из фокуса» несовместим с методом «Форма из движения», поскольку при вычислении формы из движения как правило используются объективы, практически не требующие фокусировки (например типа "рыбий глаз"). Метод «Форма из движения» может быть применен только, если Vp0s, больше заранее определенной величины Vmim где vpo6 - скорость движения робота, поскольку при медленном движении мобильной платформы методы определения формы из движения становятся неэффективными за счёт высокой схожести получаемых изображений.

Таким образом, выполняются условия: (тзєМЧт л єМЧтз). (2.29) Если {{vpo6 Vmin)A{vpo6e{uu и2,..., ud))), то ( еМ Нтз М1)). (2.30) Еспи ((vpo6 Vmin)A(vpo6e(uu и2,..., ud))), то ((т3еМ1)л(т4М1)). (2.31) К множеству параметров робота в наших целях можно отнести такие параметры как скорость мобильной платформы, параметры видеокамеры (угол обзора, тип и точность объектива), частота получения изображения с видеокамеры, вычислительная мощность аппаратной составляющей, параметры подвижной платформы.

К параметрам среды относятся: наличие подсвечиваемых маячков, наличие в области видимости хорошо выраженного и выделяемого шаблона текселей, наличие источников освещения с известными параметрами, размеры экспериментального стенда, запылённость воздуха и параметры поверхности, по которой движется мобильная платформа (возможность возникновения дополнительных помех за счёт тряски или пыли).

Параметры объекта - это его текстура, отражательные свойства, прозрачность, геометрическая сложность и габариты.

Отметим, что исходя из рассмотренных нами методов определения формы объектов монокулярными СТЗ, основными методами, используемыми в разработанной системе являются методы определения формы объекта из фокуса и методы определения формы объекта из движения, поскольку они не имеют жёсткой привязки к условиям внешней среды, в то время как методы определения формы из текстуры и затенения могут работать только в определённых условиях, а следовательно, включаются в работу эпизодически.

Решение подзадачи определения интерполирующей функции входных данных и определения соответствия между полученной информацией и информацией в базе данных

Следует отметить, что рост ошибки интерполяции с ростом числа точек - это фундаментальное свойство интерполяционного полинома. Точно проходя через все предписанные точки, он резко возрастает в интервале между ними.

Вторая причина, по которой не следует использовать сетку с равноудаленными узлами, тесно связана с первой. При интерполяции на сетке с равноудаленными узлами погрешности операций с вещественными числами могут накапливаться и привести к снижению качества интерполяции.

Рациональная интерполяция при практическом применении оказалась неудобна тем, что для любого набора точек существует интерполирующий полином, но не всегда можно построить интерполирующую рациональную функцию [114]. При использовании нейронных сетей радиальных базисных функций выявились следующие недостатки: 1) Повышение громоздкости сети при увеличении числа опорных точек, что приводит к увеличению количества вычислений, 2) Необходимость в большом количестве обучающих примеров для корректной работы сети.

Таким образом, после проделанного исследования практического использования различных методов интерполяции, было установлено, что на практике для решения задачи интерполяции входной информации наиболее эффективным является применение интерполяции сплайнами. Интерполируемая зависимость изменения размера выделенного стационарного объекта на изображении имеет достаточно простое строение (монотонно убывает, нет резких перегибов). При этом основными свойствами сплайнов является прохождение полученного графика точно через узловые точки, отсутствие резких перегибов и небольшая трудоёмкость вычислений.

Для того, чтобы установить соответствие между о, и хранящимися в базе функциями F3 введем метрику р(х,у), то есть функцию, удовлетворяющую трем аксиомам: аксиома рефлексивности - р(х,х)=0; аксиома симметричности - р(х,у)=р(у,х); аксиома транзитивности - p(x,z) p(x,y)+p(y,z).

Простейшим способом оценки сходства или различия двух графиков является использование метрик между объектами. Основные используемые метрики - это Евклидово расстояние, квадрат евклидова расстояния, расстояние городских кварталов, расстояние Чебышева и степенное расстояние [115]. Рассмотрим их более подробно.

Евклидово расстояние. Наиболее распространенная функция расстояния. Представляет собой геометрическим расстоянием в многомерном пространстве: P = ±(A,-Bf (3.28) Квадрат евклидова расстояния. Применяется для придания большего веса более отдаленным друг от друга объектам. Это расстояние вычисляется следующим образом: Р = (А,-В,)2. (3.29) Расстояние городских кварталов (манхэттенское расстояние) Это расстояние является средним разностей по координатам. В большинстве случаев эта мера расстояния приводит к таким же результатам, как и для обычного расстояния Евклида. Однако для этой меры влияние отдельных больших разностей (выбросов) уменьшается (т.к. они не возводятся в квадрат). Формула для расчета манхэттенского расстояния: Р = \А,-В,\ . (3.30) Расстояние Чебышева. Это расстояние может оказаться полезным, когда нужно определить два объекта как «различные», если они различаются по какой-либо одной координате. Расстояние Чебышева вычисляется по формуле: / = тах(Д-Д). (3.31) Степенное расстояние. Применяется в случае, когда необходимо увеличить или уменьшить вес, относящийся к размерности, для которой соответствующие объекты сильно отличаются. Степенное расстояние вычисляется по следующей формуле: Г = г (А,-В,У . (3.32) Здесь Р - расстояние между объектами А и В; А, - значение /-ого свойства объекта A;Bj- значение г -ого свойства объекта В. В случае сравнения двух графиков, А, и 5, - значения функции в точке абсциссы г. Параметр р ответственен за постепенное взвешивание разностей по отдельным координатам, параметр г ответственен за прогрессивное взвешивание больших расстояний между объектами. Если оба параметра -гир — равны двум, то это расстояние совпадает с расстоянием Евклида.

На практике использование данных метрик даёт сопоставимый результат. Для того, чтобы установить соответствие между о, и хранящимися в базе функциями F3 необходимо последовательно сопоставить полученную интерполированную информацию с уже имеющейся в базе данных и найти последовательность минимально отличающуюся от полученной. Это может занять существенное количество времени, поэтому при выборе метрики для программной реализации, следует руководствоваться быстротой вычислений. Наиболее простые вычисления происходят при использовании метода городских кварталов, следовательно, для оценки сходства или различия графиков следует использовать именно эту метрику.

Если обозначить через F50, полученную после интерполяции функцию, соответствующую наблюдаемому объекту, то в качестве ближайшей к ней функции выбираем функцию F3 , для которой выполняется: Р =тіп( p F30,! )), где хранящиеся в базе функции.

Разработка аппаратной части экспериментального стенда

В качестве проверки работоспособности данного метода было проведено моделирование работы данной СТЗ при помощи трёхмерного редактора 3D Studio Мах. Данные, полученные с его помощью использовались для обучения нейронной сети, а также последующей её проверки. Для создания нейронной сети использовалось пакет программ Neural network toolbox, входящий в состав Matlab.

При помощи редактора 3D Studio Мах моделировалось движение четырёх объектов с различными пространственными характеристиками относительно наблюдателя-видеокамеры [131].

В качестве объектов выступали шары с диаметром равным 40, 80, 120 или 160 сантиметра. Видеокамера располагалась на одном уровне с анализируемым объектом. Разрешение видеокамеры составляло 640x480 пикселей, угол обзора 40, дисторсия изображения отсутствовала. В виртуальной сцене каждый объект помещался напротив видеокамеры на расстоянии 100 метров, затем в течение 4,16 секунд (всего 100 кадров, 24 кадра в секунду) расстояние между объектом и видеокамерой сокращалось до 2,5 метров, и происходила запись потока изображений, получаемых с видеокамеры (рисунок 4.1). Затем изображения анализировались при помощи Matlab. На каждом изображении, начиная с первого, выделялся объект-препятствие и определялось значение его ключевого параметра - ширины в пикселях. Если ключевой параметр превышал минимальное значение 10 пикселей, происходила его запись в буфер. Так продолжалось до тех пор, пока ключевой параметр не превышал или становился равным 160 пикселей. После этого значения в буфере очищались за исключением последних 40. На рисунке 4.2 показаны графики содержимого буфера для всех четырёх объектов.

График полученной последовательности ключевых значений четырёх объектов Затем производилась интерполяция последовательности значений буфера сплайнами и поиск значения в последовательности, максимально приближенного к 160 пикселям. После этого из полученной последовательности подбиралось 40 значений таким образом, чтобы последним значением являлось найденное, 120 максимально приближенное к 160 пикселям значение. Период между значениями полученной последовательности равен периоду последовательности до интерполяции (рисунок 4.3).

Затем данная последовательность использовалась для обучения однонаправленной многослойной нейронной сети. Нейронная сеть, созданная при помощи Neural network toolbox состояла из двух слоев с логистической сигмоидальной функцией активации в каждом слое. Количество входов нейронной сети бралось равным 40 (количество значений последовательности), количество нейронов в выходном слое равно 4 (количество классифицируемых объектов). В качестве выхода выступал вектор из 4 значений, одно из которых равнялось единице, а остальные нулю. Позиция единичного значения вектора соответствовала номеру распознаваемого объекта. Количество нейронов в скрытом слое экспериментально было выбрано равным 10 [132].

Сеть использовала алгоритм градиентного спуска с возмущением и адаптацией параметра скорости настройки. Этот алгоритм основан на алгоритме обратного распространения ошибки и позволяет преодолевать локальные неровности поверхности ошибки и не останавливаться в локальных минимумах. Алгоритм реализует следующее выражение для приращения вектора весов сети [133] AW{k) = mcAW(k-l)+mJrg(k), (4.1) где AW - приращение вектора весов на к-ой итерации обучения; тс -параметр возмущения; 1Г — параметр скорости обучения; g(k) - вектор градиента функционала ошибки на -ой итерации обучения.

Обучение проводилось либо до достижения значения среднеквадратичной погрешности, равного 0,1, либо до выполнения 50000 эпох обучения. Значение параметра возмущения тс было выбрано равным 0,95; параметр скорости возмущения 1Г по умолчанию равен 0,01. Вектор градиента функционала ошибки вычислялся стандартными функциями Neural network toolbox (рисунок 4.4). На рисунке 4.5 представлен график ошибки обучения, получаемой на протяжении всего времени обучения нейронной сети. Ошибка достигла требуемой погрешности 0,1 через 34245 эпохи обучения.

Похожие диссертации на Методы и алгоритмы определения пространственных характеристик стационарных объектов при навигации мобильного робота с монокулярной системой технического зрения