Содержание к диссертации
Введение
Глава 1. Разработка интерпретатора дальномерной информации на базе нейрокомпьютерной техники 33
1.1. Обоснование использования нейронных структур для обработки дальномерной информации 33
1.2. Общая структура интерпретатора 41
1.3. Выводы по материалам главы 1 47
Глава 2. Алгоритмы выделения непроходимых одиночных препятствий 48
2.1. Стратегия обнаружения непроходимых одиночных препятствий . 48
2.2. Разработка неиросетевои модели выделения непроходимых одиночных препятствий на основе синтеза методов фильтрации и сравнения гипотез 50
2.2.1. Математическая постановка задачи выделения непроходимых одиночных препятствий 50
2.2.2. Оценка дальностной информации при отсутствии одиночных препятствий 53
2.2.3. Разработка НС оценки дальностной информации при наличии одиночных препятствий 55
2.2.4. Разработка неироалгоритма сравнения рисков Байеса 61
2.3. Разработка алгоритма выделения непроходимых одиночных препятствий с помощью обучающейся нейронной сети 69
2.4. Выводы по материалам главы 2 73
Глава 3. Разработка нейроалгоритмов выделения непроходимых наклонных участков поверхности и препятствий-навесов 7 4
3.1. Модели перехода от сферической к декартовой системе координат 75
3.2. Нейроалгоритм выделения непроходимых уклонов в зоне обзора -AMP 7 6
3.3. Разработка нейроалгоритма выделения непроходимых препятствий-навесов 7 9
3.3.1. Формализация критериев проходимости препятствий-навесов . 80
3.3.2. Построение нейронной сети выделения препятствий-навесов 82
3.4. Формирование матрицы скорректированных высот 8 6
3.5. Выводы по материалам главы 3 90
Глава 4. Разработка нейросетевых методов оконтуривания непроходимых участков поверхности и формирования выходной информации . 91
4.1. Нейроалгоритм обобщения информации о непроходимых участках поверхности зоны обзора AMP 91
4.2. Нейросетевой метод оконтуривания непроходимых участков поверхности 92
4.3. Формирование результирующей матрицы 95
4.4. Выводы по материалам главы 4 97
Глава 5. Экспериментальная система интерпретации дальномерной информации 98
5.1. Описание программно-аппаратного комплекса для проведения экспериментальных исследований 98
5.2. Модели робота и поверхности. Моделирование системы интерпретации дальномерной информации 106
5.3. Выводы по материалам главы 5 108
Заключение 110
Список использованных источников 112
Приложение 128
- Стратегия обнаружения непроходимых одиночных препятствий
- Разработка алгоритма выделения непроходимых одиночных препятствий с помощью обучающейся нейронной сети
- Формализация критериев проходимости препятствий-навесов .
- Нейросетевой метод оконтуривания непроходимых участков поверхности
Введение к работе
Робототехника является важным показателем развития научно-технического, промышленного и военного потенциала страны [118], характеристикой ее технического прогресса. Актуальность и совершенствование этого направления науки и техники характеризуется тенденцией к автоматизации и интеллектуализации различных отраслей, применению более современных технологий, не связанных с ограничениями, налагаемыми непосредственным участием в них человека [75].
Одним из приоритетных направлений робототехники является разработка мобильных роботов (MP), предназначенных для перемещения в разнообразных проблемных средах [43].
Область применения мобильных роботов простирается от производств с высокой степенью автоматизации, использующих технологию на основе применения гибких производственных систем (ГПС) - то есть систем, объединяющих совместно функционирующую в едином производственном процессе группу станков (или рабочих станций), управляемых с помощью ЭВМ и легко переналаживаемых под выпуск широкой номенклатуры изделий [21], до использования во враждебных или представляющих опасность для человека производствах и средах. Во втором случае, а также в особо трудных или вредных для здоровья человека условиях, например под водой, в шахтах, в космосе, в агрессивных газовых и жидкостных средах [62, 74, 76], возникает
необходимость выполнения работ без участия человека. В таких условиях используют автономные мобильные роботы (AMP), способные самостоятельно принимать решения в процессе адаптации к изменяющимся условиям внешней среды.
В соответствии с этим разрабатываются системы управления {СУ) сельскохозяйственных роботов [108], роботов для работы в цехах заводов и фабрик [100], подводных роботов [56], роботов для шахт [93], для работы в космосе и на поверхности планет [2, 89, 136] и в других экстремальных условиях [62, 66, 68, 69].
Использование AMP позволяет решать разнообразные проблемы на различных уровнях обобщения и трудности, в областях, которые охватывают вопросы восприятия, принятия решений, реализации коммуникаций и т.д. Все эти вопросы необходимо рассматривать в совокупности с такими атрибутами, как обработка данных в режиме их поступления, функциональные возможности, надежность работы [43].
Вследствие этого ключевыми вопросами в развитии AMP являются:
восприятие окружающей обстановки в пространстве;
планирование и принятие решений;
выполнение задач управления в реальном масштабе времени.
Главное отличие AMP от других типов роботов состоит в том, что AMP перемещается по практически неограниченному пространству и должен преодолевать встречающиеся на пути препятствия [14].
Существует два основных типа модели внешней среды, в которых осуществляется перемещение робота. В
первом случае рассматривается работа в хорошо организованной среде. Сюда относятся модели внешней среды большинства производственных мобильных роботов, функционирующих в обстановке, приспособленной для деятельности человека, типа склад, цех, коридор и т.п. [121]. Процессы восприятия внешней проблемной среды в этом случае могут существенно опираться на априорную информацию о ее свойствах (план, описание предметов и их свойств и т.п.) и на специально организованные информационные сигналы (метки-ориентиры, метки-классификаторы и т.п.).
Второй, наиболее интересный тип моделей внешней среды связан с работой в заранее неизвестной или плохо известной обстановке. Подобные задачи возникают при создании AMP, предназначенных для работы на заранее неизвестной местности. Для решения таких задач прежде всего необходимо учитывать тип движителя. В настоящее время наибольшее распространение получили следующие типы движителей MP: колесные [1, 8], шагающие [8, 39, 88], гусеничные [61], колесно-гусеничные [61], колесно-шагающие [17], прыгающие [61]. С учетом этих конструктивных особенностей разрабатываются системы управления AMP и формируются их информационные системы.
Существенная роль при разработке СУ роботов данного типа отводится получению и интерпретации информации о среде функционирования AMP, выполняемой системой технического зрения (СТЗ) [75] . Для получения информации об априорно неизвестной внешней среде функционирования AMP необходимо сенсорное устройство, позволяющее моделировать зрение человека. Сенсорная
система динамического объекта, в частности, мобильного
робота, должна снабжать его систему управления
информацией о текущей ситуации во внешней среде
{наличии, местоположении, типе и т.п. объектов
воздействия, препятствий и др.). Эта информация может
поступать на разные уровни СУ. Например, данные о
расположении препятствий нужны на высшем уровне для
построения модели рабочей среды в целях планирования
действий робота; результаты классификации объекта - на
стратегическом уровне для расчленения общего плана
действий на конкретные манипуляциоиные операции,
задания их последовательности и параметров; информация
об отклонении фактической траектории от
предусмотренной - на исполнительном уровне для
выработки управляющих сигналов на приводы и т.д. [81, 95, 99] .
Последние годы характеризуются появлением ряда работ, в которых указываются пути преодоления априорной неопределенности при решении задач приема и обработки информации. Эффективный путь решения указанной проблемы - использование адаптивных систем [3, 7, 12, 55, 69, 102, 110, 136] . При этом под адаптацией понимается обучение и самообучение, а также процесс оптимальной перестройки структуры приемного устройства в соответствии с критериями качества. Выбор критериев оптимальности, естественно, определяется назначением системы [30, 103, 137].
Роль AMP со встроенной системой технического зрения особенно существенна при расширении процесса роботизации в таких областях, как горнодобывающая промышленность, строительство, сельское и лесное
хозяйство и т.п., где рабочая среда носит плохо структурированный характер. Системы технического зрения необходимы роботам, предназначенным для исследования космического и подводного пространства, используемым при стихийных бедствиях и др. В таких случаях СТЗ должна не только обеспечивать данные для непосредственной выработки сигналов обратной связи при управлении движением робота и передачу сведений об окружающей среде, но и готовить информацию для формирования роботом модели рабочей среды в целях автоматического планирования действий [42, 75, 95, 99] .
При разработке СТЗ в ряде случаев можно использовать те или иные из созданных ранее технических средств, алгоритмов или приспособить их к задачам робототехники с незначительной модификацией. Однако часто специфика робототехнических приложений требует развития оригинальных подходов к созданию СТЗ с учетом новых функциональных задач, конкретных возможностей реализации и условий работы в составе робототехнических систем.
Проблемы, связанные с техническим зрением роботов, достаточно хорошо исследованы в работах Л.Н. Лупичева [67], В.И. Новожилова [67], Ю. Г. Якушенкова, B.C. Розова [51, 81] и др., где в качестве сенсорных элементов, являющихся важнейшей частью СТЗ, использовались фотометрические, ультразвуковые [60], локационные {с использованием
рентгеновских и у-лучей), оптические триангуляционные, фотонные, моно- и стереотелевизионные датчики.
Создание СТЗ робота, отвечающей ее конкретному функциональному назначению, включает следующие этапы:
постановку задачи на содержательном уровне и составление технического задания на СТЗ;
выбор структурной и функциональной схем СТЗ;
математическую формулировку задач функциональных блоков СТЗ;
разработку алгоритмов решения функциональных задач;
выбор средств реализации алгоритмов и конкретизации технических характеристик аппаратных, аппаратно-программных и программных блоков СТЗ в соответствии с техническим заданием;
разработку аппаратного и программного обеспечения СТЗ.
Системы технического зрения робота по функциональному назначению {в зависимости от области и конкретных условий его применения} можно подразделить на много классов. Наиболее типичными функциями СТЗ являются: регистрация наличия объекта в поле зрения датчика (зоне обзора робота); подсчет числа объектов, находящихся в зоне обзора; считывание и расшифровка меток; обнаружение препятствий, мешающих движению робота; классификация {распознавание} объектов; поиск нужных объектов на рабочей сцене; измерение геометрических параметров объекта и т.д. [1, 81]. В данной работе рассматривается один из классов СТЗ, основной задачей которой является интерпретация информации, получаемой со сканирующего дальномерного
устройства с целью обнаружения непроходимых участков поверхности.
Для выделения непроходимых участков поверхности необходимо составить систему условий, так называемые "критерии проходимости". Для колесного многоприводного AMP существуют следующие критерии статической непроходимости (при скорости робота, близкой к нулю) [44, 45, 46]:
Одиночно выступающие препятствия (камни, валуны, эскарпы, контрэскарпы) считаются непроходимыми, если высота препятствия превышает треть диаметра колеса робота;
Препятствие в виде рва (канавы) непроходимо, если его ширина превышает некоторую величину, определяемую расстоянием между крайними осями робота;
Наклонная поверхность считается непроходимой, если ее наклон превышает некоторое значение, определяемое наименьшим из критических углов крена и дифферента робота;
Поверхность непроходима, если возможен отрыв от поверхности хотя бы одного колеса;
Поверхность непроходима, если происходит касание ее днищем робота, или если робот принимает такое положение, когда крен его и дифферент превышают критические значения.
Аналогичные условия непроходимости могут быть сформулированы и для шагающего робота.
Задача проверки условий проходимости может быть решена идентификацией поверхности в зоне обзора с получением оценок ее параметров, соответствующих физическим условиям проходимости, методом расчленения
сложных форм поверхности на более простые элементы (классы), исходя из критериев непроходимости [44].
К системам управления адаптивных роботов, способных эффективно функционировать в условиях недетерминированной внешней среды, в том числе AMP, предназначенных для использования в рабочей зоне с вредными и опасными для человека условиями, в военных целях и других специальных применений, предъявляются достаточно противоречивые требования [54, 55] . Такие системы должны обрабатывать большие объемы информации в реальном масштабе времени, определяемом темпом поступления информации и скоростью перемещения робота, а с другой - массогабаритные и энергетические характеристики технических средств должны удовлетворять жестким ограничениям и обеспечивать возможность функционирования на борту AMP [8 9]. Первое требование связано с обеспечением непрерывного движения на местности и глубины планирования движения.
В качестве сенсорного устройства могут выступать телевизионные [43, 81] или дальномерные [5, 18, 22, 39, 48, 81, 95, 114] датчики.
Однако, если AMP функционирует в условиях труднопроходимого рельефа, сложность задач совместного анализа последовательности изображений {поступающих с одной или нескольких телекамер), необходимого для определения пространственных координат объектов внешней среды, резко возрастает, что приводит к ограничению скорости движения робота. В частности, экспериментальный робот, созданный в рамках исследовательской программы NASA по проблемам навигации планетоходов, оснащенный двумя
стереоскопическими телекамерами и вычислительной системой на базе процессора Motorola 68040, мог перемещаться со скоростью 1.5 м/с [133].
Из этих соображений очевидно, что использование дальномерных СТЗ, позволяющих получать информацию о внешней среде непосредственно в виде ее геометрических характеристик, значительно упрощает последующую обработку. При этом среди существующих и перспективных дальномерных систем требованиям, предъявляемым к бортовым системам, наилучшим образом отвечают СТЗ на основе сканирующего лазерного дальномера {СЛД), вырабатывающего данные в сферической системе координат. Существенными особенностями СЛД являются сравнительное небольшое энергопотребление, масса, они компактны, обладают достаточным быстродействием, разрешающей способностью и точностью измерений (в настоящее время разработаны СЛД с инструментальной погрешностью, составляющей 0.1-0.2 мм на расстояниях до 100 м) [22, 55] .
Подавляющее большинство лазерных дальномеров {ЛД) , используемых в настоящее время, содержит твердотельный лазер с оптической накачкой в качестве источника передаваемой мощности [106].
Лазеры являются источниками света от инфракрасного до ультрафиолетового излучения. Частично они излучают непрерывно, частично в виде отдельных импульсов. Почти всегда излучение монохроматично и сильно сфокусировано. Посредством твердотельных лазеров достижима очень высокая импульсная мощность, что приобретает особое значение в науке и технике. При помощи их удается создавать и излучать отдельные
световые вспышки особо высокой энергии (лазер с нечетким импульсом) . Такая световая вспышка, как только она отразится от любого объекта, снова может приниматься фотодиодом. Оба процесса - излучение и прием - можно записать во времени, благодаря своей взаимосвязи они способствуют созданию метода быстрого и точного измерения дальности [71].
В качестве лазерных источников могут использоваться твердотельные лазеры (содержат рабочее тело, способное создавать оптическое усиление в резонаторе, в котором возникает положительная обратная связь), газовые лазеры {с непрерывным излучением), полупроводниковые лазеры (используются в точных дальномерах и в датчиках при дальности 10-100 м) [106].
Измерение дальности представляет собой информацию об относительном движении между дальномерным устройством и объектом измерения. Время прохождения лазерного импульса до цели и обратно определяет измеряемое оптическое расстояние, которое отличается от геометрического расстояния в результате воздействия рефракции, дисперсии и турбулентности атмосферы. Это различие в основном зависит от температуры и давления атмосферы [116].
Современный (классический) метод измерения дистанции основан на оптическом дистанционном измерении, триангуляции. При переходе к большим длинам необходимо считаться со значительным увеличением погрешности, обусловленным неточностью системы [71].
При известной скорости распространения, которая может приниматься постоянной по всему участку, можно с
достаточной точностью определить дальность. Искомая дальность R получается из простой связи между временем
рассеяния импульса At и скоростью распространения света С0 [71] :
R = -C0At.
Наряду с самостоятельным применением все большее значение придается СЛД в качестве составной части комплексной электротехнической системы измерения и наблюдений, при помощи которой, кроме точного опознавания объекта, осуществляется надежное, быстрое и точное измерение (в частности, СЛД использовался для слежения за мишенями с целью мгновенного определения положения высокоскоростных летательных аппаратов, для измерения дальности до Луны и до искусственных спутников Земли и т.п. [106]). Устройства такого рода имеют типичный радиус действия до 10 км (он определяется выбором параметров устройства). При неблагоприятных условиях погоды он может уменьшаться, так как потери на поглощение в атмосфере и обратное рассеяние излучения в парах воды, промышленных отходящих газах и мельчайших частицах пыли означает снижение интенсивности, возрастающее с дальностью. Влияние этого коэффициента снижения на максимально возможный радиус действия и его связь с соответствующими энергетическими параметрами и параметрами измерения объекта может быть представлено уравнением [71]:
р -Р p-2Pi*T? —г
где:
РЕ - мощность принимаемого сигнала;
Ps - излучаемая мощность;
Д - постоянная поглощения воздуха;
R - искомая дальность;
FE - площадь в месте приема;
rz - коэффициент отражения цели.
Использование СЛД требует разработки соответствующего алгоритмического обеспечения систем технического зрения.
В работе предполагается, что сканирование зоны обзора лучом лазерного дальномера может быть проведено как в условиях "прямоугольной", так и в условиях "косоугольной" съемки. В этих условиях при априори неизвестном виде и распределении препятствий важно обеспечить необходимую плотность замеров. Наиболее целесообразной при этом считается равномерная плотность замеров, то есть такое сканирование, при котором на ровной поверхности точки замеров отстоят на приблизительно одинаковом расстоянии друг от друга, достаточном для выявление мелких непроходимых препятствий.
Прежде чем начать анализ какого-либо явления или объекта, нужно получить о них определенную, каким-либо способом упорядоченную информацию. Такая информация представляет собой характеристику объектов или явлений [20] .
Опыт автоматизации сложных объектов показал, что необходимо использовать все возможности классической теории управления, но там, где это невозможно, следует
где:
РЕ - мощность принимаемого сигнала;
Р3 - излучаемая мощность;
Д - постоянная поглощения воздуха;
R - искомая дальность;
FE - площадь в месте приема;
rz - коэффициент отражения цели.
Использование СЛД требует разработки соответствующего алгоритмического обеспечения систем технического зрения.
В работе предполагается, что сканирование зоны обзора лучом лазерного дальномера может быть проведено как в условиях "прямоугольной", так и в условиях "косоугольной" съемки. В этих условиях при априори неизвестном виде и распределении препятствий важно обеспечить необходимую плотность замеров. Наиболее целесообразной при этом считается равномерная плотность замеров, то есть такое сканирование, при котором на ровной поверхности точки замеров отстоят на приблизительно одинаковом расстоянии друг от друга, достаточном для выявление мелких непроходимых препятствий.
Прежде чем начать анализ какого-либо явления или объекта, нужно получить о них определенную, каким-либо способом упорядоченную информацию. Такая информация представляет собой характеристику объектов или явлений [20].
Опыт автоматизации сложных объектов показал, что необходимо использовать все возможности классической теории управления, но там, где это невозможно, следует
органа манипулятора, прямые и обратные задачи кинематики и динамики. СУ мобильными роботами, автомобилем [122], автономными подводными аппаратами в настоящее время также разрабатываются на НС.
Так как AMP должен обладать способностью адаптироваться к произвольной реальной среде функционирования, а также вырабатывать управляющие воздействия в реальном масштабе времени, то целесообразно разрабатывать как его систему управления в целом, так и подсистему интерпретации дальномерной информации в неиросетевом логическом базисе.
При разработке нейросетевых моделей решения различных задач используются, как правило, два различных подхода. Первый состоит в том, чтобы переложить на нейронную сеть уже существующие хорошо зарекомендовавшие себя классические (традиционные) последовательные алгоритмы. Но, как правило, данный подход не приносит ожидаемого эффекта, так как методы, применяемые в разработках, реализованных на микропроцессорных ЭВМ, используют лишь небольшую часть возможностей НС и зачастую оказываются громоздкими и малоэффективными при реализации в неирокомпьютерном логическом базисе. Поэтому наиболее часто используется второй подход, состоящий в разработке новых алгоритмов решения непосредственно в неиросетевом исполнении с учетом достоинств существующих методов.
В нашей стране и за рубежом уже продолжительное время ведутся работы по созданию AMP с СТЗ [43, 126, 133, 135].
Впервые исследования в области производства MP были начаты в Стэнфордском исследовательском институте
в конце 60-х годов [43] . В 1968 и 1971 гг. были созданы две версии автономного мобильного робота SHAKEY. Этот робот имел два свободных колеса и два независимо управляемых колеса, имеющих приводы от шаговых двигателей; был оснащен телекамерой, оптическим дальномером и несколькими датчиками касания.
В университете Беркли в 1970-1975 годах был создан робот JASON, у которого в качестве датчиков выступали ультразвуковой сканирующий дальномер и 8 инфракрасных дальномеров на светоизлучающих диодах. В 1975-197 9 годах для исследования планет солнечной системы был создан робот Mars ROVER, представляющий собой тележку небольшого размера [12 6].
Относительная сложность функциональных задач СТЗ характеризуется рядом признаков, таких как размерность рассматриваемой сцены {дву- или трехмерные), степень изолированности объектов, однородность объектов, стационарность рабочей сцены, число элементов изображения, число градаций яркости, спектральный состав видеосигнала.
Задачи распознавания объектов реального трехмерного мира, наблюдаемых в естественных условиях, составляют отдельную область приложения методов распознавания образов и методов искусственного интеллекта [20]. Объемность рассматриваемых объектов заметно увеличивает трудность решения задач по сравнению с более традиционными задачами распознавания одно- и двухмерных объектов.
В конце 70-х годов разрабатывался мобильный робот HILARE, предназначенный для функционирования в среде,
представляющей собой гладкую (или почти гладкую) поверхность, окруженную стенами, которые образуют комнаты, холлы, коридоры; в них могут находиться различные перемещаемые объекты, мобильные и неподвижные препятствия. HILARE представлял собой трехколесную транспортную тележку, оснащенную ультразвуковой сенсорной системой и видеодатчиками (лазерным дальномером и телекамерой), имеющую вес 400 кг, размеры 1100x1100x700 и достигающую максимальную скорость 1 м/с.
Под руководством профессора К.Н. Шена (США) построен макет автономного колесного транпортного робота, оснащенного лазерной СТЗ, с 6-ю неповоротными мотор-колесами, предназначенного для исследования планеты Марс [136].
Значительных результатов достиг коллектив, возглавляемый Д.Е. Охоцимским и А.К. Платоновым, разработавший действующие макеты шестиногого шагающего и четырехколесного роботов, снабженных СТЗ на базе полупроводникового лазерного дальномера. Построен программно-аппаратный комплекс для управления этими макетами. Исследованы теоретические и практические проблемы, связанные со сбором и обработкой информации, поступающей с дальномера, и необходимой для обеспечения движения робота [88].
Коллективом под руководством А.Л. Кемурджиана построены робот с неповоротными мотор-колесами и колесно-шагающий робот с системой технического зрения (СТЗ) на основе полупроводникового лазерного дальномера [2, 57] . СТЗ позволяет прогнозировать профильную проходимость на полкорпуса вперед.
Обработка информации производится на аналоговом устройстве.
Коллективом под руководством Н.М. Амосова и Э.М. Куссуля создан трехколесный робот "ТАИР", снабженный СТЗ на базе триангуляционного оптического дальномера. Обработка информации ведется на устройстве, построенном на основе М-сетей [8].
В институте проблем управления (ИПУ) построен транспортный робот "Кентавр" с восемью неповоротными колесами и СТЗ на основе ТВ-камеры и полупроводникового лазерного дальномера [16, 17].
Для вышеперечисленных AMP СТЗ были основаны на алгоритмах, предназначенных для реализации на последовательной технике, что ведет к существенным ограничениям в скорости обработки информации, которая должна быть проанализирована и интерпретирована.
Подход к разработке СТЗ, основанной на использовании однородных нейроподобных структур, был предложен при построении AMP коллективом под руководством А. В. Каляева [54] . Его недостатками является сложная организация СТЗ и недостаточно большая глубина просмотра.
Из последних работ следует отметить комплексную реализацию системы управления автономным транспортным роботом "MAVIN" (Mobile Adaptive Visual Navigator) специалистами Бостонского университета с использованием динамических нейронных сетей. Его СТЗ основана на классических методах обработки информации [119] .
Аналогичные работы проводились в Германии, Японии и др. странах [108, 129, 130].
Разработка нейроалгоритма и построение неиросетевои модели выделения непроходимых одиночных препятствий в зоне обзора AMP.
Выбор критериев проходимости и разработка адекватного нейросетевого метода для выделения препятствий-навесов.
Выделение непроходимых уклонов на поверхности зоны обзора AMP с целью выявления тех участков поверхности, на которых робот может перевернуться.
Оконтуривание всех определенных непроходимых участков поверхности.
Формирование выходной информации в виде результирующей матрицы, содержащей информацию о всех непроходимых участках зоны обзора робота с учетом оконтуривания.
Поставленные задачи решаются с учетом критериев статической проходимости на основе применения классических нейросетевых парадигм и разработки специализированных НС. Используются методы классификации областей, методы прямого и обратного распространения информации по НС, метод обучения НС с учителем.
Для исследования синтезируемых алгоритмов и их неиросетевои реализации широко применялось моделирование на ПЭВМ. Окончательные исследования нейросетевого обеспечения проводились на многопроцессорном комплексе LNEURO 1.0.
Очевидна практическая ценность разработанного нейросетевого комплекса, являющегося необходимой частью адаптивной системы управления AMP. Полученные
результаты могут быть применены в реальных робототехнических системах.
Полученные в работе результаты были использованы в научно-исследовательской разработке и внедрены в Научном центре нейрокомпьютеров (НЦН), о чем свидетельствует соответствующий акт.
Результаты работы докладывались и были обсуждены на:
научно-технической конференции-конкурсе студентов, аспирантов и молодых специалистов (Москва, МГИЭМ, 1994 г.);
международной студенческой школе-семинаре "Новые информационные технологии" (Крым, 1994, 1995, 1996 гг.);
межвузовской научно-технической конференции "Микроэлектроника и информатика" (Москва, МГИЭТ, 1996 г.);
научном семинаре "Управление" под руководством проф. А. А. Первозванского {Санкт-Петербургский государственный технический университет, 1996 г.)
школе-семинаре "Нейрокомпьютинг" под руководством проф. Б.Н. Оныкия (МИФИ, 1996 г.)
научно-практическом семинаре "Новые информационные технологии" {МГИЭМ, 1998 г.);
научном семинаре "Управление и устойчивость" кафедры Кибернетика МГИЭМ под руководством проф. В.Н. Афанасьева, проф. В. Р. Носова, проф. В.Б. Колмановского (МГИЭМ, 1998 г.)
ряде Всероссийских и Международных конференций и рабочих совещаний, в том числе:
International Workshop "New Computer Technologies in Control Systems" (Pereslavl-Zalessky, August 13-19 1995; 29 July - 2 August 1996);
Всероссийской конференции "Нейрокомпьютеры и их применение (НКП)" (Москва, 1995, 1996, 1998 гг.);
Научно-технической конференции "Экстремальная робототехника" (С.-Петербург, 17-19 апреля 1996 г.; 16-18 апреля 1997 г.);
Украинской конференции "Моделирование и исследование устойчивости систем (моделирование систем}" (Киев, 15-19 мая 1995 г.; 20-24 мая 1996 г.);
Втором Международном симпозиуме "Интеллектуальные системы" (С.-Петербург, 1-4 июля 1996 г.);
International Workshop "Symbolic-Numeric Analysis of Differential Equations (SNADE-97)"
(Prague, 16-18 June 1997);
- Third International Workshop "Singular Solutions
and Perturbations in Control Systems (SSPCS-97)"
{Pereslavl-Zalessky, July 7-11 1997).
Основные положения диссертационной работы изложены в 17 публикациях, из них 4 на иностранных языках.
Диссертация состоит из введения, пяти глав, заключения, списка литературы и приложения. Объем работы: 136 печатных страниц текста, включая рисунки. Библиография содержит 14 0 наименований, из них 22 на иностранных языках.
В первой главе обосновано использование нейронных структур в качестве базового вычислителя для системы
обработки дальномерной информации. Рассмотрена общая постановка задачи и описана структура нейроинтерпретатора, предназначенного для ее решения.
Сенсорное устройство (сканирующий дальномер} вырабатывает данные в сферической системе координат с началом в так называемой "базовой" точке. Результаты измерения представляются в виде матрицы дальностей D = {dij} (i=l, . . . ,М; j=l, ... . ,N) , которая содержит информацию о расстояниях от базовой точки дальномера до точек пересечения луча дальномера с поверхностью. Эти данные получаются за счет варьирования азимутального угла и угла места. Элементы матрицы упорядочиваются согласно значениям этих углов. Размерность матрицы дальностей зависит от плотности замеров и размера зоны обзора робота, который, в свою очередь, определяется исходя из назначения AMP и технических возможностей лазерного дальномера.
Матрица дальностей D рассматривается по столбцам:
D = (d1, d2,..., dM).
При этом каждый элемент j-ro столбца этой матрицы представляется в виде:
d{=4+ vj (і = 1,..., N),
где:
г? - истинное расстояние между базовой точкой дальномера и точкой пересечения луча дальномера с поверхностью в зоне обзора;
v:[ - погрешность измерения дальности.
Необходимо обработать матрицу дальностей с целью определения всех непроходимых участков поверхности зоны обзора.
Для решения поставленной задачи предложена структура нейроинтерпретатора, состоящего из отдельных неиросетевых блоков, каждый из которых предназначен для решения определенной подзадачи
Представлены нейросетевые блоки, предназначенные для реализации алгоритма выделения непроходимых одиночных препятствий в зоне обзора AMP, перехода в декартовую систему координат, выделения препятствий-навесов, определения непроходимых уклонов поверхности зоны обзора AMP, обобщения информации обо всех рассматриваемых типах непроходимых препятствий, и оконтуривания всех выделенных непроходимых участков поверхности.
Во второй главе решена задача выделения непроходимых одиночных препятствий в зоне обзора AMP. Разработаны и проанализированы альтернативные нейроалгоритмы, реализующие решение данной задачи. В частности, анализируется эффективность описанного в [132] метода Робертса.
Произведена нейросетевая реализация алгоритма, описанного в [44] и основанного на синтезе уравнений дискретного фильтра Калмана и байесовского метода сравнения статистических гипотез.
Приведена математическая модель, включающая уравнения состояния и наблюдений. Вводится стратегия обнаружения непроходимых одиночных препятствий.
Разработан альтернативный нейроалгоритм решения задачи выделения одиночных непроходимых препятствий,
основанный на использовании неиросетевои парадигмы обучения с учителем; этот алгоритм обладает более высоким быстродействием по отношению к предыдущему, прост в реализации, но менее точен. В соответствии с алгоритмом разработана НС, позволяющая настраивать пороговое значение для оценки нелинейного скачкообразного возмущения, отражающего перепад изменений в последовательных показаниях дальномера по расстоянию и свидетельствующего о наличии края препятствия на поверхности.
В третьей главе разработаны алгоритмы выделения препятствий-навесов и выделения непроходимых уклонов поверхности зоны обзора.
Для построения этих алгоритмов предварительно производится переход в декартовую систему координат.
Выделение непроходимых уклонов проводится с целью выявления тех участков поверхности, на которых AMP может перевернуться.
Для каждой точки поверхности зоны обзора AMP формируется окрестность (прямоугольная область), соизмеримая с поверхностью робота, с центром в этой точке. Далее для каждой точки из сформированного участка поверхности записывается уравнение плоскости {без учета точек, принадлежащих предварительно выделенным одиночным препятствиям).
Эти уравнения представляются в виде системы линейных уравнений (в общем случае несовместной); ее решением является вектор, первая и вторая компоненты которого характеризуют соответственно поперечный и продольный наклоны участка поверхности. Нахождение этого вектора реализуется НС с обратной связью.
Если наклон поверхности превышает значение, определяемое наименьшим из критических углов крена и дифферента робота, то рассматриваемая точка поверхности считается непроходимой, и соответствующий
элемент бинарной матрицы U* становится равным 1.
Для разработки нейроалгоритма выделения препятствий-навесов предварительно вводится множество точек {Sq} , расстояние от которых до рассматриваемой точки меньше линейного шага сетки сканирования. Среди всех элементов этого множества ищется точка с минимальной высотой (координатой z) . В случае, если точка поверхности проходима, ее высота полагается равной значению высоты этой точки.
Для каждой точки поверхности формируется множество Sq, в нем производится поиск точки с минимальной высотой, и анализируется проходимость данной точки с использованием предложенных критериев проходимости для препятствий-навесов.
В соответствии с этим алгоритмом разработана НС выделения препятствий-навесов, состоящая из нейроблоков определения принадлежности точки поверхности к множеству Sg, нахождения точки с минимальной высотой в этом множестве и вычисления значения функции LQ(q), определяющей, является ли точка q проходимой.
Для формирования матрицы скорректированных высот также разработана соответствующая НС, состоящая из двух нейроблоков.
В четвертой главе разработаны алгоритмы оконтуривания непроходимых участков поверхности и формирования результирующей матрицы.
Предлагается принцип обобщения информации обо всех непроходимых участках поверхности зоны обзора AMP (с точки зрения рассматриваемых в работе типов препятствий - непроходимых одиночных препятствий, уклонов, препятствий-навесов}, основанный на поэлементном наложении данных из матриц D*, U* и L*.
По результатам такого "наложения" информации формируется бинарная матрица Р, для получения которой разработана однослойная НС.
Используя данные о технических и геометрических характеристиках робота, выбирается минимально
допустимое расстояние (&) , позволяющее объединять точки, относящиеся к различным непроходимым препятствиям. Для каждой точки зоны обзора робота
формируется множество Caj, включающее все точки поверхности, расстояние от которых до рассматриваемой
точки (Pjj) не превышает 3. В случае наличия
препятствий в этой окрестности ру маркируется как
непроходимая.
Для оконтуривания препятствий предложена однослойная НС, на вход которой поступают элементы матрицы Р, соответствующие точкам поверхности из
окрестности С1:.
Последний каскад в схеме интерпретатора служит для формирования результирующей матрицы, содержащей информацию о всех непроходимых участках зоны обзора робота с учетом оконтуриванияг а также о реальных высотах всех проходимых точек зоны обзора.
Для формирования такой матрицы разработана однослойная нейронная сеть. Выходами нейронов являются
либо реальные высоты соответствующих точек поверхности, либо число А (используется для обозначения непроходимости данной точки). Эти значения заносятся в результирующую матрицу.
В пятой главе описана экспериментальная система интерпретации дальномерной информации. Приведено описание программно-аппаратного комплекса для проведения экспериментальных исследований, модели робота и типов анализируемой поверхности.
Разработанная нейросетевая система обработки дальномерной информации для. AMP была протестирована на многопроцессорном комплексе LNEURO 1.0, представляющем собой программно-аппаратную эмуляцию нейронных сетей.
Приведены основные характеристики LNEURO 1.0. Архитектура комплекса включает параллельный компьютер, в котором располагаются суперблок и тандем (парный блок), отвечающие за поддержку параллельности вычислений. Суперблок представляет собой параллельную транспьютерную систему, содержащую 32 обычных и несколько специальных INMOS-транспьютеров. Каждый транспьютер имеет оперативную память от 1 до 8 МБ и 4 линии связи, позволяющие организовать взаимодействие с остальными транспьютерами. Тандем организован аналогично суперблоку и позволяет связывать одиночные компьютеры {терминалы) , имеющие до 64 транспьютеров каждый.
Работа с LNEURO может вестись в двух режимах: однопользовательском и многопользовательском. Показано, что использование многопользовательского режима позволяет организовать взаимосвязанную работу всех транспьютерных систем, что дает возможность
полностью задействовать имеющиеся ресурсы и максимально приблизиться к организации искусственных нейронных сетей. Также рассмотрен механизм, позволяющий выполнять произвольно задаваемые правила обучения на LNEURO.
В качестве модели робота выбран колесный мобильный робот с корпусом - прямоугольным параллелепипедом, ширина которого в полтора раза превышает длину. Колеса робота расположены вдоль боковых поверхностей на равном расстоянии друг от друга.
В качестве моделей поверхности рассматривались: горизонтальные плоскости с расположенными на них выступающими одиночными препятствиями, препятствиями сферической и прямоугольной формы, препятствия в виде оврагов и впадин, комбинация наклонных плоскостей, а также различные препятствия типа навесов (мосты, канаты, трубы и т.п.).
В заключении сформулированы основные результаты работы.
В приложении приведены результаты экспериментальных исследований, а также представлен акт внедрения результатов диссертационной работы.
Стратегия обнаружения непроходимых одиночных препятствий
Для обнаружения непроходимых одиночных препятствий предлагается воспользоваться анализом изменений в последовательных показаниях дальномера по расстоянию (qL = ri+1 - r±, где r± - истинное расстояние между базовой точкой дальномера и точкой пересечения луча дальномера с поверхностью в зоне обзора), описанным в [48, 139]. Для достаточно ровной поверхности величина q± будет фактически постоянной и, следовательно, ее вариации (скачок Ui) близки к нулю. При пересечении луча дальномера с ближней кромкой выступающего препятствия (или дальним краем впадин) происходит резкое уменьшение (или увеличение) величины gi-i. Это и есть "скачок" Ui_i, который свидетельствует о принадлежности і-ого элемента столбца передней кромке препятствия.
Когда луч дальномера пересекает задний край выступающего препятствия (или ближний край впадины), величина gi увеличивается (уменьшается) до gi+l и снова уменьшается (увеличиваются) до дц-2. Таким образом, задний край также характеризуется значительным изменением двух последовательных величин д.
Если происходит существенное отклонение величины Ui от нулевого значения, то соответствующая точка поверхности считается принадлежащей непроходимому препятствию.
В [132] показано, что при наличии матрицы дальностей для оценки принадлежности точки поверхности проходимому/непроходимому препятствию можно использовать несколько методов, основанных на пороговой логике, в частности, метод Робертса с соответствующими значениями порога P={PL или Рм} :
для выступающих препятствий вводится оператор
Если вычисленное значение оператора (Lij или М ) в точке dij превосходит по абсолютной величине соответствующее значение порога, то данная точка относится к непроходимому препятствию.
Простота данного алгоритма и независимость анализа информации для различных точек поверхности зоны обзора позволяет легко реализовать его.
Эмпирические результаты с использованием этой реализации показывают, что оператор Робертса не дает полного представления о непроходимых одиночных препятствиях (плохо выделяются передние кромки выступающих препятствий и задние кромки впадин). Однако вышеприведенный способ вьщеления препятствий таких типов является достаточно простым, что является его несомненным достоинством, несмотря на невысокую эффективность.
Как нетрудно заметить, и оператор Робертса, и оценки скачка в измерениях характеризуются одним и тем же физическим фактором - резким изменением в показателе дальности. Этот феномен и является основой для разработки двух альтернативных нейроалгоритмов выделения непроходимых одиночных препятствий, приведенных ниже.
Разработка алгоритма выделения непроходимых одиночных препятствий с помощью обучающейся нейронной сети
Предложенный в предыдущем пункте нейросетевой метод решения задачи выделения непроходимых одиночных препятствий представляют собой перенос существующих последовательных алгоритмов в нейросетевой логический базис. Нейросетевая реализация подобных алгоритмов является достаточно трудоемкой, что затрудняет их использование.
Предлагается разработать алгоритм выделения непроходимых одиночных препятствий непосредственно в неиросетевом логическом базисе, применяя метод обучения нейронной сети с учителем.
Для каждого элемента матрицы дальностей d±±, соответствующего точке поверхности зоны обзора, формируются два вектора - d\ и d , которые содержат элементы, соседние с рассматриваемым, по строке и по столбцу соответственно: Данные вектора подаются на вход нейронной сети (рис. 2.9) с весовыми коэффициентами {1, -2, 1}. Предлагается произвести свертки d и d с вектором S = (і - 2 1 , результаты сравнить со значением порога Uk {в качестве начального значения выбирается U0, равное, например, половине диаметра колеса робота) и направить на вход функции активации (х): ( х = 0, х 0 1, х О Если величина результата хотя бы одной свертки превышает значение порога, фиксируется наличие скачка (по строке или по столбцу), и выходное значение соответствующего нейрона принимает значение 1. Точка поверхности зоны обзора считается непроходимой, если хотя бы один из выходов нейронов первого слоя равен 1. Взвешенная сумма выходов нейронов с коэффициентами, равными 1, подается на вход функции активации f2(x) :
Выход второго слоя Yjt является выходом НС принятия решения о принадлежности точки поверхности к непроходимому одиночному препятствию: Если значение Yx равно единице, то соответствующая точка поверхности зоны обзора фиксируется как непроходимая. Точка считается проходимой, если выход нейронной сети равен нулю.
Процесс настройки НС заключается в корректировке порогового значения Uk. В блоке настройки значение YK сравнивается с указанием учителя d±j, равным 0, если соответствующая точка поверхности проходима, то есть скачок отсутствует, и равным 1, если соответствующая точка поверхности принадлежит препятствию. В результате формируется ошибка е как разность выхода НС и указания учителя (е = Yk - d±j ) :
є = 0, если значение di:j совпадает с решением НС; є = -1, если препятствие не было обнаружено (пороговое значение выше требуемого);
е = 1, если препятствие было распознано неверно (пороговое значение ниже требуемого).
При необходимости корректировки пороговое значение предлагается настраивать следующим образом: Uk = ик_, + h - е, где h = h (к) - шаг изменения порога на к-ой итерации. Для эффективной работы этого алгоритма необходимо выбрать оптимальное значение шага h. Б [85] показано, что от выбора метода изменения шага зависит как сходимость метода, так и количество итераций НС. Предлагается изменять шаг методом отжига [72, 87, 105], который позволяет наиболее эффективно обучить сеть:
Формализация критериев проходимости препятствий-навесов .
Для разработки нейроалгоритма выделения препятствий-навесов предлагается ввести ряд понятий.
Определим Q как множество точек поверхности зоны обзора AMP: Q={qi, &, .. , Он), где R=N-M. Рис. 3.2. Различные типы препятствий-навесов Предлагается проверку проходимости всех точек поверхности зоны обзора q є Q с точки зрения препятствий-навесов проводить параллельно. 81 Введем Sq как множество точек, расстояние от которых до рассматриваемой точки q меньше минимального шага сетки сканирования (Amin) : Sq - {s: p s, q) Д }, (3.3) где: Pi(s, q) = max{qx - sx, qy - sy} . (3.4} Определим точку SqeSq как точку с минимальной высотой (координатой z) среди всех точек s множества Sq: Тогда условие непроходимости точки q с точки зрения препятствий-навесов предлагается записать в виде: Т - максимальная высота препятствия, которое AMP может преодолеть (в работе - треть диаметра колеса робота);
Н - минимальная высота препятствия-навеса, под которым AMP может проехать (определяется геометрическими характеристиками робота).
Отображением LQ(q) (q є Q) назовем функцию, переводящую множество Q в множество {0,1} по следующему принципу: [0, q проходима
Если LQ(q)=l, то точка q является непроходимой согласно выбранному критерию и соответствующий элемент бинарной матрицы L полагается равным 1; в противном случае - 0.
В соответствии с разработанным алгоритмом предлагается спроектировать НС выделения препятствий-навесов, состоящую из нейроблоков определения принадлежности точки поверхности к множеству Sq, нахождения точки с минимальной высотой в множестве Sq и вычисления значения функции LQ(q), определяющей, является ли точка q проходимой.
Для определения принадлежности точки поверхности к множеству Sq в соответствии с (3.4), (3.6) предлагается воспользоваться методом классификации точек по отношению к замкнутой области и построить двухслойную НС согласно (3.7).
ЯЫе Sx координаты x точек поверхности q и s соответственно; qy, sy - координаты у точек поверхности q и s соответственно. Если вычисленное значение tqs НС, представленной на рисунке 3.3, для конкретной взятой точки q равно 1, то точка s принадлежит к множеству Sq.
Для нахождения точки с минимальной высотой в множестве Sq (в соответствии с (3.5)}, предлагается следующий принцип вычисления минимальной высоты среди высот заданного множества точек на НС:
В первом слое определяется соотношение высот точек s, w зоны обзора; выходные значения нейронов, соответствующие различным точкам w є Q, равны 1, если точка w Sq и sz , wz или w Sq. Если для всех (NM 1) точек w є Sq sz wz и точка s eSq, то выход третьего слоя НС для данной точки s будет равен 1.
Значение на выходе НС равно координате z точки s є Sq с минимальной высотой. Соответствующая НС представлена на рисунке 3.4.
Точка поверхности q является непроходимой, если функция LQ(q) принимает значение 1. Это происходит при выполнении условия (3.6). При этом значение функции LQ(q) вычисляется следующим образом:
В первом слое НС для точки s определяется выполнение условий: sz - Sj3 . Н, Т sz - Szq . Если оба условия выполнены и s є S4 {tq = 1) , то выходное значение второго слоя для данной точки s будет равно 1, что соответствует наличию препятствия-навеса в точке s е S4. Если хотя бы одна такая точка является непроходимой, то на выходе НС будет значение 1,характеризующее непроходимость точки q поверхности.
Нейросетевой метод оконтуривания непроходимых участков поверхности
Оконтуривание непроходимых участков поверхности предлагается производить, исходя из данных о технических и геометрических характеристиках робота.
Выбирается минимально допустимое расстояние (&) , позволяющее объединять точки, относящиеся к различным непроходимым препятствиям. Для каждой точки зоны обзора предлагается проводить анализ области, расположенной вокруг этой точки, и она маркируется как непроходимая в случае наличия препятствий в окрестности.
Для каждой точки поверхности зоны обзора робота можно сформировать множество, включающее все точки поверхности, расстояние от которых до рассматриваемой точки {pij) не превышает минимально допустимое расстояние $: Cij = {р»: р(рц, Pm) 4 (4Л}
Так как принцип сканирования {прямо- или косоугольная съемка) и шаг изменения углов азимутального и места зависят от сканирующего устройства, то для конкретного AMP можно заранее определить, какие точки зоны обзора отстоят от точки с номером ij поверхности не более, чем на &. Тогда можно записать номера строк и столбцов матрицы Р, элементы которых принадлежат множеству С11, Диапазон строк m для элементов из множества Cij предлагается записать в виде: m = m7,m (от номера столбца j не зависит) . Для фиксированного номера строки m {из данного диапазона номеров строк) , номера столбцов п элементов из С1-" изменяются следующим образом: n = nmrnffd Принцип выбора точек, принадлежащих множеству С1:, отражен на рисунке 4.2. В случае принадлежности хотя бы одной точки из множества С13 препятствию рассматриваемая точка ij маркируется как непроходимая в матрице Р . То есть точка p±j считается непроходимой тогда и только тогда, когда существует точка рт є Clj, такая, что Р = 1 Для оконтуривания непроходимых участков поверхности предлагается использовать однослойную НС, фрагмент которой представлен на рис. 4.3. На вход сети поступают элементы матрицы Р, соответствующие точкам поверхности из окрестности С1]. Функция активации имеет вид: Выходное значение НС характеризует проходимость точки поверхности зоны обзора (р = 0) или ее непроходимость (Pij = 1) . В последнем блоке в схеме разрабатываемого нейроинтерпретатора предлагается сформировать результирующую матрицу Z, содержащую информацию о всех непроходимых участках зоны обзора робота с учетом оконтуривания, а также о реальных высотах всех проходимых точек зоны обзора.
Для формирования такой матрицы предлагается однослойная нейронная сеть, входами которой являются элементы матриц Р и Z2 с весами 2А и 1 соответственно (А » 1 - константа, обозначающая непроходимость данной точки поверхности). В качестве функции активации предлагается использовать следующую:
Так как элементы матрицы Р принимают лишь два значения - 0 или 1 в зависимости от того, является ли соответствующая точка поверхности проходимой, а элементами матрицы Z2 являются скорректированные высоты всех точек поверхности зоны обзора, то выходами нейронов будут являться либо реальные высоты соответствующих точек поверхности (p j = 0), либо число A (Pij =1}. Эти значения заносятся в результирующую матрицу Z, в которой маркировка А свидетельствует о непроходимости точек поверхности зоны обзора AMP: