Содержание к диссертации
Введение
ГЛАВА 1. Анализ возможностей нейросетевых парадигм для решения задач сенсомоторной координации робота-манипулятора 12
1.1. Обучающиеся нейронныечгети с глобальной адаптацией 15
1.1.1. Аппроксимационные свойства многослойных нейронных сетей 16
1.1.2. Алгоритмы обучения многослойных нейронных сетей 17
1.1.3. Проблема глобальной аппроксимации 26
1.2. Обучающиеся нейронные сети с локальной адаптацией 27
1.2.1. Кусочная аппроксимация многослойными сетями 28
1.2.2. Кусочно-линейная аппроксимация локально адаптивными нейронными сетями... 31
1.2.3. Проблема локального представления функций 33
1.3. Преднастраивающиеся нейронные сети с локальной адаптацией 34
1.3.1. Бионические предпосылки использования преднастройки 35
1.3.2. Функциональная универсальность нейронной сети с преднастройкой 37
1.3.3. Поисковые принципы функционирования 39
1.4. Проблема константности восприятия сенсорных сигналов 40
1.4.1 Реализация функции константности восприятия как оптимизационная задача .41
1.5. Выводы 43
ГЛАВА 2. Разработка и исследование модели нейронной сети с преднастройкой 46
2.1. Архитектура и параметры нейронной сети с преднастройкой 47
2.1.1. Модель нейрона 47
2.1.2. Элементарная ячейка нейронной сети 48
2.1.3. Нейронная сеть с пш вставочными нейронами 50
2.2. Аппроксимационные свойства нейронной сети с преднастройкой 55
2.3. Исследование зависимости точности аппроксимации от количества вставочных нейронов 57
2.4. Выводы 62
ГЛАВА 3. Сравнительное тестирование нейронных сетей 64
3.1. Архитектуры нейронных сетей и алгоритмы их функционирования 64
3.1.1. Нейронная сеть с преднастройкой 64
3.1.2. Нейронная сеть с обратным распространением ошибки 71
3.1.3. Нейронная сеть адаптивной резонансной теории 76
3.2. Результаты вычислительных экспериментов 80
3.2.1. Сравнение нейронных сетей с преднастройкой и обратным распространением ошибки 81
3.2.2. Сравнение нейронных сетей с преднастройкой и адаптивной резонансной теории Н5
3.3. Выводы 89
ГЛАВА 4. Применение модели нейронной сети с преднастройкой для реализации функции константности восприятия в системе упра вления робота-манипулятора 91
4.1. Модель робота-манипулятора 91
4.2. Модель нейросети константности . 92
4.3. Результаты моделирования 94
4.3.1. Перемещение объекта всхвате по заданной траектории 94
4.3.2. Взаимодействие схвата с внешним объектом 96
4.4. Выводы 99
Заключение 102
Выводы 104
Список источников литературы 105
- Алгоритмы обучения многослойных нейронных сетей
- Исследование зависимости точности аппроксимации от количества вставочных нейронов
- Сравнение нейронных сетей с преднастройкой и обратным распространением ошибки
- Взаимодействие схвата с внешним объектом
Введение к работе
Актуальность темы. Наиболее востребованным на сегодняшнем этапе развития робототехники является создание роботов, позволяющих существенно сократить затраты ручною труда в различных сферах человеческой деятельности, а также способных автономно функционировать в экстремальных условиях (под водой, в космосе). Среды, с которыми приходиться взаимодействовать роботу в таких задачах, характеризуются низкой степенью организации. Роботу, способному автономно функционировать в неопределенной или изменяющейся обстановке, необходимо очувствление, обеспечивающее обратную связь от среды, и адаптивность поведения. Сенсорная информация, доставляемая системой очувствления адаптивной управляющей структуре, используется для восполнения априорных сведений о внешней среде с целью формирования правильных выходных управляющих воздействий, направленных на достижение и поддержание некоторого оптимального поведения системы. В результате становится возможным организация адекватного функционирования робота в динамической окружающей среде [1,2].
Построение функционального преобразования, устанавливающего связь между входными - сенсорными и выходными - моторными переменными системы управления, составляет задачу формирования сенсомоторной координации робота. При этом синтез управления поведением робототехническими системами, активно взаимодействующих со сложным окружением, основывается на применении принципа обратной связи. Однако задачи управления по принципу обратной связи, рассматриваемые в теории автоматического управления, существенно отличаются от задачи управления роботом.
Основная проблематика теории автоматического управления связана с изучением временного аспекта процессов в системах с обратной связью, а их функциональные возможности ограничиваются решением задачи отслеживания заданных значений регулируемых величин [3]. В робототехнических же системах большее значение приобретает пространственный аспект описания среды, в связи с чем значительно усложняются сами задачи организации процессов управления. Это и определяет основную специфику задачи формирования сенсомоторной координации. В частности, в таких системах цель поведения задается в пространстве одних переменных, а закон управления ищется в пространстве других переменных. Кроме того, сама цель управления может задаваться в неявной форме из-за недостатка априорной информации. В силу изменчивости окружающей среды характерным для решения поведенческих задач становятся непрерывные цепи изменяющихся целей поведения, что требует от системы управления реализации в одной и
5 той же структуре динамической смены функций, необходимых для осуществления процессов управления на разных этапах поведения робота.
В таких условиях функциональные возможности и эффективность роботов в значительной степени будут зависеть от используемых принципов обработки сенсорной информации и методов управления. Когда среда не полностью известна, модели сенсоров, робота и его окружения будут содержать множество неизвестных параметров. В этом случае реализация системы управления на основе программных алгоритмов не представляется возможной. Поэтому при создании роботов существенное значение приобретают структуры и алгоритмы, которые обеспечивают адаптивные свойства системы управления. Вся необходимая информация, которая не доступна в форме априорных знаний, должна быть приобретена управляющей системой робота в процессе его активного взаимодействия со средой. Обучающиеся системы могут обеспечить высокую степень адаптивности, когда априорной информации недостаточно.
Среди обучающихся структур прочное место занимают искусственные нейронные сети. Однако накопленный к настоящему времени опыт решения задач, связанных с организацией поведения робота с использованием информации об окружении, свидетельствует о том, что проблема координированного управления многозвенными роботами-манипуляторами не имеет удовлетворительного решения в рамках развиваемых нейросетевых парадигм.
Как будет показано в данной работе, возможности существующих нейросетевых алгоритмов не удовлетворяют специфике задачи формирования сенсомоторной координации. Этот факт заставляет исследователей искать другие, более простые в реализации, структуры, но эти структуры не позволяют решать более сложные задачи. Указанный недостаток относится и к создаваемым в настоящее время наиболее перспективным и продвинутым разработкам гуманоидных роботов. Используемые в них алгоритмы нечеткой (fuzzy) логики основаны на простых, интуитивно понятных правилах обучения, но сценарии поведения жестко ограничиваются этим набором правил.
С другой стороны, не вызывает сомнения адекватность именно нейросетевых реализаций задачам сенсомоторной координации, так как мозг человека и животных успешно их решает, но эффективного решения пока не было предложено. Таким образом, построение адаптивных структур на основе нейроподобных элементов остается наиболее актуальным аспектом при реализации компонентов системы управления роботом.
Целью настоящей диссертационной работы является разработка и исследование адаптивной модели нейронной сети с преднастройкой для решения задач сенсомоторной координации роботов-манипуляторов.
Для достижения поставленной цели в диссертации решаются следующие основные задачи:
разработка архитектуры модели нейронной сети с преднастройкой, обладающей свойством локальной адаптивности;
разработка процедуры преднастройки, как механизма адаптации в модели нейронной сети;
исследование функциональной универсальности нейронной сети с преднастройкой при различных способах инициализации ее параметров;
проведение имитационного программного моделирования нейронной сети с преднастройкой с целью тестирования разработанной модели на ряде задач;
применение разработанной модели к задаче реализации функции константности восприятия в системе управления программной модели двухзвенного робота-манипулятора.
Методы исследований. Для решения поставленных задач в работе использованы методы вычислительной математики, теории вероятностей и математической статистики, а также методы прикладного программирования.
Объект исследования. Объектом исследования являются: методы построения нейросетевых структур, обладающих заданными свойствами; способы аппроксимации функций в базисе нейронных сетей; алгоритмы адаптации нейросети к изменяющимся условиям функционирования.
Научная новизна.
Научная новизна заключается:
в предложенной оригинальной нейросетевой парадигме, использующей в качестве адаптивной процедуры преднастройку нейронной сети на требуемое функциональное преобразование. В отличие от известных нейросетевых структур, вместо обучения в качестве механизма адаптации разработанная модель нейронной сети реализует процедуру преднастройки на основе «включения» и «выключения» вставочных нейронов сети посредством их комбинаторного вытормаживания, чем обеспечивается функциональная универсальность такой сети.
в новой структуре из нейроподобных элементов позволяющей осуществлять аппроксимацию кусочно-непрерывными функциями без итеративных процедур последовательного приближения сразу на всей области определения, оставаясь в
7 рамках фиксированной структуры, и достигать высокой точности аппроксимации с помощью нейросети небольших размеров.
- в разработанном алгоритме преднастройки, реализующем в нейросети поисковые
принципы функционирования, основанные на идее пробных локальных
преобразований.
Основные научные результаты:
разработана элементарная нейронная структура, на основе которой строится архитектура модели нейронной сети с преднастройкой, реализующей кусочно-j? инейную аппроксимацию;
разработана процедура преднастройки, как механизма адаптации в модели нейронной сети, на основе «включения» и «выключения» вставочных нейронов сети посредством их комбинаторного вытормаживания;
исследованы алгоритмы инициализации параметров нейросети с преднастройкой для получения функционально универсальных структур;
получены результаты имитационного моделирования разработанной нейронной сети с преднастройкой, доказывающие эффективность предложенной нейросетевой структуры и ее преимущество перед существующими аналогами.
Основные положения, выносимые на защиту:
новый подход к задаче формирования сенсомоторной координации роботов-манипуляторов;
архитектура нейронной сети, обладающей свойством локальной адаптивности при распределенном представлении аппроксимируемых в нейросети функций;
алгоритм преднастройки на требуемое функциональное преобразование как механизм адаптации нейросети к изменяющимся условиям функционирования на основе "включения" и "выключения" вставочных нейронов сети посредством их комбинаторного вытормаживания;
- алгоритмы инициализации параметров модели нейронной сети с преднастройкой для
получения функционально универсальных структур;
- способ формирования константности восприятия в системе управления роботом-
манипулятором.
8 Теоретическая и практическая ценность:
разработанная нейронная структура позволяет решать задачи синтеза координированного управления движениями многозвенных роботов-манипуляторов за счет объединения в едином процессе как поиска элементарных поведенческих актов, так и воспроизведения ранее освоенных сценариев поведения;
разработанная архитектура нейронной сети с преднастройкой, которая может служить основой при построении схем, реализующих функции целенаправленного зрительного восприятия в системах технического зрения роботов;
предложенная реализация механизма преднастройки в нейронных структурах может быть использована для воспроизведения управления селективным вниманием, предсказания последствий действий и других важных функций для систем с активным поведением во внешней среде.
Апробация работы. Основные результаты работы докладывались и обсуждались на XIII Международной конференции по нейрокибернетике (г.Ростов-на-Дону, 2002 г.), на II и V Всероссийских научно-технических конференциях «Нейроинформатика» (г.Москва. 2000 г., 2003 г.), на VIII Всероссийской конференции «Нейрокомпьютеры и их применения» (г.Москва, 2002 г.), на семинаре Лаборатории вычислительного эксперимента (ЮГИНФО РГУ, г Ростов-на-Дону, 2003г.), а также на семинарах кафедры биофизики и биокибернетики физического факультета РГУ и НИИ НК РГУ.
Публикации. По теме диссертации опубликовано 8 работ, из них 1 - в российском рецензируемом журнале, 7 - в тезисах и материалах конференций.
Структура диссертации. Работа состоит из введения, четырех глав, заключения, списка литературы, приложения и изложена на 134 страницах, содержит 30 рисунков и 3 таблицы; список литературы включает 124 наименования.
Содержание работы.
t Во введении обоснована актуальность темы диссертации, сформулированы цели и
задачи исследования, отмечена новизна результатов, их научная и практическая ценность.
* приведены основные положения работы, выносимые на защиту.
В первой главе проведен классификационный анализ нейросетевых парадигм и возможностей их применения для задач формирования сенсомоторной координации робота-манипулятора. В основу классификации положены такие свойства нейронных сетей как
9 способ аппроксимации и представления функций, а также механизмы, реализуемые ими для пострсения заданного отображения. По этим характеристикам нейросетевые алгоритмы условно разделяются на три группы: (і) обучающиеся нейронные сети с глобальной адаптацией; (ii) обучающиеся нейронные сети с локальной адаптацией; (iii) преднастраивающиеся нейронные сети с локальной адаптацией. Обучающиеся нейронные сети с глобальной и локальной адаптацией представляют существующие и уже довольно устоявшиеся нейросетевые парадигмы. В первых двух разделах главы описываются основные ограничения их применимости к рассматриваемой задаче.
Предлагаемая в настоящей работе модель относится к третьей выделяемой группе нейронных сетей. В третьем разделе показано, что преднастраивающаяся нейросеть является наиболее подходящей для решения задач сенсомоторной координации робота-манипулятора. Среди ключевых моментов выделяются следующие: (і) локальные аппроксимирующие свойства нейросети позволяют осуществлять процедуры перенастройки на частично измененную исходную функциональную зависимость только на требуемых участках; (ii) распределенный характер представления реализуемых функций способствует достижению высокой точности аппроксимации сложных зависимостей при небольших размерах нейросети; (iii) другой, чем в существующих нейросетевых парадигмах, механизм построения необходимого функционального преобразования позволяет добиться независимости структуры нейросети и ее параметров от вида конкретной аппроксимируемой функции.
В конце первой главы обсуждается задача обеспечения константности силового восприятия робота-манипулятора и отмечается актуальность ее решения для организации адекватного поведения робота в изменяющейся среде.
Вторая глава посвящена описанию архитектуры и параметров разработанной модели нейронной сети с преднастройкой. Основная идея состоит в том, что построение требуемого отображения происходит без изменения топологии и весов связей нейросети, выбранных в процессе ее реализации. Поэтому структура и параметры нейросети определяются так. чтобы гарантировать необходимую широту производимых этой нейросетью функциональных преобразований.
В первой части главы рассматриваются принципы построения архитектуры нейронной сети. В ее составе выделяются два нейросетевых модуля: нейронная сеть адаптивной фильтрации реализует все функциональные преобразования, а в нейронной сети состояний запоминаются соответствующие преднастраивающие воздействия. Эти воздействия представляют собой вытормаживающие сигналы на вставочные нейроны нейросети адаптивной фильтрации. Показано, что введение комбинаторики вытормаживания позволяет
10 проводить кусочно-линейную аппроксимацию произвольных функциональных зависимостей при распределенном представлении выходных функций в структуре нейросети.
Во второй части главы исследуется функциональная универсальность полученной нейронной структуры при различных способах инициализации ее параметров. Подчеркивается, что конкретные значения весовых коэффициентов тормозных связей вставочных нейронов нейронной сети адаптивной фильтрации оказывают прямое влияние на ее размеры для достижения требуемой точности аппроксимации. Рассматриваются три варианта инициализации этих весов: расчетными, одинаковыми и случайными значениями. В результате проведенного исследования выбран алгоритм инициализации случайными равномерно распределенными значениями, который является наиболее простым и эффективным.
В третьей главе проводится сравнение разработанной модели нейронной сети с преднастройкой с двумя из наиболее известных и мощных нейросетевых парадигм -многослойным персептроном с алгоритмом обратного распространения ошибки и нейросетью Fuzzy ARTMAP - на примере решения ими задачи аппроксимации тестовой функции.
В первом разделе описываются алгоритмы работы тестируемых нейронных сетей. Основное внимание уделено рассмотрению процедуры преднастройки в разработанной сети, которая заключается в поиске вытормаживающих комбинаций вставочных нейронов для построения необходимой функциональной зависимости. Среди рассмотренных эволюционного, последовательного и случайного методов перебора выбран последний, как наиболее эффективный при поиске комбинаций вытормаживания вставочных нейронов. Проведены исследования зависимости точности аппроксимации в нейросети с преднастройкой со случайным поиском вытормаживающих комбинаций от количества вставочных нейронов.
Во втором разделе главы приводятся и обсуждаются результаты тестирования. Сравнение с алгоритмом обратного распространения позволило продемонстрировать эффективность алгоритма функционирования нейронной сети с преднастройкой по количеству итерационных шагов, затрачиваемых обеими нейросетями для построения полной аппроксимации требуемой функции. Сравнение с нейросетью Fuzzy ARTMAP демонстрирует преимущество предлагаемой модели в размерности нейросети, необходимой для решения поставленной задачи, а также в дискретизации области определения. Обсужден вопрос обобщающих свойств нейронной сети с преднастройкой.
»
В четвертой главе описывается применение модели нейронной сети с преднастройкой для реализации функции константности восприятия в системе управления робота-манипулятора.
В общем случае, проблема заключается в неоднозначности сенсорной информации, получаемой роботом при активном поведении в изменяющейся внешней среде: является ли то или иное изменение сенсорного сигнала следствием собственного движения, возмуїдающее ли это влияние среды или действие обоих факторов. Решение демонстрируются на программной модели двухзвенного плоского манипулятора, оснащенного двухкомпонентным датчиком силы в запястье схвата. Для рассматриваемого квазистатического случая изменения в сенсорном сигнале за счет собственного движения робота связываются с действием силы тяготения на схват с нагрузкой. Отмечается, что при произвольных движениях манипулятора сигналы с датчика, обусловленные действием силы тяготения, изменяются достаточно сильным образом. Выявить на этом фоне влияние внешних возмущающих воздействий, которые могут быть значительно меньшими, сложно.
Показано, что при использовании нейронной сети с преднастройкой для прогнозирования показаний силового датчика в отсутствие внешних сил, задача выявления внешнего возмущающего силового воздействия на фоне сильно изменяющихся сигналов с датчика становиться разрешимой. Повышение точности выполняемых роботом задач, например, перемещения объекта манипулирования в заданную точку пространства, в условиях возмущающего воздействия внешние среды является следствием реализации функции константности восприятия в системе управления робота-манипулятора.
В заключении обобщаются полученные результаты и рассматриваются перспективы применения разработанной нейросетевой структуры. Приведены выводы по работе.
Алгоритмы обучения многослойных нейронных сетей
В парадигме обучения с учителем цель состоит в построении зависимости у =Ддс), которая дает выход у = (у\,...ут) на входной вектор х = (xi,...,xn). Эта зависимость строится на примерах требуемых выходных величин 0 d(l)j d(2)„...,) для соответствующих входных данных (дс(1 ) (2),...,) посредством минимизации суммы квадратов ошибок выходов в данных точках при определенных ограничениях на зависимость /, такие как гладкость [12]. Существует большой класс задач, когда есть некоторая совокупность поставленных в соответствие друг другу значений входов и выходов (обучающая выборка) и эту совокупность можно рассматривать как точки, через которые должна проходить аппроксимируемая функция. Оценка или критерий правильного функционирования задаются как функция рассогласования текущего ответа сети и правильного или желаемого ответа. Процесс минимизации оценки в пространстве обучаемых параметров сводится к использованию метода градиентного спуска с вычислением значений частных производных оценки по подстраиваемым параметрам сети [25]. В нейронной сети это вычисления от выхода к входу. Широко используемым является алгоритм обратного распространения ошибки, предложенный независимо в трех разных работах [26,27,28] или его модификации.
С применением этих алгоритмов задачи поиска функциональных преобразований в многослойных нейронных сетях с доступом к обучающей выборке решаются достаточно успешно. Отсюда успешные приложения данных нейросетевых алгоритмов в задачах, для которых наличие обучающей выборки, как заранее заданного набора экспериментальных данных, представляется естественным. Это задачи классификации, связанные с медицинской диагностикой [29], задачи экстраполяции данных в финансовом прогнозировании [30]. интерполяции экспериментальных данных в разного рода научных расчетах [31] и многие другие.
Широко представлен и класс задач, связанных с управлением [32,33]. Способность построения нелинейных функциональных зависимостей в условиях отсутствия априорных знаний о моделируемой системе делает нейронные сети привлекательной альтернативой стандартным схемам управления. Множество методов было предложено и для применения многослойных нейросетей в робототехнических системах. Различие в этих схемах главным образом заключается в том, какую роль играет нейронная сеть, и способ, которым она обучается. Ее способность обучаться на примерах используется для того, чтобы после некоторой работы в единой системе с традиционным контроллером, взять на себя управление движениями манипулятора [34,35,36]. Так как обучающие примеры извлекаются непосредственно при многократных повторениях движений, то всевозможные неопределенности и изменения в параметрах модели будут естественно учтены в процессе обучения. Универсальные аппроксимационные свойства многослойной сети гарантируют, что любые, сопровождаемые этим, нелинейности будут отображены. Однако практическое применение таких нейронных сетей сталкивается не только с проблемой необходимости настройки стандартного контроллера для первоначального обучения нейросети, но и результат работы применяемого алгоритма обучения не всегда приемлем. Так в работах [37,38] сообщается, что широко применяемый алгоритм обучения с обратным распространением ошибки из-за чувствительности к шуму плохо сходится в таких задачах. В ряде работ предлагаются другие алгоритмы обучения многослойных нейронных сетей для задачи выработки траектории движения манипулятора, которые основаны на градиентных методах [39,40,41]. Алгоритмы настройки весов сети, разработанные для частных случаев, часто более устойчивы по сравнению со стандартным алгоритмом обратного распространения.
Основная цель применения нейронных сетей для управления движением робота-манипулятора в указанной схеме работы заключается в организации адаптивного отражения изменений в динамике робота при непредсказуемом изменении его параметров. Действительно, на практике роботы всегда функционируют в нестационарных и неопределенных условиях [42]. Это проявляется в дрейфе параметров и отсутствии информации о ряде факторов, определяющих состояние внешней среды и самого робота. К числу неопределенных факторов, которые могут непредсказуемо изменяться в широком диапазоне, относятся массо-инерционные характеристики груза, силы трения и упругие деформации в двигательных механизмах, физико-механические параметры приводов, а также характеристики внешней среды. Все эти факторы существенно влияют на качество управления роботом. При программном управлении они часто приводят к потере точности и неустойчивости программного движения. В подобных условиях эффективным методом управления в заранее неизвестных и изменяющихся условиях является адаптивное управгение. В отличие от программного управления данный метод позволяет роботу адаптироваться к реальной обстановке и после обучения выполнить требуемую операцию или программу движения. Когда программа движений известна, цель адаптации сводится в корректировке управляющих воздействий, необходимой для подстройки и приспособления их к неконтролируемому дрейфу параметров робота и изменяющимся условиям эксплуатации. Поэтому блок адаптации можно рассматривать и как своеобразную надстройку над обычными системами программного управления, который обеспечивает надежную отработку заданной программы движения при частично неопределенных или изменяющихся условиях.
Как показывает анализ нейросетевых приложений в области управления роботами. многослойные нейросетевые парадигмы направлены на решение именно этой проблемы. В роботах, как нелинейных динамических системах, с неизвестной динамикой для учета непредвиденных факторов типа трения, вибраций и т.п. нейронные сети показывают высокую эффективность, в отличие от классических схем управления. Таким образом, существующие нейронные сети с градиентными методами обучения снискали определенную нишу в управлении роботами, а их решения сводятся к учету нелинейности и частичной неопределенности параметров самого робота и среды.
Но рассматриваемая проблема синтеза управления активным поведением робота в неорганизованной внешней среде ставиться гораздо шире и требует для своего решения иных алгоритмов адаптации, нежели используемых в многослойных нейронных сетях с алгоритмом обучения с учителем.
Все упомянутые выше алгоритмы настройки неиросети требуют организации итерационного процесса для доставления обучающих пар неиросети. В их основе лежит многократное повторение цикла желаемой траектории движения для получения приемлемых результатов обучения. Это может подходить для широкого класса промышленных роботов, для которых репертуар движений ограничен, а частое повторение одних и тех же действий естественно в процессе работы, однако не пригодно, например, для обучения робота совмещения стержня и отверстия. Для такой задачи задание правильных действий манипулятора в виде обучающей выборки для управляющей им нейронной сети затруднительно. Очевидно, решение подобного рода задач представляет большую ценность для дальнейшего развития робототехнической отрасли, так как приближает робот к более востребованным условиям функционирования: например, в исследовательских целях на неизвестной поверхности или под водой. Эти задачи характеризуются тем, что критерий правильности функционирования задается не как рассогласование текущего выходного управляющего сигнала неиросети с некоторым правильным и заранее известным, а определяется на сенсорном сигнале, зависящем опосредовано через манипулятор и среду от управляющих воздействий.
Исследование зависимости точности аппроксимации от количества вставочных нейронов
П.К. Анохиным для обозначения способности живых организмов к своего рода преднастройке в отношении будущих событий в разработанной им теории функциональных систем вводиться понятие опережающего отражения действительности [103]. Выделяется нескоіько ключевых элементов такой системы. Это наличие обратной афферентации, т.е. обратной связи для доставления сенсорного сигнала, в котором отражается реальный результат произведенного для достижения некоторой цели действия. Подсистемой афферентного синтеза, на основе выработанной в ней модели сенсорных образов движений, осуществляется предсказание того результата. Акцептор результатов действия производит сличение прогнозированного результата и реально полученного. Результат сравнения является основным фактором для перестройки двигательной программы в случае получения рассогласования. Данная схема в некоторой степени реализуется в последней главе настоящей работы для построения системы управления роботом-манипулятором с функцией константности восприятия сенсорного сигнала. Для предсказания сенсорного сигнала использована разработанная нейронная сеть с преднастройкой.
Анализ реальных механизмов преднастройки в мозге затруднен недостатками конкретных нейрофизиологических данных. Предполагают, что она осуществляется как антиципирующая настройка нижних этажей, т.е. исполнительных органов, верхними этажами нервной иерархии. Благодаря такому разделению функций сохраняется возможность быстрого реагирования и одновременно возможность оценки непрерывно меняющейся ситуации в целом в соответствии с глобальными задачами сложных форм поведения.
В рамках настоящей работы акцент делается не на воспроизведении биологических функций, а скорее на исследовании, как активное поведение может быть реализовано посредством преднастраивающихся структур, обеспечивающих его устойчивость в изменяющихся неизвестных средах. Однако упомянутое разделение функций нашло отражение в конкретной организации структуры предлагаемой нейросети: все функциональные отображения строятся в одном модуле нейросети, которая и рассматривается подробно в работе, а другой модуль осуществляет преднастраивающее действие на первый и, так как это является прерогативой высших инстанций, с ним связыьается обучение, ассоциативное извлечение информации и другие механизмы, которые не рассматриваются в настоящей работе.
Преднастройка в разработанной модели нейросети реализована в виде вытормаживающего действия на определенные нейроны. Торможение в живых организмах играет важную роль в процессе восприятия, избирательной фильтрации, выделение информационно значимых сигналов из непрерывного сенсорного потока [104].
Информационно-управляющая деятельность мозга обеспечивается тормозными процессами разной степени сложности [105].
По классификации Мак Кея [106], рассматриваемый в данной модели тормозной механизм относится к классу специфических, т.е. тех, в которых отдельный сигнал тормозит один элемент или определенный набор элементов. Среди различных видов торможения, по-видимому, наиболее изученным является латеральное торможение, впервые описанное в работе Хартлайна [107] на примере сложного глаза мечехвоста. Говоря об искусственных нейронных сетях нельзя не отметить тот факт, что все известные нейронные сети с локальной адаптацией используют принцип латерального торможения для выделения нейрона с максимальной активностью и вытормаживания всех остальных. Таким образом, латеральное торможение в таких нейронных сетях позволяет не только осуществить локальную аппроксимацию, но и приводит к локальному представлению аппроксимирующих функций. Процедура преднастройки, получившая конкретное воплощение в предлагаемой нейросети в виде комбинаторного вытормаживания вставочных нейронов, позволяет реализовать локальную аппроксимацию при структурно распределенном представлении функций.
Многочисленные нейрофизиологические исследования указывают на тот факт, что образы в мозге млекопитающих представляются набором нейронов, т.е. используется распределенное представление информации. Наряду с выигрышем в компрессии, преимуществом распределенного представления информации в нейросети является надежность при выходе из строя некоторых элементов или связей, Конечно, это более важно для биологических нейронных сетей, чем для моделируемых искусственных. Однако при возможной реализации такой модели аппаратно это свойство может оказаться ценным.
Проблема функциональной универсальности связана с анализом синтезированной нейронной сети: если задана определенная топология нейронной сети, то какие функции из заданного класса могут быть в ней реализованы при вариации параметров. Этот вопрос возникает всегда при построении нейросетей, когда задаются начальные условия - число элементов в слое, число слоев, распределение связей от элементов предыдущего слоя к последующему. Далее идет подстройка весовых коэффициентов связей с использованием того или иного алгоритма, но необходимо быть уверенным, что за счет вариации параметров (весовых коэффициентов, порогов) в сети с данной топологией искомая функция может быть получена.
Топология обучающихся нейросетей определяется видом требуемой к реализации функции, которая выражена неявно в обучающей выборке. На практике определение числа слоев сети и нейронов в них осуществляется в процессе попытки достичь удовлетворительного результата аппроксимации требуемой функции при обучении. Таким образом, существующие нейросети характеризуются потерей функциональной универсальности в процессе обучения аппроксимации какой-либо одной функции.
Необходимость функциональной универсальности особенно важна в системах управі ения такими сложными объектами как роботы-манипуляторы. Принимая во внимание огромное число комбинаций факторов, влияющих на динамику манипулятора, его контроллер движений должен быть представлен как обучаемая нейронная сеть, имеющая достаточно большие размеры для того, чтобы быть способной реализовать необходимые поведенческие сценарии, т.е. способной работать в широком диапазоне функциональных преобразований, связанных с решением задачи обратной динамики. Сомнительно, что в этом случае нейронная сеть будет способна обучаться и работать в реальном времени, что является непременным условием в робототехнических задачах. Наиболее эффективное разрешение проблемы построения расширенных систем управления предлагает модульный подход [108]. Для каждого контекста в общем поведении обучается одна нейронная сеть. Однако и обучение каждого из нейросетевых модулей не свободно от проблем, связанных с многослойными сетями.
Сравнение нейронных сетей с преднастройкой и обратным распространением ошибки
Для проведения сравнительных вычислительных экспериментов были получены программные реализации моделей тестируемых нейронных сетей.
Задача каждой нейронной сети состоит в построении аппроксимации /:1 —»SJ? тестовой функции (рис. 3.3). В экспериментах варьируется размер обучающей выборки и требуемая точность аппроксимации на обучающем множестве.
Так как и инициализация весов тормозных связей вставочных нейронов, и поиск вытормаживающих комбинаций в нейросети с преднастройкой основаны на использовании случайных равновероятных процессов, то приводимые результаты усредняются по множеству проводимых с этой целью экспериментов.
Нейронная сеть с преднастройкой реализует структурно распределенное представление функций. Неотъемлемым свойством таких нейросетей является итерационный процесс ее настройки на отображение требуемой функциональной зависимости. В случае с известными нейронными сетями распределенное представление реализуемых функций неразрывно связано с глобальной аппроксимацией в таких моделях, типичным представителем которых является многослойный персептрон. Разработанная модель нейронной сети, однако, при этом осуществляет локальную аппроксимацию.
С другой стороны известные локально адаптивные нейронные сети характеризуются и локальным представлением функций. Для того чтобы локальная аппроксимация функций была осуществима при их распределенном представлении, в предлагаемой нейросети реализован алгоритм преднастройки, как адаптивной процедуры построения требуемой аппроксимации, в противоположность алгоритмам обучения в существующих нейронных сетях.
Алгоритмы обучения и преднастройки используют разные настраиваемые параметры нейросети. Для алгоритмов обучения это всегда весовые коэффициенты связей, принимающие вещественные значения. В нейросети с преднастройкой предметом поиска служит вытормаживающая комбинация на вставочные нейроны. Наличие вьіторі іаживающего сигнала на вставочном нейроне «выключает» его. Такого же результата можно добиться и при увеличении порога. Для выбранной модели нейрона это одно и то же. Тем не менее, перевод на язык порогов удобен с точки зрения проведения сравнения между нейросетями. Величины порогов могут принимать только два значения. Нулевое соответствует отсутствию вытормаживающего сигнала с нейросети состояний. Другое значение должно быть достаточно большим, чтобы обнулить активность вставочного нейрона при любом его суммарном входном сигнале (ясно, что связь с нейросети состояний здесь не принимается в расчет). Проведенное предварительное тестирование нейросети с преднастройкой (3.1.1) и многослойного персептрона с алгоритмом обучения обратного распространения ошибки (3.1.2) позволило определиться с размерами нейросетей, т.е. по существу, с количеством настраиваемых параметров в каждой из них.
Таким образом, основу алгоритма преднастройки составляет идея перехода из пространства весовых коэффициентов связей в пространство порогов вставочных нейронов нейросети (Таблица 3.1). Данное пространство характеризуется дискретностью и гораздо меньшей размерностью по сравнению с пространством непрерывных величин весов связей.
Характерной черной алгоритма преднастройки является его ориентирование на локальный способ аппроксимации. Выбор модели нейрона (2.1.1) определил выходную функцию нейросети, как линейную. Смена векторов преднастройки позволяет осуществить кусочно-линейную аппроксимацию произвольной функциональной зависимости. Локальная адаптивность придает нейросети с преднастройкой свойство стабильности по отношению к старой информации при поступлении новой. Иными словами, она позволяет получить аппроксимацию за один проход (эпоху) по всему обучающему множеству (Таблица 3.2). Для многослойного персептрона характерно забывание старого при приобретении нового знания. Поэтому построение требуемой аппроксимации сопровождается множественными возвращениями к ранее предъявляемым примерам из обучающего множества.
Таким образом, общим свойством сравниваемых нейронных сетей является распределенный характер представления в структуре нейросети отображаемых функций и, следовательно, итерационный процесс построения аппроксимации. Однако их принципиальное отличие заключается в организации этого процесса.
Если в нейросети обратного распространения ошибки он включает повторные представления всего обучающего множества, что приводит к последовательному приближению сразу на всей области определения, то в предлагаемой модели итерационный процесс направлен на поиск локально аппроксимирующих функций и полное решение выстраивается по мере поступления данных за один проход. Число итераций настройки нейросети для получения требуемой аппроксимации будет характеризовать вычислительные затраты данного процесса. Поэтому предметом дальнейшего сравнения рассматриваемых нейросетей явилось количество итерационных шагов, затрачиваемых ими для построения аппроксимации тестовой функции.
Результаты сравнительных экспериментов (рис. ЗЛО) показывают, что нейросеть с преднастройкой оказывается гораздо быстрее многослойной сети с алгоритмом обратного распространения ошибки (ВаскРгор). Превосходства по скорости случайного перебора в поиске решения над градиентным методом позволяет добиться (і) переход регулируемых параметров нейросети из пространства весов связей в пространство порогов и сопровождающееся этим сокращение как количества параметров, так и множества принимаемых ими значений, а также (іі) локальный способ аппроксимации, не требующий множественных возвращений к раннее предъявляемым примерам для сходимости процесса.
Нейронная сеть с преднастройкой осуществляет локальную кусочно-линейную аппроксимацию. Основу локально адаптивных алгоритмов составляет дискретизация области определения. Иногда она проводится заранее с использованием априорной информации о поведении функции на разных участках области определения. Однако сравниваемые нейросети проводят разбиение области определения аппроксимируемой функции на дискретные участки непосредственно во время построения аппроксимации, поэтому никакие априорные знания не требуются. Таким образом, мы можем сравнить алгоритмы данных нейросетей по количеству дискретных участков, на которые они в итоге разбивают всю область. Чем больше дискретизация, тем больше памяти требуется для запоминания или кодирования отдельных подобластей. В предлагаемой нейросети на каждом дискретном участке определяется свой вектор преднастройки. Их количество и подсчитывается. Для нейросети Fuzzy ARTMAP количество дискретных участков равно числу нейронов в слое распознавания модуля ARTa.
В каждой подобласти определяется локальная кусочно-непрерывная аппроксимирующая функция. В нейросети Fuzzy ARTMAP построение аппроксимации локальными функциями основано на наращивании нейронов распознавания в модуле ARTb, а их вид определяется весовыми коэффициентами соответствующих нейронов. Локальное представление функций в структуре нейросети позволяет реализовать безитерационный алгоритм модификации весов связей. Нейросеть с преднастройкой имеет фиксированный размер, а в основе построения аппроксимации локальными функциями лежит итерационный процесс поиска необходимых вытормаживающих комбинаций вставочных нейронов. Количество вставочных нейронов в нейросети с преднастройкой и нейронов распознавания в моделе ARTb нейросети Fuzzy ARTMAP также будут служить предметом сравнения.
Взаимодействие схвата с внешним объектом
Рассогласование предсказываемых и текущих значений силомоментного сигнала может быть использовано далее для расчета точки последующего захват детали в области центра тяжести, что уменьшает усилия, развиваемые схватом манипулятора для надежного удержания груза, и увеличивает точность выполняемых движений за счет меньшего влияния сил инерции детали на динамику манипулятора. Такая операция не требует много времени и выполняется непосредственно в процессе акта манипулирования.
Представляется возможным использование нейросети с преднастройкой не только для реализации функции константности восприятия сенсорного сигнала в системе управления робота-манипулятора, но и для решения других задач, связанных с требованием организации активного поведения робота в среде. В частности, способность функционирования нейросети в условиях, когда критерий правильности задан на входных сенсорных переменных и возможность объединения в сети двух входных сигналов, один из которых несет функцию преднастройки, позволяет организовать управление усилием схвата для удержания объекта манипулирования в процессе движения. Такая функция необходима всегда для предотвращения приложения чрезмерных усилий в случае с хрупкими объектами, но в то же время они должны быть достаточными для избежания проскальзывания детали в схвате. На начальном этапе захвата и поднятия детали усилия могут вычисляться на основе текущих силовых показаний датчика запястья, дающих информацию о весе объекта. Далее во время пассивного переноса детали или при активном ее использовании необходимые усилия для удержания в схвате рассчитываются нейросетью с преднастройкой на основе входного сигнала о текущем положении и скорости манипулятора и преднастраивающего сигнала о развиваемых при этом движении в запястье робота силовых моментов. Такая же схема может быть применена и для изменения ориентации протяженной детали в схвате во время ее переноса для минимизации развиваемых сил инерции подобно тому, как это делает человек, изгибая кисть при перемещении, например длинного шеста. В этом случае нейросеть с преднастройкой должна управлять дополнительным суставом в запястье схвата.
Основным результатом диссертационной работы является разработка и анализ искусственной нейронной сети нового типа, ориентированной на решение задач организации активного поведения робота-манипулятора в неорганизованной и изменяющейся внешней среде.
Модель нейронной сети с преднастройкой, с одной стороны, эффективно сочетает свойства локальной адаптивности и структурно распределенного представления аппроксимирующих функций, каждое из которых присуще существующим нейронным сетям только по отдельности. С другой стороны, для построения требуемой функциональной зависимости реализуется принципиально иной механизм адаптации, нежели в известных нейронных сетях, - преднастройка.
Проведенное сравнительное тестирование с многослойной нейронной сетью обратного распространения ошибки и нейросетью адаптивной резонансной теории показало, что следствием указанных характеристик разработанной модели является ее способность решать задачи построения функциональных зависимостей во многом более эффективно. А именно: нейронная сеть с преднастройкой не требует пакетных способов обучения, не требует наращиваемости структуры, позволяет осуществлять преобразования локально, при этом достигается высокая точность приближения при небольших фиксированных размерах нейроструктуры.
Из важных свойств нейросети с преднастройкой выделяется ее возможность работать в условиях, вне зависимости от того, задается ли целевая функция на входных или выходных переменных. Это обеспечивается разработанным алгоритмом преднастройки, в основе которого лежит случайный поиск вытормаживающих комбинаций вставочных нейронов нейросети. Эффективность случайного поиска решений в нейросети с преднастройкой по сравнению с известными нейросетевыми реализациями обусловлена переходом из высокоразмерного пространства настраиваемых весовых коэффициентов с непрерывными значениями в пространство меньшей размерности регулируемых порогов вставочных нейронов с бинарными значениями.
Конкретные значения весовых коэффициентов тормозных связей вставочных нейронов нейросети с преднастройкой оказывают прямое влияние на ее размеры для достижения требуемой точности аппроксимации. Исследование функциональной универсальности разработанной нейроструктуры позволило выбрать способ инициализации весовых коэффициентов тормозных связей вставочных нейронов нейросети случайными значениями.
Эта процедура представляется простой и не требующей каких-либо дополнительных вычислительных алгоритмов. Кроме того, при этом достигается баланс между малыми размерами сети и надежностью при поиске вытормажимающих комбинаций.
Возможность получения функционально универсальной структуры состоялась благодаря разделению функций между двумя модулями нейронной сети. В нейронной сети адаптгвной фильтрации, подробно рассматриваемой в данной работе, на единожды определенных ее размерах и параметрах реализуются все функциональные преобразования, а в нейронной сети состояний запоминаются соответствующие преднастраивающие воздействия. Нейросеть состояний является обучающейся и осуществляет поисковый процесс вытормаживающих комбинаций на вставочные нейроны нейросети адаптивной фильтрации, имеющих смысл преднастройки данной сети на локальные функциональные преобразования. Если говорить о повышении эффективности поиска, осуществляемого сетью преднастройки, то, скорее всего, следует его связывать с какими-то ассоциативными процессами в этой нейросети и соответствующими механизмами обучения.
Исследование применения нейронной сети с преднастройкой для реализации функции константности восприятия в системе управления программной модели двухзвенного робота-манипулятора показало, что такая функция позволяет организовать активное поведение робота в неорганизованной и динамически изменяющейся внешней среде. Это в свою очередь существенно расширяет круг задач, решаемых робототехнической системой, и повышает точность выполнения заданных манипуляционных операций.
В качестве перспективных направлений использования нейронной сети с преднастройкой выделяются реализация адаптивного управления робота-манипулятора с воспроизведением селективного внимания. Необходимость воспроизведения селективного внимания диктуется тем, что в изменяющихся и неорганизованных средах робот должен функционировать в многоцелевом режиме, когда для реализации одной цели значения каких-то входных переменных могут быть незначимы, а для реализации другой цели реакция на изменение этих переменных должна быть вполне определенной. Рассмотренные механизмы преднастройки нейронных сетей в полной мере относятся и к задачам активного зрительного восприятия, когда в зависимости от текущей цели поведения робота не только переключается внимание, но и меняется алгоритм интерпретации текущих зрительных сигналов. При этом основная идея использования нейросети с преднастройкой в таких задачах, как и в рассмотренных задачах силового восприятия, состоит в том, чтобы избежать разделения между восприятием и генерацией поведения и соединить их в едином нейронном процессе. Важным является то, что тогда зрительные сцены характеризуются непосредственно в категориях поведения, т.е. суммой действий, которые, например, описьиают возможные способы доступа к частично закрытым объектам.