Содержание к диссертации
Введение
1. Некоторые проблемы задачи синтеза неиросетевых систем управления нелинейными динамическими объектами 13
1.1. Базовые сведения о многослойных нейронных сетях 15
1.2. Алгоритмы обучения многослойных нейросетей в реальном времени 17
1.3. Базовые структуры нейросетевых динамических систем 23
1.4. Дифференциальные уравнения процессов преобразования и настройки многослойных нейросетей 26
1.5. Методы синтеза нелинейных систем управления 31
1.5.1. Метод аналитического конструирования оптимальных регуляторов 32
1.5.2. Синтез регуляторов на основе нелинейного преобразования координат 36
1.5.3. Метод аналитического конструирования агрегированных регуляторов (АКАР) 39
1.5.4. Задача управления динамическим объектом в условиях неопределенности 42
1.6. Постановка задачи диссертации 46
2. Аналитический синтез оптимальных законов управления в нелинейных динамических системах 49
2.1. Постановка задачи аналитического синтеза нелинейных оптимальных законов управления на многообразиях и основные определения 50
2.2. Достаточное условие возможности синтеза единственного агрегированного регулятора 55
2.3. Необходимые и достаточные условия возможности синтеза агрегированного регулятора для класса нелинейных объектов 60
2.4. Синтез агрегированных макропеременных 62
2.4.1. Процедура Ttipa-преобразования 64
2.4.2. Процедуры Tf ф а -преобразования специального вида 68
2.5. Примеры синтеза агрегированных регуляторов 75
2.8. Выводы по разделу 2 82
3. Адаптивное управление на многообразиях 83
3.1. Постановка задачи адаптивного управления на многообразиях 84
3.2. Синтез алгоритмов адаптации 90
3.3. Условия применимости алгоритмов адаптации 91
3.4. Алгоритмы адаптации в случае квадратичного сопровождающего функционала (алгоритмы КСФ) 96
3.4.1. Синтез алгоритмов адаптации КСФ 96
3.4.2. Условия применимости алгоритмов КСФ. 99
3.5. Синтез алгоритмов КСФ в случае нарушения условия выпуклости 104
3.6. Примеры синтеза адаптивных систем управления методом АУМ 119
3.7. Выводы по разделу 3... 124
4. Синтез нейросетевых систем управления 125
4.1. Постановка задачи 125
4.2. Анализ устойчивости и качества процессов обучения многослойных нейронных сетей 128
4.2.1. Анализ устойчивости процессов обучения МНС в непрерывном времени методом функций Ляпунова 128
4.2.2. Анализ сходимости процессов обучения МНС в дискретном времени 136
4.3. Синтез нейросетевых систем управления нелинейными динамическими объектами с непрерывной математической моделью 141
4.3.1. Синтез нейросетевых систем управления в случае выполнения условий достижимости 141
4.3.2. Анализ условий применимости процедуры обучения МНС в случае нарушения условий достижимости 149
4.4. Синтез нейросетевых систем управления нелинейными динамическими объектами с дискретной математической моделью 151
4.4.1. Обобщенная схема обратного распространения ошибки "сквозь время" 151
4.4.2. Условия устойчивости процессов обучения МНС в составе ОНО 152
4.4.3. Условие диссипативности синтезированной нейросетевой системы управления 155
4.4.4. Условия достижения наименьшего значения критерия обучения МНС 157
4.5. Выводы по разделу 4 159
5. Синтез системы управления скоростью вращения вала двигателя внутреннего сгорания на холостом ходу 160
5.1. Постановка задачи 161
5.2. Синтез регулятора основного контура 162
5.2.1 Синтез регулятора основного контура с астатизмом нулевого порядка 162
5.2.2. Синтез регулятора основного контура с астатизмом первого порядка 168
5.3. Синтез адаптивной системы управления скоростью вращения вала двигателя в режиме холостого хода 171
5.3.1 Синтез адаптивной системы управления идентификационного типа 171
5.3.2 Синтез системы прямого адаптивного управления скоростью вращения вала двигателя внутреннего сгорания 176
5.3.3. Синтез неиросетевои адаптивной системы управления скоростью вращения вала двигателя на холостом ходу 178
5.4. Выводы по разделу 5 181
Заключение 183
Список источников 185
Приложение 1 194
- Алгоритмы обучения многослойных нейросетей в реальном времени
- Постановка задачи аналитического синтеза нелинейных оптимальных законов управления на многообразиях и основные определения
- Постановка задачи адаптивного управления на многообразиях
- Анализ устойчивости процессов обучения МНС в непрерывном времени методом функций Ляпунова
Введение к работе
Нейросетевые системы управления относятся к классу нелинейных динамических систем. В составе таких систем искусственная нейронная сеть может выполнять различные функции: диагностика технологического оборудования, управление подвижными объектами и технологическими процессами, прогнозирование ситуаций, оценка состояния и мониторинг технологических процессов и многое другое. Примеры такого рода нейросетевых систем можно найти в множестве зарубежных публикаций (например, в [55, 65, 71-73, 79, 80, 84-86, 95, 102, 104]) и в опубликованных трудах российских авторов [9, 11, 18, 19, 35-37]. В последующем изложении содержание понятия "нейросетевые системы управления" ограничим более узкой областью функций, выполняемых нейронной сетью.
Это, во-первых, функция адаптивного регулятора нелинейного многосвязного объекта. Здесь возможны два варианта функционирования нейросети. В первом — нейросеть обучается и одновременно формирует управляющее воздействие на входе исполнительного устройства системы управления. Цель обучения сети и цель управления объектом совпадают, что отражается в задании единой целевой функции системы. Сеть обучается в реальном времени, в темпе протекания процессов в системе (режим on-line). Во втором варианте работа сети состоит из двух этапов: предварительного этапа обучения сети заданной оптимальной функции управления и этапа воспроизведения аппроксимации этой функции в режиме управления объектом при тех же условиях или близких к ним. Целевые функционалы обучения сети и управления объектом могут отличаться друг от друга. Такой вариант применения нейронной сети для управления — т.н. супервизорное управление — нашел преимущественное распространение до настоящего времени, хотя процесс синтеза нейросе-тевого кронтроллера и настройка его параметров в этом случае протекает не в реальном времени (режим off-line).
Выбор конкретного подхода к обучению сети (on-line или off-line) зависит от специфики задачи и, более того, определяет конкретный вид алгоритма обучения сети (беспоисковые/поисковые схемы, глобальная/локальная оптимизация и т.д.). Так, например, в отраслях промышленности, где накоплены огромные массивы данных о поведении исследуемого технического объекта (например, в автомобильной промышленности при проектировании системы управления новым типом двигателя [87]) более разумнным представляется использование off-line техники обучения с применением генетических алгоритмов [76], алгоритмов с элементами случайного поиска [73, 86] или "статистического" обучения [99]. С другой стороны, для объектов, технические характеристики которых меняются относительно быстро в процессе эксплуатации, наиболее предпочтительным становится применение on-line алгоритмов настройки сети.
Нейронные сети находят применение и как идентификаторы для оценивания вектора состояния нелинейных систем и как адаптивные фильтры типа фильтра Калмана в нелинейных динамических системах. Наконец, отметим известное применение нейронной сети в качестве оптимизаторов для настройки параметров регуляторов с типовыми законами регулирования и для настройки параметров алгоритмов адаптации, реализуемых на основе известных методов теории адаптивных систем.
Для обозначения класса нелинейных систем с такого рода применением искусственных нейросетей далее и применяется термин нейросете-вые системы управления {ПСУ).
Последующее сужение рассматриваемого в диссертации класса НСУ осуществим за счет выбора одного из трех основных типов искусственных нейросетей для выполнения перечисленных функций: обучаемых многослойных нейронных сетей прямого распространения (многослойных перцептронов), рекуррентных сетей Хопфилда и сетей ("самоорганизующихся карт") Кохонена [12]. Преимущественное распространение для целей управления по ряду причин нашли многослойные нелинейные нейронные сети (МНС), меньшее — сети Хопфилда и еще меньшее — сети Кохонена. В последующем рассматривается применение обучаемых много 9 слойных сетей только прямого распространения.
Первые попытки использовать искусственные нейронные сети для управления динамическими объектами в "бионических системах" были предприняты еще в начале 70-х годов. Сошлемся, для примера, на работы [44, 60]. В них авторы, отталкиваясь от анализа биологических управляющих систем ("биологических прототипов"), пришли к выводу, что нейронные структуры в биологических управляющих системах работают в фазовом пространстве, а нейронная регулирующая система может выполнять функцию обучаемого или самообучаемого классификатора в этом пространстве. Термин "классификатор" в этом случае обозначает, что сеть выполняет оценивание переменных фазового пространства системы относительно окрестности особых точек этого пространства. Фиксируемое попадание изображающей точки системы в одну из областей фазового пространства вызывает на выходе классификатора корректирующие сигналы для изменения функции управления состоянием объекта. Подобная идея "бионического" управления самими авторами называлась гипотетической, но с "... достаточно большим коэффициентом правдоподобия" ([44], с. 54). В качестве примера биологических систем управления, вписывающихся в предложенную концепцию построения нейросетевой систем с классификатором фазового пространства, в работе [44] приводилась "глазодвигательная" система животных. Заметим, что в то время еще не был известен метод обучения многослойных нейронных сетей.
Применение обучаемых многослойных нейросетей в системах управления началось по настоящему в конце 80-х годов, главным образом в США, для управления движением подвижными роботами по аналитически заданным траекториям [72, 73, 80, 95, 96]. Это направление использования нейросетей в системах управления остается по-прежнему актуальным, только теперь решение задачи распространилось и на случай не заданных заранее траекторий движения. В это же время начались исследования по применению многослойных сетей как идентификаторов состояния нелинейных объектов, и это направление также получило следствии хорошее развитие [71, 79, 84, 95]. Пример применения многослойной нейронной сети как оптимизатора настроек параметров промышленного ПИД-регулятора содержится в работе [1].
Но лишь в самые последние годы появились первые результаты по использованию нейросетей для управления динамическими объектами. Можно сослаться, например, на редакционную статью в [80], где ее авторы определяют проблемы синтеза нейросетевых систем управления динамическими объектами. Эти проблемы касаются: 1) синтеза структур нейросетевых систем управления; 2) ограничений на максимальную скорость настройки параметров сети; 3) модификации алгоритмов настройки, обеспечивающих малые траекторные ошибки при ограничениях на значения весовых коэффициентов синаптических связей нейронов; 4) модификации управления, гарантирующего грубость в условиях неконтролируемых возмущений.
Подходы к решению перечисленных проблем, безусловно, так или иначе, отражены в существующей литературе по применению нейросетей в задачах управления. Еще в 1992 г. в [91] (J. Slotine) была приведена процедура синтеза системы управления нелинейными объектами с применением RBF (radial basis function) нейросетей. В [91] достаточно подробно рассматриваются вопросы синтеза архитектуры сети и алгоритма адаптации. Проблемы же, связанные с качеством процессов и нечувствительностью системы к неизмеряемым возмущениям, не решаются. В более позднее время, например, в работах [82, 89, 92] (1997 г.) были предложены методы синтеза нейросетевых систем управления сложными техническими объектами, в частности, для решения задач синтеза нейросетевых автопилотов и систем управления угловым движением ракеты. Необходимо отметить, что методы, описанные в [82, 89, 92] были протестированы на действующих моделях в "реальных условиях" (то есть при наличии помех в каналах измерения, неточности математических моделей и т.д.). Однако, математические модели объектов, эксплуатирующиеся в [82, 92], достаточно специфичны и, вероятно, полезны лишь для отдельных областей технической науки. Кроме того, основной результат этих работ в математическом плане - ограниченность всех траекторий в системе - недостаточен для обоснования эффективности разработанного подхода, так как в работе изначально предполагается ограниченность всех решений системы [63].
В работе [91], например, предлагается метод прямого адаптивного нейросетевого управления нелинейным объектом, допускающим линеаризацию обратной связью, с применением RBF сетей. Авторами исследуются достаточные условия достижение цели управления (в частности, установлены ограничения на параметры градиентного алгоритма настройки сети - указана оценка снизу для коэффициентов усиления в алгоритме адаптации), но не учитываются внешние возмущения, влияние немоделируемой динамики. Хотя, выглядит достаточно очевидным, что относительно большие коэффициенты усиления в алгоритме адаптации автоматически означают и аналогичное "усиление" помехи, присутствующей в канале измерения.
Примечательно, большинство работ по искусственным нейронным сетям и их применению опубликовано в зарубежных изданиях научной литературы. Российская же библиография по в этом направлении довольно скудна по сравнению с зарубежной, а в приложениях к управлению динамическими объектами практически отсутствует. Этим, а также, и другими перечисленными факторами подтверждается актуальность темы диссертации.
Как вытекает из краткого анализа существующей на данный момент доступной и относительно свежей литературы по применению ней-росетей в задачах управления динамическими объектами, большинство публикуемых результатов носит частный или эмпирический характер, что подтверждается в обзоре [80]). Более того, на текущий момент времени не существует регулярных методов синтеза нейросетевых систем управления динамическими объектами, что обусловлено прежде всего сложностью математического анализа свойств обучаемой нейросети в составе динамической системы.
Основной целью диссертации является создание основ теории синтеза - как алгоритмического, так и структурного - нейросетевых систем управления стационарными нелинейными динамическими объектами. В нейросетевых системах задача структурного синтеза может быть сведена, как это показано в диссертации, к обоснованному выбору содержательной информации, необходимой для обучения многослойных нейронных сетей формированию оптимального закона управления и установлению условий существования решения задачи управления для класса нелинейных объектов и требуемых целей управления [53]. Алгоритмический же синтез включает в себя решение задачи выбора алгоритма обучения нейросети в реальном времени и анализа условий достижимости целей управления с их помощью, что существенно с практической точки зрения. Результаты, изложенные в диссертации, выполнены в рамках научно-исследовательских работ, проводимых с 1994 года на кафедре автоматики и процессов управления СПбГЭТУ «ЛЭТИ» по научному направлению "Нейросетевые системы управления" под руководством проф. В.А. Терехова [49-54].
Основными положениями диссертации, выносимыми на защиту, являются:
1) Метод аналитического синтеза оптимальных законов управления, формируемых многослойной нейронной сетью в процессе ее обучения в реальном времени для класса многомерных нелинейных стационарных объектов управления.
2) Метод адаптивного управления на многообразиях, в рамках которого решаются вопросы алгоритмического синтеза нейросетевых систем управления.
3) Методика синтеза нейросетевых систем управления, базирующаяся на методах адаптивного управления на многообразиях и синтеза оптимальных законов управления.
Алгоритмы обучения многослойных нейросетей в реальном времени
Под обучением искусственной нейронной сети понимается процесс настройки весовых коэффициентов u»f] нейронов, результатом чего является возможность выполнения сетью конкретной задачи — распознавания, оптимизации, аппроксимации, управления. Достижение подобных целей формализуется целевым функционалом (функцией) обучения Q, минимальное значение minQ = Q которого соответствует наилучшему решению поставленной задачи.
Многообразие алгоритмов обучения определяется функциональным назначением сети, ее архитектурой и избранной стратегией обучения. Различают три основных стратегии обучения: "с учителем", "без учителя" (т. е. с самообучением) и смешанную. В первом случае, нейро-сеть настраивается по заданной обучающей выборке в соответствии с принятым правилом или алгоритмом. Во втором случае, заранее не требуется знать правильный результат обучения, и в процессе настройки весовых коэффициентов образуется внутренняя структура активированных базовых элементов, соответствующая предъявленному вектору входа сети. При смешанной стратегии обучения часть весовых коэффициентов xufy настраивается по заданной обучающей выборке, а другая — в соответствии с правилами обучения "без учителя".
Перечисленным стратегиям соответствуют свои алгоритмы обучения искусственных нейросетей. Каждый алгоритм ориентирован на конкретную архитектуру сети и применим для решения определенного типа задач. Так, многослойные сети обучаются по первой стратегии, и это применимо для решения задач классификации, аппроксимации и управления. Самообучение используется в сетях Хопфилда, в сетях Ко-хонена, в т.н. ART- сетях (сокр. от англ. Adaptive Resonance Theory) [55]. Смешанная стратегия обучения применяется в двухслойных RBF-сетях — с упомянутыми выше радиально-базисными функциями активации [9, 72, 73, 96].
Общим для всех модификаций алгоритмов является их рекуррентный характер, а сами алгоритмы обучения представляют собой нелинейные дифференциальные (или разностные) уравнения первого порядка, составленные по определенному правилу. Эти правила имеют эвристический характер, не всегда вытекающий из принципов функционирования бионейронов и нервной сети живого организма. Наибольшее распространение получили следующие правила обучения искусственных нейросетей: правило Хебба; 8-правило; обучение с "конкуренцией" или методом соревнования; ART-правило (обучение "без учителя"); "больцманово" обучение [73, 96]. Правило Хебба — исторически первая предложенная концепция обучения нейросети "без учителя". В соответствии с ней весовые коэффициенты и {j синаптических связей увеличиваются, если активированы (возбуждены) оба нейрона — источник возбуждения и приемник сигнала возбуждения. Тем самым регулярно используемые входы и си-наптические связи активируются за счет увеличения "своих" весовых коэффициентов в большей степени, чем остальные нейроны сети. Модель обучения Хебба предназначалась для объяснения способности биологической нервной сети к привыканию и обучению этой способности через повторение. Правило или алгоритм Хебба записывается следующим образом: ьии]{к + 1) = и)и][к) щ {, где u ij{k) — значение весового коэффициента до настройки в момент времени t = к М, (к = 1,2,...; At — период дискретизации); witj(k + 1) — то же, но после настройки; q{, qj — выходы нейронов i,j соответственно; у 0 — коэффициент "усиления" алгоритма.
Правило Хебба может быть применено для обучения однослойных сетей с линейной функцией активации (т.н. "мадалин"), рекуррентных сетей Хопфилда. Оно положило начало процессу "конструирования" множества подобных правил обучения нейросетей "без учителя" и, в частности, на этом пути был получен удачный алгоритм обучения "с конкуренцией" для сети Кохонена (т.н. правило Кохонена). Важной особенностью правила Хебба является то, что изменения синаптических весов w{j{k) зависят только от активности искусственных нейронов, связанных между собой данным синапсом. &-правило реализует стратегию обучения "с учителем" или суперви-зорного обучения. "Учитель" — это целевой, желаемый выход искусственной нейросети и , a q — реальный выход. Для настройки весовых коэффициентов нейронов используется ошибка обучения 5 = и -q в алгоритме градиентного спуска: wt (fc + 1) = и t (/с) - убг; , у 0, (г; — вход і -й синаптической связи искусственного нейрона (рис. 1.2,6)). В 1986 г. исследовательская группа по параллельным вычислениям (группа PDP: Д. Румельхарт, Дж. Хинтон, Р. Вильяме, США) разработала вычислительную процедуру обучения многослойных нейронных сетей, получившую название "error back propagation algorithm" (алгоритм BP) — алгоритм обратного распространения ошибки [72]. После этого интерес к искусственным нейронным сетям и их практическому применению приобрел во всем мире характер настоящего бума. В алгоритме используется технология последовательной и послойной настройки нейронов, начиная с последнего, выходного слоя и заканчивая настройкой нейронов первого слоя. Такой "урок" обучения искусственной нейросети может быть повторен необходимое число раз. Для настройки весовых коэффициентов применяется 8-правило в виде алгоритма минимизации функционала обучения Q(eu). Здесь еи = и -и= и -q(K) — вектор ошибки обучения сети относительно желаемого (эталонного) выхода и при нелинейном, согласно (1.4), преобразовании входного вектора г в выходной вектор u = q(K:) последнего слоя К. Ошибка еи явным образом зависит от коэффициентов ьи\к) и может быть использо 20 вана как аргумент функционала Q для настройки базовых элементов К -го слоя. Явная зависимость вектора еи и функционала Q(eu) от весовых коэффициентов w\i]j , т.н. "скрытых" слоев ( = 1, К-1), отсутствует. Поэтому в случае использования функционала Q (еи) для настройки коэффициентов w\g)j, ошибка еи в процедуре обучения многослойной нейросети последовательно пересчитывается в обобщенные ошибки ае для каждого слоя, и эти ошибки уже явно зависят от значений w\e)j. Настройка коэффициентов w[ej "скрытых" слоев осуществляется по алгоритму градиентного спуска, в котором используются обобщенные ошибки ое. Очевидно, что для слоя К ошибка ак = eu(vr ). В стандартном алгоритме ВР используется локальный квадратичный функционал обучения Q(a) = 0,5ото. Минимизация Q{p) по настраиваемым весовым коэффициентам ги У ( = к -l,...,l) методом градиентного спуска с пересчетом ошибки ак =eu(w(K)) для слоя К в ошибку ае = e{w{i)) для слоев = К-1,К-2,...,1 определяет суть ВР-технологии обучения многослойных нейросетей.
Постановка задачи аналитического синтеза нелинейных оптимальных законов управления на многообразиях и основные определения
Отсюда, основной целью диссертационной работы ставится разработка теоретических основ синтеза нейросетевых систем управления в условиях неопределенности (неопределенность математической модели и учет влияния неизмеряемых возмущений) с обучаемой МНС в качестве регулятора. Для достижения поставленной цели в работе решаются следующие задачи. 1. Развивается метод аналитического синтеза оптимальных законов управления для класса нелинейных динамических объектов. В качестве основных информационных единиц используются вектор состояния объекта (локальная информация) и желаемые инвариантные многообразия (макроинформация). Синтезируемые макропеременные в последующем выполняют роль обобщенных ошибок в процедурах обучения МНС. 2. В развитие метода синтеза агрегированных регуляторов в условиях неопределенности математической модели объекта вводится метод адаптивного управления на многообразиях и анализируются условия его применимости. 3. Метод адаптивного управления на многообразиях и метод синтеза агрегированных регуляторов распространяются на случай нейросетевой реализации регуляторов. Отдельно рассматриваются вопросы, связанные с прикладной спецификой нейросетевого управления: — условия устойчивости (сходимости) процедур обучения сети; — задача выбора функционала обучения сети; — условия применимости алгоритмов настройки весовых коэффициентов в случае нарушений условий достижимости и выпуклости; — условия возможности выработки МНС наилучшего управления в смысле выбранного критерия обучения сети. Это коррелируется с вопросами достижения глобального минимума в невыпуклых и многоэкстремальных задачах. Содержание разд. 2 посвящено развитию теории синтеза оптимальных регуляторов для многосвязных нелинейных объектов. В основе рассматриваемой теории лежит концепция синергетического синтеза оптимальных законов с использованием макроинформации о поведении системы в виде агрегированных макропеременных [23]. Агрегированные макропеременные конструируются на основе измеряемых векторов состояния динамической системы и образуют левые части уравнений инвариантных многообразий или параметров порядка (синергии). Инвариантным многообразиям (далее кратко — многообразиям) соответствуют возможные или желаемые диссипативные структуры в расширенном фазовом пространстве системы управления. Множество таких многообразий определяет "виртуальные" (промежуточные) и конечную структуры динамических систем управления в процессе их эволюции.
В настоящее время синтез оптимальных регуляторов с использованием агрегированных макропеременных наиболее полно развит в теории синергетического управления проф. А.А. Колесникова и реализован в рассмотренном в разд.1 методе аналитического конструирования нелинейных агрегированных регуляторов (методе АКАР) [23]. В зарубежной литературе близким к нему методом можно считать метод "обхода интегратора" [70, 78] и метод синтеза систем, основанный на идее отыскания "подходящего" преобразования координат [75] (методы feed-back linearization). Отдавая должное этим теориям и полученным на их основе результатам применительно к синтезу законов регулирования нелинейными многосвязными объектами, обратим внимание на ряд нерешенных в них проблем.
Во-первых, не определены условия существования оптимального закона управления, в том числе, условия существования неединственного решения задачи синтеза агрегированного регулятора и условия грубости полученного по методу АКАР закона управления.
Во-вторых, в методе АКАР не решена задача синтеза адаптивных алгоритмов управления нелинейными динамическими объектами в условиях функционально-структурной и параметрической неопределенности их математической модели.
В-третьих, к настоящему времени в методе АКАР отсутствует регулярная процедура выбора агрегированных переменных, согласованных с заданным классом дифференциальных уравнений нелинейного объекта.
В-четвертых, как отмечалось в разд. 1, в ряде случаев процедура специального нелинейного преобразования координат [70, 75, 98] не приводит к желаемому результату — к линейной динамике в новой системе координат. Система сохраняет "нелинейное описание" и, следовательно, вопросы синтеза регулятора, обеспечивающего заданное качество движения системы, остаются по-прежнему не разрешенными.
Отсюда следует актуальность развития теории синтеза оптимальных законов регулирования, учитывающей существенно нелинейную динамику объекта и связанные с ней неединственность и неопределенность решения задачи. Предлагаемое в разд. 2 решение поставленной проблемы служит теоретическим обоснованием синтеза нейросетевых систем управления, где обучаемая нейронная сеть реализует алгоритмы адаптивного управления на многообразиях. Решение этой задачи приводится в разд. 4.
Постановка задачи адаптивного управления на многообразиях
Предложен метод синтеза оптимальных законов управления на основе вводимых агрегированных макропеременных для класса нелинейных динамических объектов управления в соответствии с заданным критерием качества в условиях возможной функционально-структурной и параметрической недоопределенности математической модели объекта и с учетом физической реализуемости агрегированного регулятора. 2. Сформулированы и доказаны условия возможности синтеза агрегированного регулятора для нелинейных объектов и достаточные условия существования единственного оптимального закона управления для класса нелинейных систем, выбранных агрегированных макропеременных и произвольного сопровождающего функционала . В ряде практических задач достаточно использовать лишь квадратичный сопровождающий функционал. Для класса аффинных по управлению динамических объектов найдены необходимые и достаточные условия синтеза агрегированных регуляторов. 3. Разработана регулярная процедура (Tf (р а -преобразование) выбора управляемых инвариантных локальных целевых многообразий, достижение которых гарантирует достижение глобального целевого многообразия, т. е. выполнение системой управления своей технической задачи. 4. Исследованы условия физической реализуемости агрегированных регуляторов. В некоторых случаях (теорема П2.1 Приложения 2) можно говорить о возможности построения огрубленного агрегированного регулятора даже при условии неразрешимости исходной задачи синтеза. 5. Решена задача достижимости огрубленной цели управления в условиях структурной неопределенности математической модели объекта (теорема П2.3 Приложения 2), что позволяет говорить о возможности синтеза агрегированных регуляторов с использованием минимальной информации о структуре объекта .
В разделе дается решение задачи синтеза алгоритмов адаптивного управления на многообразиях (АУМ) нелинейными многосвязными объектами в условиях параметрической недоопределенности системы их дифференциальных уравнений. По существующей в настоящее время классификации рассматриваемые системы относятся к адаптивным системам прямого действия [46, 78, 85]. Адаптивное управление на многообразиях определяется как управляемый процесс "самоорганизации" на синтезируемых диссипативных структурах в расширенном фазовом пространстве адаптивной системы. Важным элементом синтеза является выбор желаемых агрегированных макропеременных, согласованных с исходной системой уравнений нелинейного многосвязного объекта. Решению этой задачи был посвящен разд. 2.4.
Суть адаптивного управления на многообразиях состоит в управляемом асимптотическом движении изображающей точки (ИТ) фазового пространства из произвольного начального состояния в окрестность пересечения множества задаваемых желаемых многообразий — в случае векторного управления или последовательного движения из начального многообразия в окрестность конечного через промежуточные многообразия — в случае скалярного управления с последующим движением вдоль пересечения многообразий или же вдоль конечного многообразия. Выбор финишного многообразия в обоих случаях согласуется с технической целью управления нелинейным объектом. Алгоритм движения к финишному многобразию следует как результат асимптотической оптимизации на множестве целевых функционалов, аргументами которых служат обобщенные ошибки управления — функции выбранных макропеременных или же — в простом случае — сами макропеременные. Локальные или промежуточные цели управления достигаются, когда ИТ попадает в окрестности промежуточных многообразий. Конечная цель управления на много-бразиях достигается, если в асимптотике ИТ попадает на финишное многообразие (пересечение локальных), а адаптивный алгоритм настройки параметров агрегированного регулятора минимизирует соответствующие целевые функционалы. Движение на финишном многообразии определяется редуцированной системой дифференциальных уравнений, а необходимый закон управления рассчитывается на основе метода синтеза агрегированных регуляторов, рассмотренного в разд. 2.
Реализация вводимых алгоритмов адаптивного управления традиционными компьютерными программами, безусловно возможна, однако более оправдано применение нейросетевых средств управления с алгоритмами обучения многослойной нейросети, аргументами которых являются вводимые макропеременные или функции макропеременных. Решению этой конечной цели работы посвящен разд. 4.
Анализ устойчивости процессов обучения МНС в непрерывном времени методом функций Ляпунова
Условие выпуклости автоматически выполняется для класса аффинных по управлению объектов в случае настройки лишь выходного слоя нейронной сети. (Возможность подобной схемы обучения следует из теоемы П5.1). Условия применимости процедур (4.29) настройки МНС в составе ОНО в случае неопределенности математической модели объекта следуют, в частности, из теорем 3.4 — 3.6, П4.1 — П4.3 с учетом замены формулировок условий достижимости и выпуклости.
Таким образом, для класса объектов, математическая модель которых может быть представлена системой дифференциальных уравнений (4.24), совместное использование методов аналитического синтеза агрегированных регуляторов и адаптивного управления на многообразиях однозначно определяют методику синтеза нейросетевых систем управления в условиях неопределенности как последовательность следующих действий. 1. Формализация глобальной цели управления в виде многообразия (4.24). 2. Отыскание управляемых локальных макропеременных Ws с помощью процедуры Tf а -преобразования и выработка локальных целей управления. Достижение глобальной цели управления при условии использования Tf а -преобразования для синтеза управляемых макропеременных следует из теорем 2.4, 2.5. 3. Определение структуры сопровождающих функционалов в зависимости от желаемого качества результирующей системы и из условий диссипативности движения изображающей точки в случае структурной неопределенности математической модели объекта. В частности, для функционалов вида (2.11) (квадратичных сопровождающих функционалов) ограничениями на класс подынтегральных функций cps могут служить условия П2.3 — П2.5. Свойство диссипативности синтезируемой системы следует из теоремы П4.2. 4. Определение условий возможности синтеза агрегированного закона управления. Здесь достаточно рассмотреть лишь условия разрешимости (нестрогой разрешимости) задачи синтеза агрегированных регуляторов в классе выбранных локальных макропеременных Ts и экстремалей "подходящих" сопровождающих функционалов (или, в общем случае функций вида (2.8)). Более того, в силу априорной погрешности при вычислении функции управления и посредством МНС, достаточно требовать разрешимости задачи синтеза с точностью до некоторого є 0. Величина числа є выбирается из условия: є 6 . Число 5 О получено из условия грубой достижимости. 5. Синтез архитектуры МНС В задачу синтеза архитектуры нейронной сети прямого распространения включены вопросы, связанные с выбором функций активации, числа слоев, числа минимально необходимого БПЭ в слое. Выбор класса функций активации осуществляется из условий конкретной задачи. Критерием отбора для ортогональных базисных функций может служить, например, скорость сходимости аппроксимаци-онного ряда или известные спектральные характеристики допустимых функций управления. В случае отсутствия какой-либо дополнительной информации о свойствах допустимых управлений или об условиях функционирования объекта, наиболее предпочтительно использование сигмо-идных, гиперболических или гауссовских функций активации вследствие относительной простоты их физической и технической реализации. Число нейронов в слое и число слоев МНС определяются в зависимости от требуемой точности реализации функции управления и в зависимости от управляющих входов объекта (числа управляемых макропеременных 4 s).
Многосвязность исходного объекта управления диктует два основных типа структур сетей: 1 — изображенная на рис. 4.3 , 2 — полносвязная МНС. Архитектура сети на рис. 4.3 позволяет воспроизводить функции управления без учета взаимного влияния каналов управления: для каждого управляющего входа выбирается обособленный участок сети. Что касается минимально необходимого числа БПЭ в слое и, вообще говоря, числа слоев в сети, то к настоящему времени получены лишь качественные результаты: оценки порядка числа БПЭ в сети для сигмоидных и гауссовских (или потенциальных) функций активации [40]. "Количественные" результаты — не решенная на сегодняшний день математическая проблема. Тем не менее, это не является принци Допустимая архитектура МНС. пиальным ограничением предложенного метода в практических приложениях, так как современная элементная база в состоянии обеспечить достаточно большое число БПЭ в МНС при условии ее аппаратной реализации. 6. Синтез критерия (функционала) обучения сети производится из условий и формулировок теорем 3.1 — 3.6, П4.1 — П4.3. Основным требованием к критерию обучения является доступность всех его компонент для измерения или вычисления и гарантированное достижение цели управления при условии синтеза процедуры обучения сети в составе ОНО (4.29) по выбранному функционалу настройки. 7. Синтез алгоритма обучения МНС. На этапах 1 — 6 предлагаемого метода синтеза неиросетевых систем получены: управляемые локальные макропеременные 4fs, сконструированы критерии обучения Qs (4/s, х, w), выбрана архитектура сети. Пусть архитектура сети имеет вид - рис. 4.3. Тогда для каждого локального целевого условия: Т3 - 0 при t -» «э, со 147 гласно методу синтеза адаптивного управления на многообразиях, конструируется агрегированный регулятор. В роли такого агрегированного регулятора выступает соответствующий участок МНС.