Содержание к диссертации
Введение
1 Краткий обзор работ по теории управления с использованием сетевых систем 10
1.1 Общие сведения о сетевых системах управления 10
1.2 Учет запаздывания в передачах пакетов данных 14
1.3 Потери пакетов данных 15
1.4 Контрольный пример 16
1.5 Структура канала обмена данными 16
1.6 Выводы 19
2 Стабилизирующее сетевое управление линейными дискретными системами в условиях потери пакетов данных 20
2.1 Линейные системы с доступным измерению вектором состояния 23
2.2 Линейные системы с управлением по вектору измерений . 27
2.3 Метод решения задачи 30
2.4 Примеры 30
2.4.1 Модельная задача 30
2.4.2 Стабилизирующее управление полетом квадрокоптера . 34
2.5 Используемые определения и теоремы 37
2.6 Выводы 38
3 Стабилизирующее сетевое управление линейными искретными системами с использованием банков сенсоров иисполнительных устройств 39
3.1 Описание системы 40
3.2 Построение стабилизирующего управления 42
3.3 Построение оценки вектора состояния 43
3.3.1 Наблюдатель с переключаемой структурой 44
3.3.2 Наблюдатель постоянной структуры 45
3.4 Метод решения задачи 49
3.5 Пример 49
3.6 Используемые определения и теоремы 52
3.6.1 Построение матрицы усиления стабилизирующего управления 52
3.6.2 Основные уравнения робастного фильтра Калмана . 54
3.7 Выводы 59
4 Иcпользование элементов прогнозирующего управления для построения стабилизирующего управления сетевыми объектами 60
4.1 Применение методов прогнозирующего управления при работе с сетевыми системами 62
4.2 Схема функционирования системы 64
4.3 Уравнения системы 65
4.4 Метод решения задачи 70
4.5 Пример 70
4.6 Выводы 75
Заключение
Библиографический список
- Учет запаздывания в передачах пакетов данных
- Стабилизирующее управление полетом квадрокоптера .
- Построение оценки вектора состояния
- Схема функционирования системы
Учет запаздывания в передачах пакетов данных
Одними из самых ранних исследований, посвященных данной тематике, можно считать работы A.Ray и L.W. Liou [57,71]. Авторы рассматривают объект управления с непрерывным временем и систему управления с дискретным временем и анализируют систему, используя подход с дискретным временем. Они рассматривают рассинхронизированную систему объекта управления и системы управления. В их работах рассматриваемая система представляется расширенным вектором состояния, который включает прошлые и настоящие состояния входов и выходов системы.
Nilsson [67] также анализирует сетевую систему управления в дискретном времени. Автор моделирует запаздывания в сети как постоянные, полностью случайные и случайные, но подчиняющиеся законам Марковских последовательностей, величины. Он решает задачу построения оптимального управления для различных моделей запаздывания пакетов данных. Он также указывает на важность сообщений с засечками времени, которые позволяют построить историю изменения системы.
Авторы [84] рассматривают объект управления и систему управления с непрерывным временем. Они вводят понятие максимально допустимого интервала передачи данных (), разделяющего последовательность успешно преданных сообщений системы. Их цель установить значение , при котором заданное качество (устойчивость) сетевой системы управления гарантировано сохраняется.
К настоящему времени данное направление развито достаточно хорошо. Так, например, в современных работах можно найти классификацию запаздываний по их длительности [28]. Также разнообразен и математический аппарат, используемый исследователями. В работах [28, 90] используются линейные матричные неравенства, в [78] - нелинейные матричные неравенства, авторы [38] в своей работе используют фильтрацию Калмана.
Сетевые системы управления, которые учитывают потери пакетов данных, были исследованы [42]. В частности авторы [80] рассмотрели влияние потери пакетов данных с распределением Бернулли при передаче по сетевому каналу на задачу построения оптимальной оценки. В дальнейшем эта работа была расширена с учетом объединения эффектов потери пакетов данных и запаздывания в передаче данных [76].
В настоящее время существует большое количество работ посвященных построению стабилизирующего управления с учетом потери пакетов данных. Качество таких систем было проанализировано в [55] и [79] в предположении некоторых моделей потерь пакетов данных. Также в этих работах были предложены алгоритмы для компенсации потерь. Авторы [41] проанализировали качество системы, когда потерянные данные заменяются нулями. В [55, 56] была поставлена задача нелинейной оптимизации для построения оптимального управления для случая, когда потери имеют равномерное распределение. В [16] для минимизации целевой функции был предложен субоптимальный наблюдатель и регулятор. В работах [64,76] этот подход расширен для получения оптимальных регуляторов, когда потери пакетов данных имеют равномерное распределение.
Авторы [88] рассматривали задачу стабилизации сетевых систем управления с учетом потери пакетов данных для случаев с непрерывным и дискретным временем. В [35] потери пакетов данных моделируются как асинхронно переключаемая система. В этом подходе действительные переключения заменяются средней системой, для которой рассматриваются условия устойчивости. В [67] потери моделируются Марковской цепью и рассматриваются две схемы стабилизации: с сохранением старого управления или построение нового в зависимости от того, потерян ли пакет данных.
В соответствии с направленностью проектов, в рамках которых выполнялась данная работа, основной интерес будут представлять задачи управления летательными аппаратами. В качестве контрольного примера для рассматриваемых алгоритмов выберем задачу построения стабилизирующего управления полетом квадрокоптера. Линейная система, характеризующая малые отклонения от положения равновесия по каналу угла крена и нулевого положения в пространстве, была взята из [47].
Беспилотные малоразмерные летательные аппараты в последнее время получают все большее распространение в силу удобства использования в целях разведки и картографии. При построении стабилизирующего управления такими аппаратами канал обмена данными уже не может считаться идеальным, т.к. в нем неизбежны задержки и потери пакетов данных.
Таким образом, построенный контур управления должен учитывать не только действительные возмущения, воздействующие на объект, такие как ветровые нагрузки, например, но и возмущения, индуцированные природой канала обмена данными.
Стабилизирующее управление полетом квадрокоптера .
В предыдущей главе рассматривался случай, когда объект управления получал информацию через единственный набор сенсоров и передавал управление через единственный набор исполнительных устройств. В реальных системах могут иметь место другие схемы. Например, в системе управления летательным аппаратом обычно содержатся основная и резервная система датчиков курса и вертикали. Кроме того, для корректировки текущего положения может использоваться информация со спутников и других внешних устройств. Таким образом, имеем многоуровневую систему резервирования, а, значит, и систему управления, в которой возможны переключения между различными наборами сенсоров и исполнительных устройств. Дополнительные сложности появляются в случае сетевого управления, т.к. часть передаваемых пакетов может быть повреждена или потеряна.
Предыдущий подход рассматривал сетевую систему управления с одним наборов сенсоров и исполнительных устройств как марковскую цепь с двумя возможными состояниями: пакет получен либо потерян. В дальнейшем стабилизирующее управление находилось из решения линейных матричных неравенств. В данном разделе рассматривается случай произвольного количества блоков сенсоров и исполнительных устройств, через которые происходит обмен данными между объектом и системой управления. Прямое обобщение результатов предыдущей главы на такие системы приводят к необходимости решения систем билинейных матричных неравенств сложной структуры, что связано со значительными трудностями.
Для получения эффективного алгоритма построения стабилизирующего управления предлагается новый подход, cуть которого состоит в следующем. Как и ранее вводится гипотеза о возможности разделения процессов оценивания и управления. Затем вводится эвристическая модификация неравенств исходной системы, которая позволяет сравнительно легко получить решение. В качестве альтернативного способа рассмотрен подход с использованием наблюдателя Калмана.
Считается, что характеристики канала передачи данных известны, т.е. известны вероятности переключения между блоками сенсоров и регуляторов. Эта информация используется для построения матрицы переходов при построении марковской цепи.
Материалы главы опубликованы в [5,6] в том числе в изданиях из списка ВАК [6].
В этой системе объект управления формирует массив данных для основных и резервных сенсоров системы управления (yk) и высылает их через сетевой канал данных. В процессе пересылки часть информации теряется либо портится (несовпадение контрольных сумм). Таким образом, система управления переключается на доступные в настоящий момент сенсоры (yk). Рис. 3.1. Схема сетевой системы управления.
При пересылке управляющей информации от системы управления объекту управления ситуация повторяется: система формирует сигналы для всех регуляторов (щ), но использован будет только тот, который не был потерян либо испорчен при пересылке. Модель системы задаётся линейным разностным уравнением следующего вида: Xk+i = Axk + BiUk, (3.1) У к = CiXk-, где ж/г+і–п-мерный вектор состояния перехода, я –п-мерный вектор исходного состояния, г –т-мерный вектор управления, –/-мерный вектор измерений, /с-дискретное время, выраженное в числе интервалов дискретности длительности At, матрицы А Є Шпхп и Д; Є Мпхт-матрицы перехода вектора состояния и усиления вектора управления соответственно.
В каждый дискретный момент времени матрица выхода системы может находиться в одном из следующих структурных состояний: Si : СІ = Сі, (3.2)
Кроме того, в случае потери сигнала информация может отсутствовать (СІ = 0). Здесь СІ Є 1 хп-матрицы, характеризующие і-й выход системы в различных структурных состояниях.
Аналогично подходу, изложенному в предыдущей главе, воспользуемся принципом разделения задач оценивания и управления и будем искать соответствующие матрицы усиления по отдельности. После того, как матрицы будут найдены для разделенных систем, подставим их в общую систему (3.5) и проверим её ЭУСК. Отметим здесь, что при разделении системы предполагается, что пары матриц (А, ВІ) полностью управляемы, а пары матриц (Л, СІ) полностью наблюдаемы.
Построение оценки вектора состояния
В данном разделе рассматривается случай произвольного количества блоков сенсоров и исполнительных устройств, через которые происходит обмен данными между объектом и системой управления. Прямое обобщение результатов предыдущей главы на такие системы приводят к необходимости решения систем билинейных матричных неравенств сложной структуры, что связано со значительными трудностями.
Для нахождения оценки вектора состояния вводится эвристическая модификация неравенств исходной системы, которая позволяет сравнительно легко получить решение. В качестве альтернативы рассматривается применение одной из модификаций фильтра Калмана -Robust Kalman flter, которая хорошо подходит для работы с системами с существенно изменяемой структурой.
Для нахождения стабилизирующего управления используется алгоритм, основанный на решении системы линейных матричных неравенств из [12]. Эффективность алгоритма продемонстрирована на примере нахождения стабилизирующего управления системой с двумя наборами сенсоров и исполнительных устройств. Рассмотрены два варианта функционирования такой системы: с однократным и многократным переключением сенсоров и регуляторов. Глава 4 Иcпользование элементов прогнозирующего управления для построения стабилизирующего управления сетевыми объектами
Модель прогнозирующего управления относится к классу алгоритмов управления, которые используют модели предсказания будущих реакций системы. Изначально подход разрабатывался для удовлетворения специфических потребностей управления электростанций и нефтеперерабатывающих заводов. В настоящее время прогнозирующее управление можно найти в самых различных областях применения: пищевой, автомобильной и аэрокосмической промышленности.
Суть подхода в следующем: на каждом интервале управления алгоритм пытается оптимизировать будущее поведение системы путем вычисления последовательности будущих управлений. Последовательность управлений рассчитывается таким образом, чтобы оптимизировать будущее поведение системы в течение интервала времени, получившего название горизонта предсказаний. Первое управление из полученной последовательности отправляется объекту, и в следующий момент времени задача управления решается заново, используя обновленные измерения.
Идеи прогнозирующего управления можно проследить до 1960х годов [36], но интерес к этим методам начал быстро расти только в 1980х годах после публикаций первых работ по прогнозирующему управлению: Identifcation and Command (IDCOM) [73], динамическому матричному управлению (Dynamic Matrix Control [29,30]) и первому всестороннему изложению идей обобщенного прогнозирующего управления Generalized Predictive Control (GPC) [25,26]. Хотя в изначальном виде идеи, лежащие в основе DMC и GPC схожи, DMC был задуман для многомерного управления с ограничениями, в то время как GPC в первую очередь подходит для одной переменной, а также адаптивного управления.
На рисунке 4.1 показана основная идея прогнозирующего управления [60]. Мы ограничимся обсуждением системы с одним входом и одним выходом. Будем рассматривать систему с дискретным временем. Текущее состояние обозначено как шаг t. На рисунке показаны две траектории: пунктирная - идеальная траектория и предсказанная траектория (обозначена точками). Предсказанная траектория начинается с текущего момента t и определяет траекторию, двигаясь по которой объект должен вернуться на идеальную траекторию. Прогнозирующий регулятор имеет собственную модель, которая используется для прогнозирования поведения системы внутри горизонта предсказаний. В простейшем случае мы можем попытаться выбрать предсказанную траекторию таким образом, чтобы совместить ее с идеальной в конце горизонта предсказаний.
Вопросы возможности оптимизации в реальном времени, устойчивости и качества широко изучены для систем, описываемых линейными моделями (книги [19, 21, 24, 27, 59]). Значительный прогресс в применении прогнозирующего управления для гибридных систем, дискретных систем, систем с логическими условиями, эвристического анализа был получен в [18]. Материалы главы опубликованы в [7] (издание входит в список ВАК), а также в [8–10].
Схема функционирования системы
В случае отсутствия внешних возмущений можно видеть, что система стабилизирована без значительных отклонений от стабилизированной траектории в случае потери пакетов данных.
При воздействии внешнего возмущения отклонение от нулевого состояния не превышает 5 градусов и 1 метра Рис.4.5.
Кроме того приведем распределение количества потерянных пакетов данных. В этом распределении ненулевые величины показывают количество потерянных пакетов данных, начиная с последней удачной передачи. В приведённом примере количество потерянных пакетов составляет около 50% от их общего числа.
Сравнивая результаты двух методов построения стабилизирующего управления, можно видеть, что использование принципов прогнозирующего управления позволяет добиваться устойчивости замкнутой системы при значительно больших потерях информации в канале обмена данными. Так для рассматриваемого примера стабилизирующего управления квадрокоптером их количество не превысило 20% в случае использования марковской цепи для моделирования смены состояний системы и составило более 50% при использовании принципов прогнозирующего управления.
Объяснено это может быть тем фактом, что в подходе с использованием марковской цепи в Главе 2 одним из структурных состояний являлась разомкнутая система, и искомые матрицы усиления обратной связи для управления и наблюдения должны были обеспечивать устойчивость системе, которая с некоторой вероятностью находилась в разомкнутом состоянии. В рассмотренных примерах было показано, что при использовании предложенного метода данное условие может быть выполнено для относительно небольшого количества потерянных пакетов данных.
Следует, однако, помнить, что при использовании методов прогнозирующего управления ключевым элементом является степень соответствия построенного прогноза истинному состоянию системы. Неудачно выбранная модель может не позволить стабилизировать рассматриваемую динамическую систему. 4.6 Выводы
В разделе рассмотрено применение принципов прогнозирующего управления для синтеза стабилизирующего управления при работе с сетевыми объектами. Применение принципов прогнозирующего управления очень привлекательно из-за нахождения системы в одном структурном состоянии, когда информация о ней доступна. Хотя нужно помнить, что иногда эта информация будет предсказанной, а не истинной.
Для получения оценки вектора состояния системы используется линейный фильтр Калмана, записанный для расширенного вектора состояния.
Эффективность предложенного алгоритма продемонстрирована на примере построения стабилизирующего управления полета квадрокоптера в условиях потери значительного количества пакетов данных. Заключение
В диссертационной работе получены следующие научные результаты: 1. На основе принципа разделения при построении управления с динамической обратной связью по выходу в сетевых системах в условиях потерь пакетов данных разработан метод синтеза простых стабилизирующих управлений; 2. На основе принципа разделения предложен метод синтеза алгоритма управления сетевыми системами с резервированием с динамической обратной связью по выходу в условиях потерь пакетов данных; 3. Предложен метод синтеза алгоритма управления сетевыми динамическими системами в условиях потерь пакетов данных на основе принципов прогнозирующего управления.
При решении задач оценивания и прогноза в работе используется вычислительно эффективный аппарат линейных матричных неравенств и теории наблюдателей Калмана, что обеспечивает относительно простую реализацию предлагаемых алгоритмов и позволяет надеятся на эффективное решение широкого круга задач. Численные примеры подтвердили работоспособность и высокую эффективность предложенных методов.