Содержание к диссертации
Введение
1 Постановка задачи синтеза управления системой стабилизации перегрузки бпла при действии возмущений 18
1.1 Системы стабилизации БПЛА 18
1.1.1 Системы стабилизации баллистических ракет и ракет-носителей .. 19
1.1.2 Системы стабилизации зенитных ракет, ракет классов «воздух-воздух» и «воздух-поверхность» 24
1.2 Постановка задачи управления в виде дифференциальной игры 36
1.3. Анализ методов синтеза управления при наличии возмущений на основе теории дифференциальных игр 39
Выводы по РАЗДЕЛУ 1 47
2. Синтез управления системой стабилизации перегрузки БПЛА в линейной постановке 49
2.1 Постановка задачи 49
2.2 Выбор параметров контура стабилизации перегрузки при отсутствии возмущений 51
2.3 Алгоритм синтеза управления линейной системой стабилизации перегрузки БПЛА на основе метода экстремального прицеливания... 53
2.3.1 Постановка задачи синтеза в виде конфликтной задачи сближения53
2.3.2 Расчет областей достижимости БПЛА и возмущений 56
2.3.3 Дифференциально-игровой алгоритм формирования управления линейной системой стабилизации перегрузки БПЛА с учетом возмущений, статистические свойства которых неизвестны 67
2.3.4 Результаты моделирования 69
Выводы по разделу 2 75
3. Синтез управления системой стабилизации перегрузки бпла с учетом нелинейности модели 77
3.1 Постановка задачи 77
3.2 Алгоритм синтеза управления системой стабилизации на основе метода экстремального прицеливания 79
3.2.1 Постановка задачи синтеза в виде конфликтной задачи наведения 79
3.2.2 Расчет областей достижимости БПЛА с учетом возмущений 80
3.2.3 Дифференциально-игровой алгоритм формирования управления системой стабилизации БПЛА с учетом возмущений, статистические свойства которых неизвестны 90
3.2.4 Результаты моделирования 92
Выводы по разделу 3 99
4. Исследование точности наведения бпла при стрельбе по маневрирующим целям с учетом компенсации возмущений в контуре стабилизации перегрузки .101
4.1. Постановка задачи и алгоритм формирования управления 101
4.2. Программный комплекс для исследования дифференциально-игровых алгоритмов управления контуров стабилизации 105
4.3. Результаты моделирования 112
Выводы по разделу 4 127
Заключение 129
Литература 132
- Системы стабилизации баллистических ракет и ракет-носителей
- Выбор параметров контура стабилизации перегрузки при отсутствии возмущений
- Расчет областей достижимости БПЛА и возмущений
- Расчет областей достижимости БПЛА с учетом возмущений
Введение к работе
Актуальность темы. Диссертация посвящена разработке метода управления для систем стабилизации перегрузки беспилотных летательных аппаратов (БИЛА) при действии детерминированных и случайных возмущений с неизвестными статистическими свойствами на основе теории дифференциальных игр.
В процессе движения БИЛА на него могут действовать внешние возмущающие моменты, вызванные различными факторами. Например, в современных скоростных БИЛА для реализации режима сверхманевренности наряду с аэродинамическим управлением используется газодинамическое управление. При газодинамическом способе управления возникают дополнительные возмущающие моменты относительно поперечных осей, что затрудняет управление воздушными рулями. К дополнительным ошибкам стабилизации приводит влияние неучтенных производственных и эксплуатационных отклонений от номинальных значений. Дополнительные возмущающие моменты могут быть вызваны случайными порывами ветра, взрывной волной от подрыва боевых частей других БИЛА и рядом др. причин.
Перечисленные выше причины, ухудшающие работу системы стабилизации, могут носить как случайный, так и детерминированный характер.
Для решения задач оптимального управления динамическими системами при действии возмущений широкое распространение получили методы стохастической оптимизации, методы теории адаптивно-робастного управления, ней-ро-нечеткого управления.
Статистические характеристики случайных возмущений, действующих на БПЛА, как правило, неизвестны, что затрудняет применение методов стохастической оптимизации. Стандартные методы адаптивного управления не могут быть непосредственно использованы для компенсации внешних детерминированных возмущений, недоступных прямым измерениям, что требует разработки специальных методов адаптивной компенсации детерминированных возмущений. Интенсивно развивающиеся методы нейро-нечеткого управления трудно использовать для синтеза управления системами стабилизации скоростных БПЛА при действии возмущений, т.к. в таких системах недостаточно времени на перенастройку коэффициентов нейросети в режиме реального времени.
Таким образом, для синтеза управления системами стабилизации скоростных БПЛА при действии возмущений детерминированного или случайного характера с неизвестными статистическими свойствами, нужно совершенствовать рассмотренные выше методы, или искать новые методы управления, что говорит об актуальности темы диссертации.
В диссертации задача управления системой стабилизации нормальной перегрузки скоростного БПЛА при наличии возмущений рассматривается как антагонистическая дифференциальная игра.
Первые работы по антагонистическим дифференциальным играм относятся к шестидесятым годам прошлого века . В эти же годы теория антагони-стических дифференциальных игр интенсивно развивается и в нашей стране ' . Существенный вклад в ее становление и развитие внесли Л.С. Понтрягин, Н.Н. Красовский, А.И. Субботин, А.Б. Куржанский, Ю.С. Осипов, Б.Н. Пшеничный, А.Г. Ченцов, Ф.Л. Черноусько, R. Isaacs, M.G. Crandall, P.L. Lions, L. Berkovitz, P. Bernhard, A. Blaquire, J.V. Breakwell, W.H. Fleming, G. Leitmann.
Применению методов теории дифференциальных игр для управления летательными аппаратами посвящены работы О.А. Толпегина ' . В работах О.А. Толпегина рассмотрены также задачи синтеза управления системой стабилизации крена БПЛА и следящей системой с использованием линейных дифференциальных уравнений. Работ, в которых рассматривается решение задачи стабилизации БПЛА на основе теории дифференциальных игр с использованием линейных и нелинейных математических моделей, практически нет.
Целью данной диссертации является:
Повышение точности и быстродействия систем стабилизации перегрузки скоростных БПЛА при действии внешних детерминированных и случайных возмущений с неизвестными статистическими свойствами путем разработки и доведения до программной реализации методов и алгоритмов синтеза управления в системах стабилизации перегрузки БПЛА на основе решения антагонистических дифференциальных игр.
Основные задачи исследования:
Сравнительный анализ методов теории дифференциальных игр и выбор метода для решения задачи синтеза управления в системе стабилизации перегрузки БПЛА при действии возмущений.
Выбор структуры и параметров контура стабилизации для проведения дальнейших исследований.
Создание метода решения задачи синтеза управления системой стабилизации перегрузки БПЛА при действии детерминированных и случайных возмущений с неизвестными статистическими свойствами на основе теории позиционных дифференциальных игр.
Разработка дифференциально-игровых алгоритмов формирования управления системой стабилизации перегрузки БПЛА с учетом действия детерминированных и случайных возмущений с неизвестными статистическими
1 Айзеке Р. Дифференциальные игры. М.: Мир, 1967.
2 Понтрягин Л.С. Линейные дифференциальные игры. 1 // Докл. АН СССР. 1967. Т. 174, № 6.
С.1278-1280.
3 Понтрягин Л.С. Линейные дифференциальные игры. 2 // Докл. АН СССР. 1967. Т. 175, № 4.
С. 764-766.
Толпегин О. А. Дифференциально-игровые методы управления движением беспилотных летательных аппаратов. СПб.: БГТУ, 2009.
Толпегин О.А. Методы решения прикладных задач управления в игровой постановке. СПб.: БГТУ, 2007.
свойствами на основе анализа областей достижимости (ОД) для ряда дискретных будущих моментов окончания переходного процесса с использованием линейных и нелинейных математических моделей.
Создание пакета прикладных программ для анализа и синтеза управления системой стабилизации нормальной перегрузки БПЛА на основе разработанных дифференциально-игровых алгоритмов.
Апробация разработанных алгоритмов управления при наведении скоростного БПЛА на маневрирующую цель.
Объект исследования: система стабилизации перегрузки БПЛА при действии внешних детерминированных и случайных возмущений с неизвестными статистическими свойствами.
Методы исследования: математический аппарат теории дифференциальных игр, теории оптимального управления, численные методы оптимального управления, динамики полета и систем автоматического управления, математическое моделирование, а также вычислительный эксперимент.
На защиту выносятся:
Метод синтеза управления системой стабилизации перегрузки скоростного БПЛА при наличии возмущений с неизвестными статистическими свойствами, основанный на расчете ОД для ряда дискретных будущих моментов окончания переходного процесса и анализе их взаимного положения.
Дифференциально-игровой алгоритм синтеза управления в системе стабилизации перегрузки скоростного БПЛА, когда движение определяется линейной системой дифференциальных уравнений.
Дифференциально-игровой алгоритм синтеза управления в системе стабилизации перегрузки скоростного БПЛА, когда движение определяется нелинейной системой дифференциальных уравнений.
Алгоритм приближенного построения ОД для нелинейной системы стабилизации перегрузки БПЛА с учетом действия возмущений.
Результаты исследования наведения скоростного БПЛА на маневрирующую цель с использованием разработанного программного комплекса.
Научная новизна результатов диссертации:
Создан метод формирования управляющего сигнала для системы стабилизации перегрузки БПЛА при действии детерминированных и случайных возмущений с неизвестными статистическими свойствами, основанный на расчете ОД в системе координат «перегрузка-скорость изменения перегрузки» и анализе их положения для ряда дискретных будущих моментов времени окончания переходного процесса.
Разработан алгоритм формирования управляющего сигнала для системы стабилизации перегрузки БПЛА при действии внешних возмущений в линейной постановке, отличающийся тем, что строятся ОД от управления и ОД от возмущения для ряда дискретных будущих моментов времени окончания переходного процесса в системе координат «перегрузка-скорость изменения пере-
грузки», и на основе анализа их взаимного положения формируется сигнал управления.
Впервые разработан алгоритм формирования управления для системы стабилизации перегрузки БПЛА при действии внешних возмущений в нелинейной постановке, заключающийся в построении минимаксной ОД для ряда дискретных будущих моментов времени окончания переходного процесса и в формировании сигнала управления на основе анализа положения этой ОД.
Впервые создан алгоритм построения ОД в системе координат «перегрузка-скорость изменения перегрузки» для нелинейной системы стабилизации перегрузки БПЛА, отличающийся тем, что граница ОД строится по точкам с учетом противодействия возмущения.
Достоверность результатов, полученных в работе, определяется:
Корректной постановкой общих и частных задач работы.
Корректным использованием математического аппарата теории дифференциальных игр и теории оптимального управления.
Использованием апробированных математических моделей динамики полета БПЛА.
Вычислительными экспериментами с различными математическими моделями, видами возмущающих воздействий, вариантами маневра цели.
Сравнением с известными методами стабилизации без учета компенсации возмущений, показавшим совпадение с ранее известными результатами.
Практическая ценность результатов диссертации заключается:
В более рациональном использовании динамических возможностей БПЛА при действии возмущений детерминированного и случайного характера, что позволяет повысить точность и быстродействие систем стабилизации перегрузки, и как следствие, увеличить надежность функционирования БПЛА в условиях внешних возмущений.
В том, что реализация предложенного метода синтеза управления не требует внесения изменений в структуру системы стабилизации. Управление, вычисленное по разработанным алгоритмам, вводится в контур стабилизации как дополнительное управляющее воздействие.
В разработанном научном и методическом обеспечении проектирования новых систем управления БПЛА различного назначения и модернизации существующих.
В разработанном комплексе программного обеспечения для формирования управления и моделирования действий этого управления. Применение комплекса продемонстрировано на примере задачи наведения БПЛА на маневрирующую цель, что показало его работоспособность и возможность его применения в конструкторских разработках.
Внедрение результатов: Результаты диссертационного исследования внедрены в ОАО «МКБ «Факел» имени академика П.Д. Грушина», в ФГУП
«1 ЦНИИ МО РФ», а также в учебном процессе БГТУ «ВОЕНМЕХ» им. Д.Ф.Устинова, о чем имеются соответствующие акты.
Апробация работы: Основные результаты диссертационной работы докладывались и обсуждались: на седьмой межведомственной научно-технической конференции «Проблемные вопросы сбора, обработки, передачи и защиты информации в сложных радиотехнических системах» (ПВИРЭ KB, Пушкин, 2005), VIII конференции молодых ученых "Навигация и управление движением" (ЦНИИ "Электроприбор", СПб, 2006), одиннадцатой всероссийской научно-практической конференции «Актуальные проблемы защиты и безопасности» (ВМА им. Кузнецова, СПб, 2008), международной научно-практической конференции «Синергия образования, науки, промышленности» (БГТУ «ВОЕНМЕХ», СПб, 2008), 39 молодежной школе-конференции «Проблемы теоретической и прикладной математики» (ИММ УрО РАН, Екатеринбург, 2008) и на семинарах кафедры «Процессов управления» БГТУ «ВОЕНМЕХ» им. Д.Ф.Устинова.
Публикации: По теме диссертационной работы опубликовано 18 научных работ, из них - 5 статей (2 статьи в изданиях из перечня, рекомендованного ВАК), 8 отчетов по НИР.
Структура и объем диссертации: Диссертация состоит из введения, четырех разделов, заключения, списка литературы, включающего 156 наименований, и двух приложений. Основная часть работы содержит 147 страниц машинописного текста, 122 рисунка и 6 таблиц.
Системы стабилизации баллистических ракет и ракет-носителей
Система автоматической стабилизации является одной из основных частей системы управления полетом и предназначена для стабилизации и управления угловым положением беспилотного летательного аппарата (БПЛА).
Система стабилизации представляет собой единую пространственную систему. Однако в процессе проектирования ее принято разделять на три составные части: по каналам крена, тангажа и рыскания. Между этими тремя каналами в зависимости от расположения несущих поверхностей и органов управления БПЛА существуют аэродинамические и инерционные перекрестные связи [66].
Основное назначение систем стабилизации заключается в улучшении устойчивости и управляемости БПЛА. В беспилотных летательных аппаратах (ЛА) система стабилизации обеспечивает правильность выдачи сигналов управления при самонаведении и телеуправлении по двум каналам наведения. Большое влияние система стабилизации оказывает на уменьшение перекрестных связей между каналами и повышение точности наведения БПЛА.
Неотъемлемой частью системы автоматического управления полетом является контур демпфирования, который обеспечивает требуемое затухание переходных процессов. Для полного решения задачи стабилизации контур демпфирования необходимо дополнить контуром управления по координате, характеризующей траекторию полета. В качестве такой координаты используется либо приращение нормальной перегрузки, либо угол тангажа.
Качество систем стабилизации определяется способностью парирования внешних возмущений и степенью влияния переменности параметров БПЛА на динамические процессы отработки углов крена, тангажа, рыскания.
При создании систем управления полетом БПЛА для эффективной компенсации нестационарности параметров БПЛА встает задача синтезировать систему постоянной структуры. Рассмотрим вопрос формирования контуров автоматической стабилизации современных скоростных БПЛА, на примере таких БПЛА как баллистические ракеты, ракеты-носители, ракеты классов «воздух-воздух», «воздух-поверхность» и зенитные управляемые ракеты (ЗУР).
Системы стабилизации баллистических ракет и ракет-носителей космических ЛА предназначены для стабилизации движения центра масс ракеты в продольной и боковой плоскостях и ее угловой стабилизации относительно центра масс по тангажу, курсу и крену.
Стабилизация движения ракеты вдоль траектории обеспечивается системой программного регулирования кажущейся скорости. При этом регулирование выполняется путем изменения расхода топлива двигателей. Стабилизация же движения центра масс может осуществляться и вдоль других осей, при этом должны обеспечиваться также линейные смещения центра масс ракеты, при которых на траектории получаются малые ошибки отклонения ракеты от плоскости пуска и небольшие ошибки по скорости в момент выключения двигателей. Данные о движении центра масс ракеты рассчитываются по сигналам с трех интегрирующих датчиков линейных ускорений, расположенных на гиростабилизированной платформе и измеряющих проекции вектора кажущейся скорости на оси инерциальной системы координат. Эти сигналы через преобразователи поступают на приводы, поворачивающие разгонные двигатели ракеты.
Системы угловой стабилизации по тангажу и крену поддерживают требуемые угловые положения осей ракеты, парируя при этом действие различного рода возмущений. На систему угловой стабилизации по крену возлагается задача обеспечения полета ракеты без крена, в результате чего исключаются появление боковой перегрузки и отклонение центра масс от плоскости пуска.
Данные об угловом положении ракеты снимаются с датчиков углов тангажа, рыскания и крена, которые также устанавливаются на гиростабилизированной платформе. Сигналы с датчиков углов в виде напряжений поступают на рулевые приводы поворота двигателей.
При рассмотрении таких контуров большое внимание уделяется колебаниям топлива в баках, а также упругим колебаниям корпуса ракеты. Близкое совпадение частот колебаний топлива и упругих колебаний с собственной частотой колебаний контура стабилизации приводит к возникновению слабозатухающих или незатухающих колебаний ЛА на траектории, нарушающих нормальный режим его полета. В ряде случаев это явление служит причиной поломки аппаратуры, а иногда и разрушения корпуса ракеты в воздухе. Необходимо отметить, что число упругих тонов, оказывающих существенное влияние на систему стабилизации, зависит от величины отношения длины корпуса ракеты к ее диаметру. При больших значениях отношений в систему стабилизации приходится вводить искусственное демпфирование от первых трех, а иногда и четырех тонов упругих колебаний [9,48,107]. Для этого часто пользуются показаниями от дополнительных датчиков угловых скоростей (ДУС), жестко закрепленных на корпусе ракеты.
На выбор места расположения гиростабилизированной платформы и основных ДУС существенное влияние оказывает форма первых трех тонов упругих колебаний, так как выходные сигналы, снимаемые с этих датчиков, определяются суммой двух сигналов: от собственного положения ракеты (ее угловой скорости вращения) и поворота сечений (угловой скорости поворота), вызванных упругостью корпуса. Наиболее чувствительны к размещению ДУС, которые усиливают воспроизведение высокочастотных упругих колебаний и «забивают» ими контура стабилизации и управления. Поэтому при проектировании систем стабилизации баллистических ракет и ракет-носителей наряду с выбором структуры и параметров контура проектировщик должен определить наилучшие месторасположения датчиков формируемой системы.
Колебания топлива и упругие колебания корпуса приводят к необходимости их демпфирования конструктивным путем (введением в баки кольцевых и радиальных перегородок, крестовин, пластмассовых шариков, продольных и поперечных ребер жесткости и т.п.). Параметры контура стабилизации должны выбираться такими, чтобы не уменьшалась степень демпфирования, полученная конструктивным путем.
Если принятые конструктивные меры не позволяют получить требуемую степень демпфирования, то в контур стабилизации вводится дополнительное корректирующее устройство в виде узкополосного фильтра. За счет этого в контуре получается провал логарифмической амплитудной частотной характеристики на резонансных частотах, что соответствует разомкнутому состоянию системы. В этом заключается так называемый амплитудный способ стабилизации ракеты.
Выбор параметров контура стабилизации перегрузки при отсутствии возмущений
Процесс стабилизации будем рассматривать как антагонистическую дифференциальную игру двух игроков. Будем считать что, движение первого игрока определяется векторным дифференциальным уравнением (2.9) с начальными условиями (2.11), а движение второго - уравнением (2.10) с начальными условиями (2.12).
Для выбора управления в позиции j ,x(I)(7 ),.r(2)(/ )} составляется вспомогательная минимаксная задача оптимального программного управления, которая ставится как исходная конфликтная задача (2.9)-(2.15), но решается она из позиции jf ,x(1)(/ ),x(2)(r )j и управления игроков определяются только как функции времени на интервале времени [/ ,г).
С выбранным управлением происходит переходной процесс в течение времени At. Одновременно реализуется некоторое возмущение , неизвестное первому игроку. В позиции у +At,x \t +At),x(-2\t + At)j вновь составляется вспомогательная задача и т.д.
Переходной процесс продолжается до минимального "расстояния" между игроками г(Т), которое определяется формулой (2.15). Момент Т определяется в процессе стабилизации.
В основе решения вспомогательной минимаксной задачи на основе метода экстремального прицеливания лежит расчет областей достижимости игроков для ряда будущих моментов времени.
Рассмотрим алгоритм построения областей достижимости для линейной системы стабилизации нормальной перегрузки БПЛА при наличии возмущений с неизвестными статистическими свойствами. Требуется построить ОД в плоскости ONyNy для момента времени Т (рис: 2.3).
ОД для линейных систем с ограничениями вида (2.3), (2.4) являются выпуклыми и замкнутыми, поэтому достаточно построить только границу ОД. Границу ОД будем строить по точкам [79].
Для расчета точек границы ОД первого игрока из позиции jr ,x(1)(/ )j к моменту времени Т сформулируем следующую задачу оптимального управления.
Таким образом, изменяя значение угла ср от 0 до 360 и решая задачу о максимальном смещении в заданном направлении, построим границу ОД первого игрока.
Для решения задачи (2.18) использовались необходимые условия принципа максимума Понтрягина [59], а возникающая при этом краевая задача решалась с использованием метода последовательных приближений Крылова - Черноусько [86].
ОД будем строить для момента времени Т t0. Требуется найти оптимальное управление, обеспечивающее максимум функционалу (2.18) в заданный момент времени Т при ограничении (2.21) и начальных условиях (2.20).
Для решения поставленной задачи используем необходимые условия оптимальности принципа максимума Л.С. Понтрягина. Таким образом, задача оптимального управления сводится к краевой задаче - найти решение систем уравнений (2.19) и (2.24), фазовые координаты которых удовлетворяют начальным условиям (2.20) и граничным условиям (2.26). Кроме того, согласно принципу максимума, функция Гамильтона (2.23) при оптимальном управлении должна достигать максимума.
Для решения краевой задачи на основе метода последовательных приближений использовался алгоритм, рассмотренный в [77], [86]. Для расчета ОД второго игрока использовался аналогичный алгоритм. Движение второго игрока определялось следующей системой дифференциальных уравнений: dt у mV y "в mV dc{2)z =(m-a +mSJS B+m dt - OJ zlV (2) (2) . -ОТ z ,dt a 2)=l9(2)_0(2). — т г 1/7 (2.28) B=-kyKyNy2)-k(0co ; V =const . ОД строится для начальных условий: /0 = 0, Є(2)(0) = 0, .9(2)(0) = 0, 42)(0) = 0, 42)(0) = 0. (2.29) Возмущение удовлетворяет ограничению Ш пшх. (2-30) ОД строится для момента времени T t0. Функционал (2.18) представим в следующем виде; J3 = zT(T)I = Ny2) (Т) cos р + Ny2) (Г) sin ср. (2.31) Требуется найти оптимальное управление, обеспечивающее максимум функционалу (2.31) в заданный момент времени Т при ограничении (2.30) и начальных условиях (2.29). Поставленная задача решается с использованием принципа максимума, а для решения краевой задачи, как и при расчете ОД первого игрока, использовался метод последовательных приближений. Алгоритм вычисления оптимального управления второго игрока имеет вид: ?([) = { ЪМАХ (2.32) [- МАХ если Н2 0, qSl t где Н2 =y/a-—ml . Моделирование показало, что, как и при расчете ОД первого игрока, режим особого управления не возникает. Результаты расчета областей достижимости Расчет производился для гипотетического БПЛА (аналога ЗУР «Пэтриот» [21,32,46,135,136,137,138]) со следующими параметрами: /=5.3 м; 5=0.13 м ; /и =395 кг; Л =981 кгм . Параметры системы (2.1) имели значения /и? =-0.0022 1/град; /и?й =-0.011 1/град; mf- =-0.761; сау =0.15 1/град; с5/ = 0.046 1/град; кпу =0.336; ку =-0.002; кю =-0.0805 с. ОД игроков строились при следующих начальных условиях: 6 (1)(0) = 0.9 рад, 6»(2)(0) = 0, со9](0) = со{2)(0) = 0, ,9(1)(0) = 1 рад, ,9(2)(0) = 0, п)(0) = 2)(0) = 0 Расчет производился для различных соотношений управлений игроков. а) Управления игроков удовлетворяли ограничениям: итах = 20, %тах =0.1. В этом случае возможности возмущения меньше возможностей первого игрока. На рис. 2.4 - 2.6 представлены ОД первого игрока G] и второго игрока G2 построенные из начальной позиции для моментов времени Т = 0.2с , Т = 0.3с , Т = 0.5с соответственно. б) Управления игроков удовлетворяли ограничениям: итах=\0, тах=0Л. В этом случае возможности игроков равны. На рис. 2.7- 2.9 представлены ОД первого игрока G} и второго игрока G2 построенные из начальной позиции для моментов времени Т = 0.2с , Т = 0.3с , Т = 0.5с соответствен н о. в) Управления игроков удовлетворяли ограничениям: итах = 5, %тах = 0.1. В этом случае возможности второго игрока превосходят возможности первого игрока. На рис. 2.10 - 2.12 представлены ОД первого игрока G{ и второго игрока G2 построенные из начальной позиции для моментов времени Т = 0.2с , Т = 0.3с , Т = 0.5с соответственно. Ny 150.0 т Результаты расчета областей достижимости игроков показывают: - области достижимости являются выпуклыми и замкнутыми; - геометрические размеры областей зависят от заданных ограничений на управления игроков и заданного момента Т .
Расчет областей достижимости БПЛА и возмущений
Задача (3.1) - (3.5) при наличии ограничений (3.3), (3.4) является конфликтной задачей наведения, для решения которой можно использовать метод, аналогичный методу экстремального прицеливания Н.Н.Красовского, основанный на построении областей достижимости (ОД) игроков [33], [77]. Управления игроков выбираются в дискретные моменты времени /0=0, t0+At, /0+2Д/,..., (3.6) и так далее, где Л/ - шаг выбора управления.
Для выбора управления в позиции {/ ,z(/ )} составляется вспомогательная минимаксная задача оптимального программного управления, которая ставится как исходная конфликтная задача (3.1)-(3.5), но решается она из позиции {t ,z(t )} и управления игроков определяются только как функции времени на интервале времени \t ,T).
Здесь zT =[V,e,co:,3,SB,x,y \ - вектор состояния системы. В результате решения вспомогательной минимаксной задачи определяется unp(t) и в качестве оптимального управления первого игрока в позиции {u,z(t )} принимается u{u,z{u)) = unp{t)\t= . (3.7) Для рассматриваемой задачи выбор управления на основе (3.7) является оптимальным [33]. С выбранным управлением происходит переходной процесс в течение времени At. Одновременно реализуется некоторое возмущение , неизвестное первому игроку. В позиции [t + At,z(t + ДО} вновь составляется вспомогательная задача и т.д.
Переходной процесс продолжается до минимального "расстояния" между общей для игроков областью достижимости и заданной точкой (Ny ,0). Момент Т определяется в процессе стабилизации. В основе решения вспомогательной минимаксной задачи лежит расчет общей для игроков области достижимости для ряда будущих моментов времени, что является отличительной особенностью предложенного метода синтеза.
Рассмотрим приближенный алгоритм построения областей достижимости для нелинейной системы стабилизации нормальной перегрузки БПЛА при наличии возмущений с неизвестными статистическими свойствами. Требуется построить ОД в плоскости ONyNу для момента времени Т (рис. 3.1). Предполагаем, что граница ОД является ограниченной и выпуклой, что подтверждают результаты вычислений. Границу ОД будем строить по точкам [79]. Рис. 3.1 Для расчета точек границы ОД из позиции {t ,z(u)} к моменту времени Т сформулируем следующую дифференциальную игру. В плоскости ONyNy введем единичный вектор Iі =[cos p sinср\. Смещение в направлении этого вектора к моменту времени Т в плоскости ONyNy определяется по следующей формуле: jl = Ny (Т) cos (p + Ny (Г) sin ср. (3.8) Первый игрок выбирает управление u(t) и максимизирует критерий (3.8), т.е. решает задачу о максимальном смещении в направлении вектора / к моменту времени Т. Второй игрок выбирает возмущение (г). Будем предполагать, что интересы второго игрока противоположны интересам первого игрока, т.е. второй игрок минимизирует критерий (3.8) и решает задачу о минимальном смещении в направлении вектора / к моменту времени Т. В этом случае игра будет антагонистической.
В результате решения данной задачи при определенном значении угла ср, получим точку с координатами N (Г) и N (Т), которая и будет являться точкой границы ОД. Таким образом, изменяя значение угла ср от 0 до 360, построим границу ОД игроков в предположении, что ОД является выпуклой.
Для решения поставленной дифференциальной игры разработан следующий итерационный алгоритм: АЛГОРИТМ3.1: 1. Задаются начальные программы управления первого и второго игроков и(0,(0 2. С использованием принципа максимума Л. С. Понтрягина находится оптимальная программа управления первого игрока ux{t), обеспечивающая максимальное смещение в направлении вектора / при фиксированной программе (0 3. Фиксируется программа u\t) и на основе принципа максимума Л.С. Понтрягина находится оптимальная программа управления второго игрока Є1 (t), обеспечивающая минимальное смещение в направлении вектора /. 4. Фиксируется программа (/) и находится новая оптимальная программа управления первого игрока к2(0, и т.д. 5. Итерации продолжаются до тех пор, пока на некотором шаге к программы uk{t) и (/) не перестанут изменяться. 6. Полученные программы uk(t) и gk(t) принимаются в качестве оптимальных решений игроков в рассматриваемой дифференциальной игре. Для решения задачи (3.8) при фиксированной программе управления одного из игроков использовались необходимые условия принципа максимума Понтрягина [59], а возникающая при этом краевая задача решалась с использованием метода последовательных приближений Крылова - Черноусько [86].
Расчет областей достижимости БПЛА с учетом возмущений
Рассмотрим задачу о наведении беспилотного летательного аппарата (БПЛА) преследователя (П) на маневрирующую цель (Ц) при действии возмущений, которые могут носить как случайный, так и детерминированный характер. Наведение происходит в вертикальной плоскости. Для наведения П используется метод пропорциональной навигации, а для компенсации возмущений, вызывающих колебание П относительно поперечной оси, предлагается использовать дифференциально-игровой алгоритм, разработанный в главе 3 диссертации.
Здесь: в — угол наклона вектора скорости; coz — угловая скорость вращения вокруг поперечной оси; Q — угол тангажа; дв — угол отклонения рулей высоты; а — угол атаки; N — нормальная перегрузка ; т — масса ; V—скорость; х, у—координаты П в вертикальной плоскости; s — площадь миделя; q—скоростной напор; сх0,А,Су ,сув - безразмерный коэффициенты и безразмерные производные коэффициентов аэродинамических сил; mf, m5zB , mfz —безразмерные производные коэффициентов аэродинамического момента; ті- безразмерный коэффициент возмущающего момента; и —управляющий сигнал; , — возмущение; Трп —- постоянная времени рулевого привода; крп — коэффициент усиления рулевого привода; J: — момент инерции; / — характерный размер; є — сигнал, подаваемый на вход рулевого привода; ку, кпу, ка :— коэффициенты контура стабилизации нормальной перегрузки.
Движение Ц в процессе наведения происходит по программе, заданной в виде функции времени a4(t), которая удовлетворяет ограничению (4.6).
Сигнал управления u(t), поступающий на вход контура стабилизации нормальной перегрузки П, формируется в дискретные моменты времени tQ, t\ = tQ + А/, t2 =t] + At, и так далее и остается постоянным в течение времени At, где At - шаг выбора управления.
Для формирования сигнала управления u(t) с использованием дифференциально-игрового алгоритма компенсации возмущений, рассмотренного в разделе 3, при наведении по методу пропорциональной навигации используется следующий АЛГОРИТМ. 1. С выхода головки самонаведения снимается сигнал, пропорциональный угловой скорости линии визирования цели иг=кг{%, (4.7) at где кг - коэффициент усиления головки, — - угловая скорость линии (it визирования цели. 2. В блоке формирования требуемой нормальной перегрузки определяется Uo V Л V \dt j g Ну_тРеб=- Г +созв=-(- иг) + со5Є. (4.8) треб S КГ 103 где кпи - коэффициент пропорциональности в методе пропорциональной навигации. 3. Проверяется выполнение ограничения Ny_mpe6(J)\ Ny_don (4.9) и при необходимости Ny тре5 корректируется. 4. Требуемое значение нормальной перегрузки Ny mpeQ подается в блок формирования сигнала управления u{t). 5. В блоке формирования сигнала управления с использованием дифференциально-игрового алгоритма компенсации возмущений, рассмотренного в разделе 3, вычисляется сигнал u(t) и подается на вход контура стабилизации нормальной перегрузки.
В данном алгоритме предполагается, что время вычисления управления u(t) не превышает время дискретности вычисления управления П. Процесс наведения моделируется следующим образом. 1. В начальный момент времени t0 с использованием рассмотренного алгоритма выбирается управление П u(tQ), которое остается постоянным в течение времени At. С этим управлением П совершает движение и переходит в новую позицию, соответствующую моменту времени t\ = Оо + АО При этом на П действует возмущение (/), где t0 t t\. 2. Маневрирующая цель на интервале времени от /0 до /]=(/0+Д0 совершает движение по заданной программе, которая не известна П. 3. В новой позиции, соответствующей моменту времени t] , вновь выбирается управление П w( ) и так далее до минимального расстояния между П и Ц.
Результаты моделирования наведения П на маневрирующую цель по методу пропорциональной навигации с учетом переходных процессов в контуре стабилизации нормальной перегрузки при компенсации возмущений на основе разработанного дифференциально-игрового алгоритма управления представлены в разделе 4.3 диссертации. Все результаты получены с использованием программного комплекса, созданного на основе разработанных дифференциально-игровых алгоритмов синтеза управления, компенсирующих действие возмущений.
Программный комплекс Stabilizacia предназначен для исследования работоспособности дифференциально-игровых алгоритмов синтеза управления в контуре стабилизации перегрузки БПЛА с учетом действия возмущений, статистические свойства которых неизвестны.
В программном комплексе реализованы процедуры синтеза управления, как для линейной, так и для нелинейной системы стабилизации перегрузки БПЛА.
С помощью программного комплекса исследуется также точность наведения БПЛА на маневрирующую цель по методу пропорциональной навигации с учетом динамики системы стабилизации перегрузки БПЛА с дифференциально-игровыми алгоритмами управления при действии возмущений с неизвестными статистическими свойствами.
Программный комплекс Stabilizacia позволяет пользователю проводить исследования для различных БПЛА (путем ввода тактико-технических характеристик БПЛА), варьировать начальные условия, выбирать вид внешнего возмущающего воздействия, а также задавать различные программы движения Ц.