Электронная библиотека диссертаций и авторефератов России
dslib.net
Библиотека диссертаций
Навигация
Каталог диссертаций России
Англоязычные диссертации
Диссертации бесплатно
Предстоящие защиты
Рецензии на автореферат
Отчисления авторам
Мой кабинет
Заказы: забрать, оплатить
Мой личный счет
Мой профиль
Мой авторский профиль
Подписки на рассылки



расширенный поиск

Синтез оптимального по быстродействию управления в задаче перелета Моисеев Игорь Анатольевич

Синтез оптимального по быстродействию управления в задаче перелета
<
Синтез оптимального по быстродействию управления в задаче перелета Синтез оптимального по быстродействию управления в задаче перелета Синтез оптимального по быстродействию управления в задаче перелета Синтез оптимального по быстродействию управления в задаче перелета Синтез оптимального по быстродействию управления в задаче перелета Синтез оптимального по быстродействию управления в задаче перелета Синтез оптимального по быстродействию управления в задаче перелета Синтез оптимального по быстродействию управления в задаче перелета Синтез оптимального по быстродействию управления в задаче перелета Синтез оптимального по быстродействию управления в задаче перелета Синтез оптимального по быстродействию управления в задаче перелета Синтез оптимального по быстродействию управления в задаче перелета
>

Данный автореферат диссертации должен поступить в библиотеки в ближайшее время
Уведомить о поступлении

Диссертация - 480 руб., доставка 10 минут, круглосуточно, без выходных и праздников

Автореферат - 240 руб., доставка 1-3 часа, с 10-19 (Московское время), кроме воскресенья

Моисеев Игорь Анатольевич. Синтез оптимального по быстродействию управления в задаче перелета : диссертация ... кандидата физико-математических наук : 01.01.09.- Санкт-Петербург, 2003.- 177 с.: ил. РГБ ОД, 61 03-1/961-8

Содержание к диссертации

Введение

Глава I. Структура и свойства точек переключения оптимального управления 12 стр.

1. Постановка задачи. Вывод основных соотношений 12 стр.

2. Свойства точек переключения оптимального управления 16 стр.

3. Исследование условий существования и оптимальности особого управления 24 стр.

4. Число точек'переключения оптимального управления .30 стр.

Глава 2. Синтез оптимального управления 38 стр.

1. Некоторые свойства синтезирующего управления 38 стр.

2. Определение области движения с оптимальным особым управлением 45 стр.

3. Определение движения с одним переключением управления, не содержащего особых участков 53 стр.

4. Определение областей движения с управлением (1,0), (-1,0).

Случай существования альтернативного варианта с равным начальным управлением 61 стр.

5. Определение областей движения с управлением .64 стр.

6. Исследование на оптимальность движения с управлением 78 стр.

7. Синтез оптимальной траектории движения с управлением (0,1)и (0,-1) 88 стр.

8. Синтез оптимальной траектории с двумя точками переключения управления 101 стр.

Глава 3. Частные случаи синтеза оптимального управления Алгоритм синтеза оптимального управления 107 стр.

1. Синтез при одном переключении управления, без наличия особых участков 107 стр.

2. Определение условий существования движений с набором управлений (и,0) и (u,-.u) 112 стр.

3. Синтез траектории с управлением (и?0) и (-u,u) 116 стр.

4. Синтез траектории с управлением (0,и) и (u,-u) 128 стр.

5. Синтез оптимальной траектории при двух переключениях управления 134 стр.

6. Алгоритм синтеза оптимального управления 140 стр.

Приложение

Введение к работе

Различные процессы, протекающие в технике, экономике, производственной деятельности и т.п., обычно являются управляемыми, т.е. возможно их' осуществление различными способами в зависимости от вмешательства человека. Поэтому проблема управления в целом процессами или объектами имеет большое значение. Степень сложности управляемых объектов явилась причиной постановки новых задач и привела к существенному изменению подхода к данным задачам, а также методов их решения [7,8,10,21,22,30 — 32,44,46,58 — 60]. В результате появилась соответствующая математическая теория, которая, в целом, была создана в середине 50-х годов и получила название "теории оптимальных процессов". Выдающуюся роль в этом сыграл "принцип максимума", высказанный Л. С. Понтрягиным в качестве гипотезы и подробно исследованный В. Г. Болтянским, Р. В. Гамкрелидзе и Е. Ф. Мищенко [7,8,21,22,58 — 60]. Внимание к принципу максимума со стороны специалистов разных областей науки привело к появлению различных интересных доказательств данного факта. Так, независимое доказательство принципа максимума методом приращений было дано Л і И. Розоноэром [63]. Дальнейшими исследованиями Р. Габасова, Ф.\ М. Кирилловой и их учеников [16,17], а также других авторов [26,/27,46] метод приращений оформился в универсальный метод исследования разнообразных и актуальных задач оптимального управления, в котором заложена возможность получения как необходимых, так и достаточных условий оптимальности. Следует также отметить, что в некоторых работах [40,45,66 — 69] оптималь-

ные процессы были исследованы методами классического вариационного исчисления. В начале 60-х годов А. Я. Дубовицким и А.

А. Милютиным [27] был разработан метод исследования экстре-

I мальных задач, который позволил осуществить вложение теории

управления в общую теорию экстремальных задач.

На практике часто функционалом качества является время, т.е. приходится решать так называемую задачу быстродействия. Данная задача в силу своей актуальности исследовалась достаточно широко [2,3,5,6j9-ll,13,23,28,34-37,55,56,57,61,65,66,71,72].В случае линейных систем обыкновенных дифференциальных уравнений принцип максимума является не только необходимым, но и достаточным условием оптимальности [60], следовательно найденное с его помощью управление будет оптимальным. Если же система нелинейная, то приведение ее к линейной, т.е. линеаризация часто дает хорошие результаты, но все-таки далеко не всегда. Поэтому

приходится проводить дополнительные исследования, опирающееся на вид и свойства конкретной нелинейной системы, которые позволяют найти не только число точек переключения управления, но и сами точки [5,6,9,11,34 — 37,55,61,66,71]. Кроме того, даже в достаточно простых случаях при рассмотрении линейных систем, могут возникнуть нештатные ситуации. Например, в [60] рассматривается задача быстродействия для системы:

хг2, х2 — u(t).

Требуется перевести объект из заданной начальной точки в начало координат. Управляющая функция u{t) удовлетворяет условию

(гг(^) j < 1. Принцип максимума дает следующее оптимальное решение:

Ґ1, tf3(0>0> w 1-1, Фз(і) < 0.

Так как скорость X2(t) не может быть величиной неограниченной, то логично потребовать, чтобы выполнялось условие |а?2()| < V, а тогда данное управление не будет оптимальным. В то же время условие u(t) — 0, если x2(t) = ±V, дополняющее ранее найденное, даст нам оптимальную траекторию.

Вообще говоря, из-за локальности условий, доставляемых принципом максимума, легко представить ситуацию, когда на основе столь ограниченной информации нельзя дать ответ на вопрос об оптимальности найденного управления. Может случиться так, что максимум достигается в нескольких точках, или же гамильтониан не зависит от управления. Такие случаи называют особыми, а управление, вдоль которых они реализуются, получили название особых управлений. Впервые понятие особого управления было введено Л. И. Розоноэром [63]. Он же показал, как вычисляются особые управления, исходя из определения. В простых случаях можно довольно легко указать вид особого управления, однако, с повышением порядка и усложнением системы задача становится слишком трудоемкой. Реальная возможность ее решения была получена А. М. Летовым [43] в результате использования аппарата скобок Пуассона. Оптимальность данных управлений первоначально не рассматривалась, и только в 1964 г. Г. Келли [33] впервые исследовал данный вопрос. В дальнейшем идея Г. Келли была развита Р. Коппом и F. Мойером [38] и другими авторами.

Оптимальное управление, как правило, состоит из кусков особых и неособых управлений. В связи с этим возникает задача оптимального сопряжения различных участков управления. Этот вопрос исследовался Г. Келли, Р. Коппом и Г. Мойером [38,70], но, наиболее полно проблема оптимальности для особых управлений была развита В. Ф. Кротовым [40]. В. И. Гурман [24 — 26] в рамках метода В. Ф. Кротова исследовал особые управления в различных модельных задачах прикладного характера. Кроме того, другие результаты по достаточным условиям оптимальности особых управлений были получены в работах Р. Габасова и Ф. М. Кирилловой

I [14 — 16,18 — 20], В. А. Срочко [64]. Проведенные исследования задач динамики полета показали, что особые управления являются достаточно широко распространенным явлением. Подтверждением данного факта и важности особых управлений служит их связь с так называемыми скользящими режимами. Кроме того, каждой задаче со скользящим режимом можно поставить в соответствие задачу, в которой может отсутствовать скользящий режим, но зато обязательно появится особое управление. Поэтому, в данной диссертации в процессе поиска оптимального в смысле быстродействия синтезирующего управления для нелинейной системы третьего порядка специального вида, исследуется возможность существования допустимого особого управления и проводится исследование его на оптимальность. Следует отметить, что подобная задача рассматривалась неоднократно. В 60-х годах как задачу наведения ее рассматривал Ю. 3. Алешков [4], как задачу преследования - Г. С. Розенберг [61]. Из других авторов необходимо отметить Э. М. Бо-

лычевцева [9], И. ,Ф. Верещагина и Н. А. Репьяха [11]. В 70-х годах задачу рассматривали Ю. И. Бердышев [5], А. Брайсон и Хо Ю Ши [10], Н. Хамза, И. Колас, В. Рунгальдер [65], Т. Пексваради [71], в 80-х годах - Г. Н. Яковенко [66]. Задача рассматривалась при нулевых значениях помех и была решена Ю. И. Бердышевым при призвольном конечном курсовом угле и Г. Н. Яковенко с заданными свойствами угла в конечной точке. Т. Пексваради было найдено программное управление и, соответствующие ему, оптимальные траектории. Игровая постановка встречалась в работах [1,29,62]. Постановка аналогичной задачи с менее жесткими конечными условиями встречается у Н. X. Розова [62], но решения ее не приводится. Таким образом, ни у одного из перечисленных авторов не дается полного решения задачи, т.е. способа нахождения оптимальных синтезирующих траекторий при произвольных начальных данных. Полностью задача в постановке, приведенной в данной работе, не рассматривалась. Не проводился и синтез оптимальных траекторий.

В первой главе диссертации исследуются свойства точек переключения управления для искомой системы, определяется вид оптимального управления и доказывается теорема о числе точек переключения данной системы.

Первый параграф посвящен постановке задачи и нахождению допустимого управления, удовлетворяющего необходимым условиям

I оптимальности.

Во втором параграфе исследуются точки переключения управления и доказывается теорема о свойствах данных точек.

Целью третьего параграфа является исследование возможности существования особых участков траектории движения, поиск особого управления и исследование его на оптимальность.

И, наконец, в четвертом параграфе данной главы доказывается теорема о числе точек переключения оптимального управления и определяются все возможные наборы управлений, претендующих на оптимальность.

Вторая глава1 посвящена вопросам построения оптимального по быстродействию синтезирующего управления, сопряжения особых и не особых участков траектории движения. Находятся области начальных данных для конкретных вариантов. Так как особый интерес и сложность представляет случай с одной точкой переключения, то рассматриваются возможные альтернативные варианты, которые могут иметь место.

В третьей главе рассматриваются частные случаи движения. В соответствии! со схемой, изложенной во второй главе, проводится исследование на оптимальность различных вариантов движения. Своеобразным заключением работы является последний параграф главы, в котором приводится алгоритм нахождения оптимальной траектории.

Основные результаты диссертации состоят в том, что:

  1. Получена структура оптимального управления и свойства точек переключения.

  2. Найдено максимальное число точек переключения оптимального управления и возможные оптимальные траектории движения. В случае одновременного существования движений, удовлетворя-

ющих необходимым условиям оптимальности, предлагаемая методика исследования позволяет свести проверку количества данных движений к минимуму.

3. Разработан алгоритм построения синтезирующего оптимального
управления.

4. Реализована [диалоговая программа решения данной задачи на
основе предложенного алгоритма.

Отметим, что данная работа представляет практический интерес. Можно считать, что исследуемая система описывает движение центра масс летательного аппарата, поэтому в последние годы регулярно появляются публикации, в которых рассматриваются похожие системы более высоких порядков [6, 13, 28, 39, 41, 42]. Полученные результаты могут быть использованы при исследовании более сложных систем или при проектировании систем автоматического управления.

Основные результаты диссертации опубликованы в [12,47 — 54]. По материалам диссертации сделаны доклады на Всесоюзной конференции по управлению в механических системах (Казань 1985), на I, II и Пі! Всесоюзных школах "Оптимальное управление. Геометрия и анализ" (Кемерово, 1986, 1988, 1990), XI Всесоюзной конференции "Проблемы теоретической кибернетики" (Волгоград, 1990), Международной конференции "DYNAMICAL SYSTEMS: STABILITY, CONTROL, OPTIMIZATION" (Минск, 1998), XXXI Научной конференции "Процессы управления и устойчивость" факультета ПМ-ПУ СПбГУ (С-Петербург, 2000), XXXII Научной конференции "Процессы управления и устойчивость" факультета ПМ-ПУ

СПбГУ (С-Петербург, 2001) и на семинарах кафедры математической теории моделирования систем управления факультета прикладной математики - процессов управления Санкт-Петербургского государственного университета.

Г л а в a I. Структура и свойства точек переключения

оптимального управления

1. Постановка задачи. Вывод основных соотношений

Пусть движение некоторого объекта описывается системой уравнений третьего порядка

х = V sin + Wx,

y = Vcosy, (1.1.1)

ф — uju(t),

где x(t),y(t) - геометрические координаты объекта, - курсовой угол, отсчитываемый по часовой стрелке от положительного направления оси OY до вектора V(VX, Vy), u(t) - скалярное управление, выбираемое из класса кусочно - непрерывных функций и удовлетворяющее ограничению \u(t)\ < 1. Скорость объекта V является положительной ограниченной константой, угловая скорость cj << V -также положительная постоянная величина. Относительно "помехи" Wx>Wy предположим, что эти величины постоянные, неравны нулю одновременно и связаны с линейной скоростью V управляемого объекта неравенством V > kiW%?,Wmmax{|Wx|, |Wy|}, A;i < 1,&2 > 1. Требуется из заданной начальной точки (жо,2/о,<^о) перевести объект в область (0,0 ,<рт), cos <рт = 1 за минимальное время (под Т мы подразумеваем, конечный момент времени). Пусть

x = f(x(t),u(t)),

^0 = (^(0^(0,--,^(0),

функции /г определены для любых значений векторной переменной x(t) Є X и для ^значений u(t), принадлежащих области управления U, непрерывны по совокупности переменных х1 ,...,хпи непрерывно дифференцируемы по х1,..., хп. Для нахождения управления, удовлетворяющего необходимому условию оптимальности, т.е. принципу максимума, воспользуемся следующей теоремой [60]. Теорема. \Пусть u(t),t Є [іо^і] - допустимое управление, переводящее фазовую точку из положения xq в положение Xi,x(t)-соответствующая траектория, так что ж(0) = xo,x(ti) хі-Для оптимальности (в смысле быстродействия) управления и(і) и траектории x(t) необходимо существование такой ненулевой непрерывной вектор - функции ір(і) = (ф1(і), ...,фп(і)), удовлетворяющей условиям

#,- дН

,1 = 1,2...п, (1.1.2)

dt дх>

что:

1. Для всех t,t Є [(ь*і]> функция

н(ф(і),х(і),и) = ^2тіґш^) (1.1.3)

переменного и U достигает в точке и = u(t) максимума:

Н(ф(і),х(і),и(і)) = М(<ф(і), x(t)), (1.1.4)

2. В конечный момент времени t\ выполнено неравенство

MMt^xfafi^O. (1.1.5)

Оказывается, что если величины ?/>(), ж (),іі(і) удовлетворяют соотношениям

(1.1.6)

(IXі дН

I — JL , 4.7Z.

d д-фі

и (1.1.2), а также (1.1.3), то функция M(i[>(t),x(t)) переменного t постоянна, так что проверку (1.1.5) можно проводить в любой момент времени t, t Є [іо, і]5 а не только в момент t — t\. Из (1.1.3) следует, что гамильтониан системы (1.1.1) имеет вид:

Н{х,у,ір\-ф,и) = фг (V sin <р + WX) + $2{V cos ц> - Wy)+

+il>zwu(t), (1.1.7)

а, согласно (1.1.2), сопряжённая (1.1.1) система имеет вид:

^1=0,

^2=0,

^3 = — (Фі У COS <р — ^2^ Sin 9?),

откуда получаем

V»i = Ci,^2 = C2, (1.1.8)

ф3 = - J фгУ coscpdt + / VbVsinyxft = -Сі / (у + Wy)dt+

+C2\j{x - Wx)dt = C2(x - Wxt) - Сг+ Wvi) + C3. Из приведённой выше теоремы следует, что

«(*) =

1, ^з(0 > о, -1, ^з(0<о.

(1.1.9)

Пусть фз (t) обращается в нуль на конечном множестве точек - точек переключения управления u(i). Если ti - первая подобная точка, тогда фз(іі) = О и

Сз = Сг(У1 + Wyh) - С2(х! - Wvh),

х1 = x(t1),y1 =y(ti),

откуда

ф3(і) = С2(х -Xl- Wx(t - U)) - Сг{у -У1+ Wy(t - h)).

Подставляя данные соотношения в (1.1.7), получаем

Н(х,у,(рЖи,Ь) = Схsinv? + WX) + C2(Vcosip - Wy)+

+u(t)u[C2{x L Xl - Wx(t - ^)) - d(y -yi + Wy{t - b))]. (1.1.10)

В силу линейности и однородности гамильтониана Н по Сі и ( мы можем выбрать их таким образом, что С\ + С\ — 1. Кроме того, на интервалах постоянства управления [г, t] имеем

uu(r) '

(p(t) = (р(т) + u(r)u)(t - т),

V cos cos

ши{т)

x(t) = x(r) + Wx{t- т) +

(1.1.11)

A / \ m/ \ V sin (р(т) V sin (pit)
V{t) = У{г) - Wy(t - r) ^-+ ^W

ши(т) uju{t)

Так как необходимо вывести объект на многообразие (0,0, <рт), то в общем случае требуется попасть на некоторую кривую, определяемую соотношениями (1.1.11), движение по которой с управлением +1 или —1 обеспечит решение поставленной задачи.

j2. Свойства точек переключения оптимального управления

Пусть начальная точка (жо,2/о>^о) не лежит на какой-либо из кривых (1.1.11), ,т.е. для решения задачи требуется переключение управления. Пусть таких точек п > 2. Функция трз(і) обращается в нуль лишь на этом множестве точек. Гамильтониан системы (1.1.1) как функция времени постоянен на оптимальной траектории и, кроме того, неотрицателен, т.е. выполняется

H(t) = const, H(t) > 0.

Рассмотрим первый момент переключения управления t\. Функция ^3(^1) = 0, следовательно, выполняется равенство

н(ц) = еду sinpi + wx) + c2(Fcos^i - ид,

где постоянные Сі и С2, вообще говоря, находятся из начальных условий и

Ci(Vsin^i + Ид + С2(Усо8у>і - Wy) > 0,

Vfdsin^i +C2cosy>i) > C2Wy - CWs, (1.2.1)

но постоянные Сі и С2 удовлетворяют условию С\ + С2 = 1, следовательно, чтобы выполнялось приведённое выше неравенство, мы

можем положить С\ = sin^ii) и С2 = cos^>(ii) и (p(ti) = arctg ^-В ситуации, когда Ci = 0, должно выполняться неравенство

C2V cos if! >C2Wy,

что обеспечивается при 6 cos<>i. Так как С\ = 1, то cpi = -кк, где к - целое. Если же ( = 0, то должно выполняться

CiVsmtpiZ-dW*,

что справедливо при Ci = sin^i, но С\ — 1, а это означает, что = f (2 + 1), ,где к - целое. Отметим, что данные рассуждения справедливы для любого момента переключения управления. Точки переключения управления обладают свойством, доказанным в следующей теореме. Теоремаї. Пусть функция фз(і) обращается в нуль лишь

на конечном множестве точек ti,i = 1,п,п > 2,^ - точки переключения управления в задаче (1.1.1). Тогда справедливы соотношения:

sm cpi = ... = sm (рп,

cosn, (1.2.2)

т.е. (fi = <Рі-{ + 2nk, k - любое целое, (pi = Доказательство:

Из условия постоянства гамильтониана по времени на оптимальной траектории имеем

#(*!) = ... = #&) = ... = #(*„),

но ips(ti) =І0, а тогда, учитывая (1.1.10), получим:

Сг{У Sill (Р! + Wx) + C^FcOS^ -Wy) = ...

і = diVtnmpn + Wx) + C2{Vcosn - Wy). (1.2.3)

Из (1.2.3) следует' что

Ci sin С2 cos ... = C\ sin cpn 4- C2 COS ifT

Рассмотрим равенства

Ci sin if 1 + C2 cos (p1 = C\ sin (fi-i + C2 cos (pi-i,

Ci sin 9?i +1C2 cos y?i = Ci sin tpi + C2 cos cpi,i = 2, n. (1.2.4)

После их преобразования, получим

Ci(sm- sin(pi_i) = C2(cosy?i_i - cos

Ci(sin^i — Siny?j) = C2(cOS(fi — COSy?i),

откуда

Уг-1 j\- . >г-1 -^1 „ . (Pi-l + .

61 cos r sm = C2 sin sin -

61 cos sm = G2 sm sm

Отсюда имеем

sm —— (Ci cos C2 sm ) = 0,

. I 4>i - Pi lrt
sin (Gi cos

2 " * ~~" 2
C2 sin ) = 0.

Окончательно

J Pi-i + Pi - 2arctg(Ci/C2)
sin sm — = 0,

2 "" 2

0.

. Pi -. : + 2 arctg(Ci/C2)

Если

. <Рі-і -n
sm = 0,

= 0,

тгк{,

откуда

+ 2тгк'.

где к' - любое целое число, т.е.

smipi = ... = smni

cosy?! = ... = cos(pn.

Если же

. <Рі-і -n
sin = 0,

. arctg(Ci/C2) n
sm —— = 0,

жкі-.и ipi = 2тгк' - <р! + 2arctg(Ci/C2)

ipi = 2nk" - &_! + 2arctg(Ci/C2).

Мы можем взять arctg(Ci/C2), а тогда и (pi = 2тгк' + откуда следует (1.2.2).

В ситуации, когда имеет место

sin = О,

Vi-i + arctg(Ci/C2)
sm —: = О,

получим

= fi + 2тткіу

У>*-1 = 2тг/г' - + 2arctg(C1/C2).

Отсюда

^ = 2тгк" - ipi-x + 2arctg(d/C2),

а так как можно положить (pi — arctg(Ci/C2), то снова имеет место

(1.2.2).

И, наконец, рассмотрим последний случай, когда

. Ч>\ - 2arctg(Ci/C2)

sm —- = О,

. (pi + arctg(Ci/C2)
sm — = и.

Из данных равенств следует, что

рх + 2arctg(C1/C2),

(Pi = 2тгк" - <р! + 2arctg(Oi/C2), Pi = у>і-і + 2тгк.

Полагая рл = arctg(Ci/C2), вновь убеждаемся в справедливости равенств ((1.2.2).

Выше мы рассматривали все соотношения исходя из предположения, что Сі ф 0 и ( ф 0. Пусть Ci = 0. В данном частном случае принципу максимума удовлетворяет <р\ = тек, но тогда выполняется условие

COS ... = cos <рп,

откуда следует, что ц>{ = где к{ - целое и

sin ср1 = ... = sin ipn.

При С2 = 0 принципу максимума удовлетворяет ipi = ^ (2к + 1), но так как выполняется

sin^i = ... = sin^n,

то вновь имеем соотношения ері — (pi + 27г/гг-, ki - целое, откуда

COSy?! = . . . = COS^n,

что и требовалось доказать.

Следствие!.. Координаты точек переключения управления

u(t) находятся по формулам:

і = X! + WX(U -*i),

Уі = j/i -Wy(U -h),i = 2,

п.

Доказательство:

Точки переключения управления, начиная со второй, в силу теоремы 1 и (1.1.11) удовлетворяют следующим соотношениям:

х2 = хг + Wx(t2 -i),

2/2 = 3/1- Wy{t2 - h), хз = x2 + Wx(t3 -t2), Уз=У2- Wy{t3 -12),

Жі_і = Жі_2 + Wx(ti-! - U-2),

2/i-l = Уі-2 - Wy(it_i - ti_2),

і = жг-_і + WX(U — **—1),

2/i = 2/i-i - Wy(U - ti_i).

Сложим почленно данные равенства

^2 + ^3 + --- + Жі-l + Xi = Хг 4- Wasfe - *l) + X2 + ^(3 - t2) +

... 4- + Wa(ii_i - ;_2) + a?i-i + И^.(і - і,-_і), 2/2 + 2/3 + ...,4- Уі-і + у,- = Уі - Wy(t2 - 1) + 2/2 - Wy(*3 - ^2) + ' ... + уі-2 - Wyfc-г - U-2) + 2/i-i - ^y(ii - i_i).

Отсюда получаем

ж» = xi + И^.(*2 - *i + 3 - І2) + - - - + U-i - U-2 + U - ti-x),

Уі = Уі г Wy(t2 -^1+^3-^2) + .-- + ti-i - U-2 + U- ij_i).

Окончательно

хі = Xi 4- W^fi; - ti),

2/t = 2/1 -^y(t,- -h),i = 2,n.

Следствие 1 доказано.

Замечани el. Данное следствие рассматривалось в предположении, что Wx ф О и Wy ф 0. Если Wx = 0, тогда координаты точек переключения вычисляются по формулам:

Xі Х\ 5

Уг = Уг - Wy(ti - іі),г = 2,п. В случае, когда Wy0, выполняются равенства:

хі = xi + WX(U -h),

Уі = 2/1, г = 2, п.

Следствие 2. Е'слм ii - первый, a tn - последний моменты переключения! управления, то все точки переключения лежат на прямой

Хп - Я5і 2/п - Ї/1

W„

Доказательство:

Для точек переключения управления справедливы равенства:

ж2 -зі 2/2 - 2/1

-Wv '

ЖЗ - »2 2/3 - У2

~Wy '

Жп-і - Жп_2 _ 2/w-l - Уп-2

wx ~ -wy '

En хп — 1 Уп Уп — 1

W*

-w„

Сложив почленно эти соотношения, получим

"'ТІ *^1

Уп ~У\

-ж,

что и требовалось доказать.

Замечание 2. Доказанное следствие справедливо, если Wx ф 0 и Wy ф 0. В случае, когда Wx = 0, для первой и последней точек переключения выполняются условия:

Хп Х\ ,

Уп-у\- wy(tn - h).

Если же Wy = 0, тогда:

хп = хг + Wx(tn -ii),

2/1-

3. Исследование условий существования и оптимальности особого управления

До сих пор мы рассматривали ситуацию, когда фз(к) обращалась в нуль лишь на конечном множестве точек-точек переключения управления. Теперь рассмотрим возможность существования особого управления для системы (1.1.1). Согласно [18] допустимое управление lu(t), t Є [^oj^iL называется особой экстремалью(особым управлением), если вдоль него выполняются соотношения

0,

dH(x(t),1>(t),u(t)>t)

,d2H{x(t)^(t\u{t),t)
U дії* M-'

(1.3.1)

здесь смысл параметров x(t),ip(t),u(t) тот же, что и в 1 данной главы.

Перепишем систему (1.1.1) в векторном виде

z = fo{z) + u(t)f1(z)1

г* = (х,у,<р),

fjS{z) = (Vsm

x,Vco8(p-Wy,0),

#(2) = (0,0,0/).

Гамильтониан! (1.1.7) представим в виде:

Н(г(і))ф(і), u(t)) = H0(z(t), ф(і)) + u(t)HMt), №), где

H0(z(t)^{t))\=(il;*(t)Jo(z)) = C^V sin

x) + C2(V cosy), Н^{і)^(і)) = (ф*{і), /1(2)) = u(C2(x - Wxt) - Сг(у + Wyt) + Сз).

Здесь, как обычно, (-0*(),/o(z)) и (ift*(t),fi(z)) - скалярные произведения соответствующих векторов. Введём следующие обозначения:

Н = H(z\t)^(t),u{t)),HQ = Н^{і)^{і)),Нг = Hx(z(t)^{t)).

На управление u{t) ограничений накладывать не будем, тогда при сделанных предположениях кусочно-непрерывное управление u(t), t Є [о>і] является особым тогда и только тогда, когда

#іОф)^(*)) = 0,іЄ[і0,іі].

Данное условие эквивалентно первому из (1.3.1), выполнение других условий (1.3.1) следует из линейности исходной системы по управлению. Заметим, что в данном случае особое управление имеет место, если ф$(і) е 0 на интервале времени [ті,Т2]. Найти это управление можно, используя скобки Пуассона [18]. Напомним, что скобкой Пуассона скалярных функций V(x,(p),W(x,(p), где х и р -векторы размерности п называется выражение

SV W\ - ^—— - dV*dW дх dtp dp дх

Здесь знак * означает операцию транспонирования. В дальнейшем нам понадобятся следующие свойства скобок Пуассона [16] :

{V,W} = ~{W,V},

(1.3.2)

{V,V} = 0, {V, W1 + W2] = {V, Wx} + {V, W2}. На интервале времени [ті,т2] выполняется условие

= Н1(г(і),ф(і)) = 01

d_ di

поэтому

^w*),^(0) = o

и, используя свойства (1.3.2) скобок Пуассона, а также (1.1.1) и (1.1.8), получим формулу для вычисления управления u(t). Последующие выкладки будем проводить согласно алгоритму, изложенному в [18] :

d тт / /,ч ,, s\ дНл dz дЩ dib ШН*'>*М =-6ЇЛ +-8ф1 =

{#!,#}

рщ дн дщ он

dz дф дф dz {ЯьВД+ЦіНІЯьЯі} = -{Яо,Яі}+^){Я1>Я1} = -{Яо,^}.

Вычислим теперь вторую производную Н\ по t :

- -%{Яо'Яі> ^ - ^{Яо'Яі} вг) -

= -{{нт,н} = -{{Яо,Я!},я0} - «(^{{Яо^!}^!} -

= {ЯоЛ^о,Я1}} + и(і){Я1,{Яо,Я1}} = 0. Отсюда получаем, что

».(+\ {НоЛНОіНі}} о ox

u{t) = 4^,(.}} (L3-3)-

Таким образом, формула для вычисления особого управления получена. В принципе знаменатель в выражении (1.3.3) отличен от нуля, если же это не так, то необходимо найти ^з-Яі и т.д. Для упрощения дальнейших выкладок введём следующее обозначение:

Я2 = {Я0,Я!}.

Далее найдём значение числителя и знаменателя (1.3.3).

I По определению

ЭЩ дНг дЩ дНг

dz дф дф dz

Вычислим частные производные функций Но иЯі.

(0,0, dV cos - С2V sin <р),

дір дЩ

0 =(Vsm(p + Wx,Vcos

= uj(-y-Wyt,x-Wxt,l),

= 07(02,-^,0).

dz Отсюда получим выражение для вычисления Н2 :

Я2 = ш(0,0,СіУ cos^ - С2У sin^)(-2/ - Wyt,a; - W^.l)*-

-u(Vsm(fi + Wx,Vcosy,0)(C2,-Cu0y = оо^У cos 2V sin ip-C2V sin 2Wx+0^008 (p-dWy)^ \(2CyVcos(f - 2C2VsmXWV - C2WX). Далее найдём: частные производные Н2 по z и ф :

-т-2- = w(0,0, -2CiFsin^ - 2С2У cos^), аг

j—-?- = u(2Vcosу> - Wy>-2Vsmtp - Wx,0).

Теперь мы вплотную подошли к вычислению особого управления u(t) с помощью формулы (1.3.3). Числитель (1.3.3) равен

1ТТ ттх_дЩдн2 ащдн2 _ 01н2} - -q^-щ- - -щ—^- -

-u(Vsinx,Vcosy,0)(0,0, -2СгУ sinLp-2C2Vcos

-29-Знаменатель дроби (1.3.3)

fl 1 - дЩ дН2 дЩ дН2 =

((ь 2)~ dz дф дф dz

= u2(C2Acu0)(2Vcosy,-2Vsmx,0y-

2(-у - Wyt,x- VM, 1)(0,0, -2dVsm(p- 2C2Vcoscp)* =

= ^^2(2^1:08^-1^) + 01(2^8111^ + ^) + 2071^8111^+

+2C2Vcos2(4VC1sm2cos(p-C2Wy+C1Wx). (1.3.4)

Выше мы выбрали постоянные Oi и С2 из условия С2 + Of = 1.

Конкретизируем данное требование: положим Oi = sin^', а С2 =

= cos ср', где (р' j- курсовой угол на участке траектории, отвечающем

особому управлению. С учётом этого условия (1.3.4) преобразуется в следующее выражение:

иН2}\= u?(WC2 + 4F022 - C2Wy + dWx) = cv2(4V-

-G2Wy + C1Wx)>0.

Таким образом, мы получили, что в данном случае особое управление будет равно нулю. Теперь необходимо проверить, будет ли данное особое управление удовлетворять хотя бы необходимому условию оптимальности, сформулированному для особых управлений. В качестве такого критерия возьмём условие Келли [18] :

д <Р_дН

ди dt2 ди ~

Выше мы получили следующие соотношения:

дн

-зо

поскольку {Яо,{Ло,Яі}} = О? то

= {Яо,{Яо,Я1}} + и(*){Яь{Яо,Я1}} =

u(t){HuH2}.

dt2 Отсюда следует,!что

д d2 дН

{Я!,Я2}>0,

ди dt2 ди

т.е. условие Келли выполняется. Особое управление u(t) — 0 принадлежит области допустимых управлений для задачи (1.1.1), и, с учётом изложенного выше, мы получим следующее условие вычисления для управления u{t) :

Г і, МО > о,

u(t) = sgn^W - < 0, ф3(і) = О, (1.3.5)

[ -1, ф3(і) < 0.

Заметим, чтоівсе сказанное выше справедливо, если какая-либо из

постоянных Wx, Wy, Сі, С2 равна нулю.

4. Число точек переключения оптимального управления

Заметим, что при постановке исходной задачи никаких ограничений на изменение угла (pit) не накладывалось. На самом же деле

изменение курсового угла является величиной ограниченной, что

I следует из Леммы 1.

Л е м м а 1. Пусть в задаче (1.1.1) фз{і) обращается в нуль

в конечном'числе точек переключения управления ti, г = 1,п. Тогда, если очередное переключение управления происходит через мо-

мент времени —{I 1), / = 2,п, т.е. — 1), то результат будет тот э/се, что и в случае 1 — 1 переключения через

интервал\—.

-31-Доказательство:

Wx
xi = xi -\ (I - 1) -2тг,

\yi ==yi у (/ _ і) . 2тг, I = 27n,

2тг
xi ^ (I - 1)WX = xh

y' = yi- [l - i)W - Vsin(pi + Vanfa + 2ir(l - 1)щ) =

= Уі (I - l)Wy = yi.

Полученный результат справедлив, если одна из "помех" Wx, или

Wy равна нулю. Лемма доказана.

Из леммы следует, что изменение угла (p(t) ограничено интервалом

[-2тг,2тг].

Теперь мы' вплотную подошли к вопросу о точках переключения управления для системы (1.1.1). Число точек переключения определяет

Т е о р е м|а 2. Оптимальное управление в задаче (1.1.1) имеет не более двух точек переключения. Доказательство:

Предположим, что выведение объекта в начало координат с заданным курсовым углом возможно как с управлением (1.1.9), так и с управлением (1.3.5). В первом случае точки переключения лежат

на прямой|

хп ~ xi _ Уп -Уі Wx ~ -Wy

являющейся общей касательной к окружности, содержащей начальную точку, и окружности, примыкающей к началу координат.

При движении с управлением вида (1.3.5) точки переключения управления (хі,уі),(х2,У2) лежат на касательной к начальной и конечной окружностям разворота. По лемме 1, сформулированной ранее, мы при движении с управлением вида (1.1.9) можем сделать управление ип = щ, где ип - управление на конечном участке. Общее время движения по начальной и конечной окружностям в первом случае равно

<рт = Ч>'\ + ыщ(Т' - t'n), <рг' = ср0+ wuoh',

T>_t>n + t>i = ??LZJ±, (1.4.1)

(здесь Т' - конечный момент времени, 'х и t'n - первый и последний

моменты переключения управления), во втором случае

T-t2 + t1 = (PT~(f\ (1.4.2)

(смысл параметров Т, Ц и tтот же, что и в первом случае). Отсюда ясно, что'для определения оптимального управления необходимо подсчитать и сравнить время движения между первой и последней точками переключения управления. Докажем, что длины касатель-

ных к окружностям, содержащим эти точки, равны. Координаты точек переключения найдём по формулам:

. ттг , Vcos^o Vcoscpi

шщ шщ

шщ шщ

. і ттг ,m, , s V cos x'n L-WX(T'- t'n) ^- +

UJUq UJUq

У'п = WV(T'- t'n) +

V sin cp[

UJUq

(i

Для второго варианта

x\ = xq + Wxt1 +

V cos (po VC2

ш + V sin y J_ ^1
2/1=2/0- ^1 -f

ОЖ()

W^o

UJUq UJUq

X2 = -Wx(T-t2)-^ +

UJUq

y2 = Wy(T-t2) +

(1

Докажем параллельность прямых, проходящих через точки

(Яі,Уі),(ж2,;3/2) И (ЖІ'2/ІМЖп>Уп) :

2/і -2/п

ж2 - Xi

Т (З/І ~ У«)(Ж2 - Жі) - (?/1 - У2)(х'п - х'г) =

с учетом значении координат точек переключения

V sin <о V sin ip[

= (лі - Wvii

+

^(T' - f„y

Vsiav,1)M-w4T-t2) vc*

UJUq

UJUq

- Xq - Wxh -

UJUq
V COS ifQ VC2

+

UJUq

UJUq

V sin (fQ VCi

-(2/0 - Wyh +

UJUq

UJUq

-Wy(T-t2)-V-^)x(-Wx(T-Q-VcS^

UJUq

UJUq

V I Ш +> V CS ^ V CS ^1 N

UJUq

UJUq

UJUq

UJUq

V\ V cos

UJVLq

x(

Vsm0 ,,,uY

2/o -:: Wy{T -tn + t^jx

UJUq

-x0-Wx(T-t2 + t1))-

UJUq

V\ V cos (fo

7(2/0 - , .„, y - Wy(T -t2 + h))x

x(

UJUq UJUq

Fsin^owrp, .,

= Wx(yQ -

UJUq
V V COS

- xQ - WX(T' - t'n + t[)) = )(T'-t,n + tl1-T + t2-t1)-

-XQ)(T'-t'n + t,1-T + t2-t1) =

UJUq UJUq

с учетом времени движения по начальным и конечным окружностям разворота'

Vsimpo V Vcos(pQ u

UJUq 7/ .1 , ./

= (WJ(y0 ——) - Wy( xQ))x

UJUq UJUq

х(Ґ -tn + t'1-T + t2-t1) = 0.

Теперь докажем параллельность прямых, проходящих через точки

(хі,Уі)ЛХ1>Уі) И (ж2,2/2),«,Уп) :

2/1 -2/1

Х\ — Х\

2/2 п

(2/1 - Уі)(хпі - х2) - (х[ - хх)(у2 - у'п)

V sin (р0 VGi
=
(2/0 - Wytx +

UJUq UJUq

, V sin sin (fi

)x

-г/о + Wyt\ +

UJUq

UJUq

шщ

, Vsin^i'

LOUq

= drWyh + —- + иуі -

LOUq

)x

x(-W.(T'-4)

Fcos9?i'

+ Wx(T-t2) + —)-

LOUq

-{Wy{T-t2)+V~^-Wy(T'-fn)-V-^-),

LOUq

LOUq

, (ш , У cos y?Q FC2 ,

CUWq

LOUq

далее поступаем так же, как и в доказательстве, приведенном выше

= (Wy(*i - *i) + —(Сі - 8Іп^і))№(Г - і2 - ТЧ

*») + -(^2 - COS ^)) - (И^'і - ii) + WUq

(C2 - cosy>i))(Wv(r - i2 - Г + )+ — (Ci - sin ^)) - — (T -t2-T' + 4 - *i 4- h)x

LOUq Г LOUq

x{Wx(d - sin^i) - Wy(C2 - cos<^)) = 0.

Отсюда следует, что длины касательных равны как стороны параллелограмма. Аналогичный результат получается, если Wx, или Wy равно нулю. Квадрат времени движения из точки (а?'1?2/і) в точку (x'nJy'n) определим по формуле

ДГ = (^-^=^/^,

где г - длина касательной. Во втором случае при движении из точки (ац,3/1) в точку (xj,y2)

Ai2 = (t2 Ah)2 = t2I({VCx + Wx)2 + (VC2 - Wyf) =

2/-i2

= Tz/{V"Ci ft Wi + 2VdWx + V2Ci + W" - 2VC2Wy) =

= r/(W2 J V2 - 2VW cos(arctg -^ + arctg —)).

C->

(1.4.5)

Отсюда

Таким образом, мы видим, что при Wx ф 0 и Wy ^ 0 время движения по траектории, определяемой управлением (1.3.5), меньше, следовательно, это управление оптимально. Допустим, что Wx = 0. Тогда из (1.415) следует, что

At" = r2/(W* + V- 2VC2Wy),

a At'2 = r2/Wi и

W„

,2

V2 2VC2 +1>,V

У

/2 _ „2 ПКГ2

At2 Wl W,

Если же Wiy = 0, то At' = r2/W2,

1)2»1.

1.2 Jl U\jt2 , т/2

Atz = Tlj{Wi + Vі + 2VC1WX),

а тогда

At2 ~ W?+ Wx + ~[WX l) > '

то есть и в этих случаях оптимально движение (1.3.5), и число точек переключения управления не более двух, что и требовалось доказать.

Замечание 1. При доказательстве теоремы предполагалось, что при движении (1.3.5) управления на начальном и конечном участках равны. Вариант с различными управлениями можно не рассматривать, т.к. если он "более оптимален", чем вариант с равными управлениями, то теорема справедлива, если нет, то оптимален вариант, рассмотренный при доказательстве теоремы.

Следствие. Оптимальным для задачи (1.1.1) является

\ один из следующих наборов управления:

(+1,0,+1) (+1,0,-1); (-1,0,4-1); (-1,0,-1); (+1,0); (0,+1);

(-10); (0, -1); (-1, +1); (+1, -1); (+1); (-1); (0).

Замечание 2. Из рассмотрения были исключены варианты (+1,-1,0); (р-1, +1,0), а также (0,+1,—1); (0, —1,+1), так как в силу теоремы 1 и доказанной выше леммы эти случаи не являются вариантами с двумя точками переключения управления.

Свойства точек переключения оптимального управления

Пусть начальная точка (жо,2/о о) не лежит на какой-либо из кривых (1.1.11), ,т.е. для решения задачи требуется переключение управления. Пусть таких точек п 2. Функция трз(і) обращается в нуль лишь на этом множестве точек. Гамильтониан системы (1.1.1) как функция времени постоянен на оптимальной траектории и, кроме того, неотрицателен, т.е. выполняется Рассмотрим первый момент переключения управления t\. Функция 3( 1) = 0, следовательно, выполняется равенство где постоянные Сі и С2, вообще говоря, находятся из начальных условий и или но постоянные Сі и С2 удовлетворяют условию С\ + С2 = 1, следовательно, чтобы выполнялось приведённое выше неравенство, мы можем положить С\ = sin ii) и С2 = cos (ii) и (p(ti) = arctg -В ситуации, когда Ci = 0, должно выполняться неравенство что обеспечивается при 6 — cos i. Так как С\ = 1, то cpi = -кк, где к - целое. Если же ( = 0, то должно выполняться что справедливо при Ci = sin i, но С\ — 1, а это означает, что pi = f (2 + 1), ,где к - целое. Отметим, что данные рассуждения справедливы для любого момента переключения управления. Точки переключения управления обладают свойством, доказанным в следующей теореме. Теоремаї.

Пусть функция фз(і) обращается в нуль лишь на конечном множестве точек ti,i = 1,п,п 2, - точки переключения управления в задаче (1.1.1). Тогда справедливы соотношения: т.е. (fi = РІ-{ + 2nk, k - любое целое, (pi = p(ti). Доказательство: Из условия постоянства гамильтониана по времени на оптимальной траектории имеем но ips(ti) =І0, а тогда, учитывая (1.1.10), получим: -18 Из (1.2.3) следует что Рассмотрим равенства Ci sin 9?i +1C2 cos y?i = Ci sin tpi + C2 cos cpi,i = 2, n. (1.2.4) После их преобразования, получим . I 4 i - Pi lrt sin (Gi cos " " C2 sin ) = 0. Окончательно J Pi-i - Pi Pi-i + Pi - 2arctg(Ci/C2) sin sm — = 0, 2 "" 2 0. sm . Pi - Pi . pi: + pi - 2 arctg(Ci/C2) sm Выше мы рассматривали все соотношения исходя из предположения, что Сі ф 0 и ( ф 0. Пусть Ci = 0. В данном частном случае принципу максимума удовлетворяет р\ = тек, но тогда выполняется условие откуда следует, что ц { = pi + 2nki, где к{ - целое и При С2 = 0 принципу максимума удовлетворяет ipi = (2к + 1), но так как выполняется то вновь имеем соотношения ері — (pi + 27г/гг-, ki - целое, откуда что и требовалось доказать. Следствие!.. Координаты точек переключения управления u(t) находятся по формулам: Доказательство: Точки переключения управления, начиная со второй, в силу теоремы 1 и (1.1.11) удовлетворяют следующим соотношениям: Отсюда получаем Окончательно Следствие 1 доказано. Замечани el. Данное следствие рассматривалось в предположении, что Wx ф О и Wy ф 0. Если Wx = 0, тогда координаты точек переключения вычисляются по формулам: равенства: Следствие 2. Е слм ii - первый, a tn - последний моменты переключения! управления, то все точки переключения лежат на прямой Для точек переключения управления справедливы равенства: Сложив почленно эти соотношения, получим Замечание 2. Доказанное следствие справедливо, если Wx ф 0 и Wy ф 0. В случае, когда Wx = 0, для первой и последней точек переключения выполняются условия: До сих пор мы рассматривали ситуацию, когда фз(к) обращалась в нуль лишь на конечном множестве точек-точек переключения управления. Теперь рассмотрим возможность существования особого управления для системы (1.1.1). Согласно [18] допустимое управление lu(t), t Є [ oj iL называется особой экстремалью(особым управлением), если вдоль него выполняются соотношения здесь смысл параметров x(t),ip(t),u(t) тот же, что и в 1 данной главы. Перепишем систему (1.1.1) в векторном виде Гамильтониан! (1.1.7) представим в виде: Н(г(і))ф(і), u(t)) = H0(z(t), ф(і)) + u(t)HMt), №), где H0(z(t) {t))\=(il; (t)Jo(z)) = C V sin p + Wx) + C2(V cos p-Wy), Н {і) (і)) = (ф {і), /1(2)) = u(C2(x - Wxt) - Сг(у + Wyt) + Сз). Здесь, как обычно, (-0 (),/o(z)) и (ift (t),fi(z)) - скалярные произведения соответствующих векторов. Введём следующие обозначения: Н = H(z\t) (t),u{t)),HQ = Н {і) {і)),Нг = Hx(z(t) {t)). На управление u{t) ограничений накладывать не будем, тогда при сделанных предположениях кусочно-непрерывное управление u(t), t Є [о і] является особым тогда и только тогда, Данное условие эквивалентно первому из (1.3.1), выполнение других условий (1.3.1) следует из линейности исходной системы по управлению.

Заметим, что в данном случае особое управление имеет место, если ф$(і) Е 0 на интервале времени [ті,Т2]. Найти это управление можно, используя скобки Пуассона [18]. Напомним, что скобкой Пуассона скалярных функций V(x,(p),W(x,(p), где х и р -векторы размерности п называется выражение Здесь знак означает операцию транспонирования. В дальнейшем нам понадобятся следующие свойства скобок Пуассона [16] : интервале времени [ті,т2] выполняется условие и, используя свойства (1.3.2) скобок Пуассона, а также (1.1.1) и (1.1.8), получим формулу для вычисления управления u(t). Последующие выкладки будем проводить согласно алгоритму, изложенному в [18] :

Определение области движения с оптимальным особым управлением

Обоснование данного варианта движения опирается на следующую теорему: Теорема 4. Пусть в некоторый момент времени г точка (хТ)УТусрТ) удовлетворяет условиям: Случай, (рассмотренной в данном параграфе, приведен в Приложении 1 п. 1.1.2. Так как sin (Ti) — 0,cos (Ti) = 1 и sixapT = 0,cos T = 1, a «n = = —u r, то при движении с управлением и т курсовой угол изменится на величину срп — рг, а при движении с ип будет меняться до рт. Таким образом, мы получаем, что р{Тг) = рт- Тогда из того, что = + wu r{tn - т) и (рт = (рп - ши Тх - „), следует, что Так как по предположению (2.2.4) удовлетворяет третьему из условий (2.2.1), то откуда Окончательно (2.2.5) Рассмотрим следующую функцию: (2.2.6) и применим к ней лемму 2. Заметим, что /(—7Г + 2/3) 0 и /(7Г + 2/3) 0, тогда согласно лемме 2 в силу монотонности функции на интервалах [—7г + 2/3,0] и [0,7Г + 2/3] не существует точки кроме а — 0, где бы выполнялось /(а) = 0. Если а = 0, тогда 9?n = т, т.е. вариант с переключением управления отпадает.

Проверим, существуют ли другие значения ее, при которых f(a) обращается в нуль, и что же имеет место в данном случае. Поиск нулей (2.2.6) нужно производить в интервале [—2%, 27г], что следует из леммы 1 4 главы 1 и из теоремы 2 того же параграфа. Рассмотрим следующие случаи: 1) Wx OiWy 0. Заметим, что, так как /(2тг) = —27rWx 0, то отпадает интервал [тг + 2/3,27г]. Тогда /(—2тг) — 2KWX 0 и /(а) обращается в нуль при а Є (-2тг,-тг + 2/3). Кроме того, /(-Зтг/2) = -(V - Wy)--WX(-STT/2 - 1) 0, т.е. а (-2тг,-Зтг/2). Тогда sina 0,u T = = —1, и из (2.2.4) следует, что уг 0. В то же время г/г 0 -налицо явное противоречие. Таким образом, приходим к выводу, что альтернативный вариант невозможен. 2) И 0, Wy 0. В данном случае /(27г) = -2nWx 0, /(—2тг) = 27rWa. 0, т.е. интервал [—2тг, —тг + 2/3] отпадает. С другой стороны, /(Зтг/2) = = — (V — Wy) -j Wx(Зтг/2 + 1) 0, а тогда получается, что данная функция обращается в нуль на интервале (Зтг/2,2тг). Тогда и г — = l,siny?i 0, и из (2.2.4) следует, что ут 0, что противоречит условиям теоремы. s)wx o,wJ o. В данном варианте, как и в 1), поиск нулей надо производить в интервале (—2тг, —Зтг/2). Тогда и т — — l,siny i 0, но мы не можем сказать сразу, что в (2.2.4) ут 0. Рассмотрим получившуюся ситуацию подробнее. Время движения из точки (хт,уг,(рт) в точку (0,0, у (Ті) їіавно тогда ДТ-j2 = -. Квадрат времени движения с постоянным управлением ur = 0 вычислим из соотношения Рассмотрим подробнее последнее выражение. Первое слагаемое в в (2.2.7) положительно, т.к. Во втором слагаемом — 2Va 0, т.к. а 0,1 (1 — cosa) 0, т.к. Wx 0 и Wy(ix - sin а) 0, но Wy 0 и a + sin a 0. Таким образом, (2.2.7) положительно, AT} - AT2 0 и ДГі - AT 0, т.е. альтернативный вариант не оптимален. 4) Wx 0,Wy 0. По аналогии с вариантом 2) получим, что нуль функции находится в интервале (27г,37г/2). Имеем и т = 1, sin о; 0. Если при этом уг из (2.2.4) отрицателен, то поступая так же, как и в 3), оценим время движения ATi и AT. После преобразований вновь придём к (2.2.7). И здесь первое слагаемое будет иметь те же оценки, что касается второго, то — 2Va 0, но а 0, (1 — cosa) 0, а Wx 0 и Wy(a - sin a) 0 , Wy 0 и a + sina 0. Таким образом, выражение (2.2.7) положительно, AT2 — AT2 0, откуда ДТі — AT 0, т.е. альтернативный вариант не оптимален.

Пусть Wx == 0, тогда для варианта движения с управлением откуда следует, что cos n = l,siny „ = 0, а тогда (рп = рт ± 2-к и Рп — фт — 27Г, и т = 1. Если и т — — 1, то рп — (Рт = —27Г, а тогда т/т = = — , откуда следует, что ут 0 при Wy 0-явное противоречие с условием (2.2.1)! Если Wy 0, то время движения с возможным альтернативным вариантом Ті = . Для основного варианта Т — ш(УЛщ-\. Отсюда видно, что Т\ Т, т.е. оптимален основной вариант. Если Wy = 0, то\ут = —2У 1 ч "щ Исследуя функцию (2.2.6) при дан \ ном значении W y, получим, что если Wx О, то а Є (—27г, —37г/2), sin а 0,Ц. = -т1,2/т 0- Если же Wz 0, то а Є (37r/2,27r),sina 0, = 1,з/т 0. Альтернативный вариант невозможен. Теорема доказана. Следствие. іслм начальная точка (жо, г/о5 о) удовлетворяет условиям теоремы 3, то движение с управлением щ — 0 будет оптимальным.

Определение областей движения с управлением

Предположим существование альтернативного варианта с управлением (—ио,щ), удовлетворяющий условиям: Смысл всех параметров здесь тот же самый, что и в случае (2.4.3). Вычислим значения (хо,уо): Ниже при рассмотрении всех возможных вариантов будем опираться на условия, сформулированные в 3, предполагая, что справедливы неравенства f (—8) 0,/ (7г — S) 0. Предварительно, из условий (2.4.1), получим выражения: Обозначим (через ip\ курсовой угол в момент переключения управления для варианта (2.5.1) и рассмотрим все возможные ситуации од I новременного существования двух управлении, воспользовавшись схемой, изложенной в 5 3. Заметим, что при о = 1 начальный курсовой угол будем считать лежащим в интервале [0,27г), а при щ — 1, принадлежащим отрезку (—27г,0]. Это всегда возможно сделать заменой ро = ±2к на (р0 = 0. Так как и0 = 1, то сро 0, рт = 27г. Если (р\ 0, Т == 27Г, 7 = 0, а при р\ 0, /?т = 0? 7 = 27Г a) W» 0,WV о, 5 Є (0,тг/2),/3 0. 1) ?о е[2тг-,2тг). 1.1)/0 0, ЇЄ[2тг-5, о). В данном случае cos 0 cos i, т.е. AT 0, если f(2ir — 5) 0. Если же рассматривать ір\ Є [тг — 8,2п — 5), то и в этом случае COS Q cos ірі и AT 0. 1.2) ІРІ е[к-Ъ,2 к-8). Ситуация рассмотрена выше. 1.3) рІ Є [ 2ТГ + (рО,ТТ - (5). Так как / (—27г+Уо) = /о 0? то і —27г+ о и на этом проверку можно закончить. 2) Ро е[п-8,2 -8). 2.1)/ 0,Йє[7г- о). В силу того, что /о 0 данный случай не рассматриваем. Пусть / (0) 0. Если сро 7г + 2/3, то /(у о) = 0. В противном случае sin (ро 0, sin р\ 0, т.е. sin р\ — sin 9?о 0, (р\ — ро 0 и из (2.5.5) следует, что г/і 0. Предположим, что / (0) 0. Тогда при ро Є [7Г,27Г — 8), следует, что р \ — sin(р\ 0, — (ро + 7Г + sin o 0 и f{ p\) 0.

Остается проверить случай, когда ср0 Є [тт — J, 7г), ї [ 0). Вычислим f(—S) предварительно представив /( і) в виде: В данной ситуации следует рассматривать угол переключения ір\ [—27г + о? —5). Такое положение возможно при f (—S) 0 и в силу того, что / (—27Г 4- іро) = /о . Если о 5 то т.е. в этом случае f((fl) 0. Отсюда следует, что нужно рассматривать лишь ро Є [тг — 5,7г), а тогда т. е. f{ fi) 0J Таким образом, для численного исследования остается лишь один интервал: Є [—7Г + 2/3, —5). 3) А)[0,тг-5). 3.1)/0 0, е[-5, о). Пусть / (0) 0. Тогда ір\ Є (0, о) и /( о) = 0. Если выполне I ны условия / (0) 0,/(-5) 0, то Є (—5,0). В этом случае требуется каким-либо численным методом найти нули функций в интервале (у5,0), если /(0) 0 и /(—5) 0. В случае их совпадения оптимально движение (2.5.1), если же нули различны, то движения не совместны. 3.2) Є [-1-5,-5). Проверку следует проводить, если /(—5) 0, или же если найденный в интервале (—5,0) угол р\ не является углом переключения управления для движения (2.5.1). В этом случае при щ Є [0,7г/2] следует проводить численные исследования в интервале [—7г/2, —5], и /((pi) 0. Следовательно, следует проверить интервал [—7г4 4-2/3, -тг/2), если /(—тг/2) 0 и / (- + 2/3) 0. 3.3) і Є [—2тг 4-1 0? -я" - &) В силу того, что / (—27Г 4- о) 0, получим условие у і —27Г+ 4- о, а тогда делаем вывод, что в данном случае имеет место лишь движение (2.4.1 ). Ъ) Wx 0, Wy І 0,5 Є (тгДтг), 0. 1) Vo Єртг- тг). 1.1) /о 0, Ї/Є [2тг - J, 0). Предположим] что 2тг — 5 7г 4- 2/3. Возможны два варианта: Є (27Г — (5,7Г 4- 2/3), или 1 + 2/3. В обоих случаях /?i г} т.е. cos o cos (pi и AT 0.

Аналогичная ситуация имеет место, если 2тг - 5 тг 4- 2/3. 1.2) ї Є[7г 27Г- ). Предположим, что 27Г — 5 7г 4- 2/3. Если G[f + 2/3,27г — ), то ДТ 0. Если же (р\ тг 4- 2/3, то Р\ — о4- sin у?о — sin ері 7г 4- 2/3 — 2тг + 5 — sin 5 4- sin 2/3 = -тг 4- 2/3 + J - sin 8 + sin 2/3 0, т.к. 5 тг f- 2/3, sin 5 sin 2/3 и /( ) 0. -72 1.3) p\ Е[-2?т + рІ7Г-5). Данный случай можно пропустить, т.к. f ((po) 0. 2) ipQ є[к-3,2тг-+5). 2.1) /0 0,(pt Є [і- 5,tpQ). Так как /Q 0, то переходим к следующему пункту. 2.2) р є[-5,тг-5). Предположим, что / (0) 0. Если о + 2/3, то f( pa) = 0. Допустим, что сро 7г + 2/3, тогда Уі — 9?о + sin о — sin /?j 7г — 5 — -лг — 2/3 — sin 2/3 — sin 5 = = -5-2/3- sin2/3 - sin5 0 и f((pl) 0. Предположим, что / (0) 0, т.е. (р\ Є [—5,0). Если 9?о я", то V i — 9 0 + тг + sin о — sin (fl рІ — тг -\- IT — sin ері 0 и f( pl) 0. Таким образом, следует рассматривать о Є [тт — )-Если —5 —7г + 2/3, то для ро 7г/2 выполняется условие AT 0, а при (fo 7Г/2, получим 1- 0 + + sin щ - sin ipl —л- + 2/3 - 7г/2 + 7Г 4-1 + sin 2/3 = = —тг/2 + 2/3 + 1 + sin 2/3 0 и /{(pi) 0. Таким образом, интервалы для численной проверки выглядят следующим образом: [—5,0), если —8 —тг + 2/3, и [—7г+ +2/3,0), если -5 -тг + 2/3. 2.3) y J є[-27Г + 0-5).

Синтез оптимальной траектории при двух переключениях управления

Сначала рассмотрим случай, когда "помеха" Wx = 0. Тогда где щ, u2 - управление на участках разворота, Т - конечный момент времени движения, (рт - значение курсового угла в начале координат, ii, t2 - моменты переключения, (рп - величина курсового угла в точках переключения. Очевидно, что ti — — Уо и Т —12 = ут п. Ниже будем рассматривать вместо уравнений (3.5.1) две системы с управлениями (ио,0,щ) и (щ,0, — Напомним, что в данном случае курсовые углы (р0,(рп, (р? и управления щ, и2 удовлетворяют соотношениям 1)гг0 = 1,и2\= 1, о 0, и Оптимальная траектория определяется минимальным из всех найденных значений времени. Допустим, что существует также движение с одной /точкой переключения, с управлением (tig, — u Q) : удовлетворяющее условиям (3.5.1), и выясним, что происходит в этом случае. Если траектория (3.5.6) существует, то необходимо рассматривать движения с управлением и 0 = щ и (г о? 0, г о) Далее проверим! возможность существования траектории движения с управлением /0, г/о). Пусть Тг-время движения вдоль этой траектории, а ж -абсцисса точки переключения. Заметим, что в этом случае конечный курсовой угол для данного движения равен нулю. Тогда

Наконец, рассмотрим последнюю возможность: существование движения с управлением (—ко,0). Время движения в данном варианте равно Здесь следует рассматривать движение (uo,0, — щ). Угол переключения для движения с управлениями (щ,0, — щ) должен быть отрицателен при щ — 1 и положителен при гг0 = —1. Ниже найдем АТ = Т3-Т: Из соотношений (3.5.7) — (3.5.9) следует, что нельзя сразу сделать вывод об оптимальности того или другого движения. Большинство параметров требуется найти или численным методом, или же путем построения соответствующей данному движению траектории, и найти время движения. Если Wy = 0, то соответствующие траектории описываются уравнениями У2 = Уі + (Vcos pn - Wy)(t2 - ), (3.5.10) Время движения в данных случаях и соответствующие значения АГ можно вычислить по формулам, полученным в 7 второй главы. Дальнейший алгоритм действий тот же, что и приведенный выше. 6. Алгоритм синтеза оптимального управления Основываясь на результатах первой и второй глав и предыдущих параграфах данной главы, мы можем изложить алгоритм построения синтезирующего управления для разработки программы построения оптимальных траекторий. 1. Если начальные данные удовлетворяют одному из соотношений: То, в данном случае, оптимально управление UQ = 0. В противном случае переходим к следующему пункту. I (po 0, wo = -1. В случае выполнения одного из данных равенств оптимально дви жение с управлением щ ф 0. Если это не так, то следует перейти к пункту 3. 3. В данном пункте проверяем возможность существования движения с управлением (щ,—щ). В случае отрицательного результата следует перейти к следующему пункту. Если же искомое движение имеет место, следует проверить условия существования траектории с управлением (—Wo,0) и сравнить время движения, если второй вариант движения существует.

Если же траекторий с особым управлением на конечном участке и одной точкой переключения не существует, то следует проверить условия существования движений (0,«о) или (wo,0,wo). 4. Проверяем, удовлетворяют ли начальные данные одному из условий, соответствующих движению с управлением (wo,0): В случае выполнения какого-либо из условий следует проверить существование траектории с управлением (—и0,0,г о). 5. Проверяем одно из условий существования движения с управлением (0,г/о) t -27Г, y?o 0,u0 = -1. Далее проверяем траекторию с управлением (щ,0,—щ). 6. Последний случай: движение с управлением (wo,0,щ) Данная ситуация возможна при отсутствии других вариантов. Следует проверить не более четырех траекторий. Движения, с изменением курсового угла выходящего за пределы 27г, следует исключить из рассмотрения. Таким образом, мы можем при произвольных начальных данных получить оптимальную траекторию. Результаты данного параграфа можно рассматривать как своеобразное заключение работы. Приложение 1. Примеры оптимальных траекторий Представленные ниже варианты движения рассчитаны при следующих значениях параметров: V=100 м/с, Wx=10 м/с, Wy=8 м/с, со =0.01 рад/с. 1.1 Примеры траекторий без переключения управления. 1.1.1 На рисунке 1 представлена траектория движения с управлением ио=1. I Начальные данные: х0=-б.28318530717959Е+0003 м, у0=5.02654824574367Е+0003 м, ф0=0.00000000000000Е+0000 рад. Координаты конечной точки: хт=-9.30674678844і б9Е-0003 м, ут=-8.56260510027298Е-0002 м, фт=27і рад.

Похожие диссертации на Синтез оптимального по быстродействию управления в задаче перелета