Содержание к диссертации
Введение
Глава 1. Анализ функционирования системы выведения космических аппаратов глонасс на орбиту 12
1.1. Использование энтропии покрытия в современных информационных технологиях, применяемых для решения задач управления полетом космических аппаратов 12
1.2. Классические элементы орбиты спутников ГЛОНАСС 17
1.3. Анализ параметров орбит спутников ГЛОНАСС 23
1.4. Анализ состава аппаратуры спутников ГЛОНАСС 27
1.5. Этапы функционирования КА ГЛОНАСС 30
1.6. Общая постановка задачи оптимального управления в информационном пространстве с использованием энтропии покрытия 33
Выводы по главе 1 37
Глава 2. Анализ выработки оптимального управляющего воздействия в информационном пространстве 39
2.1. Численные методы оптимизации 39
2.2. Принцип максимума Понтрягина в общем случае 46
2.3. Информационное пространство отношений СУ РБ 54
2.4. Методика решения задачи оптимального управления в информационном пространстве 60 Выводы по главе 2 52
Глава 3. Решение задачи выработки оптимального управляющего воздействия в информационном пространстве отношений СУРБ 64
3.1. Методические основы применения критерия среднего байесовского риска в системе управления разгонным блоком 64
3.2. Использование байесовского подхода при оптимальном оценивании вектора состояния элементов СУРБ 68
3.3. Алгоритм фильтрации дискретно-непрерывных процессов 74
3.4. Математическая модель функционирования системы выведения КА 87
3.5. Задача оптимального управления в информационном пространстве 95 Выводы по главе 3 103
Глава 4. Решение задачи оптимального управления в информационном пространстве для случая выведения ка на круговую орбиту 106
4.1. Объектно-ориентированная модель системы управления 106
4.2. Фрагмент текста программы по расчёту информационно-управляющих характеристик 108
4.3. Пространство состояний системы управления разгонным блоком как стохастической следящей системы 112
4.4. Методика исследования СУ РБ как стохастической следящей системы 120
4.5. Решение задачи оптимального управления в информационном пространстве 123
4.6. Графики зависимости энтропии покрытия вектора управляющих воздействий от начальных условий 133
Выводы по главе 4 134
Заключение 135
Список использованных норматив-но-правовых актов и научной литературы
- Классические элементы орбиты спутников ГЛОНАСС
- Принцип максимума Понтрягина в общем случае
- Использование байесовского подхода при оптимальном оценивании вектора состояния элементов СУРБ
- Пространство состояний системы управления разгонным блоком как стохастической следящей системы
Классические элементы орбиты спутников ГЛОНАСС
Неудачность этой меры проявляется в том, что она не привязана ни к какой предметной области и описывает такую математически неудачную абстракцию [79], как случайность. В настоящее время существуют значительно более удачные в практической реализации (реализации принципов управления) информационные меры. И одна из лучших в этой области принадлежит профессору А.В. Сухову - энтропия покрытия. Об этой информационной мере будет сказано ниже.
По поводу понятия «энтропия» в научном мире велось и ведётся много споров. Этот термин вначале использовал Р. Клаузиус для меры вероятности пребывания системы в данном состоянии (ввёл в середине XIX века). Этот термин удачно совпал с исследованиями Л. Больцмана, который с применением энтропии в термодинамике обосновал её начала. По существу, что такое энтропия? - Просто свёртка в переводе с латыни. Но эта свёртка обладает замечательным свойством сохранять только сущность предметов и событий, абстрагируясь от несущественных мелочей, что и было замечено в работах [2, 3, 9]. Следуя историческому экскурсу, Клод Шеннон [6] определил энтропию для разновероятных исходов случайных величин простым обобщением понятия Хартли (напомним, что Хартли термин «энтропия» не употреблял). И только благодаря его публикациям в теории информации появился этот термин.
Классификация информации может быть произведена по различным основаниям. По форме информация подразделяется на образную (идеальную) и признаковую (духовную). По источникам информация подразделяется на информацию психики человека, информационно-технических систем, объектов материального мира, документальных источников, управляющих систем.
Вид информации связан с источниками информации. Для психики человека - это знания, навыки, умения. Для информационно-технических систем информацией являются сигналы, данные, программы. Объекты материального мира имеют информацию в виде характеристик и параметров. Для документальных источников информация представляется в виде знаков (символов) и сообщений. Классификация термина «информация» весьма затруднительна в связи с затёртостью этого термина в настоящее время. Так, если информация не может в принципе существовать без духовности (человека), то и всякое упоминание о ней в полной абстракции является полным абсурдом. Этим грешат, к сожалению, некоторые учёные современности, забывая, что ИНФОРМАЦИЯ ВСЕГДА В ПЕРВУЮ ОБЕРЕДЬ СОВОКУПНОСТЬ СВЕДЕНИЙ, и только во вторую очередь - всё остальное. Приведём не вполне удачные примеры классификации информации: «По описанию объекта информации рассматривается информация об объекте (семантическая информация [7]), информация по отношению к объекту [3], а также информация на основе статистических мер и нечётких мер. Семантическая информация представляется как элементарная и неэлементарная. По отношению к объекту информация представляется как объективная информация, являющаяся внутренней структурной информацией объектов, и субъективная информация, являющаяся внешней относительной информацией объекта». Принято, что качественная сторона не предусматривает метрического представления. Отметим, однако, что под качеством информации понимается степень её соответствия потребностям пользователей (но это, опять же, при использовании таблиц соответствия вербальных характеристик метрическому представлению - также и количественная сторона информации). Эта информация определяет цели управления в эргасистемах. К примеру, при показателе качества «энергия» для одного энергопотребляющего объекта 100 кВт-ч может оказаться вполне достаточным потреблением за месяц, в то время как для более крупного объекта этого окажется крайне недостаточно, и качественная сторона информации об этих поступлениях энергии будет разной. Если критерий «качество» для измерения качественной стороны информации введён, то эта информация будет уже метрической величиной, следовательно, может быть измерена. Но поскольку принято, что качественная сторона не может быть определена количественно, то для разрешения конфликтов в терминологии предлагается не употреблять термин «качественная сторона информации», а использовать термин «содержательная сторона информации».
Объединяющим информационным подходом по признакам «количественная» и «качественная» стороны информации может являться подход, основанный на энтропии покрытия [2, 3, 9, 10]. Эта информационная мера была специально введена для оптимизации информационных процессов, протекающих в эргасистемах. Теоретико-множественная мера неопределённости содержит сведения о соответствии параметров объекта их нормативным значениям. Опять же -логарифмического представления по покрытию одного множества другим. -«энтропия покрытия» [2, 3, 9]: HC(D, Do) =kln[\ I (DDo)uDo\ \ / \ \Do\ \], (1.2) где D - множество реальных технических параметров; Do - множество нормативных (требуемых) технических параметров; \ - операция разности множеств; - - норма, допустимы первая норма (сумма абсолютных значений) и эвклидова (квадратичная); к - коэффициент пропорциональности, связанный с единицами измерения (1.2).
Энтропия покрытия принимает ненулевые значения при превышении параметром или группой параметров нормативных значений и равняется нулю при достижении требуемых значений или при лучшем результате. Такое свойство энтропии покрытия позволяет математически строго решать задачи оптимального управления с обеспечением рационального расходования ресурсов в условиях статистической неопределённости [2, 9, 10,11,15,16].
Следует также отметить, что при решении комплекса сложных задач теории управления следует использовать энтропию покрытия в обобщённой версии [2, 9, 10, 11, 16].
Различные представления информации могут быть упорядочены в две большие группы: информация по приложениям и информация объекта, что существенно для представления информации в метрической форме. Первая группа допускает представление информации в метрической и содержательной формах, в то время как во второй группе эти представления разделены. Вторая группа даёт возможность выбора каждому элементу первой группы для выбора своего количественного или содержательного представления.
В соответствии с приведённой классификацией можно отметить, что практически все пункты схемы в той или иной степени касаются вопросов анализа информационных процессов в эргасистемах с учётом информационного противодействия возмущающим факторам.
Принцип максимума Понтрягина в общем случае
Численными методами математического программирования [80] называют методы приближенного или точного решения задач нахождения экстремума целевой функции, основанные на построении конечной последовательности действий над конечным множеством чисел. Численные методы представляют собой последовательность однотипных шагов, или итераций. Напомним, что итерацией называют регулярно повторяющийся в ходе реализации алгоритма состав процедур. В основе итерации лежат рекуррентные соотношения, определяющие новые значения каждой переменной через прежние значения ее и других переменных одной или нескольких предшествующих итераций. Итеративное представление алгоритма особенно эффективно при реализации его на ЭВМ, поскольку реализация различных итераций осуществляется одной и той же частью программы, что уменьшает затраты на программирование и сокращает объем необходимой памяти ЭВМ.
Численные методы подразделяются на конечные и бесконечные (итеративные). Конечные методы позволяют получать решение за конечное, обычно заранее неизвестное число шагов. Таким, например, является симплексный метод линейного программирования. В итеративных методах строится последовательность более точных приближений к решению. Процесс решения прекращается на том или ином числе итераций, когда достигается заданная точность решения.
Численные методы математического программирования получили чрезвычайно широкое применение в связи с развитием цифровой вычислительной техники.
Большинство задач оптимизации при проектировании систем управления относится к нелинейным. Решение нелинейных задач - сложная вычис 40 лительная проблема, поэтому практически для решения используют приближенные методы, сущность которых состоит в том, что исходная постановка задачи сводится к одной линейной задаче или их совокупности. Основу многих процедур решения составляет линейное программирование.
Линейное программирование представляет собой численный метод решения задач нахождения экстремума линейной функции многих переменных при наличии линейных ограничений, т. е. линейных равенств или неравенств, связывающих эти переменные. Первые исследования по линейному программированию были проведены в 1930-е годы в Ленинградском университете акад. Л.В. Канторовичем. Термин «линейное программирование» появился в 1951 году в работах американских ученых Дж.Б. Данцига и Т. Куп-манса.
Математически задача линейного программирования ставится следующим образом: необходимо найти неотрицательные значения переменных xl, х2, ... , хп, минимизирующие целевую функцию:
Неравенства (2.3) определяют в пространстве xi, х2, ..., хп выпуклую область - выпуклый многогранник или многоугольник. Рассмотрим для простоты случай двух переменных xi и х2, для которых справедлива система ограничений: an xi + айХ2 + Ьі 0
Геометрически задача линейного программирования интерпретируется следующим образом. Если требуется найти такие xi и х2, которые придали бы линейной форме минимальное значение, то геометрически это означает, что необходимо провести прямую Z (2.5), проходящую хотя бы через одну точку области и имеющую минимальное расстояние d от начала координат (рис. 2.1, в). В случае нахождения максимума целевой функции это расстояние должно быть максимальным (рис. 2.1, г).
Для решения многомерных задач линейного программирования обычно используется симплексный метод (симплекс-метод), представляющий собой специальный способ оптимального последовательного (направленного) перебора, называемый также методом последовательного улучшения плана, так как решение задачи осуществляется итерациями, при этом на каждой последующей итерации получают план лучше полученного на предыдущей итерации. В геометрической интерпретации симплекс-метод состоит в переходе от одной вершины области допустимых значений к другой, соседней, в которой значение целевой функции лучше, чем в исходной точке. Движение происходит по периметру контура двумерной области, а для случая двух переменных - по ребрам многомерного многогранника [38]. Многие процессы проектирования систем управления, как и сам процесс проектирования, являются многоэтапными (многошаговыми). Весьма эффективным методом оптимизации сложных многошаговых процессов является динамическое программирование (планирование). Этот метод был предложен и развит американским математиком Р. Беллманом в 60-х годах XX века. В основу метода положен интуитивно очевидный принцип, названный принципом оптимальности, который можно сформулировать следующим образом: оптимальное поведение в данный момент времени определяется только состоянием объекта (системы) в этот момент времени и конечным желательным состоянием и не зависит от поведения в прошлом.
При использовании этого метода можно заменить исходную сложную задачу отыскания многошагового управления последовательным решением некоторого количества существенно более простых одношаговых задач оптимизации. Основной метод динамического программирования - метод рекуррентных соотношений, базирующийся на принципе оптимальности.
Задача динамического программирования обычно формулируется следующим образом: из множества допустимых управлений Удоп необходимо найти такое U, которое переводит объект (систему) из начального состояния хо є хо доп в конечное Хк є Хк доп так, чтобы целевая функция (критерий качества) принимала максимальное значение:
При этом система должна находиться в допустимой области состояний Хдоп. Для фазового пространства эта задача может быть сформулирована так: найти оптимальное управление U, под действием которого точка фазового пространства х переместится из начальной области в конечную, не выходя из допустимой области Хдоп, так, чтобы при этом критерий К обратился в максимум (рис. 2.2).
Использование байесовского подхода при оптимальном оценивании вектора состояния элементов СУРБ
Оптимальный фильтр имеет многоканальную структуру / каналов отношения правдоподобия (ОП). Реализация входного процесса z (t) подаётся на каждый канал ОП. Каждый канал имеет свой канал «j» для формирования числителя отношения правдоподобия, и канал «О» для формирования знаменателя. Для всех каналов общим является формирователь АПВ, который имеет 1 входов от каждого канала ОП. С каждого канала ОП выходное значение отношения правдоподобия подаётся на устройство выбора максимального значения «max», на котором происходит выбор наибольшего значения среди поступивших значений отношения правдоподобия и принимается соответствующее решение об оценке дискретного параметра у\+ь Начальное распределение р (х о zo) задаётся по сигналу начала приёма «НП». Все необходимые элементы синхронизируются метками тактовой частоты (k+1) At. Такой следящий фильтр сравнительно легко реализуется на современной микропроцессорной технике.
Приближённый алгоритм фильтрации. Возможным подходом к упрощению выражения (3.27) является разложение подынтегральной функции в ряд Тейлора и последующее её интегрирование. Разложим экспоненту в выражении (3.27) в ряд Тейлора в окрестности точки Хк, учитывая малое её изменение за время At, соответствующее выполнению условия:
Провести интегрирование выражения (3.29) для конкретной функции сообщения с заданным вектором непрерывных параметров не представляет особого труда. В общем виде оно не приводится из-за неопределённости функции (3.30) и, соответственно, неопределённости её производной по вектору Xk+ь Рассмотрим упрощение выражения (3.29) на конкретном примере. Возьмём функцию в уравнении наблюдения s (t) = A (t) cos (coo t + ф (t) + Ч (у, t)), (3.34) где A (t) - амплитуда сигнала, о - несущая частота, ф (t) - случайная составляющая фазы сигнала, Ч (у, t) - дискретная функция модуляции фазы по закону y(t). Положим в ней A (t) = AQ.
По сравнению с известными алгоритмами квазиоптимальной фильтрации, основанными на гауссовской аппроксимации АПВ, в частности, приведённом в предыдущем параграфе, погрешность предлагаемого алгоритма меньше, поскольку в рассматриваемых терминах погрешность этих алгоритмов равна
Из сравнения выражений (3.37) и (3.38) видно, что предлагаемый алгоритм обладает погрешностью на порядок меньшей за счёт учёта членов разложения более высокого порядка малости.
Дальнейшее упрощение выражения (3.29) можно провести, используя разложение функции (3.30) в ряд Тейлора в окрестности точки tk по степеням At В этом выражении нормирующая константа Сі не зависит от х и у. Поэтому в отношении правдоподобия она сократится, как общая для числителя и знаменателя. Для модели сообщения (3.28) в приведённом алгоритме фильтрации вместо выражений (3.40), (3.43) используются выражения (3.41), (3.44), соответственно.
Можно отметить ещё одну особенность. Проведение интегрирования во времени в (3.29) и аппроксимация этого выражения одинаково нежелательны. Проведение интегрирования по времени обусловливает необходимость дополнительного использования аналоговой техники и снижает эффективность алгоритма в целом. Аппроксимация (3.39) не всегда допустима. В частности, для цифровых сигналов её использовать в чистом виде нельзя. К тому же для сложных сигналов она приводит к снижению энергетики канала передачи сигналов. Поэтому целесообразно интеграл в выражении (3.30) заменять конечной суммой с проведением предварительного квантования по времени. Выражение (3.30) при этом примет следующий вид:
Выбор интервала дискретизации то определяется из условий выполнения теоремы Котельникова для всех используемых непрерывных функций. То есть существует максимально допустимое значение этого интервала, определяемое известной зависимостью от ширины спектра сообщения. К тому же во всех выражениях фильтрации необходимо заменить спектральную плотность мощности помехи на величину Nk = No/At.
В подсистемах информационного обмена в настоящее время наблюдается подавляющий переход к цифровым каналам. В первую очередь это связано с всё более широким использованием компьютерных средств во всех технических комплексах, а также с объективными преимуществами цифровых каналов информационного обмена. По таким каналам организуется обмен информационными потоками в процессе функционирования наземного комплекса.
Поэтому для СУ РБ актуально построение оптимальных алгоритмов текущего оценивания для цифровых каналов информационного обмена, образуемых использованием цифровых сигналов.
Движение РБ представляет собой довольно сложный процесс, поскольку оно происходит под действием системы сил, зависящих от параметров движения, свойств среды, в которой совершается полёт, конструкции РБ, его системы управления и других факторов. Сложность процесса движения затрудняет его изучение в полном объёме. Поэтому при теоретическом исследовании действительный процесс движения представляют математической моделью. Модель движения РБ с КА описывается определённой системой дифференциальных уравнений, выражающих основные закономерности процесса движения.
Под математической моделью движения (ММД) КА обычно понимают объективную схематизацию действительного движения КА в форме, позволяющей производить необходимые вычисления с требуемой точностью
Пространство состояний системы управления разгонным блоком как стохастической следящей системы
Классический метод анализа динамических систем разработан французским математиком Анри Пуанкаре [71, 68, 72]. Он основывается на замене потока динамической системы с непрерывным временем некоторым отображением, называемым отображением Пуанкаре.
Приведем отображения Пуанкаре для автономных систем (для неавтономных систем имеются отличия) при отсутствии случайных воздействий. Пусть она имеет n-й порядок с предельным множеством L. Пусть X - некоторая точка на этом множестве, а Т - минимальный период на L. Возьмем (п-1)-мерную гиперплоскость S, трансверсальную L в точке X . По истечении времени Т траектория системы G(T), исходящая из точки X , пересечет S в точке X . Вследствие условия плотности множества L в любой сколь угодно малой окрестности любой точки множества, траектории, начинающиеся в некоторой достаточно малой окрестности и точки X , приблизительно через время Т пересекут гиперплоскость S вблизи точки X . Следовательно, (4.1) и
Отображение Р называется отображением последования Пуанкаре. На рис. 4.3 представлена иллюстрация указанных положений, а также приведена последовательность точек (xl, х2, хЗ, х4,...), образуемых предельным циклом и поверхностью S. Эта последовательность точек образует орбиту динамической системы. При этом отображение Р является диффеоморфизмом, т.е. допускает обратную функцию Р-1 [69, 70].
Приведенное определение для стохастических следящих систем не подходит, поскольку требует знания положения предельного множества, которое, как указывалось выше, аналитически описывается тяжело или не может быть описано. Поэтому зададим (п-І)-мерную плоскость S следующим образом:
Если гиперплоскость S выбрана правильно, исследуемая траектория будет многократно пересекать S. Причем пересечения только с одной стороны образуют две области S" и S+, называемые односторонними отображениями последования Пуанкаре:
Вся последовательность точек пересечения гиперплоскости безотносительно к направлению перехода из одной области в другую определяет двустороннее отображение последования Пуанкаре. Но не всегда говорят об устойчивости решений динамической системы. При введенных понятиях о предельных множествах можно оценить устойчивость точек этих множеств.
Для случая дробного числа емкость, корреляционная размерность, информационная размерность и размерность по Ляпунову [68, 69]. Мы рассмотрим емкость с целью уяснения понятия размерности и информационную размерность, хорошо характеризующую странные аттракторы в рассматриваемом случае.
Этими s-элементами могут являться сферы, кубы и т.д. В случае покрытия n-мерного тела (с целой размерностью) такими элементами, их количество будет пропорционально s-n. Обозначим число этих элементов через N(s). Устремим є к нулю и возьмем предел:
В литературе доказывается, что Dcap Di [69, 70]. При этом необходимо, чтобы система функционировала достаточно долго.
В заключение отметим, что детальное описание поведения вектора состояния позволяет оценить надёжностные характеристики системы в целом, и, в первую очередь, ее устойчивость. Кроме того, выявление предельных множеств (странных аттракторов), их сравнение с предельными множествами альтернативных систем, оценка размерности позволяют получить рабочие характеристики системы, выявить лучшую из возможных систем или найти пути улучшения рабочих характеристик систем. При этом в большинстве случаев для анализа достаточно использовать перспективные методы моделирования динамики систем на ЭВМ с использованием объектно-ориентированного подхода.
Есть известная притча Чжуан-цзы (369-286 г. до н.э.) [69], которая в переводе звучит так: «Правителя Южного моря звали Шу (Краткий), правителя Северного моря звали Ху (Быстрый), а правителя срединного края звали Хун-тун (Хаос). Временами Шу и Ху встречались во владениях Хун-туна, и Хун-тун был очень щедр к ним. Шу и Ху думали, как бы отблагодарить его за доброту. «У всех людей, - говорили они, - есть семь отверстий, и они могут видеть, слышать, есть и дышать. Лишь у Хун-туна нет ни одного. Давай просверлим и ему!» Каждый день они стали сверлить ему по дыре, и на седьмой день Хун-тун умер».
Очевидно, что прояснение тайны путём анализа, систематизации, доказательств, экспериментов и т.д. приводит, в конце концов, к тому, что тайна перестаёт быть тайной. Слово «смерть» в приведённой притче и является тем, что хаос перестаёт быть чем-то таинственным, а становится прогнозируемым вещественным явлением. В этом смысле и следует понимать исследования динамики стохастических следящих систем.
В настоящее время известны методики исследования динамики детерминированных систем и систем с неравновесным порядком (см., например, труды Горьковского (Нижегородского) государственного университета им. Н.И. Лобачевского - серия «Динамика систем», известные методики в [68, 69] и др.). СУ РБ
При исследовании ССС в качестве примера было проведено исследование динамики цифровых следящих фильтров сигналов - переносчиков информации в СУ РБ. Для таких систем к исследуемым параметрам относились несущие частоты сигналов, тактовые частоты цифровых сигналов, длина модулирующей псевдослучайной последовательности, коэффициенты в математических дифференциальных уравнениях состояния, уровень параметрических и канальных шумов, полосы каналов передачи информации, частоты дискретизации цифровых следящих фильтров. Для таких ССС исследование динамики проводилось по следующей программе [54, 57].