Содержание к диссертации
Введение
Глава 1. Проблема построения оптимальной дисперсионной модели сложного объекта управления с агрегированным выходом 8
1.1. Регрессионные модели квазистационарных объектов управления с агрегированным выходом 8
1.2. Оценка модели дисперсии агрегированной переменной 16
1.3. Проблема оценивания параметров модели дисперсии агрегированной переменной 20
1.4. Критерии структурной идентификации модели объекта управления 23
1.5. Выводы 27
Глава 2. Исследование особенностей и эффективности процедур идентификации модели дисперсии агрегированной переменной 28
2.1. Распределение максимального собственного числа выборочной ковариационной матрицы 28
2.2. Исследование методов оценки параметров модели дисперсии агрегированной переменной 32
2.3. Построение области возможных значений параметров модели дисперсии 38
2.4. Вычислительный эксперимент по сравнению методов оценивания параметров модели дисперсии агрегированной переменной 41
2.5. Прогнозирующая способность методов оценивания параметров модели дисперсии агрегированной переменной 47
2.6. Оценка среднеквадратической ошибки прогноза для модели дисперсии агрегированной переменной 52
2.7. Выводы 58
Глава 3. Метод идентификации сложного объекта управления по моде- 60 ли дисперсии агрегированной переменной
3.1. Критерии скользящего контроля в задаче идентификации структуры модели дисперсии агрегированной переменной 60
3.2. Вычислительные эксперименты по исследованию свойств критериев селекции .63
3.3. Метод идентификации сложного объекта управления по модели дисперсии агрегированной переменной 68
3.4. Вычислительный эксперимент по исследованию эффективности метода идентификации сложного объекта управления по модели дисперсии агрегированной переменной 74
3.5. Идентификации квадрата расстояния между двумя центрами распределения данных по модели дисперсии агрегированной переменной 78 3.6 Вычислительный эксперимент по исследованию эффективности метода идентификации квадрата расстояния между центрами распределения данных по модели дисперсии агрегированной переменной 84 3.7. Выводы 89
Глава 4. Примеры использования метода идентификации сложного объекта управления по модели дисперсии агрегированной переменной 90
4.1. Программное управление процессом подготовки спортсменов 90
4.2. Мониторинг потребительских цен в экономике 95
Заключение 107
Литература 108
- Регрессионные модели квазистационарных объектов управления с агрегированным выходом
- Распределение максимального собственного числа выборочной ковариационной матрицы
- Критерии скользящего контроля в задаче идентификации структуры модели дисперсии агрегированной переменной
- Программное управление процессом подготовки спортсменов
Введение к работе
При разработке систем управления особо ответственным является этап идентификации объекта управления, от реализации которого в значительной степени зависит качество спроектированной системы управления. Проблеме идентификации объектов управления в условиях неопределенности посвящено большое количество работ, как в отечественной, так и в зарубежной литературе (Вапник В.Н. [5, 10], Ивахненко А. Г. [22-29], Сте-пашко B.C. [54, 55], Цуканов А. В.[84-90], Миллер А. [94] и др.). Для класса стохастических объектов управления в большинстве этих работ рассматривается построение моделей зависимостей средних значений выходных переменных от входных переменных. В то же время, для широкого класса сложных объектов управления, характеризующегося стохастич-ностыо, иестационарностьго, многомерностью и многосвязностыо, необходимо идентифицировать модель дисперсии выходной переменной. К таким объектам можно отнести многие технологические и экономические процессы, биологические, экологические и медицинские системы. Большой вклад в развитие методов идентификации такого класса систем внесли Райбман Н.С. [16, 42,46], Айвазян С.А.[1-4], Перельман И.Щ44], Расстри-гин Л.А. [48,49] и др.
Современный уровень вычислительной техники позволяет сделать следующий шаг в повышении эффективности решения задачи идентификации рассматриваемого класса систем за счет интенсивного использования методов имитационного моделирования и новых результатов, полученных в теории управления.
В связи с вышеизложенным разработка методов идентификации объектов управления по модели дисперсии на основе имитационного моделирования является актуальной научной задачей и имеет важное народнохозяйственное значение.
*
Цель работы состоит в разработке метода идентификации сложного объекта управления по модели дисперсии агрегированной переменной с мультипликативной случайной составляющей и в применении этого метода для повышения эффективности управления конкретными системами.
Для достижения цели исследования в диссертации решены следующие задачи:
1) определены особенности и критерии эффективности процедур парамет
рической идентификации модели дисперсии агрегированной переменной ,
в частности:
получены аналитические выражения оценок параметров для метода наименьших квадратов, взвешенного метода наименьших квадратов, метода наименьших отношений и показаны их свойства;
проанализирована прогнозирующая способность рассматриваемых методов оценивания параметров;
получено аналитическое выражение оценки среднеквадратического риска, как критерия качества идентификации, с учетом особенностей идентифицируемой модели;
проведены вычислительные эксперименты по исследованию свойств рассматриваемых методов оценивания параметров;
выбраны критерии для идентификации структуры идентифицируемой модели и исследованы их свойства;
разработан и исследован метод идентификации сложного объекта управления по модели дисперсии агрегированной переменной.
Материал диссертации изложен в четырех главах.
Во введении обоснованы актуальность темы и излагается перечень вопросов, исследованию которых посвящена диссертация, формулируется цель исследования, а также защищаемые автором положения.
В первой главе сформулирована задача идентификации сложных объектов управления, характеризующихся большим числом составляющих элементов, неполнотой информации, ошибками в данных и наличием множества моделей для описания по модели дисперсии агрегированной переменной. Показано, что решение задач идентификации такого класса объектов требует использования дополнительной априорной информации о свойствах объекта управления, большого объема экспериментальных данных и проведения имитационного моделирования. Для повышения эффективности процесса идентификации ставится задача разработки метода идентификации сложного объекта управления по модели дисперсии агрегированной переменной.
Во второй главе проводится исследование различных методов оценивания параметров модели дисперсии агрегированной переменной. Рассматриваются свойства оценок параметров. Оценивается прогнозирующая способность методов. Качество прогноза оценивается по критерию средне-квадратической ошибки прогноза, для которого получено аналитические выражения с учетом особенностей модели дисперсии агрегированной переменной.
Третья глава посвящена выбору критерия селекции для идентификации структуры модели дисперсии агрегированной переменной и его исследованию. Предлагается метод и алгоритм идентификации сложного объекта управления по модели дисперсии агрегированной переменной. Рассматривается применение предлагаемого метода идентификации к задаче оценки квадрата расстояния между центрами распределения данных и проводится его сравнение с классическим методом оценки такого расстояния.
В четвертой главе рассматривается применение разработанного метода идентификации сложного объекта управления по модели дисперсии агрегированной переменной для следующих объектов управления: процесс подготовки спортсменов и мониторинг потребительских цен в экономике.
В заключении сформулированы выносимые на защиту результаты диссертационной работы и возможные направления дальнейших исследований.
Регрессионные модели квазистационарных объектов управления с агрегированным выходом
Формализация функционирования объекта управления является важной задачей теории управления. Одним из эффективных методов построения модели сложного объекта на основании наблюдений является идентификация. Теории и методам идентификации посвящено большое число работ как в отечественной, так и в зарубежной литературе. В качестве примера можно привести работы Вапника ВН., Ивахненко А.Г., Рай-бмана Н.С., Расстригина Л.Л., Эйкхоффа П., Акаике X. [10, 22-29, 46, 48, 49,71].
Разрабатываемые подходы в значительной степени определяются задачами управления сложными объектами в различных областях науки и техники, в том числе, в биологии, медицине и экономике. Согласно Ивахненко А.Г. [22-29] объекты такого класса характеризуются следующими свойствами: наличием большого числа составляющих элементов и связей между ними, слабоструктурированностью, наличием количественных и качественных характеристик; отсутствием полной информации о внешней среде и о связях между параметрами; наличием ошибок в полученных данных; необходимостью использования множества моделей и языков для своего описания.
Часто для такого класса объектов не возможно определить точную модель функционирования. В этом случае строится приближенная модель, которая аппроксимирует истинную зависимость. При этом задача идентификации состоит в выборе моделей из имеющихся классов на основе экспериментальных данных, априорной информации и цели моделирования.
Всю информацию об объекте можно разделить на две части: априорную и апостериорную. Априорная информация - это информация, которая имеется до начала процесса идентификации и должна содержать в себе структуру идентифицируемого объекта и сведения о классе моделей, описывающих данный объект. К апостериорной информации относятся результаты наблюдений входов и выходов объекта. В зависимости от априорной информации об объекте управления различают задачи идентификации в узком и широком смысле [10]. Задача идентификации в узком смысле состоит в оценивании параметров объекта по наблюдениям над входными и выходными переменными, описывающими состояние объекта. При этом известна структура объекта и задан класс моделей, к которым относится данный объект. Идентификация в широком смысле включает в себя решение таких задач, как оценка структуры и параметров модели, степени стационарности и возможности представления конкретного объекта стационарной моделью, степени линейности и возможности использования линейной модели; выбор информативных входных переменных; оценка степени идентичности модели реальному объекту. В данной диссертации рассматривается идентификация в широком смысле. Все переменные, описывающие объект, в работе разделены на следующие группы: 1) вектор входных переменных х = (г,,х2,..., ,), где -общее число входных переменных. Значения этих переменных можно точно вычислить, измерить, предсказать, а так же задать в эксперименте; 2) вектор неуправляемых и неконтролируемых переменных с. Этот вектор задает неоднородность исследуемого процесса. В этот вектор входят возмущающие воздействия, которые носят случайный характер и не поддаются непосредственному измерению; 3) вектор выходных переменных у = ( 1, 2,..., ,)) гДе У, - случайные величины, имеющие условное математическое ожидание M i\xt} и условную дисперсию о{у,д:(}, /--число выходных переменных. Здесь Л/{}-оператор математического ожидания и D{ }- дисперсионно-ковариационный оператор; 4) вектор латентных переменных v = (vt,v2,...,vrl)J, где v, -некоторая непосредственно не наблюдаемая характеристика, которая может быть получена с помощью определенных математических методов из выходных переменных. Переменные v могут рассматриваться как переменные, полученные в процессе преобразования вектора выходных переменных у, и в этом случае их можно называть агрегированными переменными [1, 2, 18, 19, 21, 39,40,62,77-79,91]. Выбор переменных, описывающих объект, и построение модели зависимости между ними определяется конкретными условиями исследуемого процесса, возможностью оперативного измерения, надежностью и доступностью информации. Так на рисунке 1.1 изображено возможное расположение экспериментальных данных. Здесь объект управления ха 11 рактеризуется одной входной и одной выходной переменными. Черными точками изображены средние значения выходной переменной, двойные стрелки обозначают разброс наблюдений относительно среднего значения.
Распределение максимального собственного числа выборочной ковариационной матрицы
Во второй главе проводится исследование свойств метода наименьших квадратов, взвешенного метода наименьших квадратов и метода наименьших отношений при оценивание параметров модели дисперсии агрегированной переменной. Исследуются свойства оценок параметров, такие как несмещенность и минимум дисперсии. Качество прогноза оценивается по критерию среднеквадратической ошибки прогноза, полученного с учетом особенностей модели дисперсии агрегированной переменной.
Параметрическая идентификация модели дисперсии агрегированной переменной требует выбора и исследования свойства метода оценивания параметров. Известно, что во многом свойства оценок параметров зависят от характера распределения как входных и выходных переменных, так и случайных составляющих [1-4, 7, 20, 32, 33, 70]. Поскольку для модели (1.14) нарушаются основные предпосылки классического регрессионного анализа [4], для анализа свойств метода оценивания параметров требуется определить функцию плотности распределения выходной переменной (в модели (1.14) - максимальное собственное число выборочной ковариационной матрицы (1.7)). Так как элементы матрицы (1.5) имеют нормальное распределение, то матрица (1.7) имеет плотность распределения Уишатра с параметрами \v(l,n). Согласно Т. Андерсену [8] плотность совместного распределение pdffa, Лг) характеристических корней уравнения (1.7), удовлетворяющих условию А, Л ... Лг 0 есть Пусть теперь матрица Y(x,) имеет размер JVxl. Тогда ковариационная матрица D{Y(XI)} имеет размерность їх]. В этом случае оценка максимального собственного числа вычисляется как где - элемент матрицы Y(s() И у- среднее значение. Анализ выражений (2.3) и (2.4) показывает, что полученные оценки представляют собой оценки дисперсии рассматриваемых параметров. Поэтому, учитывая тот факт, что дисперсия обычно распределена по закону Z2 с у степенями свободы, функцию плотности распределения вида (2.2) можно аппроксимировать функцией плотности распределения х1 Пирсона вида (1.2). Пусть случайная величина Лтт эквивалентна некоторой случайной величине, распределенной по закону х1 с дисперсией т, и числом степеней свободы /: Лтм гхХг(у)- С помощью вычислительного эксперимента покажем возможность аппроксимации функции плотности распределения максимального собственного числа распределением хи-квадрат с у степенями свободы. Под вычислительным экспериментом в данной работе понимается проведение имитационного моделирования на ЭВМ, осуществляемое методом Монте-Карло [6, 38, 41, 56, 63]. При этом используется следующая схема вычислительного эксперимента. Генерируется матрица размером rxN, элементы которой имеют нормальный закон распределения с параметрами 7V(0,o,). На основе этой матрицы вычисляется оценка матрицы ковариаций (1.7), для которой определяется максимальное собственное число матрицы. Такая процедура повторяется 10000. Для полученного вариационного ряда значений максимального собственного числа с использованием стандартных функций пакета MATLAB строится гистограмма и подбирается функция плотности распределения х1 Качество подбора функции проверяется по критерию хг [33, 36] на уровне значимости а31ШЧ. Вычислительный эксперимент осуществлялся с использованием ЭВМ типа IBM PC Pcntium-120, при этом были заданы следующие параметры:. Гистограмма полученного вариационного ряда и теоретическая кривая для аппроксимации функции плотности распределения максимального собственного числа вида (2,2) приведены на рисунке 2.1. Пунктирной линией изображена подобранная функция плотности распределения случайной величины crtx2(y). Для проверки соответствия полученного вариационного ряда распределению хи-квадрат была проверена нулевая гипотеза о том, что в основе выборки лежит распределение %г ПРИ альтернативной гипотезе -выборка принадлежит к неизвестному распределению. Так, на уровне значимости aVHI4 = 0.05 расчетное значение критерия хи-квадрат равно 2.27 при критическом значении критерия 32.36. Поскольку расчетное значение для критерия на заданном уровне значимости меньше критического значения, то можно считать, что в основе выборки лежит распределение хи-квадрат. Таким образом, доказано, что распределение максимального собственного числа матрица (1.7) можно аппроксимировать распределением хи-квадрат Пирсона.
Критерии скользящего контроля в задаче идентификации структуры модели дисперсии агрегированной переменной
Сущность предлагаемого метода заключается в том, что для идентификации сложного объекта управления по модели дисперсии агрегированной переменной предлагается из имеющейся статистической информации об объекте исследования сформировать панели данных, используя априорную информацию о возможных значениях входных и выходных переменных, назначить класс моделей, с помощью которого можно описать зависимость дисперсии агрегированной переменной от входных, построить область возможных значений параметров старшей модели и выполнить серию вычислительных экспериментов в полученной области. Результаты этих экспериментов позволят выбрать метод оценивания параметров и критерий структурной идентификации модели, обладающие наилучшей прогнозирующей способностью.
Метод идентификации состоит из несколько этапов. На первом этапе вводится статистическая и априорная информация об объекте управления и формируются панели данных так, как это описано в параграфе 1.2. На втором этапе по исходной статистической информации проверяются основные предпосылки рассматриваемого метода: 1) отсутствие сильной мультиколлинеарности для вектор х,; 2) нормальность распределения каждого вектора $,{%,) каждой панели данных.
Выполнение первой предпосылки необходимо для корректного использования таких методов оценивания параметров, как метод наименьших квадратов, взвешенный метод наименьших квадратов и метод наименьших отношений. Вторая предпосылка утверждает, что совместное распределение собственных чисел матрицы оценок ковариаций D{Y(X,)} имеет распределение Уишарта и, следовательно максимальное собственное число может быть аппроксимировано %2 распределением. Если хотя бы одна из предпосылок не выполняется, то необходимо, используя соответствующие приемы, преобразовать исходные данные.
На третьем этапе для каждой панели данных оценивается матрица ковариаций (1.2.3) и определяется ее максимальное собственное число. Используя технику бутстреп - метода [72, 97], определяется количество степеней свободы х1 распределения каждого максимального собственного числа Лтіі (к,). Техника бутстреп - метода заключается в том, что в исходной матрице Y(Xj) случайным образом исключается несколько строк и на основе оставшихся вычисляется ковариационная матрица, для которой оценивается максимальное собственное число. Такая процедура повторяется многократно. В результате получают выборку, элементами которой являются максимальные собственные числа. После этого производится ап 70 проксимация распределения максимального собственного числа распределением х2 и определяются параметры полученного распределения. Вычисляется среднее значение количества степеней свободы. На четвертом этапе назначается класс линейных по параметрам моделей, при помощи которых можно описать зависимость максимального собственного числа от вектора х, причем количество наблюдений (число панелей) должно быть больше числа оцениваемых параметров старшей модели назначенного класса. На пятом этапе для старшей модели класса строится область возможных значений параметров. На шестом этапе с использованием бутстреп - метода проводится вычислительный эксперимент по выбору метода оценивания параметров моделей назначенного класса, обладающего на области возможных параметров наилучшей прогнозирующей способностью. На седьмом этапе проводится вычислительный эксперимент по определению критерия селекции моделей, использование которого также позволит в заданной области ограничений параметров получить модель, обладающую наилучшей прогнозирующей способностью. На последнем этапе, используя выбранный метод оценивания параметров и критерий селекции моделей идентифицируются параметры и структура искомой модели. На основе предложенного метода был разработан алгоритм, структурная схема которого представлена на рисунке 3.1. Алгоритм метода идентификации включает следующие блоки.
Программное управление процессом подготовки спортсменов
В настоящей главе рассматривается применение метода идентификации к задаче программного управления процессом подготовки спортсменов и технического анализа потребительских цен в экономике. Для каждого примера анализируются экспериментальные данные и показывается необходимость применения метода. По экспериментальным данным строятся прогнозирующие модели. Даются рекомендации по использованию метода.
Примером использования метода идентификации сложного объекта управления по модели дисперсии агрегированной переменной является построение модели процесса подготовки спортсменов или программного управления процессом подготовки. В ходе тренировок одной группы спортсменов происходит сравнение антропометрических данных этих спортсменов с данными моделей (тестирование). Целью тренировки является достижение минимального разброса между данными спортсменов и моделей для всех спортсменов одной группы. С другой стороны, идентификация зависимости разброса данных от времени позволяет тренеру определить, каким образом влияет выбранная схема тренировок на результаты спортсменов и принять решение об эффективности тренировочного процесса.
Экспериментальные данные о тренировочном процессе предоставлены фитнес клубом, г. Радом. В тренировочном процессе участвовало 15 спортсменов, для каждого из которых имелись модельные антропометрические данные. Один раз в месяц, в течении шести месяцев, каждый спортсмен проходил тестирование, т.е. измерялись следующие антропометрические показатели; возраст (у,), рост (уД вес (уД длина ног (уД объем шеи (уД объем грудной клетки (уД объем плеча (у7), объем предплечья (уД объем талии ( -,), объем таза (yi0), объем бедра (уп), объем голени
В этом случае входной вектор характеризуется только одной переменной - время - t, / = 1,2,...,6. В качестве компонент вектора выходных переменных будем использовать переменные у, -у]г. Для каждого момента времени панели данных были сформированы следующим образом: столбцы соответствовали выходным переменным у,-уп, первые пятнадцать строк — данным моделей, а вторые пятнадцать — данным спортсменам. В таблице 4.1 приведен фрагмент матрицы, соответствующий первому контрольному моменту. Путем нормирования все исходные данные были сведены к единому масштабу, и как в предыдущем параграфе для каждой панели данных был проведен компонентный анализ. На рисунке 4.1 приведены результаты этого анализа. Очевидно, что с течением времени разница между значениями показателей моделей и спортсменов уменьшается, таким образом, можно утверждать, что разброс данных уменьшается и что это свидетельствует об эффективности тренировочного процесса. Поэтому программное управление тренировочным процессом можно осуществлять, используя разработанный в диссертации метод. В качестве показателя эффективности процесса тренировок будем использовать максимальное собственное число матрицы ковариаций, оцененной по панели Y(r(), / = 1,2 б. Для каждой панели данных были оценены ковариационные матрицы и на их основе вычислены максимальные собственные числа, В таблице 4.2 приведены значения максимальных собственных чисел для каждой панели исходных данных. где ог0,ог, и UT2 - неизвестные параметры, требующие определения. Согласно алгоритму метода идентификации для старшей модели была определена область возможных значений параметров, в которой были проведены вычислительные эксперименты с целью выбора метода оценивания параметров и критерия селекции моделей. Оценки параметров моделей множества, полученные методом наименьших отношений, и вычисленные для каждой модели значения критерия селекции 7Ж2 приведены в таблице 4.3.