Содержание к диссертации
Введение
Глава 1. Анализ известных подходов к управлению сложным социальным объектом в условиях начальной неопределенности 11
1.1. Основные характеристики, определяющие специфику управления сложными социальными объектами 11
1.2. Постановка задачи обучения 20
1.3. Анализ применения фрактальной размерности в качестве характеристики нестабильности системы управления состоянием
сложного социального объекта 31
1.4. Выводы и задачи исследования 37
Глава2. Разработка системы управления социальными объектами не требующей описания модели изменения состояния в явном виде 39
2.1. Основные свойства и предположения, определяющие характеристики состояния объекта управления 39
2.2. Экспериментальное исследование поведения объекта управления в условиях начальной неопределенности 51
2.3. Метод оценки попадания состояния объекта в целевую область на основе вычисления фрактальной размерности странного аттрактора по временным рядам наблюдений состояния обучаемого объекта 60
2.4. Выводы к главе 2 71
Глава 3. Алгоритм управления состоянием обучаемого социального объекта в условиях начальной неопределенности 73
3.1. Разработка алгоритма обучения с заданным количеством измерений состояния объекта и его вероятностный анализ 73
3.2. Анализ асимптотического поведения алгоритма обучения 84
3.3. Реализация алгоритма обучения 91
3.4. Выводы к главе 3 104
Заключение 106
Литература 108
- Основные характеристики, определяющие специфику управления сложными социальными объектами
- Основные свойства и предположения, определяющие характеристики состояния объекта управления
- Метод оценки попадания состояния объекта в целевую область на основе вычисления фрактальной размерности странного аттрактора по временным рядам наблюдений состояния обучаемого объекта
- Разработка алгоритма обучения с заданным количеством измерений состояния объекта и его вероятностный анализ
Введение к работе
Актуальность работы. Методы современной теории управления имеют широкое практическое применение в различных сферах человеческой деятельности. В частности, процессы обучения некоторых социальных групп работников можно рассматривать как процессы управления достижением требуемого уровня квалификационного состояния. Особое значение управление качеством обучения приобретает при подготовке персонала, обслуживающего потенциально опасные объекты, например, предприятия химической промышленности, военные объекты и т. п. В этих случаях, как правило, объем информации, подлежащий усвоению, заранее определен и рассматривается как дискретное управляющее воздействие, распределенное во времени. Важно организовать процесс управления качеством обучения таким образом, чтобы иметь гарантию того, что по результатам обучения квалификационное состояние объекта управления (обучаемого) будет удовлетворять заданным критериям качества обучения. Известные методы решения задач управления социальными объектами, представленные в работах таких авторов как Аткинсон Р., Буш Р., Брайсон А., Дейч А. М., Евтушенко Ю. Г., Са-ридис Дж., Куржанский А. Б., Леондес К. Т., Растригин Л. А., Тихомиров В. М, Чаки Ф., Эренштейн М. X. и др., требуют формализованной модели объекта управления в виде нелинейной системы дифференциальных уравнений с каким-либо образом введенной стохастичностью. Основным недостатком такого подхода является принципиальная невозможность построения адекватной модели обучаемого человека. Следовательно, актуальной является задача исследования подходов к построению алгоритмов управления, не требующих описания модели в явном виде, а использующих временные ряды наблюдений состояния объекта управления.
Для построения алгоритма управления социальными объектами (на примере обучения) по измеряемым значениям временных рядов квалификационных состояний обучаемого (объекта управления) требуется определить
5 условия возникновения хаотического поведения, которое нелинейная динамическая система обнаруживает при некоторых значениях параметров и которое характеризуется в фазовом пространстве областью, называемой странным аттрактором. Для управления сложной системой важно, оценить размерность области странных аттракторов и тем самым оценить допустимую область управляемости,
Диссертационная работа выполнена в соответствии с научным направлением кафедры ПМиЭММ «Разработка математических моделей, методов и информационных технологий в технических и экономических системах перерабатывающей промышленности» (№ г.р. 01200003664).
Целью работы является исследование и разработка алгоритма управления качеством обучения на основе методов качественного анализа поведения нелинейной системы, обеспечивающего контроль и достижение целевых квалификационных состояний.
В соответствие с поставленной целью в работе решались следующие основные задачи: анализ рассматриваемых в теории управления известных подходов к оценке динамики состояния обучаемого и управлению этим состоянием; обоснование понятия состояния обучаемого социального объекта и желаемой окрестности состояния в конце процесса обучения для класса объектов с начальной неопределенностью; экспериментальное исследование поведения объекта управления под влиянием управляющего воздействия в условиях стохастических начальных условий; разработка метода оценки попадания состояния объекта в целевую область на основе вычисления фрактальной размерности странного аттрактора по временным рядам наблюдений состояния обучаемого; разработка алгоритма управления состоянием обучаемого, учитывающего выделенные особенности постановки задачи управления сложными социальными объектами; апробация разработанного алгоритма, реализованного в программно-методическом комплексе, учитывающем специфику отдельных классов задач и особенности применяемых на практике критериев качества.
Методы исследования. Для решения поставленных задач в работе использованы методы теории управления, качественной теории нелинейных динамических систем, теории фракталов. Для обработки полученных результатов использованы методы математической статистики.
Научная новизна. В диссертации получены следующие результаты, характеризующиеся научной новизной.
Количественные характеристики состояния объекта управления (обучаемого), основанные на вычислении уровня незнания в фиксированные моменты времени, отличающиеся от оценок Л. А. Растригина учетом взаимосвязи выдаваемых порций информации.
Метод контроля попадания состояния объекта управления в целевую область, основанный на вычислении фрактальной размерности странного аттрактора.
3. Алгоритм управления динамикой изменения состояний класса сложных социальных объектов (на примере обучения), основанный на анали зе временных рядов наблюдений, не использующий математической модели динамики состояния в явном виде.
Практическая ценность. В результате проведенных исследований разработана система управления, реализованная в программно-методическом комплексе, которая может быть использована для подготовки различных категорий работников. Научные результаты, полученные в диссертации, использовались для оценки параметров функционирования алгоритма управления при создании программного обеспечения для организации обучения специалистов, обслуживающих потенциально опасные объекты (химическая
7 промышленность, военные объекты). Разработанный в диссертационной работе алгоритм управления обеспечивает использование существующих методик обучения и одновременно независимость от ряда случайных факторов, позволяющую получить требуемый уровень подготовки специалистов, что становится особенно важным при работе на аварийно-опасных предприятиях. Основные результаты диссертационных исследований использованы для обучения специалистов на ОАО «Воронежсинтезкаучук» и внедрены в учебный процесс Воронежского ВАИИ.
Апробация работы Основные положения работы докладывались и обсуждались на научных семинарах кафедры ПМиЭММ, кафедры математики ВВАИИ 1999 - 2004гг.; всероссийской научно- практической конференции «Совершенствование наземного обеспечения авиации» (Воронеж, 2003г.), на межвузовских научных конференциях в Воронежском ВАИИ, IV всероссийской научно-практической конференции в Воронежском институте МВД России 2003г.; международной школе «Современные проблемы механики и прикладной математики» (ВГУ, ВГТА, май 2004г).
Публикации. По теме диссертационной работы опубликовано 8 печатных работ, 2 электронных учебных пособия.
Личное участие автора в работах, опубликованных в соавторстве и использованных для написания диссертации, заключается в получении экспериментальных результатов, их статистической обработке и обобщении, разработке алгоритма управления для выделенного класса объектов.
Структура и объем работы. Работа состоит из введения, трех глав, заключения, списка использованной литературы и приложения. Диссертационная работа изложена на 124 страницах машинописного текста, включает 19 рисунков, 8 таблиц и 3 приложения. Список использованных источников составляет 110 наименований.
КРАТКОЕ ИЗЛОЖЕНИЕ ДИССЕРТАЦИИ
Во введении обосновывается актуальность темы диссертационного исследования, определяются цель, задачи и методы исследования, показана научная новизна и практическая значимость работы, представлена структура диссертации. - В первой главе представлены рассматриваемые в теории управления известные подходы к оценке динамики изменения состояния обучаемого и управлению этим состоянием, рассмотрены требования к организации процесса обучения как управления состоянием обучаемого, определено понятие состояния обучаемого социального объекта. Выделены особенности, которые появляются при формализации обучения как процесса управления состоянием обучаемого при переходе из некоторого начального состояния в заранее заданное конечное состояние под влиянием последовательности управляющих воздействий. Указаны характеристики состояния обучаемого, которое описывается вектором вероятности незнания каждого элемента обучающей информации. На основе проведенного анализа обосновано понятие состояния обучающегося объекта и желаемой окрестности состояния по итогам обучения, определены цель и задачи исследования и указаны способы решения поставленных задач
Вторая глава посвящена разработке системы управления социальным объектом (на примере обучения), учитывающей следующие особенности: невозможность точной математической формализации структуры объекта, неопределенность начальных условий. Записаны характеристики состояния объекта управления для случая взаимосвязанных порций информации. Указаны формулы для вычисления индивидуальных характеристик обучаемого. Проведен анализ динамики изменения состояния объекта при условии неопределенности начального состояния и непрерывно изменяющихся во времени свойств самого объекта. На основе численных экспериментов сделан вывод о том, что в пространстве состояний существует некоторая область, внутри ко-
9 торой траектории состояния объекта управления (обучаемого) блуждают явно нерегулярным образом, но за пределы которой, не выходят. Сделано предположение о том, что данная область является странным аттрактором. Исходной основой для обоснования такого предположения являются качественные признаки существования детерминированного хаоса. Обоснованы гипотезы, позволившие применить методы нелинейной динамики для исследования динамики изменения состояния объекта под влиянием дискретных управляющих воздействий. На основе использования метода вычисления фрактальной размерности по временным рядам наблюдений разработан метод оценки попадания состояния объекта в целевую область. С помощью данного метода вычислена фрактальная размерность аттрактора, размерность фазового пространства, в которое вложен аттрактор, которая и позволила оценить количество компонент функции качества, задействованных в изменении состояния объекта, т. е. количество переменных отвечающих за изменение состояния системы на аттракторе.
В третьей главе разработан и исследован алгоритм управления достижением целевого квалификационного состояния объекта управления, рассмотрены вопросы разработки и апробации программных средств на базе представленного алгоритма. На основе исследования процесса обучения получена оценка максимальной длительности обучения, которую можно использовать для прогнозирования параметров процесса обучения для каждого обучаемого. Приведены результаты апробации данного алгоритма при решении задачи обучения специалистов, работающих на потенциально опасных объектах химической и военной промышленности. Проведено сравнение результатов, полученных с помощью предложенного алгоритма обучения и традиционных методик обучения. По результатам апробации отмечается тот факт, что указанный алгоритм управления достижением желаемого уровня квалификационного состояния позволяет уменьшить влияние внешних факторов на результат обучения, что особенно важно при подготовке специалистов для работы на потенциально опасных объектах, и позволяет улучшить
10 качество обучения в 1,5 раза при уменьшении времени, потраченного на обучение.
Заключение содержит оценку вклада автора в проведенные в диссертации исследования и значимости полученных результатов.
Основные характеристики, определяющие специфику управления сложными социальными объектами
Теория методов анализа и синтеза систем управления получила широкое развитие в начале 50-х годов с появлением разнообразных прикладных задач, которые привлекли внимание математиков, физиков и инженеров, в том числе Р. Беллмана, Л. С. Понтрягина, А. Стабберуда, Р. Калмана, А. М. Летова, А. М. Вышнеградского и др. Общие методы анализа и синтеза линейных систем с постоянными и переменными параметрами изложены в работах [25, 27, 28, 64, 80, 89] Одной из наиболее сложных проблем современной теории управления является управление нелинейными системами. Можно отметить большое количество работ, посвященных данной тематике [13, 22, 24, 28, 40, 44 ,46 ,66 ,70 ,72 ,79 ,80 ,89 ,96]. Проблематикой управления нелинейными системами занимались многие ученые Алексеев В. М., Тихомиров В. М., Брайсон А., Габасов Р., Куржанский А. Б., Растригин Л. А. и многие другие. Несмотря на это, следует отметить, что универсальных методов синтеза не существует, все полученные результаты, так или иначе, носят локальный характер. Тем не менее, разработанные методы можно успешно применять для решения ряда прикладных задач, таких, например, как задача обучения. Идея применения управления для решения социальных задач возникла на стыке двух направлений в теории обучения: психологические исследования (полученные эмпирические данные выражаются в виде уравнений, которые, не опираясь на теорию, лишь интерпретируют имеющиеся данные) и математические методы (построение моделей и оценок процесса обучения на основе анализа самого процесса). Начиная с 70-х годов, методы теории и практики управления стали активно применяться для создания эффективного управления социальными процессами. Идеология применения методов теории и практики управления в социальной сфере, принадлежит Л. А. Растри-гину, так как: «феномен управления имеет всеобщий характер, и применим к широкому кругу процессов целенаправленной деятельности человека, таких, как проектирование, моделирование и познание, обучение, лечение и даже воспитание». В [71] задача обучения естественным образом формулируется как задача управления, т. е. взаимоотношения ученика и учителя естественно интерпретируются как отношения объекта управления и управляющего устройства, реализующего заданный алгоритм управления в соответствии с целью управления (рис. 1.1).
Объект управления рассматривается как сколь угодно сложная система, преобразующая входные управляющие воздействия U(t) в выходные сигна 13 лы (траектории) X{t), характеризующие состояние объекта управления в момент времени t. Очевидно, что реальный объект управления может иметь множество входов и выходов, определяющих его функциональное взаимодействие с внешней средой (рис. 1.2).
Предполагается, что на объект действуют возмущения %{t\ изменяющие, как правило, в непредсказуемом направлении характеристики объекта управлении и все функции времени, изображенные на рис. 1.2, являются вектор-функциями с вещественными компонентами и заданными размерностями Так как человек как объект управления является сложным объектом, то к нему применимы все принципы управления сложными объектами. В работе [72] этапы управления сложным объектом интерпретируются как этапы обучения, таких этапов семь (рис. 1.3).
При определении стратегии управления необходимо наличие математической модели, описывающей объект управления. Обычно модель объекта управления получают как математическую формулировку законов физики, механики и др., которым подчинена работа объекта. Однако выделяются такие системы, для которых принципиально невозможно построить модели чисто математическим путем [76]. Примерами таких систем может служить коллектив людей или отдельный человек, выполняющий определенные функции: проектирование, моделирование, познание, лечение, воспитание и т. п. Такие объекты относятся к сложным объектам управления и обладают классом характерных особенностей.
Одной из основных проблем применения теории и методов управления в социальной сфере являются сформулированные в работах [66, 70, 80, 5, 98] особенности человека как объекта управления: 1. Стохастичность; тенденция человека вести себя неожиданным образом, обусловленная влиянием ряда психологических факторов 2. Нелинейность: в некоторых задачах поведение объекта может являться линейным, в то же время большое число данных показывает, что в большинстве задач поведение объекта нелинейно. 3. Зависимость от времени: зависимость характеристик объекта управления от времени, которая проявляется в том, что: во-первых, его характеристики изменяются со временем по той причине, что человек обучается; во-вторых, он может реагировать на изменение параметров окружающей среды и соответственно изменять свои характеристики. 4. Детерминированность на малом промежутке времени: вообще говоря, человек является недетерминистской системой, поскольку его характеристики изменяются от опыта к опыту. Однако его изменчивость мала в ситуациях, когда время обучения достаточно и когда решаются одноуровневые задачи.
Основные свойства и предположения, определяющие характеристики состояния объекта управления
Известно, что на практике часто встречаются сложные системы, для которых прогнозирование параметров их функционирования представляется исключительно сложным, а иногда и невозможным из-за большого объема необходимой информации. К таким системам, безусловно, относятся системы управления социальными объектами (например: система обучения), в силу сложности, многообразия и непредсказуемости факторов влияющих на процесс управления. Кроме того, поведение системы управления сложным социальным объектом всегда носит случайный характер, В современной теории динамических систем этому поведению соответствует состояния хаоса, самоорганизованной критичности, бифуркации [5, 18, 32, 45, 82, 83]. Существует много определения хаоса, сформулированных Девани, Дж. Бэнксом, Д. Гуликом, С. Кнудсеном, однако общим в этих определениях является одно - основополагающей чертой хаоса является существенная зависимость от начальных условий, т. е. наблюдаемые в состоянии хаоса флуктуации только кажутся случайными - их значения полностью предопределены входными параметрами. Еще в 1912г. в своем учебнике «Исчисление вероятностей» А. Пуанкаре отмечал связь неустойчивости и случайности: «Очень малые причины, которые от нас ускользают, вызывают значительные эффекты, которые мы не можем предвидеть, и тогда мы говорим об этом эффекте, как о случайности. Если бы мы точно знали законы природы и положение мира в начальный момент, то мы могли бы предсказать точно положение мира в любой последующий момент». Действительно, на практике мы никогда не располагаем абсолютно точной информацией о начальных условиях из-за ошибок, которые есть всегда при их измерении, причем эта погрешность распространяется практически на все системы, описывающие изменение динамически меняющихся объектов. Критической задачей для исследования функционирования нелинейных динамических систем является задача прогнозирования. Причиной этого является нелинейность и локальная неустойчивость динамики. То, что эти свойства приводят к потере предсказуемости, было давно замечено при исследовании нелинейных систем. Так как в хаотических системах малая начальная неопределенность растет по времени экспоненциально, то это препятствует долгосрочному прогнозу. Тем не менее, решение задачи прогнозирования возможно благодаря результатам исследований А. Колмогорова, Н. Крылова, А. Самарского, Ю. Данилова, Г. Заславского, С Курдюмова, Я. Синая, Ю. Неймарка, А. Филатова, Э. Лоренца, С. Воронина, Ф. Такенса, Р. Са-гдеева, Ю. Климонтовича, Г. Шустера и многих др.
С открытием в 1970-х годах Э, Лоренцем странных аттракторов при изучении простых автономных динамических систем появилась возможность моделирования случайного поведения динамических систем без использования стохастических моделей [88]. Более того, в работе [44] отмечается, что хаотическое поведение имеет сходные закономерности в вариациях в различных временных масштабах, как фракталы в различных пространственных масштабах. У фракталов, к которым близки, как показано [44], характерные для сложных систем распределения, неопределенность тоже растет, но медленнее - по степенному закону, а не по экспоненциальному. Говорят [45], что фрактальные структуры эволюционируют на грани хаоса, а поведение им соответствующих структур является результатом самоорганизованной критичности и является детерминированным хаосом. В детерминированном хаосе, что очень важно, возможно долгосрочное прогнозирование. В полностью хаотических системах прогнозирование возможно в интервале времени, зависящем от К-энтропии Колмогорова [18]: Получение системных показателей характера поведения сложных динамических систем на основе изучения фрактальных размерностей рассматривается во многих работах [23, 44, 45» 52, 91] и др. Это связано с поведением динамических систем со странными аттракторами» которые порождают хаотическое и по существу случайное поведение даже хорошо определенной детерминистической модели. При этом во многих случаях такой аттрактор является глобальным, и движение такой динамической системы состоит их двух тактов [18]: «1) движение к аттрактору, 2) движение на аттракторе. Как правила, размерность аттрактора меньше размерности фазового пространства, которое, например, для уравнений в частных производных бесконечномерно. Благодаря первому «такту» (притяжению) система сваливается на аттрактор, который представляет собой конечномерное пространство в фазовом пространстве системы, и вся ее дальнейшая жизнь проходит на нем». В соответствии с этим, многие сложные системы никогда не достигают равновесия и эволюционируют, естественным образом переходя из одного мета-стабильного состояния к другому, к критическому состоянию, когда малое возмущение может вызвать реакцию, влияющую на любое число элементов системы и приводящую к последствиям, аналогичным большим воздействиям на систему. Известно, что для полного качественного описания динамики системы на аттракторе требуется количество переменных порядка величины размерности аттрактора. В этом случае характеристикой нестабильности функционирования системы является фрактальная размерность аттрактора, которая может использоваться при определении количественных характеристик нестабильности, указывая на возможность перехода системы в состояние детерминированного хаоса.
Метод оценки попадания состояния объекта в целевую область на основе вычисления фрактальной размерности странного аттрактора по временным рядам наблюдений состояния обучаемого объекта
Практически устойчивость данного невозмущенного движения означает, что при достаточно малых начальных возмущениях э возмущенное движение будет сколь угодно мало отличаться от невозмущенного движения. Если же невозмущенное движение неустойчиво, то возмущенное движение будет отходить от него, как бы малы не были начальные возмущения [55].
Отсюда следует определение предсказуемости решения: устойчивое по Ляпунову решение задачи (2.2.1) назовем предсказуемым, если S3 $, где дл - точность, с которой известны начальные данные, а є - предельно допустимая ошибка в прогнозе траектории, причем все неустойчивые решения будем считать непредсказуемыми. Как уже отмечалось выше, допустимая погрешность $э начальных условий фактически исключает постановку задачи Коши в том виде, в каком она фигурирует в классических теоремах существования и единственности, доказанных в предположении, что начальные значения х0 известны без всякой погрешности. Дело в том, что при о , траектории, выходящие из S3 - окрестности начального состояния, для нас не различимы.
Поэтому задача Коши не имеет прежнего смысла, так как в качестве начального состояния выступает уже не точка, а некоторая область начальных точек. Еще в 1912г. в работах А. Пуанкаре отмечается следующая общая и чрезвычайно важная идея, что стохастичность вызывается неустойчивостью динамики. Причем особо им была выделена существенная зависимость от начальных условий, «когда малая ошибка в первых влечет огромную ошибку в последних» [78].
Строгая формулировка данного условия такова. Пусть хеХ, a G - открытое множество, содержащее х. Отображение р обладает существенной зависимостью от начальных условий, если для некоторого д 0 существует такое целое число п 0 и такая точка у є С?, что d[ pn{x), (fy-n {y) Sj (рис 2.8) [45]
Таким образом, неустойчивость означает, что если мы возьмем две близкие начальные точки, то расстояние между отвечающими им решениями растет экспоненциально по і, В работах Н. С. Крылова сформулирована идея, а в работе Колмогорова [39] изложена математическая теория, объясняющая связь между неустойчивостью и стохастичностью, постулатом которой является, что неустойчивость динамики вызывает стохастичность и непредсказуемость. Известно, что в фазовом пространстве нелинейных динамических уравнений возникают странные аттракторы - притягивающие области, характеризующиеся режимом установившихся непериодических колебаний [18]. Условия возникновения странного аттрактора - сочетание глобального сжатия с локальной неустойчивостью. Режим странного аттрактора реализуется только в диссипативных системах и характеризуется неустойчивостью по Ляпунову, но устойчивостью по Пуассону. Дня обнаружения детерминированного хаоса в динамических системах можно использовать различные методы [5, 18, 30]. Рассмотрим некоторые из них. Во-первых, режим странного аттрактора характеризуется наличием в спектре положительных показателей Ляпунова. О наступлении хаотического режима можно судить по тому, что в сечении Пуанкаре фазового потока возникает облако точек. Кроме того, о выходе системы на хаотический режим можно судить по поведению автокорреляционной функции. Пусть y(t) - наблюдаемый сигнал, тогда автокорреляционная функция имеет вид
Для непрерывного случая корреляционная функция служит мерой корреляции между двумя значениями величины, разделенными временным интервалом г. В хаотическом режиме она быстро (обычно - экспоненциально) убывает. В дискретном случае, если орбита хаотическая, то корреляция отсутствует, т. е. значение функции спадает до нуля [30].
Можно также использовать преобразование Фурье у{со) движения y(t) и рассматривать спектр мощности Р{б))=\у( а){ . Если спектр имеет нерегулярный характер, то это признак того, что y(t) представляет собой хаотическое движение. Можно отслеживать значения управляющего параметра, при которых в динамических системах наступает детерминированный хаос. Можно также вычислить К-энтропию Колмогорова. Если К 0, то это служит признаком хаоса в динамической системе. К-энтропия имеет смысл средней скорости потери информации о поведении динамической системы [23]. Она определяется следующим образом. Рассмотрим в Я" динамическую систему со странным аттрактором, и пусть y(t), t 0 определяет траекторию этой системы на аттракторе, которую мы будем рассматривать в дискретные моменты времени jr,j = 1,..., я; r 0. Разобьем Rn на ячейки с длиной /. Обозначим через /Ц Ля совместную вероятность того, точка у(0) находится в ячейке с номером i 0, точка у(т) в ячейке с номером і і и т.д. Тогда средняя скорость потери информации о поведении динамической системы определяется по формуле метрической энтропии Реньи:
Разработка алгоритма обучения с заданным количеством измерений состояния объекта и его вероятностный анализ
Таким образом, результатом процесса обучения будет являться достигнутое среднее значение уровня незнания и время прохождения обучения, которое для каждого обучаемого определяется индивидуально, но не превышает общий ресурс времени Т, выделенный на обучение.
Тогда цель обучения Z можно Так как порции информации, в общем случае, зависимы, т. е. восприятие каждой следующей порции зависит от восприятия или не восприятия предыдущей. Кроме того, учитывая специфику объекта, мы не можем предполагать, что выдача порции ОИ равносильна знанию объектом этой порции информации, которые выдаются в режиме реального времени независимо от состояния объекта, поэтому задача вычисления необходимого для выполнения неравенства (3.1.12) количества измерений является одним из самых важ 77 ных моментов при разработке алгоритма. Следующей специфической особенностью является то, что вектор состояния х{к) не доступен для использования в управлении, поэтому при разработке системы управления нам не нужна модель динамики изменения состояния объекта. В процессе управления изменяется уровень незнания Q., информация о котором и определяет состояние объекта управления.
На вход объект управления поступают вектор управляющих воздействий U, вектор возмущений, который в нашем случае совпадает с щ, так как обучение начинается после выдачи первой порции ОИ. Алгоритм измерения состояния позволяет выработать вектор реакций R на порцию ОИ, алгоритм идентификации позволяет определить вектор вероятностей незнания Р, на основе которого и осуществляется алгоритм управления, который используется для выработки управляющего воздействия. Схематично алгоритм обучения представлен нарис. 3.2. состоит в следующем: 1. Осуществляется проверка знаний обучаемым порции обучающей информации ик в результате которой образуется множество Кк = ( ,7 ,...,7 ), где rf определяются соотношением (3.1.7). 2. По правилам (3.1.6), (3.1.9) осуществляется адаптация параметров объекта управления (обучаемого). 3. Согласно выражению (3.1.4) с использованием соотношений (3.1.5) -(3.1.6), (3.1.9)-(3.1.10) формируется вектор вероятностей незнания элементов обучающей информации Рк. 4. Согласно выражениям (3.1.10-3.1.11) вычисляются значения Q- и функция качества обучения Q. 5. Если выполнен критерий качества обучения Q т, то к-й сеанс обу чения заканчивается и выдается следующая порция обучающей информации ик+1. Далее выполняются пункты 1-5. В противном случае Q a, тогда если j s , где s - оценка количества переменных функции качества, полученная на основе метода вычисления корреляционной размерности по временным рядам наблюдений, осуществляется повторная выдача порции ОИ ик и для нее повторно выполняются пункты 1-5. Идея организации схемы управления достижения желаемого уровня квалификационного состояния состоит в получении оценки количества измерений, необходимых для достижения необходимого для усвоения следующей информации уровня по окончании каждого сеанса обучения. (о)
И, Данная оценка не использует модель изменения состояния объекта управления, которая может не совсем точно отражать реальное состояние объекта, в силу многообразия и случайности факторов, влияющих на его поведение, а только реальные наблюдения (временные ряды), полученные на основе экспериментальных данных. Тогда, чем точнее оценка s , тем ближе синтезированная система по своим свойствам к оптимальной системе при полной информации о состоянии. Структура такой системы изображена на рис. 3.3,