Содержание к диссертации
Введение
Глава I. Оптимальные процедуры ошена информации при неполной информированности о целевой функции и множестве выборов нижнего уровня 13
I. Теоретико-игровая модель ИСУ 14
2. Возможные процедуры принятия решений 16
3. Построение оптимальной процедуры обмена информацией в случае конечного множества параметров неопределенности 18
4. Оптимальная процедура обмена информацией ( общий случай ) 25
5. Анализ частных стратегий Центра 36
6. Некоторые обобщения 42
6.1. Учет запрещенных ситуаций при выработке процедуры принятия решений 42
6.2. Оптимальные процедуры принятия решений в ИСУ веерной структуры 45
6.3. Зависимость целевой функции Центра от параметра неопределенности 47
6.4. Другие случаи начальной информированности игроков о параметре неопределенности 50
7. Пример стимулирования максимального производства посредством надбавки 54
Глава 2. Эффективные процедуры 0ш1ена информацией в ису распределением ресурсов веерной структуры ... 58
8. Использование информации о целевой функции Центра для построения оптимальной стратегии обмена информацией ( случай одного исполнителя ) 59
9. Случай нескольких элементов нижнего уровня 62
10. Игровая модель ИСУ распределением ресурсов 68
II. Иллюстративный пример 73
12. Оптимальная процедура обмена информацией 77
13. Структура оптимальных стратегий 84
Глава 3. Использование эффективных информацией при управлении районным аграрным обэдинением 98
14. Цели экономического механизма РАО 98
15 . О стимулировании участников РАО к сообщению точной информации 100
Основные результаты и выводы ИЗ
Литература
- Построение оптимальной процедуры обмена информацией в случае конечного множества параметров неопределенности
- Анализ частных стратегий Центра
- Случай нескольких элементов нижнего уровня
- . О стимулировании участников РАО к сообщению точной информации
Построение оптимальной процедуры обмена информацией в случае конечного множества параметров неопределенности
Множество од содержит некоторое подмножество, определяемое правилом поведения 11 , которое мы назовем множеством рациональных стратегий Исполнителя Sj с S2 . Так как 11 может выбрать стратегик константу зслєЕ(о/о), то он всегда имеет стратегию, гарантирующую ему результат L («( ). Далее предполагаем, что множество од содержит хотя бы одну стратегию, гарантирующую Исполнителю результат U ( dx?) . При применении Центром стратегии S SA максимальный гарантированный выигрыш Ц, есть
В рассматриваемых ниже процедурах обмена информацией под множеством Sz рациональных стратегий Исполнителя понимается множество его осторожных стратегий. Выбирая на каком-то шаге принятия решений управляющий параметр У ( сообщаемая информация, выбор ос2є л2( )и т.д. ), осторожный Исполнитель максимизирует свой гарантированный результат где lyC J - множество возможных с точки зрения 11 совместных выборов (3 ,) при выборе им на данном шаге параметра vj
Ниже будут построены оптимальные процедуры принятия решений, гарантирующие Центру получение результата К(о )с любой наперед заданной точностью, т.е. тогда для любого S - 0 найдется стратегия Центра S Sd , такая, что К ( f,S,) k(oO- для всех А ,
Сначала рассмотрим частный случай конечного множества А , для которого есть простой метод нахождения оптимальных стратегий Центра. В этом случае Центр может, после предварительного обмена информацией о параметре JL , перед выбором Исполнителем точки Хд є ХА(о/в/), сообщить П. точную зависимость своего выбора от ОС эс = (ff(pt) и достичь при этом максимального выигрыша с требуемой точностью.
При бесконечном множестве параметров неопределенности Центр может быть вынужден для получения такого же результата применить л/ многозначную функцию 9С4 є g QXx) оставляя за собой право ее дальнейшей конкретизации после реализации Исполнителем некоторой точки
Есть несколько оптимальных процедур обмена информацией, которые можно описать одной схемой квазиинформационных расширений частного вида. Для конкретизации правила поведения Исполнителя в таких процедурах опишем класс соответствующих им информационных расширений ( подкласс класса квазиинформационных расширений исходной системы ).
Пусть Ф = { X - Aj } - множество всех отображений из Хд в ХА ( множество "чистых" стратегий Центра в игре Г4 ), и задано некоторое множество СЦ . Определим Q2=(q2: Of " A}. Множества Qi и QJL назовем множествами информационных действий Ц и П соответственно. Пусть также определено непустое подмножество множества всех отображений из U A в Ф : S {5 Qi A Ф] . Обозначим в { У-Ф- Хд (?/)}-множество всех отображений из ф в л2С ) ( множество "чистых" стратегий Исполнителя в игре Г2 ). Тогда SL =5 QL х л множество стратегий Центра, S4 — ( чГ - множество стратегий Исполнителя.
Проекция : S4 х $д - Xt X Х л (do ) задается следующим образом: пусть S4= C%V,hs (V У) . 1Чт fytyJ StylA) тогда . ),0: )= у( ( }) и $СМ )в( , 4) В рамках принятой формализации информационные расширения определяются заданием множеств U и i . Множества 0 и Qg характеризуют информационный обмен между игроками: сначала Центр выбирает некоторое Qt L и сообщает его П , в ответ на это Исполнитель сообщает Центру некоторую информацию о параметре неопределенности: cL CL(G J, Семейство отображений 2 определяет свободу выбора для Центра функции УЧ д), которая будет сообщаться Исполнителю после происшедшего обмена информацией о параметре d.
Анализ частных стратегий Центра
В некоторых случаях Центр может, не теряя в выигрыше, использовать более простые стратегии по сравнению с построенными в 3-4.
В работе [15 ] , где впервые были предложены уточняемые стра тегии и найдены некоторые условия, при которых Исполнитель был вынужден сообщать точную информацию, рассматривалась стратегия Центра, состоящая в предварительном сообщении Исполнителю, что для совместной реализации Центр будет предлагать точки из множества D(ow » где cL - информация, которую сообщит Исполнитель. Счи талось, что в этих условиях Исполнитель сообщает такую информацию, которая максимизирует его гарантированный выигрыш, и если сущест вуют такие сообщения cL& А » при которых выигрыш Исполнителя бу дет строго больше максимального гарантированного значения критерия, то именно эти сообщения образуют множество рациональных сообщений информации A(dLq)sJ\. Легко видеть, что максимальный гарантиро ванный выигрыш Исполнителя не зависит от сообщаемой информации и равен L( o) . В самом деле, если Исполнитель сообщает информа цию такую, что то рискует, что ему будет предложена для совместного выбора точка вне множества u(cLo). Если же D(cOsD(o 0 » то Б СИЛУ леммы I максимальный гарантиро ванный выигрыш П. равен U(eLo). Множество рациональных сооб щений информации есть, однако, Д ( 0) = { є А D (cL) S D (cLJ) Л, так как при сообщении любого CLG Д (cLaj Исполнитель получит выигрыш, строго превышающий L Ш.
Предполагая, что множество А не обязательно конечно, рассмотрим информационное расширение, описанное в 3 ( с детерминированными стратегиями наказания ) и стратегию Центра в нем ЗСІ= $$() описана в 3. Таким образом, при введенных предположе ниях о правиле поведения Исполнителя верна следующая теорема: Теорема 4. Для того, чтобы стратегия Si гарантировала Центру для любого cloe А результат К(0- и получение инфор мации ( (fy)=л такой, что необходимо и достаточ но, чтобы для любых выполнялось либо либо (Xs А выполнялось A(dL) {o(.}, т.е П был.вынужден сообщить точную информацию независимо от do , необходимо и достаточно, чтобы для всех Лф /2 выполнялось
Использование особенностей структуры множеств может облегчить построение оптимальных стратегий Центра, даже если считать, что Исполнитель осторожен в обычно понимаемом наїли смысле.
Рассмотрим процедуру обмена информацией, использующую много значные стратегии наказания и описанную в 4. Оказывается, что если для всех то Центр может получить сколь угодно близкий к максимальному результат, сообщая на первом шаге Исполнителю произвольную непрерывную положительную функцию, лишь бы она была равномерно ограничена сверху достаточно малым числом. Берна Теорема 5. Пусть для всех аСфР выполняется либо D )\D(Bj f f , либо D( 0=D(jO. Тогда для любых найдется -0 такое, что при любом х0єА и сообщении Центром на шаге I - 38 произвольной непрерывной функции !A" (P,li), а затем предложении Исполнителю для совместного выбора точки ( 1,3) » доставляющей максимум тал % М4 (Xi,x4) где л - полученная от Исполнителя информация, выигрыш Ц составит не менее K(» J u . При этом для любой осторожной стратегии П j\(G(d,aW), d(ci0)) V.
Доказательство. Достаточно показать, что сообщаемая Исполнителем информация удовлетворяет условию где П ) при . —0. По лемме 3 Q(cl,.W) Р о (коІ)еВ(іо)для любого осторожного сообщения JL S. А . Допустим, что для любого n= найдутся соответствующие функции пО 0 и значения Лп& & к , что Без ограничения общности в результате предельного перехода имеем что противоречит исходному предположению теоремы. Теорема доказана.
Таким образом, в случае_, если не существует таких значений о/іє А , что D(d) JJCji), Центр получает сколь угодно близкий к максимальному результат и достаточно точную информацию при использовании на первом шаге стратегий-констант (oi) = =Cont.
Если А конечно, то в данном случае при достаточно малых Исполнитель будет вынужден сообщить информацию JL такую, что
Однако, такой точности еще не всегда достаточно для того, чтобы Центр мог получить максимальный результат, исполь зуя детерминированные стратегии наказания, даже в случае конечного множества А . Этот факт иллюстрирует схематический рис. I, на котором заштрихованная область соответствует множествам D (оО = D (Уд.) = D ( з) , а на выделенных множествах Rl3 функции М4( / ) достигают значений L (elІ J: функция Ма ( ,., О на К І , функция , функция
Случай нескольких элементов нижнего уровня
Рассмотрим случай, когда множество выборов Центра зависит от выбора Исполнителя эс е Х2 ( /0) и от реализовавшегося значения oi0 параметра сіє.к.
Обоснованием такой постановки может служить, например, материальное стимулирование деятельности экономического предприятия посредством премирования его руководства, когда премиальный фонд руководящих работников зависит от результатов деятельности предприятия ( в конечном счете - от принятых руководством решений ).
Предположим, что после выбора Исполнителем точки ЯаєХ (о(о) Центру становится известным не только выбор ЭСд , но и значение некоторого параметра У-у( о)єУ . Функция У(-) известна Центру и Исполнителю и определяет степень дополнительной ( не зависящей от действий Исполнителя ) информированности Центра о параметре d0 . Если Y=A и для всех Д выполняется У ( L)=cL f то в этом случае Центр узнает истинное значение параметра do , в другом же крайнем случае, когда У («О Const для всех сіє А , Центр никакой дополнительной, независящей от П , информации не получает.
Таким образом, функция У () факторизует множество А , раз бивая его на непересекающиеся классы эквивалентности А(у)={ еАад = у}. Перед выбором своего управления Х1 Центр может идентифициро вать значение параметра L0 с точностью до класса эквивалентное : - 43 соответствующего этому значению, А (?(«()) . Предположим, что множество выборов Ц Х эс У) зависит от реализовавшегося параметра У = 3(оо") и выбора Исполнителя ос.є Хж(о 0) » а Б остальном постановка совпадает с описанной в I. Предполагаем, что функция У С ) непрерывна, отображение Х4(эс У) непрерывно по Хаусдорфу, а множество X4(?ca,V)) при любых Х,_ и У есть непустой компакт.
Введем обозначения, аналогичные ( І.І-І.З ): l! GO = тазе «In МА (У, хХ хА) -, Предполагаем, что выполняется условие ( аналогичное ( 1.4 )), достаточное для правильности системы: D"( )={( xo eXt ОЬ№),Х ЯІМ№ & ifr) ( )); Обозначим E )=Ara шоу mln Мя0А,Хі, А
Данная система имеет много общих свойств с рассмотренной ранее. Аналогично результатам 2 можно показать, что не существует процедуры обмена информацией, гарантирующей Центру получение результата выше , при этом величина L, (cL ,) есть максималь-ный гарантированный результат Исполнителя, а значение U(oio)- максимальны! гарантированный результат U, в условиях полной информированности. Как и ранее, существует процедура обмена информацией, в которой - 44 для любого 5-0 есть стратегия Центра, обеспечивающая ему выигрыш И (оіь) — . Однако, в отличие от ранее рассмотренной постановки, Центр использует информацию о реализовавшемся значении параметра ь)=У(оі.) для построения своей стратегии. Оптимальная процедура обмена информацией выглядит следующим образом: Шаг I. Центр сообщает Исполнителю параметрическое семейство множеств QQl)c: D (0и гарантирует, что если Ц сообщит информацию CLG Д , то Центр предложит для совместного выбора точку из множества QL (d). Шаг 2. Исполнитель сообщает некоторую информацию діє Д , При этом не обязательно JL do. Шаг 3. Центр предлагает П. некоторую точку (Х, д) Од ( ) . Если Исполнитель выберет ЭС эСд и окажется , что 9=S(oL ) , то ЭСА= эс .В противном случае Центр применяет одну из стратегий наказания (Kq mill VLfe J, где У-У(сО, cL e.fi(y) Какую именно стратегию наказания может применить Центр на этом шаге, Исполнителю заранее неизвестно. Шаг 4. Исполнитель выбирает эс ХД о) , а Центр - С1еХ1(эс1 V)(oio)) , причем выбор 3Ci не противоречит сообщенной Центром на шаге 3 информации.
Таким образом, после получения информации о(є Д Центр сообщает Исполнителю многозначное отображение следующего вида f{ i0}, если V .yW-SW y) ( ] (ого win M XIX UGA U противном случае.
Как и ранее, в случае конечного множества А Центр может воспользоваться лишь детерминированными стратегиями наказания. - 45 Единственное отличие предлагаемой процедуры от уже рассмотренных заключается в контролироваїши Центром совпадения у(оО ( 0 и применении стратегии наказания, если такое совпадение не наблюдается. Множества L(d) таковы, что если П сообщит d cL0 , то его гарантированный выигрыш будет строго больше L (cL0) . Если же 3(р0т (?U), то будет применена стратегия наказания. Поэтому любое осторожное сообщение Исполнителя удовлетворяет условию у(с ) = У(У.о). Легко видеть, что в рассматриваемой постановке верны аналоги всех утверждений 3-4, при формулировке и доказательстве которых следует ограничиться компактным множеством параметров А (У(М) , а не рассматривать все множество А .
. О стимулировании участников РАО к сообщению точной информации
Максимальный гарантированный результат Центра, как будет показано ниже, при любой процедуре обмена информацией не может превышать величину К(В). Примем также предположение о структуре возможных множеств информированности элементов: для любых DtGFL "tf-eVifflcJ УІЄ\С( І,ВІ)» Lj tLiCft UCDj+bf], І» і,ТІ найдется набор параметров ( .../О
Это условие означает, что среди наихудших значений параметра неопределенности для Центра найдутся такие его значения, при которых Центр может выбором своих управлений понизить выигрыши исполнителей по крайней мере до МЕР, Например, в экономической системе неизвестными всем элементам системы параметрами на этапе планирования могут быть будущие конъюнктурные условия, природные факторы и т.п. Эти параметры обладают тем свойством, что влияют в одном направлении на целевые функции элементов нижнего уровня и Центра, Принятое предположение также всегда выполняется, если Ж7(р т[. =Const для всех і , т.е.когда Центр полностью "управляет" выигрышем подчиненных элементов.
Перед рассмотрением оптимальной процедуры обмена информацией, позволяющей Центру получить с любой наперед заданной точностью максимальный результат, равный К (В) , рассмотрим частный пример - однопродуктовую ИСУ распределением ресурсов.
Рассмотрим простейшую однопродуктовую модель. Пусть целевая функция элемента нижнего уровня - исполнителя П есть "прибыль" M4-pj-fy+rt где р. - произведенная продукция, CL- затраты, Г; - премия. Параметры Pf и СЬ наблюдаемы Центром и он назначает свое управление Г 0 в зависимости от реализовавшихся значений этих параметров, а также потребления ресурсов в количестве 1); элементом ГЦ из множества V . Целевая функция Центра Mofp /j монотонно не убывает по р и не возрастает по CJ,; и Г- . Заданы неотрицательные производственная функция &(СДї} и функция затрат (&?,1 ) исполнителя IT; . При этом где y f0, ] и 3; 1 - ненаблюдаемые Центром управления исполнителя Пс , имеющие смысл эффективности функционирования ГЦ . Элемент ГЦ знает, что о єД. , а АєЬ , Центр же не знает этих множеств: ему известно, что єА;,й?єВс . При этом А--А: , В- g В,; . Центру необходимо добиться, чтобы вектор потребления ресурсов удовлетворял глобальным ограничениям tf W , Считаем, что
Определим функции: Максимальный гарантированный результат Центра при полной осведомленности об информированности исполнителей - множествах А;, и Ь і есть к(А;вв)=шах М( (А,Я, +(В»,Г(А;В:І))), (2.23 где функция ґ (A0,B,TJ) определяет минимальное значение Г , при котором элементы ГЦ получат максимальные гарантированные результаты Ц (A;, Bt): ГС(А;,Б:Д)=Ц(А:,В)- :(А:Л)+ С(ВДО, где Центр может достичь выигрыша К(А,В)с любой наперед заданной точностью , используя следующие стратегии О - в противном случае, - 75 где 0 - достаточно малое число, а и = ( 1,..., )- доставляет максимум в ( 2.23 ). При использовании стратегий ( 2.24 ) каждый исполнитель ГЦ вынужден выбрать \, wi,i/i = 2c=A , так как только в этом случае его максимальный гарантированный выигрыш превышает Ц(А Вс ) . Так как Центр не знает множеств А:, В; , он производит обмен информацией с исполнителями для уточнения их информированности о параметре неопределенности. Легко видеть, что Центру для получения максимального результата не обязательно знать точ А О TY , I JHS » -достаточно, чтобы информация Ас Вс , полученная от исполнителей, удовлетворяла следующим свойствам
При этом Ц(Ас,Вс) = ;(Ас,В ), и Центр, используя стратегии ( 2.24 ), построенные на основании информации А:Ьі t»l/H , получит максимальный результат K(At)B-) = K(A,B J . Для получения информации, удовлетворяющей соотношениям ( 2.25 ), Центр может использовать следующую процедуру обмена информацией: Шаг I. Центр сообщает элементу Пс ,что будет использовать стратегию вида ( 2.24 ) в зависимости от сообщенной информации А,Ьг."/( т.е. будет положено Ai AtBt Bj, в ( 2.24 )). При этом точка tfL будет выбрана из множества V- , а значение 61 будет равно где мера &1 , заданная на подмножествах V , обладает тем свойством, что любая окрестность в V имеет положительную меру, а параметры f . B.L 0 выбраны так, чтобы всегда выполнялось неравенство t Q. Шаг 2. Исполнитель П {, сообщает Центру информацию, удовлетворяющую ( 2.25 ). ,В самом деле, при сообщении такой информации он - 76 о _о , дО _ о получит выигрыш не менее L A Bcj + QcCAc Bj. J . Если для некоторой точки ТІ; выполняется "(АсД- ) $1 (At, /3 или (Bl O Pttbc c) » то П- рискует, что l! будет выбрано равным 1). и тогда П будет наказан и гарантированно получит выигрыш не выше к [A- B J. Таким образом, для любого осторожного сообщения ГЦ выполняется для всех "і . Таким образом, Q- (А В;) 4i(As w Есж хотя бы для одного o одно из неравенств ( 2.26 ) строгое, то ввиду непрерывности функций f. ( )/ (0 и свойств меры Д: будем иметь QtCAc,B J Qc(A B;, J.