Электронная библиотека диссертаций и авторефератов России
dslib.net
Библиотека диссертаций
Навигация
Каталог диссертаций России
Англоязычные диссертации
Диссертации бесплатно
Предстоящие защиты
Рецензии на автореферат
Отчисления авторам
Мой кабинет
Заказы: забрать, оплатить
Мой личный счет
Мой профиль
Мой авторский профиль
Подписки на рассылки



расширенный поиск

О задачах управления процессом наблюдения по неполным данным Джамбурия Леван Гивиевич

О задачах управления процессом наблюдения по неполным данным
<
О задачах управления процессом наблюдения по неполным данным О задачах управления процессом наблюдения по неполным данным О задачах управления процессом наблюдения по неполным данным О задачах управления процессом наблюдения по неполным данным О задачах управления процессом наблюдения по неполным данным О задачах управления процессом наблюдения по неполным данным О задачах управления процессом наблюдения по неполным данным О задачах управления процессом наблюдения по неполным данным
>

Данный автореферат диссертации должен поступить в библиотеки в ближайшее время
Уведомить о поступлении

Диссертация - 480 руб., доставка 10 минут, круглосуточно, без выходных и праздников

Автореферат - 240 руб., доставка 1-3 часа, с 10-19 (Московское время), кроме воскресенья

Джамбурия Леван Гивиевич. О задачах управления процессом наблюдения по неполным данным : ил РГБ ОД 61:85-1/2269

Содержание к диссертации

Введение

ГЛАВА I. Задача о разладке винеровского процесса при наличии платы за наблюдения . 16

I. Вспомогательные результаты 16

2. Постановка задачи и формулировка основной теоремы 22

3 Задача Стефана 27

4 Уравнение Беллмана 34

5. Доказательство основной теоремы 39

ГЛАВА II. Задача поиска 50

I. Постановка задачи 50

2. Задача Стефана 55

3. Задача Стефана (продолкение) 64

4, Уравнение Беллмана 71

"5. Исследование производных и формула Ито . 85

б. Основная теорема 99

ГЛАВА III. Задача о разладке при наличии платы за наблюдения. дискретное время 109

I. Постановка задачи и основная теорема 109

2. Некоторые вспомогательные предложения и рекуррентные соотношения

3. Доказательство основной теоремы 118

Литература

Введение к работе

В настоящей диссертации рассматриваются две задачи статистического последовательного анализа - задача о разладке и задача последовательного различения двух гипотез. Эти задачи рассматривались многими авторами в различных постановках (см, [І] -М и указанную в них литературу). Как обычно, они сводились к задаче оптимальной остановки некоторого марковского процесса. Из общей теории оптимальной остановки марковских процессов, развитой в [Ij , следует существование оптимального момента остановки в задачах о разладке и последовательном различении двух гипотез. В случае непрерывного времени находится также явное выражение для функции риска.

Предложенная в диссертации байесовская постановка этих задач отличается от обычных постановок тем, что наблюдению подлежит некоторый управляемый процесс. В связи с этим, кроме нахождения оптимального момента остановки, возникает проблема построения и оптимальной (или -оптимальной) стратегии. Рассмотрение управляемого наблюдаемого процесса в задаче о разладке обусловлено введением платы за наблюдение (в указанных выше работах рассматривался случай бесплатных наблюдений). В аналогичной постановке задача о разладке рассматривалась в [73 (в случае непрерывного времени). Основной результат этой работы заключается в определении структуры оптимальной стратегии при условии, что она существует. Отметим, однако, что рассуждения носят эвристический характер.

Задача последовательного различения двух гипотез в случае управляемого наблюдаемого процесса, или по другому, задача поиска, впервые была рассмотрена в [5J . В работе СИ были продолжены исследования, начатые в И . В [8] исследуются функции; определяющие границы в оптимальном правиле, по достижении которых следует прекращать наблюдение. Однако, в этих работах не было дано доказательство существования оптимального или - оптимального правила. В работах [9] , [10] рассматривалась задача последовательного различения \ь гипотез в случае управляемого наблюдаемого процесса для некоторого узкого класса стратегий. Аналогичным задачам посвящены такие работы [II] , [12] .

2 В настоящей диссертации задача о разладке в случае управляемого наблюдаемого процесса рассматривается как для не- прерывного, так и для дискретного времени, В случае непрерывного времени предлагается следующая постановка задачи.

Этой задаче мошно. дать следующую интерпретацию. Некоторая цель мокет появиться на одном из двух направлений (0- или Q-%) . Есть возможность наблюдать в кавиый момент времени х одно из этих двух направлений (выбрать ск,- 0 или I). Зада - 8 ча заключается в оптимальном выборе стратегии cL- (54). J-uo (в какой момент времени,какое направление следует наблюдать), в оптимальном выборе момента прекращения наблюдений (выбор ТеХс ) и в оптимальном выборе заключительного решения -есть цель на каком-нибудь из двух направлений ( не различая, на каком именно) или она отсутствует (выбор случайной величины dL ).

При решении задачи последовательного различения двух гипотез и задачи о разладке в случае непрерывного времени применяется следующий традиционный метод ( см. [і] , [із] ). Решается некоторая задача Стефана, а потом доказывается, что полученное решение совпадает с функцией риска. Затем, с использованием этого факта, строятся оптимальные и Е,- оптимальные решающие правила. Задача о разладке в случае дискретного времени решается с использованием общих результатов теории оптимальной остановки и планирования эксперимента, полученных в

4. Настоящая диссертация состоит из трех глав. В первой гпаве рассматривается задача о разладке винеровского процесса при наличии платы за наблюдения. В первом параграфе ЭТОЙ главы приведены некоторые вспомогательные результаты. В частности лемме I доказывается один частный случай формулы Ито, не являющийся следствием обобщенной формулы Ито из [15] . Заметим, что доказываемую в лемме I формулу можно также получить из формулы Ито для выпуклых функций [16] .

В главе П рассматривается задача последовательного различения двух гипотез в случае управляемого наблюдаемого процесса, или, по другому, задача поиска. В первом параграфе приводится постановка задачи. Там не показывается,что для любой стратегии ск и момента остановки Т: существует оптимальное заключительное решение сЦ. • С использованием этого факта, функция риска Р(х,ч) преобразуется к следующему виду получена система стохастических дифференциальных уравнений:

По материалам диссертации автором опубликованы работы [18]-[20] .

Работа выполнена под руководством А.Н.Ширяева, которому автор выракает искреннюю благодарность за постановку задачи и постоянное внимание к работе.  

Постановка задачи и формулировка основной теоремы

Пусть на вероятностном пространстве (Хц j, [Jt)i o)hrj заданы стандартный винеровский процесс W=(Wt 3-fc)-uo и не зависимая от него J"0- измеримая случайная величина 0 такая, что

Положим 04.=1 (0 и на вероятностном пространстве (Гї іХкоЯ) Рассмотрим процесс где ъ и б- - действительные числа отличные от нуля, а процесс -( -O-UO согласован с семейством (Г алгебр р = (3 %АТ - Ц-К) s "t\) и таков» что Уравнение (2.1) имеет единственное сильное решение. Кроме этого предположим, что процесс 0(-( ) непрерывен справа и имеет пределы слева и принимает лишь два значения - 0 и Г, Множество всех таких процессов ос обозначим через \Ь и назовем множеством допустимых стратегий. Процесс C G lL будем называть допустимой стратегией или просто стратегией.

Пусть dL - множество всех конечных моменшов остановки относительно семейства 6Г-алгебр \- - {Jj-, ] _ 0 . Положим РСогьцц LIw( ) + сМдг лхСс-Э,о) + + CnMorjo4 J) С 0 С 0 Константа е., есть плата за наблюдение за процессом (2.1) за единичный промежуток времени. Если Ц-0 , получим задачу о разладке винеровского процесса, рассмотренную в Щ . Пару A (ot,t) , где ocelL и ТієаХ будем называть решающим - 23 правилом. Определение I. Будем говорить, что решающее правило Д =.(0( 1:6) является «оптимальным (. 0) дня данного CJT , если Rr 9)+cM x -ao)+cAj oL ) +t О -оптимальное решающее правило будем называть оптималь ным,

Нашей задачей является построение .-оптимального решающего правила ( о трудностях, встречающихся при построении оптимального решающего правила, будет сказано ниасе) и нахождение выра-кения для функции риска Р(СіГ). Обозначим 9Tf = Rr(QHI 3 ) и ПУСТЬ Н) = - iihbJ- і где iKi] означает целую часть числа hX . В завершении этого параграфа покажем, что функцию риска о(?г) можно представить в следующем виде: ottU tUl Имеем Покажем теперь, что M9rM«.x(t-0,O)= Мя-іЧ оСі . (2.3) Как известно, если \ - положительная интегрируемая случайная величина и і - произвольная Є-алгебра, то .оо где - регулярная условная вероятность, существова ние которой следует из теоремы 3 из [_2Ъ] ,с.53 .

Используя эту формулу, подучим, что для произвольного .S -0 Оо ОО o&ihuLx(s-e,Obuie s }olu+j «(s-e,oKe«l5rJ0lu= оо Сделав замену переменной I--S-U , получим M u-MI V] -_ jp e.ti ТЛИ = - 26 о -Л ГСІІ, где xs=te9.ti?5 e(a iir)Joit. Очевидно, что МэтХ5 о-пРи s будем иметь Н5т(ХЯЛ-МІҐ№іІ5? Є(94ІТЛ] Іі7Л: Ил[Г[Р,(ЄНІГ)-Р,(0 ІїГ)] Р(0 іГ)-№Hir!iW?ri=fee ti -e(0 tirp-X Итак, Х=(Х /5 \- мартингал. Поскольку Xsk со оо Ря(9 ІіГШ Р,(0 іІТЛй=г и DO Vy о о то для Т є ЛГ уши \ IXsl СІІзг- О 00. Легко заметить таквсе, что Поэтому в силу теоремы 12 главы I из [I] . М,Х=М„Х0=о.

Отсюда следует (2.3) и этим представдение (2.2) доказа но, - 27 Заметим наконец, что в силу результатов главы 9 из [24] (см.уравнение 9.17 и пример 2 из 4), процесс UL,CL , 4 О удовлетворяет уравнению (еслиосехб) 0 о где 3» Задача Стефана

В этом параграфе рассматривается некоторая задача Стефана и находится её решение. В дальнейшем будет показано, что это решение совпадает с функцией риска р(1Т) .

Пусть с, J- Л . Рассмотрим следующую задачу. Най бг(л+0 г -, л i- ти действительные числа До [0,1 J » А В и двакды непрерывно дифференцируемую на ІР$) ІДІЗЛ} и один раз непрерывно дифференцируемую на [о,і]функцию 4(яг) (в точках 0 и I подразумеваются односторонние производные) такие, чтобы выполнялись следующие условия:

Уравнение Беллмана

Пусть теперь с, „с —з" Рассмотрим следующую зада е (\+сг чу Стефана. Найти константу B LWJ И Дважды непрерывно диф ференцируемую на и один раз непрерывно диф ференцируемую на [0,lj функцию Ц(Чї) такие, чтобы выполня лись следующие условия (3.3) ХО-я С )+с9г=0; ЕЯ е Со, В) ; Эту задачу будем называть задачей (3.3). Общее решение уравнения \0-7и (9г)+с }г 0 содержит одну неопределенную константу и еще неизвестна точка В . Условий, налагаемых на л. ч (9г) , токе два - в точке В доданы быть непрерывны Ч бя) и Ч (?г) Поэтому, если решение существует, то оно будет един ственным. Теорема 3. Если сл - г г , то решением задачи Л Л (л+с) , (3.3) является пара (В)ЧОл")) J где D - - и ( + -Ши,Ш+ЗГ-], OTfe[0,B): 4-97, 5Г [М A . Доказательство. Поскольку при 9Г[0, В) а при Or ( ] то на мнонестве lp3)U(B,{] функция W9?) дважды непрерывно дифференцируема (в точках 0 и I подразумеваются односторонние производные). Далее, л Л \ А Поскольку р = - — , то - p/PftN "Н , и следовате пьно, (_9Т) непрерывна в точке ( . Учитывая, что р(?г) = = --й —г при ?Ге[0;В) , получаем Х( эг) Ст) + сзг = 0, 9ге[о В). Поскольку, по определению Ц (чг)- -ЗГ при 9Г[В ) » т теоре ма доказана.

Замечание I. В случае, когда с 3\ с\а. » У задачи (ЗЛ) нет решения, В частности , не имеет решения уравнение (3.2), а для того, чтобы функция Х(9Г) имела непрерывную производную в точке В , необходимо чтобы В удовлет в оряда уравнению (3.2). Если С =- э/\ \а. » то уравнение (3.2) имеет єдин ій (А+с) д ственное решение и оно совпадает с А , а в этом случае А- \ і т.е. в этом случае решения задач (ЗЛ) и (3.3), дч-с как и следовало ожидать, совпадают.

Задача (3.3) имеет решение для произвольного СА 0 , но как будет показано в следующих параграфах, её решение сов падает с функцией риска рСЯ") только при С. . gc.А ч-г J 2. о (Х+с)

Замечание 2. Вычислив левостороннее и правостороннее производные второго порядка функций Х(ТІ) и 70 в точках соответственно, мокно убедиться, что (ft) и (6) не существуют. 4. Уравнение Беллмана В этом параграфе будет показано, что функции (?г) и и (7г) , являющиеся решениями задач (ЗЛ) и (3.3) соответствен но, удовлетворяют некоторому уравнению, которое на са мом деле есть уравнение Беллмана для функции риска РФ")» Теорема 4. Пусть q 1 сА и этф&)0(В,1], - единственное решение уравнения (3.2). Тогда Wlin[X(fDT)j(9T3+C3T; 9г(4- (4.1) - 35 имеем а.г/1 Доказательство. Пусть 9Ге[0,А] . Тогда, в силу теоремы 2, Учитывая, что при 57 [о; A J 1 (от) - ; Xfl-sr) + причем равенство имеет место только при 5Т=А . Поканем теперь, что Рассмотрим функцию Jh.($i)-=.4\-l(?i) . Тогда - »4 4 Если q(s) - функция,определенная при доказательстве теоремы 2, то легко видеть, что QL(S) Л - у\ - при Se[A,B). Отсюда, повторяя выкладки, проведенные при доказательстве теоремы 2, получим, что при SG[A В)

Перейдем теперь к доказательству теоремы I. Рассмотрим сначала случай, когда сл < \<у ^ -т- . Если 1(ЭТ) - решение име- задачи (3.1),то в сипу леммы I для любого oCG (л. и ТеЛ/С ем:

Итак, получили, что Р(&).(у) . Докажем теперь обратное неравенство. Пусть 9rt[0>B) Дня некоторого натурального Yi рассмотрим решающее правило Д=(<*,т) , где

Обозначим для простоты подынтегральное выранение через ^(\,ы) . Поскольку функция |"(9Г) непрерывна на [о,В)1/(В,1], а -{(тг) непрерывна на [од] , то существует константа о такая» что (5.б) И-^оо Пусть|а^- некоторая последовательность неотрицательных действительных чисел, такая, что CL^CL^ и iWu=+oo . Тогда для любого фиксированного \г>0 имеем

Задача Стефана (продолкение)

Как уке было показано в лемме I, эта система имеет единственное решение ( vp(X), ЧЧ )) Поскольку пара чисел fOcf, X ") токе есть решение этой системы, то 4 (х )-1с и у(х )=Х Итак,, X есть единственное решение уравнения у(х)=Х в интервале (0,1). Лемма доказана.

В завершении этого параграфа отметим одно свойство функций vp(x) и Ч/(х) , которое будет использовано в 4. Лемма 3. Пусть Хє[о,Х ] . Тогда Ч (х)Н-х и vWxk l-X. Доказательство. Из второго уравнения системы (2.18) о fvf (о)-YColJ f pcof -1] = 0 и поскольку 4 (0) Y(o) » то отсюда следует, что vo(0)=-J—. МО) Ч (0) 1) М0) і Допустим, для некоторого XG(0;X ] чр(хМ-Х. Тогда (х)М-х и ( От сода ілткш+2с%х )-(а)]= c( [ ( j[M- ікМ + [ )-( )] = [ (х)-( х)]. 1-х На интервале Qf-Xj + oo (2.29) ) рассмотрим функции \(д)=«с ьХ . -0-50. ілее, Тогда R(у_х) = 0, СЬ(1-Х) = 0. Даі , q (4)=Jzf . Легко заметить, что при 4 4-х выполняется неравенство ЛЯх 4,-(4-5:1) 0 » т е» /)-4f" ja 0тсюДа следует, что ftW QгСЧ) при -і-к Следовательно, равенство (2.29) не может иметь места. Полученное противоречие показывает, что не существует такой точки Xefox ] , для которой Ч (Х)=І-Х Учитывая непрерывность Ф(х) и то, что Ч (о) і » получим Y M-x ДЛЯ всех хє[0,х ].

Имеем р5 х 0, «- )=0, рз Н- , =- 4, При 4-х выполняется неравенство Ліх - -Х О . Отсюда, при Ц 4 х , B(4) O (LJ), Поэтому при ц с4-х будем иметь рJM) Q Ы) Следовательно, равенство (2.30) не мокет иметь места и поэтому не существует точки Х[о;Х ] такой, что (х)= п4 х . Поскольку Ч (о) /( и V(x) - непрерывная функция, то Ч (Х)И-Х при Xe[o,x J. Лемма доказана. Подставляя эти вырааения в (3.7), получим следующее диф-фвренциальное уравнение для функции 4 (х) :

Это уравнение с начальным условием (J4X )=.VP(X ) имеет единственное решение в области i(M)« Х Х , Ч KV (см." [25] ,с.Ю). Как видно из (ЗЛО) v Ok 0 , если (х) х . Учитывая, что (х ) - у Сх") и х (х ), имеем J(x ) x . Поэтому (Q(x)-x)!o » когда х возрастает и стремится к некой торой точке Хо , т»е. J- VbCp(x)=Xe . Положим по определению ХТХо J (М-Хо. Тогда функция (х) определена однозначно на интервале [х ХоЗ . Следовательно, поставленная в этом параграфе задача имеет единственное решение при Хе[х Хо] и 4е[х;+оо)

Понятно; что определенная таким образом функция Х(х,ч) является симметричной относительно прямой Ч = Х , т.е. Х(х,и) Как будет показано в следующих параграфах, функция \( Л) совпадает с функцией риска P(x)Jj-) При доказательстве этого факта существенно испопьзована теорема, доказательство которой является цепью этого параграфа. Доказательство. Прекде всего покажем, что входящие в равенстве (4.1) производные существуют. Как нетрудно понять, достаточно показать существование этих производных лишь в тех точках (х,ч) , для которых 4-Х Очевидно, что в остальных точках мновества Я эти производные существуют и непрерывны. Из определения функции -((Х)Ч) , в силу лемм 3 и 5, еле-дует, что ). -при(к, 7)о0 и )-__J— при (Х)Ч)еЙо З . Поэтому ясно, что при (X,jj)e30 , производные входящие в равенстве (4.1), существуют и непрерывны. По определению

Это означает, что производная — к і существует и непрерывна на МНОЕЄСТВЄ 2) . Аналогично модно показать непрерывность производных Уу Я) и J(X ) Переядем теперь к доказательству равенства (4.1). Поскольку Х(х,ч)=Х(ЧХ) . то равенство (4.1) достаточно доказать для (М)&2) таких, что Ч Х . Доказательство разобьем на несколько этапов.

Некоторые вспомогательные предложения и рекуррентные соотношения

Поскольку при и справедливы неравенства (4.3) и (4.5),то на мнокестве /)1 справедливо равешство (4.1). Как было показано, равенство (4.1) имеет место и на мнокестве Д)П(МХ)и поскольку -Г(х,ч)=Х(ч,х) » то (4.1) справедливо для всех чдЭ Теорема доказана.

Замечание I. Из доказательства теоремы видно, что при Ovj-H 2) 11 справедливо равенство За значение.производных в граничных точках рассматриваемых мнокеств принимается пределы соответствующих производных при стремлении точки (ЛЧ) к граничной точке. Как будет показано в следующем параграфе, эти пределы конечны.

Исследование производных и формула Ито Целью этого параграфа является доказательство формулы Ито Д Ч(х Ні ііг да і+ щс v ч" Y J Ї, і \(K kRl\a j (5.1) где iv -LO OOMPADO)» а множество Э было определено в предыдущем параграфе.

Такай вид формулы Ито вызван тем, что вторве производные функции 4-(Х\Ч) не существуют в точках мноЕествак ЧЭ . Пренсце чем приступить к доказательству формулы (5.1), иссле - 86 -дуем вопросы непрерывности и ограниченности производных функции -f(x»4) как было показано в предыдущем параграфе, функция -СсхіЧЛ имеет непрерывные производные первого и второго порядка всех видов, кроме смешанных производных djfr fr). И jrl Ф , на мнонестве Ю . Покажем, что эти производные токе существуют и непрерывны в любой точке(х,ч)еЭ, Ясно, что доказать существование и непрерывность этих производных надо лишь в точках (х,ч) 2) таких, что 4-Х-. В остальных точках множества их существование и непрерывность очевидна. Если (х,ч)е2)о »то такие очевидно, что e-jfafr). и jtKtt) _ существуют и непре рывны. Непосредственной проверкой можно убедиться, что "fofoft) _ "ЭК31Х) Эхй & х "SxcKj, (Ь(: :) 3"- а=х V -X г откуда следует, что производные суще ствуют и непрерывны в любой точке (х,ч)(Э Из равенств (5.10) - (5.18) следует, что производная J с— существует и непрерывна в любой точке (Х,ч) \\ . О X " Точно так же можно показать существование и непрерывность Тїтак , функция А(х) ) имеет непрерывные производные первого порядка в каждой точке (х,ч) \. и непрерывные производные второго порядка в каждой точке fojOfc-O .

При доказательстве формулы (5.1) нам потребуется ограни- ченность производных. Поскольку " & , d-7i fr) І, непрерывные функции, л)ч1/йд„- замкнутое ограниченное множество и при

Из первого уравнения системы (2.18) нетрудно заметить, что существует константа Къ 0 » Для которой УМ-Ч Х- Кз при веек ХцО, X ]» Учитывая также существование некоторой константы ГЦХ) такой, что vk(K) К при всех Х[о,х ] и констан -91 ты г 0 такой, 4T0Cf(xKl s, Xfcfox ] . из (3.20) получим, что существует некоторая константа Кс 0 такая» чт0 I $М К. Поэтому, из (5.21) подучим, что существует константа ? 0

Задача последовательного различения двух гипотез в случае управляемого наблюдаемого процесса, или по другому, задача поиска, впервые была рассмотрена в [5J . В работе СИ были продолжены исследования, начатые в И . В [8] исследуются функции; определяющие границы в оптимальном правиле, по достижении которых следует прекращать наблюдение. Однако, в этих работах не было дано доказательство существования оптимального или - оптимального правила. В работах [9] , [10] рассматривалась задача последовательного различения \ь гипотез в случае управляемого наблюдаемого процесса для некоторого узкого класса стратегий. Аналогичным задачам посвящены такие работы [II] , [12] .

2 В настоящей диссертации задача о разладке в случае управляемого наблюдаемого процесса рассматривается как для не- прерывного, так и для дискретного времени, В случае непрерыв ного времени предлагается следующая постановка задачи.

Похожие диссертации на О задачах управления процессом наблюдения по неполным данным