Введение к работе
Актуальность темы. Одной из актуальных задач теории информа-і является достикение максимальной информативности статиотиче-IX экспериментов с целью решения той или иной задачи ма^емати-жой статистики. Как правило, оптимальный эксперимент зависит "истинного" распределения наблюдений, которое становится из-зтным с достаточной степенью точности ."ишь после проведения заделенного количества экспериментов. В такой ситуации необхо-ю использовать адаптивные процедуры управления наблюдениями, гарне позволяют увеличивать информативность наблюдений по мере >чнения закона распределения наблюдений. Как правило, асимпто-іески оптимальная процедура управления наблюдениями строится сим образом, чтобы наблюдения максимизировали некоторое инфор-щонное количество. Многообразие введенных информационных ко-геств отражает то обстоятельство, что для различных задач ма-іатической статистики будут наиболее информативными, вообще юря, различные эксперименты из заданного множества возможных іпериментов. Исследования в этом направлении, восходящие к 'isher, проводятся достаточно широко. Отметим работы И.А.Ибра-гова, Р.З.Хасьминского и др, посвященные решению таких проблем іадачах оценивания параметров распределения. В задачах госле-іательной проверки статистических гипотез отличие состоит не іько в том, что используются другие информационные количества, и применяется иная техника исследований. Одной из областей іледований в этом направлении являются задачи планирования от-[вающих экспериментов. Отметим исследования A.Eenyl, P.Erdos, '.Дьячкова, М.Б.Малютова и др., посвященные, в основном, ста-еским экспериментам. Задача последовательного планирования шриментов оказалась родственной проблеме передачи информации братной связью. Исследования в этой области ведутся достаточ-широко (C.Shannon, R.Ahlswede, Т.М.Cover, G.Dueck, F.Willems, .Пинскер, Л.А.Бассалыго, В.В.Прелов и др.), и актуальной явля-я задача установления степени родства между этими задачами.
Наиболее выпукло указанное родство проявляется в решаемой и задаче определения предельной скорости отсеивающего плана
поиска а значимых переменных булеьской функции, измеряемой со случайными ошибками. Эта проблема оказалась близкой оптимальному кодированию информации при передаче по специальному каналу с множественным доступом (КМД) и безошибочной обратной связью. Последней теме посвящены работы Т.М.Cover , С.S.K.Leung1, F.M.J.Willems 2 и др., где рассматривается задача определения пропускной способности канала с троичным алфавитом. Принципиальное отличие нашей задачи по отношению к упомянутым выше заключается в том, что методы планирования экспериментов не должны зависеть от передаваемых источниками сообщений, что вообще говоря приводит к значительным дополнительным трудностям и требуется выяснить хотя бы для частных моделей соотношение между.областью пропускных способностей НМД с обратной связью и предельной скоростью отсеивающего плана поиска значимых переменных. Отметим, что предельная скорость статических планов, найденная М.Б.Малю-товым3 в случае блокового кодирования, не связана, вообще говоря, непосредственно с областью пропускных способностей при блоковой передаче информации по КМД. Актуальной является задача установления соответствия между рассматриваемыми задачами и при а=1 и адаптирования методов кодирования, предложенных M.Horstein и К.Ш.Зигангировым и М.В.Бурнашевым^ для однодоступного канала без памяти, с бесшумной обратной связью для их использования на заключительном этапе процедуры поиска а значимых факторов.
Теоретико-информационный подход, развитый в диссертации, оказался полезным и для решения задач дискриминации фиксированного числа моделей. В пионерских работах H.Chernoff5 и их многочисленных продолжениях имелся тот недостаток, что класс асимп-
-
Cover Т.И., Leung C.S.K. An achivable rate region for the multiple-access channal with feedback // IEEE Trans. Inform. Theory. 1981. 7.27. N 3. P. 292-298.
-
Willems P.M.J. On multiple access channels with feedback // IEEE Trans. Inform. Theory. 1984. 1.30. N 3. P. 842-845.
-
Малютов М.Б. Теоретико-информационные методы планирования и анализа экспериментов // Дисс. на соиск. уч. ст. док. физ.-мат. наук. 1983. 204 с.
-
Бурнашев М.В., Зигангиров К.Ш. Об одной задаче управления наблюдениями // Проблемы передачи информации. 1975. Т.11. Вып.З. С.44 - 52.
-
Chernoff Н. Sequential design of experiments // Ann. Math. Statist. 1959. V. 30, N 3. P. 755-770.
отически оптимальных процедур был слишком широк и риск процедур ланирования экспериментов оценивался слишком грубо. В работах .Keener6 и автора7 были предприняты попытки получить уточнение ункции риска, однако,и эти результаты не были окончательными,и настоящей диссертации впервые предложены процедуры, риск кото-ых отличается от оптимальных не более чем на константу.
Более сложным является случай континуального множества еизвестных параметров в. Эта задача в постановке H.Chemoff бы-а рассмотрена A.Albert . Поиск гарантийных решающих правил, .е. процедур с заданными верхними границами для вероятностей шибок, не позволяет использовать стратегии, предложенные Н.Спе-noff или A.Albert. Попытки решить задачу в рассматриваемой пос-ановке были предприняты И.В.Павловым9. Ери решении таких задач риходится рассматривать одновременно все отношения правдоподо-ия для значений параметра из альтернативного множества, т.е. эобще говоря,несчетное число траекторий. В связи с этим И.В.Па-ловым было введено требование выпуклости классов распределений, го условие является искусственным и не выполняется в болыпинсг-э случаев, поэтому приходится приближать класс допустимых расп-эделений некоторым более широким классом. Последнее приводит к эму, что строящаяся допустимая стратегия не обеспечивает дости-эние и главного члена асимптотического разложения. Приводимые в лссертации результаты показывают, что это требование является злишним. Достигается это благодаря переносу некоторых результате теории типов последовательностей10 на случай семейств мар-шгалов.
При решении рассматриваемых задач возникает задача определе-ія величины перескока заданного уровня процессом, представляю-
. Keener R. Second order efficiency in the sequential design
С experiments // Ann. Statist. 1984. V.12, N 2. P.510-532.
. Цитович И.И. О последовательном планировании экспериментов
чя различения гипотез // Теория вероятн. и ее примен. 1984.
.29. N 4. С. 778-781.
. Albert А.Е. Sequential design of experiments for infinitely
my states of nature // Ann. Math. Statist. 1959. V. 30, N 3.
.774-799.
. Павлов И.В. Последовательные статистические выводы для слож-
ix гипотез // Изв. АН СССР. Техн. кибернетика. 1983. .№ 6. С.
36-112.
3. Чисар И. Кернер Я. Теория информации / М.: Мир. 1985.
щим собой сумму, вообще говоря,зависимых случайных величин. Эт задача достаточно полно изучена в случае независимых слагаемых однако,полученные результаты не могут быть использованы для за висимых наблюдений последовательного планирования экспериментов Поэтому актуальной является задача обобщения таких результато на случай, когда слагаемые являются зависимыми и их распределе ния выбираются из некоторого заданного класса.
Цель работы. 1. Описать предельную скорость отсеивающег последовательного плана поиска значимых переменных- двоичной фун кции.
2. Исследовать асимптотическое разложение функции риска в задач
последовательного планирования экспериментов для ' проверю
фиксированного числа гипотез в случае конечного параметрическог
пространства 8.
3. Построить асимптотически оптимальную стратегию для задач:
проверки гипотез, содержащих континуальное множество распредел'
ний.
Общая методика исследований. Для доказательства нижних гра ниц используются теоретико-информационные метода, а верхних методы кодирования сообщений при передаче с обратной связью предельные теоремы теории вероятностей, современные методы теории мартингалов, теории игр, оптимального управления и др.
Научная новизна. Основные результаты диссертации - следующие:
1. Найдена предельная скорость отсеивающих экспериментов для
поиска значимых переменных двоичной функции.
2. Построена последовательная процедура обнаружения значимы:
факторов, позволящая за конечное в среднем число наблюдение
свести задачу обнаружения значимых факторов к соответствующее
задаче асимптотически оптимального кодирования при передаче со
общения по КМД с обратной связью, не зависящего от передаваемой
сообщения.
3. Исследовано асимптотическое разложение функции риска в задачі
последовательной проверки статистических гипотез и построен:
процедура управления наблюдениями, которая в регулярном случаї
обеспечивает достижение нижней границы функции риска с точность]
?л константы.
. Построена процедура управления наблюдениями, обеспечивающая
остижение нижней границы R.Keener с точностью до константы в
ерегулярном случае.
. Построена асимптотически оптимальная процедура проверки гипо-
ез в случае континуального множества в для' гарантийных решающих
равил при естественных ограничениях регулярности на класпы воз-
ожных распределений.
. Получены обобщения результатов о величине перескока уровня и
ремени пребывания процесса в полосе на случай субмартингалов.
Апробация работы. Результаты работы докладывались автором а VI советско-японском симпозиуме по теории вероятностей и ма-ематической статистике в Киеве (1991), на конференции "Применено многомерного статистического анализа" в Цахкадзоре (1991), а 3 международной конференции Model-Oriented Data Analysis в анкт-Петербурге (1992), на научных семинарах в МГУ, ИППИ, ММАН др.
Публикации. Основное содержание диссертации опубликовано в эсяти работах.
Структура диссертации. Диссертация изложена на 240 стр. и эстоит из введения, пяти глав, заключения и списка датированной иературы. Первая глава состоит из семи параграфов, вторая - из " эсти, третья - из четырех, четвертая - из семи и последняя - из рех параграфов.