Введение к работе
Актуальность темы.
Математическая теория проверки статистических гипотез, в которой критерии (решающие правила) появляются как решения точно поставленных оптимальных проблем, была создана Ю.Нейманом и Э.Пирсоном в 30-х годах нашего столетия. Работы А.Вальда и его книга "Последовательный анализ", вышедшая в свет в 1947 году, не только пролили новый свет на классическую теорию, но и стимулировали развитие направления, которое теперь можно назвать вероятностной теорией оптимального управления.
В отличие от классических задач математической статистики, в которых число производимых наблюдений (объем выборки) фиксируется заранее, методы последовательного анализа характеризуются тем, что момент прекращения наблюдений (момент остановки) является случайным и определяется в зависимости от значений наблюдаемых данных.
Преимущество последовательных методов было продемонстрировано А.Вальдом1 на задаче различения двух простых гипотез по результатам независимых наблюдений. Он установил, что такие методы дают выигрыш в среднем числе наблюдений по сравнению с любым другим способом различения, в том числе с фиксированным объемом выборки. Более того, А.Вальд указал и тот последовательный метод, названный им последовательным критерием отношения вероятностей (SPRT), который оказался оптимальным в классе последовательных тестов. Иными словами, тест Вальда позволяет различать гипотезы с заданным уровнем вероятностей ошибок за наименьшее (в среднем) время наблюдения. При этом несомненным достоинством такой процедуры является простая ( хотя и Приближенная) форма зависимости между порогами теста и соответствующими вероятностями ошибок.
Развитие идей А.Вальда на разнообразные постановки в рамках задачи проверки двух простых гипотез, в осуществлении которого боль-
'Wald A. Sequential Analysis. John Wiley, New York,1947, 212p.
шую роль сыграли работы Т.Андерсона, Д.Вольфовица, Д.Блекуэлла, М.Гиршика, Х.Роббинса, А.Н.Ширяева , привело к разработке и применению соотвествующих алгоритмов в радио- и гидролокации, сейсмологии, телеметрии и других отраслях науки и техники. Поскольку задача проверки гипотез является формой представления широкого круга проблем принятия решений, усложнение статистических моделей, применявшихся на практике, стимулировало работы по посторению и изучению свойств последовательных тестов в более сложных постановках, как в смысле модели наблюдений, так и в смысле структуры проверяемых гипотез.
С одной стороны, для проверки более чем двух гипотез или двух сложных гипотез не удается (за исключением некоторых частных постановок) построить тест, аналогичный тесту Вальда в смысле минимизации среднего времени наблюдения, что влечет многообразие подходов и постановок оптимизационных задач. С другой стороны, бурное развитие статистики случайных процессов как в теоретическом, так и в плане-приложении требует исследования задач проверки гипотез для все более сложных моделей наблюдений с использованием, так называемых, мартингальных методов. Общеприняиым стало рассматривать асимптотические свойства тех или иных процедур при стремлении вероятностей ошибок к нулю. При этом актуальной становится задача оценивания и уточнения соотношений между предельными и допредельными значениями различных характеристик, в том числе среднего времени наблюдения.
Повышенный интерес к проблемам устойчивости статистических выводов обуславливает усиление важности задачи проверки гипотез с, так называемой, "зоной безразличия", то есть областью значений параметра, которой не соответствует ни одна из гипотез. Как было замечено Д.Кифером и Л.Вейссом, классический тест Вальда утрачивает свойство минимизации среднего времени наблюдения, когда параметр принимает значение из области безразличия. Перспективным представля-
ется метод, предложенный И.В.Павловым и развитый А.А.Новиковым п В.П.Драгалиным, построения адаптивных последовательных тестов. Следует отметить, что при рассмотрении задач проверки более чем двух гипотез обобщение теста Вальда можно проводить несколькими способами, в равной мере как и накладывать условия на вероятности ошибок.
Все вышесказанное объясняет многообразно работ, опубликованных по теме последовательной проверки гипотез. Несмотря на это, актуальным остается вопрос изучения в рамках общего подхода к проблеме, свойств соответствующих тестов, в том числе и адаптивных, как при справедливости одной из гипотез, так и в зоне безразличия. Развитие в последнее время вероятностных приложений, где последовательный характер получения данных является нормой, за счет финансовой и страховой математики (кроме традиционных радиолокации, связи и радиотехники) позволяет говорить о большом практическом потенциале интеграции методов последовательного анализа с современной статистикой случайных процесов.
Цель работы заключается в построении общего подхода к проблеме проверки статистических гипотез, унифицирующего модели с дискретным и непрерывным временем, простыми и сложными, одно- и многоальтернативными гипотезами, при наличии или отсутствии зоны безразличия, разработке методов построения тестов для ее решения, в том числе и адаптивных. Кроме того, целью работы является изучение их свойств, таких как оптимальность, асимптотическое поведение среднего времени наблюдения, связь между характеристиками тестов при различных предположениях.
Методы исследования.
При решении поставленных задач применялись методы, с одной стороны традиционные для последовательного анализа, а с другой стороны подходы, широко применяемые в статистике случайных процессов, называемые еще мартингальными.
Представляемая диссертация предлагает следующий подход в рамках последовательной проверки параметрических гипотез.
Общая постановка задачи формулируется в терминах стохастического базиса. При этом случай непрерывного и дискретного времени унифицирован. Затем вводятся понятия вероятности ошибок и классы тестов, сформированные по принципу, в соответствии с которым накладываются ограничения на упомянутые вероятности. После этого определяются последовательные процедуры. Принципиальных конструкций предлагается три, при этом внутри каждой есть адаптивная и неадаптивная версии. Исследования связей между параметрами процедур и вероятностями ошибок тестов ставят целью получение правил выбора значений порогов, обеспечивающих принадлежность теста требуемому классу.
В зависимости от нужд конкретного исследования формируется среда исследования, состоящая из общей постановки, указания типа теста, класса тестов, определения оптимальности, если нужно, уточненной модели наблюдений, количества и структуры гипотез, и т.д.
Научная новизна и практическая значимость.
Все основные результаты работы являются новыми. Они могут быть использованы для построения последовательных процедур, а также для прогнозирования свойств этих процедур на основании проверки соответствующих условий.
Публикации и апробация работы.
По теме диссертации опубликовано 3 работы. Результаты диссертации докладывались на семинаре по статистике случайных процессов под руководством А.Н.Ширяева в Математическом институте им. В.А.Стеклова, на семинаре "Последовательный анализ", действовавшим там же под руководством А.А.Новикова, на Ninth European Young Statisticians Meeting (Роттердам, Голландия, август 1995) и на Первой Всероссийской школе-коллоквиуме по стохастическим методам геометрии и анализа (Абрау-Дюрсо, сентябрь 1994).
Структура и объем работы.
Диссертация состоит из введения, трех разделов и списка литературы, изложенных на 76 страницах. Список литературы содержит 42 наименования.