Электронная библиотека диссертаций и авторефератов России
dslib.net
Библиотека диссертаций
Навигация
Каталог диссертаций России
Англоязычные диссертации
Диссертации бесплатно
Предстоящие защиты
Рецензии на автореферат
Отчисления авторам
Мой кабинет
Заказы: забрать, оплатить
Мой личный счет
Мой профиль
Мой авторский профиль
Подписки на рассылки



расширенный поиск

Асимптотический анализ распределений некоторых асимптотических эффективных статистик в задачах проверки гипотез Бенинг, Владимир Евгеньевич

Данная диссертационная работа должна поступить в библиотеки в ближайшее время
Уведомить о поступлении

Диссертация, - 480 руб., доставка 1-3 часа, с 10-19 (Московское время), кроме воскресенья

Автореферат - бесплатно, доставка 10 минут, круглосуточно, без выходных и праздников

Бенинг, Владимир Евгеньевич. Асимптотический анализ распределений некоторых асимптотических эффективных статистик в задачах проверки гипотез : автореферат дис. ... доктора физико-математических наук : 01.01.05.- Москва, 1997.- 23 с.: ил.

Введение к работе

Актуальность темы.

Асимптотические методы находят широкое применение в математической статистике. Это связано с тем, что при неасимптотических постановках решение часто зависит от конкретного типа распределения, объема выборки и т.п., в то время как асимптотический подход позволяет делать достаточно обшие выводы об исследуемом объекте. При этом анализ асимптотики высших порядков в задачах математической статистики актуален как с прикладной, так и с теоретической точки зрения, поскольку он позволяет сравнивать асимптотически эквивалентные процедуры (например, критерии, имеющие одинаковую предельную мощность или асимптотическую эффективность). Как правило, он опирается на асимптотические разложения (а.р.), которые важны и сами по себе, поскольку позволяют повысить точность численных расчётов.

Возможность построения а.р., а значит, и исследования асимптотики высших порядков обычно связана с наличием явного выражения для распределения или его характеристической функции либо с представлением рассматриваемой статистики в виде суммы независимых случайных величин. Вывод а.р. в первом случае проводится в основном средствами анализа, а во втором случае основным инструментом служит хорошо развитая теория суммирования независимых случайных величин.

Однако существует много оценок и статистик критериев к которым эти методы неприменимы. Здесь можно выделить два подхода, позволяющих исследовать асимптотические свойства статистик в некоторых случаях. Первый подход основывается на том, что рассматриваемая статистика допускает стохастическое разложение определенного вида, т.е. представляется с точностью до остатка в виде полинома от нормированных сумм случайных величин. А.р. для таких статистик при минимальных моментных условиях получено Д.М.Чибисовым. Приложению таких статистик к задачам проверки гипотез и задачам оценивания уделялось большое внимание, наибольшие продвижения получены в работах Д.М.Чибисова и И.Пфанцагля (J.Pfanzagl).

Другой подход был применен В.Альберсом, П.Бикелом и В.Ван Цветом (W.Albers, P.J.Bickel, W.R.van Zwet) при получении а.р. для распределений линейных ранговых статистик (R-статистик) в двухвыборочной проблеме и проблеме симметрии и заключался в том, что рассматривалось некоторое условное распределение исходной статистики и для него

строилось а.р. Затем после усреднения получалось искомое а.р. Однако и эти методы применимы не всегда. Примерами могут служить линейные комбинации порядковых статистик (L-статистики) и U-статистики. Это связано с тем, что стохастические разложения этих статистик нельзя представить в виде полинома от нормированных сумм независимых случайных величин. В последнее время заметно повысился интерес к L- и U-статистикам. Это вызвано тем, что они находят широкое применение в теории оценивания и непараметрической статистике. Важным достоинством этих статистик является их вычислительная простота и робаст-ность, при этом при достаточно общих условиях регулярности в классах таких статистик существуют асимптотически эффективные статистики. Многие авторы при различных условиях регулярности получали асимптотическую нормальность и оценки типа Бэрри-Эссеена для распределений L-и U-статистик. А.р. для L-статистик было получено Р.Хельмерсом и В.Ван Цветом (R.Helmers, W.R. van Zwet) а для U-статистик — П.Бике-лом, Ф.Гётце и В.Ван Цветом (P.J.Bickel, F.Goetze, W.R.van Zwet).

В диссертации рассматриваются некоторые вопросы асимптотической теории проверки гипотез. Все сказанное выше можно интерпретировать как результаты, касающиеся распределений статистик критериев при справедливости нулевой гипотезы. Однако, в задачах проверки гипотез при исследовании свойств мощностей критериев необходимо рас-смативать распределения статистик критериев и при альтернативах.

Диссертация посвящена изучению свойств распределений (оценкам скорости сходимости, асимптотическим разложениям) асимптотически эффективных статистик при справедливости альтернативных гипотез. Исследуются также некоторые свойства второго порядка мощностей критериев, основанных на таких статистиках (находится асимптотический дефект). Полученные общие результаты в терминах произвольного статистического эксперимента применяются к L-, R-, U-статистикам и к L-, R- и U-критериям.

Мы рассматриваем только асимптотический подход, при котором с ростом объема выборки п размер критериев отделен от нуля, и имеем дело с последовательностью локальных альтернатив, при которых мощность отделена от единицы. Специальное внимание уделяется асимптотически эффективным критериям, основанным на L-, R- и U-статистиках при проверке простой гипотезы в однопараметрическом семействе. Мы рассматриваем только "регулярные" семейства, в которых эти локаль-

ные альтернативы приближаются к гипотезе как Ап-1/2, А > 0.

Во многих случаях распределения при альтернативах изучались теми же методами, что и при гипотезе. Например, пусть распределение исходных наблюдений зависит от параметра в и проверяется гипотеза Н0 : 9 = 9й. Предположим, что критерий основан на статистике 5„, которая асимптотически нормальна с некоторыми параметрами п(в)),<т%(6)). Тогда подстановка 9 = 90 даёт распределение при Н0, а подстановка в ф 90 — распределение при альтернативе Нх. При локальных альтернативах 9п90 получаем, что распределение 5„ асимптотически нормально с параметрами ((м„(9п)),ст1(9п)).

Этот прямой подход, однако, не учитывает специфики задачи, связанной с локальностью альтернатив и ведет к излишним условиям регулярности, накладываемым при справедливости альтернативных гипотез. Метод, адекватный постановке задачи, даёт теория Л.Ле Кама (L. LeCam), основанная на понятии контигуальности. В частности, если Л„ — логарифм отношения правдоподобия при 9„ и 90 и совместное распределение (Л„, 5„) при 9 = 90 имеет слабый предел, то и распределение (Л„,5„) при в = 9„ имеет слабый предел, который легко определяется (если предельные распределения имеют плотности Ро(х,у) и pi(x,y), то Р1(х,у) = е*рй(х,у)).

Одно из эффективных применений этого метода было в случае ранговых статистик, поскольку распределение вектора рангов при альтернативах значительно сложнее, чем при гипотезе, что затрудняет применение прямого подхода. По этой причине при получении а.р. В.Альберсом, П.Бикелом и В.Ван Цветом рассматривались условные распределения.

В диссертации рассматриваются асимптотически эффективные статистики S„, т.е. такие статистики, для которых разность

Д„ = Л„ - Г„,

в некотором смысле "мала", где Тп = anSn + рп, «„ > 0, — линейное преобразование исходной статистики, не влияющее на мощность критерия. Для таких статистик предложен общий метод получения предельных распределений, оценок скорости сходимости и асимптотических разложений при альтернативах. При этом условия регулярности делятся на две группы: — условия регулярности на Л„ при справедливости нулевой гипотезы Но и условия регулярности, используемые ранее при

доказательстве нормальности, нахождении оценок скорости сходимости и а.р. для „ при Но- В качестве статистик S рассмотрены, в частности, L-, R- и U-статистики. Причем в случае R-статистик а.р. при альтернативах получено без использования условных распределений.

Далее, обозначим через тт* мощность наилучшего критерия уровня а Є (0,1) для проверки простой гипотезы Н0 : 6 = 0 против последовательности близких альтернатив Н1п : в = \п~1/2,0 < А < С,С > 0. Согласно лемме Неймана-Пирсона, этот критерий основан на логарифме отношения правдоподобия Л„. Заметим, что Л„ зависит от А и поэтому не может использоваться в качестве статистики критерия. Этим мотивируется необходимость нахождения критерия, не зависящего от А, но

В ОПреДелёННОМ СМЫСЛе "бЛИЗКОГО" К Наилучшему Критерию. ПуСТЬ 7Г„

— мощность критерия того же уровня, основанного на асимптотически эффективной статистике S„. Типичным образом

я-* - тг„ -+ 0, п - оо.

Д.М.Чибисовым и И.Пфанцаглем было доказано, что "из асимптотической эффективности критериев следует асимптотическая эффективность второго порядка", то есть более того

у/п{ії*„ — 7Г„) —* 0, п -> со.

Для сравнения таких критериев представляет интерес нахождение величины

г = lim п(тг* — 7г„).

п-*оо * " '

Величина г тесно связана с асимптотическим дефектом, введённым Д.Ходжесом и Э.Леманом (J.L. Hodges Jr., E.L. Lehmaan (1970)), и линейно через него выражается. Исследование эффективности критериев обычно основывается на построении а.р. функций мощности жп и 7г*, которые следуют из соответствующих а.р. для функций распределения (ф.р.) статистик S и Л„ как при нулевой гипотезе, так и при альтернативе.

В отличие от этого подхода в работах Д.М.Чибисова(1982,1985) эффективность критериев исследовалась с использованием свойств отношения правдоподобия, как в описанном выше подходе Ле Кама, без построения

а.р., и была получена формула для вычисления величины г в виде некоторой условной дисперсии. При этом предполагалось, что А„ допускает стохастическое разложение, зависящее от сумм независимых случайных величин. Однако это предположение не выполняется для широкого класса статистик, представляющих интерес, например, для R-, L- и U-статистик, поскольку в этих случаях Д„ не представляется как функция от сумм независимых св. В диссертации доказан аналог формулы для г в случае R-, L- и U-статистик (критериев). Причём достаточные условия для справедливости этой формулы приведены в терминах произвольного статистического эксперимента.

Цель работы — систематическое изучение с единой точки зрения распределений асимптотически эффективных статистик при справедливости альтернативных гипотез в задачах проверки гипотез.

Методы исследования. Основные результаты диссертации получены с помощью методики, сочетающей элементы метода характеристических функций и свойств эмпирических процессов. Также используются прямые вероятностные методы. В рассматриваемых нами задачах эффективным оказалось представление исходных статистик в виде достаточно гладких функционалов от эмпирических функций распределения.

Научная новизна работы состоит в следующем:

  1. Впервые с единых позиций исследуются оценки скорости сходимости и асимптотические разложения для распределений асимптотически эффективных статистик.

  2. Получены а.р. при альтернативах для статистик, допускающих стохастическое разложение, зависящее от сумм независимых случайных величин.

  3. Известная формула для асимптотического дефекта обобщается на случай R-, L- и U-критериев.

  4. Получена формула для асимптотического дефекта комбинированного L-критерия.

Теоретическое и прикладное значение. Работа имеет теоретический характер. Показано, что асимптотические свойства часто используемых асимптотически эффективных статистик могут быть исследованы единым методом, сочетающим технику преобразований Фурье с возможностью представления рассматриваемой статистики в виде гладкого функционала от эмпирической функции распреде-

ления.

Результаты могут найти применения в прикладных исследованиях, поскольку их использование приводит к сокращению вычислений, повышению точности и возможности сравнивать асимптотически эквивалентные критерии, при этом понятие дефекта является также важным для приложений, поскольку может быть интерпретировано в терминах числа наблюдений, необходимого для различения гипотез с заданной точностью.

Апробация работы. Результаты диссертации докладывались в разное время на 4 Советско-Японском Симпозиуме (Тбилиси 1982) по теории вероятностей и математической статистике, на 16 Всесоюзной школе-коллоквиуме по теории вероятностей и математической статистике (Бакуриани 1982), на Эй-леровском семинаре посвященном А.Н.Колмогорову (Санкт- Петербург, 1993), на Ломоносовских чтениях в МГУ (1994), на международных семинарах по проблемам устойчивости стохастических моделей (Казань 1995, Дебрецен 1997), на международной конференции по прикладной информатике (Носвай, Венгрия, 1997), на Всероссийской конференции по теории вероятностей и математической статистике (Абрау-Дюрсо, 1995), на семинарах по математической статистике МИРАН (руково-итель Д.М.Чибисов) и Санкт-Петербургского отделения МИРАН (руководитель И.А.Ибрагимов), на семинаре по избранным вопросам теории вероятностей (руководители В.М.Золотарёв, В.М.Круглов, В.В.Калашников), а также в Пекинском университете (1995) и университетах Голландии (Амстердам, Лейден, Утрехт, 1995, 1996).

Всего по теме диссертации опубликовано 25 работ, 19 из которых цитируются в диссертации.

Структура и объём работы. Диссертация состоит из введения, трёх глав и списка литературы, содержащего 177 наименований. Объем работы — 212 страниц.

Во введении (27 стр.) излагается история проблемы, обсуждаются общие постановки задач и их современное состояние, описываются основные результаты, представленные в диссертации.

В главе 1 (29 стр.) получены оценки скорости сходимости функций распределения статистик, "близких" к оптимальным в задаче проверки гипотез, при справедливости альтернативной гипотезы. Доказывается общая теорема в терминах произвольного статистического эксперимента.

Затем эта теорема применяется к L-, R- и U-статистикам.

В главе 2 (58 стр.) строятся а.р. при альтернативах для "близких" статистик и статистик, допускающих стохастическое разложение, зависящее от нормированных сумм независимых случайных величин. Рассмотрены также L-, R- и U-статистики.

В главе 3 (73 стр.) получена формула для предельного отклонения функции мощности асимптотически эффективных L-, R- и U-критериев от огибающей функции мощности. Доказана общая теорема, которая применяется, как к специальному случаю, к критериям основанным на L-, R- и U-статистиках. Рассмотрены также комбинированные L-крите-рии.

Похожие диссертации на Асимптотический анализ распределений некоторых асимптотических эффективных статистик в задачах проверки гипотез