Электронная библиотека диссертаций и авторефератов России
dslib.net
Библиотека диссертаций
Навигация
Каталог диссертаций России
Англоязычные диссертации
Диссертации бесплатно
Предстоящие защиты
Рецензии на автореферат
Отчисления авторам
Мой кабинет
Заказы: забрать, оплатить
Мой личный счет
Мой профиль
Мой авторский профиль
Подписки на рассылки



расширенный поиск

Аппроксимация второго порядка и бутстреп для усеченных сумм и L-статистик Грибкова, Надежда Викторовна

Диссертация, - 480 руб., доставка 1-3 часа, с 10-19 (Московское время), кроме воскресенья

Автореферат - бесплатно, доставка 10 минут, круглосуточно, без выходных и праздников

Грибкова, Надежда Викторовна. Аппроксимация второго порядка и бутстреп для усеченных сумм и L-статистик : диссертация ... доктора физико-математических наук : 01.01.05 / Грибкова Надежда Викторовна; [Место защиты: Санкт-Петербургское отделение математического института РАН].- Санкт-Петербург, 2011.- 246 с.: ил.

Введение к работе

В диссертации исследуется асимптотика второго порядка распределений усеченных сумм, L-статистик и их бутстреп-версий, изучаются свойства порядковых статистик, устанавливаются новые формулы, соотношения.

Актуальность темы. L-статистики - это краткое название линейных функций членов вариационного ряда. Впервые использование взвешенных сумм порядковых статистик в качестве оценок параметров распределений было предложено и обосновано, согласно историческому очерку С.Стиглера1, П.Дэниеллом2 в 1920 году.

Хорошо известно, что L-статистики и, в частности, усеченные суммы элементов вариационного ряда играют ключевую роль в теории робастных статистических выводов (см., например, книгу Р.Маронна и др.3 и более ранние монографии П.Хьюбера4, Ф.Хампеля и др.5). Изучение асимптотических свойств L-статистик на протяжении последних 50-60-ти лет привлекало внимание многих известных ученых, таких, как Дж.Тьюки, П.Бикел, С.Стиглер, Г.Шорак, Д.Мэйсон, В.ван Цвет, П.Хьюбер, П.Холл и др.

Значительный интерес к L-статистикам, был обусловлен, конечно, в первую очередь приложениями, но существовала и другая немаловажная причина чисто теоретического интереса к ним - это своеобразная, связанная с упорядочением природа зависимости слагаемых, образующих L-статистику, которая делает изучение ее асимптотики довольно трудным. Необходимость развития асимптотической теории L-статистик начиная с 70-х годов ХХ-го века стимулировала открытие в этой области новых подходов и методов. В частности, в работе П.Бикела6 было впервые упомянуто о возможности аппроксимации L-статистик ^/-статистиками второго порядка. Впервые этот подход был успешно применен Р.Хелмерсом7 для получения неравенств типа Берри - Эссеена для L-статистик. Асимптотическая теория ^7-статистик была существенно продвинута в 80-90-е годы, что позволило эффективно использовать метод ^/-статистической аппроксимации для исследования асимптотических свойств симметричных статистик.

Как L-статистики, так и ^7-статистики являются симметричными функциями элементов выборки, то есть принадлежат классу так называемых

1Stigler, S.M., Simon Newcomb, Percy Daniell and the history of robust estimation 1885-1920 // J. Amer. Statist. Assoc, 1973, v. 68, no.344, p. 872-879.

2Daniell, P.J. Observations weighted according to order // American Journal of Mathematics, 1920, v. 42, p. 222-236.

3Maronna, R., Martin, R. D. and Yohai, V. Robust Statistics - Theory and Methods, Wiley, New York, 2006.

4Хьюбер, П. Робастпость в статистике, М.: Мир, 1984.

5Хампель Ф.Р., Рончєтти Э.М., Рассеу П.Д., Штаэль В.А. Робастпость в статистике. Подход па основе функций влияния, М.: Мир, 1989.

6Bickel, P.J., Edgeworth expansions in nonparametric statistics // Ann. Statist., 1974, v. 2, p. 1-20.

7Helmers, R., A Berry - Esseen theorem for linear combinations of order statistics // Ann. Probab., 1981, v. 9, p. 342-347.

симметричных статистик. В диссертации свойства усеченных сумм и L-статистик анализируются, в том числе, в контексте теории симметричных статистик. Часть результатов диссертации связана с работами В. ван Цвета8, Х.Путтера и В. ван Цвета9, В.Бенткуса и др.10.

Влияние крайних членов вариационного ряда на асимптотику сумм исследовалось многими авторами, начиная с работ Д.Дарлинга (1952), Д.З.Арова и А.А.Боброва (1960), В.А.Егорова и В.Б.Невзорова (1974, 1975), П.Холла (1978), можно упомянуть также более поздние работы Ш.Чёргё и др. (1986, 1988, 2001), Л.Пенга (2001), Р.Кулика (2008). В многомерной ситуации (при упорядочивании по норме) этот вопрос изучался Ю.А.Давыдовым и А.В.Нагаевым (2004), в контексте бутстрепа влияние крайних членов изучали П.Деовельс, Д.Мэйсон и Г.Шорак (1993), П.Бикел, Ф.Гётце и В.ван Цвет (1997). Если вопросы, относящиеся к асимптотике первого порядка усеченных сумм (то есть класс возможных предельных законов, условия сходимости к ним, необходимые и достаточные условия асимптотической нормальности и т.д.) изучены достаточно полно в работах Ш.Чёргё и др.11, П.Гриффина и В.Пруитта12 и других авторов, то до недавнего времени имелось совсем

мало работ, посвященных уточнениям. Фактически нам известна только

1 з одна статья , в которой получены некоторые оценки скорости сходимости

к нормальному закону для усеченных сумм в общем случае, когда доля

отсекаемых по краям наблюдений является последовательностью, которая

может, в частности, стремиться к 0 при п —> оо, где п - объем исходной

выборки (и эти оценки не оптимальны), и совсем не существовало работ,

посвященных получению разложений типа Эджворта в этой общей ситуации.

Другое направление исследований связано с получением разложений типа

Эджворта для усеченного среднего - хорошо известной оценки параметра

сдвига - и для его бутстреп-версии. До недавнего времени явный вид

формул разложения Эджворта для этой статистики не был известен даже

в случае стандартной неслучайной нормировки, тем более - в случае

стьюдентизации. В статье П.Холла и А.Падманабхана14 авторы пишут о том,

8van Zwet, W.R., A Berry - Esseen bound for symmetric statistics // Z. Wahrsch. Verw. Gebiete, 1984, v. 66, p. 425-440.

9Putter, H., van Zwet, W.R., Empirical Edgeworth expansions for symmetric statistics // Ann. Statist., 1998, v. 26, p. 1540-1569.

10Bentkus, V., Gotze, F., van Zwet, W.R., An Edgeworth expansion for symmetric statistics // Ann. Statist., 1997, v. 25, p. 851-896.

11Csdrgo, S., Haeusler, E., Mason, D.M., The asymptotic distribution of trimmed sums // Ann. Probab., 1988, v. 16, p. 672-699.

12GrifEn, P.S., Pruitt, W.E., Asymptotic normality and subsequential limits of trimmed sums // Ann. Probab., 1989, v. 17, p. 1186-1219.

13Егоров, B.A., Невзоров, В.Б., Некоторые оценки скорости сходимости сумм порядковых статистик к нормальному закону // Зап. научн. семинаров ЛОМИ, 1974, т. 41, с. 105-128.

14Hall, P., Padmanabhan, A.R., On the bootstrap and the trimmed mean // J. Multivariate Analysis, 1992, v. 41, p. 132-153.

что в случае (стьюдентизованного) усеченного среднего получение разложения Эджворта в явном виде очень сложно, и предлагают заменить аналитические трудности бутстреп-моделированием. В данной работе мы все же получаем явный вид формул асимптотических разложений для этой статистики и ее стьюдентизованной версии.

Бутстреп-метод, предложенный Б.Эфроном15 в 1979 году, получил широкое распространение в последние три десятилетия. Этот метод предполагает интенсивное компьютерное моделирование и демонстрирует результаты, сопоставимые с теми, что дают классические процедуры, а в ряде случаев превосходит их в эффективности. Свойство корректности второго порядка, означающее тот факт, что бутстреп-распределение статистики точнее приближает ее истинное распределение, чем предельный закон, если таковой существует, вызвало огромный интерес исследователей в конце 80-х и 90-е годы ХХ-го века и породило шквал публикаций на эту тему. Доказательство корректности второго порядка, как правило, опирается на разложения Эджворта (см., например, монографию П.Холла16), поэтому тематика, связанная с получением асимптотических разложений типа Эджворта, приобрела в последние годы новое звучание и актуальность.

Еще один круг проблем, рассмотренных в диссертации, касается получения представлений типа Бахадура - Кифера, означающих связь квантильного и эмпирического процессов. Впервые такое представление для выборочной квантили было открыто Р.Бахадуром (1966), результат Бахадура был уточнен Дж.Кифером в серии работ (1967-1970). Получение представлений типа Бахадура - Кифера17 является задачей теории эмпирических процессов18, которая имеет фундаментальное значение для математической статистики и продолжает интенсивно развиваться.

Получаемые в диссертации представления типа Бахадура - Кифера используются в данной работе для конструирования ^/-статистических аппроксимаций для усеченных сумм.

Цель работы. Основная цель работы - исследование асимптотических свойств распределений усеченных сумм случайных величин, L-статистик и их бутстреп-версий: оценивание скорости сходимости к нормальному закону, нахождение асимптотических разложений, доказательство корректности бутстреп-аппроксимаций. Особый интерес для нас представляет случай слегка усеченной суммы, когда доля отсекаемых по краям элементов вариационного ряда стремится к нулю при стремлении объема выборки к бесконечности, и случай усеченного среднего, играющего важную роль в теории робастной

15Efron, В., Tibshirani, R.J., An Introduction to the Bootstrap, Chapman and Hall, N.Y., 1993.

16На11, P., The Bootstrap and Edgeworth Expansion, Springer-Verlag, New York, 1992.

17Daheuv&/s, P., Mason, D.M., Bahadur - Kiefer - type processes // Ann. Probab., v. 18, 1990, p. 669-697.

lsShorack, G.R., Wellner, J.A., Empirical Processes with Applications to Statistics, Springer, 2009.

статистики. Целью работы является также дальнейшее изучение свойств квантильных процессов, получение для них новых формул, оценок и представлений.

Общая методика исследования. Для доказательства основных результатов по аппроксимации распределений нормированных и стьюдентизованных усеченных сумм мы конструируем стохастические ^/-статистические аппроксимации, оцениваем остаточные члены этих аппроксимаций, применяем результаты из теории ^7-статистик и теории симметричных статистик, свойства правильно меняющихся функций. При изучении случайных нормировок (стьюдентизации) мы строим также аппроксимации оценок асимптотической дисперсии суммами независимых случайных величин.

Существенную роль при построении этих ^/-статистических аппроксимаций играет уинсоризация исходных случайных величин и специальные представления типа Бахадура - Кифера, справедливость которых мы доказываем в качестве вспомогательных результатов. При получении эмпирических асимптотических разложений мы используем ядерные оценки плотности, оцениваем их точность. В части, касающейся корректности бутстреп-метода, применяются факты и результаты из теории бутстрепа, методы гармонического анализа, оценки для моментов порядковых статистик. Для доказательства результатов типа Бахадура - Кифера мы используем свойства порядковых статистик, экспоненциальные неравенства Бернштейна, Хёфдинга и Петрова.

Научная новизна и основные результаты. Все результаты, представленные в диссертации, являются новыми, к наиболее существенным из них относятся следующие.

  1. Найден новый подход к исследованию асимптотики распределений нормированных и стьюдентизованных усеченных сумм независимых одинаково распределенных случайных величин. Этот подход основан на оригинальной ^/-статистической стохастической аппроксимации, для построения которой мы используем уинсоризацию исходных случайных величин и специальные представления типа Бахадура - Кифера. Предлагаемая нами аппроксимация отличается от приближений, использующих линейную и квадратичную группы слагаемых разложения Хёфдинга, и имеет по сравнению с ними более простую и удобную для работы структуру.

  2. Впервые получены асимптотические разложения типа Эджворта для нормированных и стьюдентизованных усеченных сумм, причем рассмотрена общая ситуация, когда доли усечения ап = кп/п и п = тп/п (п - число наблюдений, кп: тп - номера порядковых статистик, по которым происходит усечение, min(;n,mn) —> оо, п —> оо) являются последовательностями, которые могут стремиться к нулю при п —> оо (слабое усечение). При этом

предполагается, что исходное распределение не имеет конечной дисперсии.

3. Получены оптимальные по порядку оценки скорости сходимости в
центральной предельной теореме для последовательностей нормированных
усеченных сумм. При этом впервые доказано, что в случае, когда исходное
распределение F не имеет конечного второго момента, оптимальной оценкой

-1/2

скорости сходимости к нормальному закону является оценка порядка rn , где гп = тт(кпп).

  1. Исследован вопрос о состоятельности бутстреп-аппроксимации для усеченного среднего. Впервые доказано, что модифицированный тп -бутстреп (т - объем бутстреп-выборки, т/п —> 0, т —> оо) без каких-либо условий обеспечивает состоятельную оценку распределения нормированного усеченного среднего. В то же время классический бутстреп Эфрона (т = п) и нормальная аппроксимация не состоятельны, если исходное распределение имеет промежутки (интервалы ненулевой длины, имеющие нулевую L-меру), граничащие с квантилями, в которых происходит усечение.

  2. Найдены асимптотические разложения типа Эджворта для бутстреп-версий нормированного (и стьюдентизованного) усеченного среднего. С помощью полученных разложений доказана корректность бутстрепа второго порядка, то есть тот факт, что бутстреп-аппроксимация для усеченного среднего при определенных условиях на порядок точнее, чем нормальная аппроксимация.

  3. Получены новые специальные представления типа Бахадура - Кифера для последовательностей выборочных квантилей уровня ап Є (0,1), в том числе, для "хвостовых", когда ап может стремиться к 0 или к 1. Найдены не встречавшиеся ранее представления для сумм порядковых статистик, находящихся между ап выборочной и соответствующей генеральной квантилями. Впервые доказана справедливость представлений Бахадура - Кифера для квантилей бутстреп-выборки.

  4. Получены новые, оптимальные по порядку оценки типа Берри - Эссеена для L-статистик при слабых моментных ограничениях и для усеченных L-статистик. Исследован вопрос о состоятельности бутстреп-аппроксимации распределений нормированных L- статистик.

Теоретическая и практическая значимость. Диссертация носит в основном теоретический характер, хотя некоторые ее результаты, особенно относящиеся к бутстреп-методу, применимы и в прикладной статистике. Методы и подходы, разработанные в диссертации, могут быть использованы для решения близких задач теории U- и L-статистик, в робастной статистике. Апробация. Результаты диссертации докладывались на следующих симпозиумах и конференциях: о Ц-15, 29-й Международные семинары по проблемам устойчивости сто-

хастических моделей, Суздаль, 1991 г., Пермь, 1992 г., Светлогорск, 2011 г. о Международная конференция "Асимптотические методы в теории вероятностей и математической статистике", С.-Петербург, 1998. о 3-й Санкт-Петербургский международный симпозиум по моделированию, С.-Петербург, 1998.

о 8, 9, 10-я Вильнюсские международные конференции по теории вероятностей и математической статистике, Вильнюс, Литва, 2002, 2006, 2010.

о 24-я Европейская конференция статистиков, Прага, 2002. о XI, XII, XIV, XVI-я Всероссийские школы-коллоквиумы по стохастическим методам, Сочи, 2004, 2005, 2007 г., Санкт-Петербург, 2009 г. о VI, VII, ХІ-й Всероссийские симпозиумы по прикладной и промышленной математике, Санкт-Петербург, 2005 г., Кисловодск, 2006, Сочи, 2010 г. о 22-я Международная северная конференция по математической статистике (NORDSTAT-2008), Вильнюс, Литва, 2008.

По результатам диссертации были сделаны доклады: на семинаре по предельным теоремам теории вероятностей в 1998 г. (руковод. - проф. В.В.Петров); на семинаре отдела PNA (Probability, Networks and Algorithms) математического центра CWI в Амстердаме, Нидерланды, в 2002 г. (руковод. -Р.Хелмерс); на городском семинаре по теории вероятностей и математической статистике в 2005, 2008, 2010 годах (руковод. - акад. И.А.Ибрагимов).

Соавтором Р.Хелмерсом были сделаны доклады в университетах Амстердама (2003), Гонконга (2004, 2007), Тель-Авива (2006), Сиднея (2008).

Публикации. Список работ по теме диссертации приведен в конце реферата. Основные результаты диссертации опубликованы в статьях [1]—[11] в журналах и изданиях, рекомендованных ВАК (перевод статьи [5] опубликован в журнале J.Math.Sci7 входящем в систему цитирования SCOPUS, статья [6] опубликована в книге, изданной VSP, Utrecht, статьи [8]-[9] опубликованы в журнале Mathematical Methods of Statistics, входящем в систему SpringerLink). Работы [12] [17] - это статьи, опубликованные в трудах конференций и препринты.

Основные результаты диссертации опубликованы также в сборниках тезисов упомянутых выше конференций.

Работы [8] [11] и [14] выполнены в соавторстве с Р.Хелмерсом (Нидерланды). В работе [8] соавтору принадлежит постановка задачи и идея использования ядерных оценок плотности в теореме 2.3, доказательство всех результатов принадлежит автору, в работе [9] соавтором предложено доказать теорему 2.7, касающуюся метода бутстреп-экстраполяции Бикела - Яхавы, в работе [10] - предложение о включении раздела 3 (Некоторые применения), в [11] - улучшение формулировок, [14] - это статья обзорного характера по полученным в работах [8]-[9] результатам.

Структура и объем диссертации. Диссертация состоит из введения, семи глав, разделенных на параграфы, и списка литературы. Библиография содержит 181 наименование. Общий объем диссертации составляет 251 страницу.

Похожие диссертации на Аппроксимация второго порядка и бутстреп для усеченных сумм и L-статистик