Содержание к диссертации
Введение
1 Введение 7
1.1 Введение главы 1 7
1.2 Основные понятия и обозначения, используемые в диссертации 10
1.3 Важнейшие результаты, известные в теории порядковых статистик 12
1.4 Краткое содержание работы 13
2 Обобщения леммы Бореля-Кантелли 31
2.1 Введение главы 2 31
2.2 Недавние обобщения леммы Бореля-Кантелли 34
2.2.1 Обобщения первой части леммы Бореля-Кантелли 34
2.2.2 Обобщение леммы Бореля-Кантелли для последовательностей событий, обладающих марковским свойством 35
2.3 Исследование асимптотических свойств максимумов в случае Fa-cxeMbi 39
3 Рекорды: распределения, предельные теоремы 43
3.1 Введение главы 3 43
3.2 Распределения рекордов 48
3.2.1 Распределения рекордных времен 48
3.2.2 Распределения рекордных величин 49
3.2.3 Распределения слабых рекордных величин в дискретном случае 51
3.2.4 Распределения слабых рекордных величин в случае, когда исходное распределение имеет конечное число атомов 54
3.2.5 Распределения рекордов с подтверждением 58
3.2.6 Распределения рекордных времен с подтверждением 60
3.2.7 Моменты рекордных времен с подтверждением 61
3.3 Предельные теоремы для слабых рекордных величин в дискретном случае Оглавление З
3.3.1 Усиленный закон больших чисел, центральная предельная теорема и закон повторного логарифма 63
3.3.2 Вероятности больших уклонений 67
3.3.3 Примеры 69
3.4 Применение теории правильно меняющихся функций для изучения асимп
тотического поведения отношений слабых рекордов 72
3.4.1 Вспомогательные результаты 73
3.4.2 Асимптотическое поведение отношений слабых рекордных величин 76
3.4.3 Асимптотическое поведение индикаторов слабых рекордных величин 81
3.4.4 Примеры 83
3.5 Асимптотические свойства рекордов с подтверждением 85
3.5.1 Асимптотические свойства рекордных величин с подтверждением 85
3.5.2 Асимптотические свойства рекордных времен с подтверждением 85
4 Статистические процедуры, связанные с рекордами 88
4.1 Введение главы 4 88
4.2 Критерии проверки гипотезы однородности, основанные на рекордах 90
4.2.1 Введение 90
4.2.2 Совместное распределение величин RMi при справедливости нулевой гипотезы 92
4.2.3 Распределения тестовых статистик 94
4.2.4 Распределения величин RMi и Rank{Y(j)) в случае справедливости альтернативной гипотезы Лемана 99
4.2.5 Мощности тестов при альтернативах Лемана 101
4.2.6 Равномерно наиболее мощный тест, основанный на величинах RMi 106
4.2.7 Альтернативные гипотезы сдвига 106
4.2.8 Тесты, в случае недостаточного количества рекордов 109
4.3 Информация Фишера, содержащаяся в рекордах 112
4.3.1 Введение 112
4.3.2 Абсолютно непрерывный случай 113
4.3.3 Информация Фишера, содержащаяся в слабых рекордных величинах 120
4.3.4 Информация Фишера, содержащаяся в верхних рекордных величинах 122
Оглавление 4
4.4 Тест, основанный на рекордах с подтверждением 127
5 Величины, регистрируемые около порядковых статистик и рекордов 134
5.1 Введение главы 5 134
5.2 Предельные теоремы для числа величин, регистрируемых около порядковых статистик 137
5.2.1 Распределения числа величин, регистрируемых около порядковых статистик. Предельные теоремы для них 137
5.3 Асимптотические свойства числа величин, регистрируемых около порядковых статистик, при изменении параметров 141
5.3.1 Экспоненциальный случай 141
5.3.2 Асимптотическое поведение числа величин, регистрируемых около порядковых статистик в случае, когда кп/п — a = 0 143
5.3.3 Асимптотическое поведение числа величин в случае, когда а Є (0,1) 145
5.3.4 Асимптотическое поведение числа величин, регистрируемых около порядковых статистик в случае, если a = 1 146
5.4 Асимптотическое поведение чисел околорекордных величин 148
5.4.1 Распределения чисел околорекордных величин 148
5.4.2 Ограниченный носитель 149
5.4.3 Предельные теоремы для чисел околорекордных величин 151
5.4.4 Асимптотическое поведение сумм околорекордных величин
5.5 Примеры 163
5.6 Приложение главы 5
5.6.1 Доказательства результатов параграфа 5.2 167
5.6.2 Доказательства результатов параграфа 5.3 171
6 Серии, основанные на порядковых статистиках и рекордах 176
6.1 Введение 176
6.2 Предварительные результаты 179
6.3 Ограниченный носитель 1 6.3.1 Серии, основанные на спейсингах порядковых статистик 181
6.3.2 Серии, основанные на спейсингах рекордных величин 183
Оглавление 5
6.4 Неограниченный носитель 186
6.4.1 Асиптотические результаты для серий, основанных на спейсингах порядковых статистик
6.4.2 Асиптотические результаты для серий, основанных на спейсингах рекордных величин 189
6.5 Серии в экспоненциальном и равномерном случаях 193
6.5.1 Равномерное распределение 193
6.5.2 Экспоненциальный случай 197
6.6 Проверка статистической гипотезы 199
7 Конкомитанты порядковых статистик и рекордов 201
7.1 Введение 201
7.2 Предварительные результаты 203
7.3 Сильные предельные теоремы для конкомитантов верхних порядковых статистик 207
7.4 Дальнейшие асимптотические результаты для конкомитантов верхних порядковых статистик 2 7.4.1 Асимптотические результаты для конкомитантов верхних порядковых статистик Y[ra-fc,ri] в случае, когда к стремится к бесконечности 212
7.4.2 Влияние неслучайных последовательностей на асимптотическое поведение конкомитантов верхних порядковых статистик 2 7.5 Сильные предельные теоремы для конкомитантов рекордов 215
7.6 Примеры и методы генерирования 2 7.6.1 Примеры 217
7.6.2 Генерирование конкомитантов верхних порядковых статистик и рекордов 220
8 Характеризационные теоремы 223
8.1 Введение 223
8.2 Характеризационные теоремы для слабых рекордов в дискретном случае 228
8.3 Характеризации, основанные на порядковых статистиках 231
Оглавление 6
8.4 Характеризация, использующая вторую рекордную величину и максимум выборки 235
Литература
- Важнейшие результаты, известные в теории порядковых статистик
- Обобщения первой части леммы Бореля-Кантелли
- Распределения рекордных времен с подтверждением
- Распределения тестовых статистик
Важнейшие результаты, известные в теории порядковых статистик
В главе 3 диссертационной работы рассматриваются рекордные величины. Математическая теория рекордов берет свое начало с работы Чендлера [61] (Chandler "The distribution and frequency of record values" 1952). На данный момент эта теория насчитывает большое количество работ, значительная часть из которых была опубликована в последние три или четыре десятилетия. Асимптотическая теория рекордов, так же как и экстремальных порядковых статистик, актуальна в связи с различными приложениями.
Определим последовательности верхних рекордных времен L(n) и величин Х(п) следующим образом:
Если второй знак неравенства в (3.1.1) заменить на , то вместо верхних рекордных времен и величин мы получим нижние рекордные времена Ll(n) и величины Xі (п). От верхних рекордных величин легко перейти к нижним, взяв вместо исходной последовательности величины —Xi,—X2,... или, если Хг 0 (г 1), случайные величины 1/Xi, 1/Хг,... Таким образом, можно ограничиться изучением только верхних рекордных времен и величин, а само слово "верхние" в данной работе мы будем опускать. Исключение составит параграф 4.3, в котором будут рассматриваться и верхние и нижние рекорды одновремен Глава 1. Введение но.
Для дискретных распределений и распределений, имеющих атомы, самостоятельный интерес представляют слабые рекордные времена и величины, введенные Верваатом [177] (Vervaat 1973). Если второй знак неравенства в (3.1.1) заменить на , то вместо рекордных времен и величин мы получим слабые рекордные времена Lw(n) и величины Xw(n). Вслед за работой Верваата [177], публикация Степанова [190] (1992) явилась второй работой, посвященной слабым рекордам. В ней была предложена концепция перехода от зависимых слабых рекордных величин к суммам независимых величин, имеющих геометрические распределения.
Часто при проведении статистических экспериментов выборки содержат посторонние наблюдения. Такие нетипичные наблюдения могут сильно влиять на статистические выводы. Предположим, что выборка, состоящая из независимых одинаково распределенных ХІ с непрерывной функцией распределения F, может быть "загрязнена" одним или несколькими наблюдениями, взятыми из выборки независимых одинаково распределенных Yj с другой непрерывной функцией распределения G. Предположим, что ХІ Yj, где означает стохастическое сравнение величин ХІ и У}. Данное сравнение подразумевает, что величины Yj имеют больше шансов стать рекордами в совместной выборке, состоящей из величин Xi HYJ. Такие рассуждения указывают на необходимость введения нового понятия рекордов - рекордов с подтверждением. Понятие рекордных величин Х(п) и рекордных времен L(n) с подтверждением было предложено Невзоровым [145] (Nevzorov 2012). Прежде чем определить рекорды с подтверждением, зафиксируем натуральные га, к, такие что 1 га к. Пусть
Лемма 3.2.4 и представление 3.2.1 обобщаются в главе 3 на случай, когда функция распределения F имеет конечное число атомов (см. лемму 3.2.6). С помощью леммы 3.2.4 и представления 3.2.1 доказываются предельные теоремы для слабых рекордных величин. Приведем некоторые из них.
В параграфе 3.4 аппарат теории правильно меняющихся функций используется для получения предельных теорем как для отношений слабых рекордных величин Zw(n,m) = Xw(n + m)/Xw(n), так и для величин Q". Приведем некоторые результаты этого параграфа.
Естественно задаться вопросом - зачем нужно использовать рекорды в статистических процедурах. Почему бы не воспользоваться классической выборкой? Дело в том, что в некоторых случаях традиционная выборка может быть недоступна. В то же время рекордные величины (полученные из данной выборки) могут быть известны. Такие рекордные выборки рассматривались в работах Саманиего и Витакера [164], [165] (Samaniego and Whitaker 1986, 1988) и назывались обратными выборками первого рода. Подобного типа выборки появляются в экспериментах теории сопротивления материалов, а также в теории надежности, где измерения проводятся последовательно и доступными оказываются величины, которые превосходят все предыдущие величины. Отметим, что использование выборок, состоящих только из рекордных величин, возможно также в случае, когда традиционные выборки содержат слишком много наблюдений.
В параграфе 4.2 рассматриваются критерии проверки гипотезы однородности, основанные на рекордных величинах. Пусть Xi, Х2 две независимые выборки независимых одинаково распределенных случайных величин с функциями распределения Fx и Fy, соответственно. Пусть нулевая гипотеза состоит в том, что при всех значениях аргумента функции распределения равны между собой, то есть Но : Fx = Fy. Пусть односторонняя альтернативная гипотеза Hi имеет вид: существуют значения аргумента, для которых Fx Fy (или Нг : Fx Fy). - последовательности рекордных величин, полученных из выборок Xi,X2,... и Уі,І2, Для натурального г 1 определим три тестовые статистики. Первую статистику RP(r) назовем статистикой доминирования У-рекордов:
Величины Rank(y(z)) являются рангами рекордных величин Y(i) в последовательности У(1),... ,Y(r),X(l),... ,X(RP(r)). Тест, основанный на величине суммы рангов рекордов, аналогичен хорошо известному тесту Вилкоксона [185] (Wilcoxon 1945), основанному на сумме рангов порядковых статистик. В параграфе 4.2 рассматриваются критерии проверки гипотезы однородности, основанные на статистиках RP(r), RM r) и RW(r). Эти критерии обсуждались ранее в нашей работе [199].
Информация Фишера (FI), содержащаяся в рекордах, слабых рекордах и в числах рекордных величин, исследуется в параграфе 4.3. Данные исследования используются при нахождении оценок неизвестных параметров. Приведем один из результатов параграфа 4.3 (теорема 4.3.1 ниже). Будем говорить, что распределение F(x \ 9) (с плотностью f{x \ 9)) принадлежит семейству распределений Ехр1( ) (или Ехр2(0)), если существуют измеримые функции с{9) и к{х), такие что l_pLL\ = с(9)к(х) (или р,хх\1 = с{9)к{х)). Информация Фишера, содержащаяся в верхних и нижних рекордных величинах и временах, извлеченных из популяции, принадлежащей семействам Ехр ) и Ехр2(#), обсуждается в теореме 4.3.1 (см. также нашу работу [204]). Теорема 4.3.1 При любом п 1 справедливы равенства:
Обобщения первой части леммы Бореля-Кантелли
Таким образом, равенство Р(Ап б.ч.) = 0 может выполняться и в случае, когда ряд Yl Li Р(Ап) расходится. Примеры таких последовательностей приведем в последующих главах диссертационной работы, а также в этой главе в параграфе 2.3. Следующий результат, также полученный в [207], вытекает из доказательства леммы 2.2.1. Обобщение леммы Бореля-Кантелли для последовательностей событий, обладающих марковским свойством
Результаты данного раздела получены в работе Степанова [227] ( Stepanov 2014). Здесь будут представлены технические обобщения леммы Бореля-Кантелли удобные для работы с цепями Маркова.
Определим последовательность событий, обладающих марковским свойством. Определение 2.2.1. Мы скажем,, что последовательность событий Ап (п 1) обладает марковским свойством, если последовательность I& (п 1) является цепью Из определения видно, что последовательности событий, обладающие марковским свойством, тесно связаны с цепями Маркова.
Далее в этом параграфе мы исследуем при каких условиях для последовательностей событий, обладающих марковским свойством, выполняются равенства Р{Ап б.ч.) = 0 (= 1). Легко показать, что условие Р(Ап) фї 0 является достаточным для выполнения неравенства Р(Ап б.ч.) 0. В следующей лемме мы будем предполагать, что Р(Ап) — 0.
Лемма 2.2.3. Пусть Ai,A2,... - последовательность событий, обладающих марковским свойством, такая что Р(Ап) — 0. Выберем номер N достаточно большим, таким что при п N справедливы неравенства Р(Ап) ф 1. Рассмотрим ряд
Поскольку при х — 0 справедливо 1п(1 — х) —х, сходимость (расходимость) ряда 2 п P(Ai+i I Щ) эквивалентна сходимости (расходимости) ряда J ralnP( 4+1 Af). Верно также и обратное утверждение. Поскольку Р(Ап б.ч.) = lim oo Р(и1пАі), утвер-ж:дение леммы 2.2.3 следует из (2.2.3).
Замечание 2.2.1. Следует отметить, что первое утверждение леммы 2.2.3 может быть также получено из леммы 2.2.1, а второе утверждение леммы 2.2.3 - из леммы 2.1.4 Глава 2. Обобщения леммы Бореля-Кантелли 37
Поскольку P(An+i Асп) = р"(Ас) и Р(Асп) — 1, лемму 2.2.3 можно переписать следующим образом.
Лемма 2.2.4. Пусть Ai,A2,... - последовательность событий, обладающих марковским свойством, такая что Р(Ап) — 0. Рассмотрим, ряд
Если ряд (2.2.4) сходится, то справедливо равенство Р(Ап б.ч.) = 0. Если ряд (2.2.4) расходится, то Р(Ап б.ч.) = 1. Очевидно, что если для последовательности Ап справедливо марковское свойство, то P(AnAn+l... Ап+к) = Р{Ап Ап+1)... Р{Ап+к_1 Ап+к)Р[Ап+к). Пользуясь методом доказательства леммы 2.2.3, можно доказать следующий результат. Лемма 2.2.5. Пусть Ai,A2,... - последовательность событий, обладающих марковским свойством, такая что Р(Ап) — 0. Рассмотрим, ряд
Если ряд (2.2.5) сходится, то справедливо равенство Р(Ап б.ч.) = 0. Если, ряд (2.2.5) расходится, то Р(Ап б.ч.) = 1.
Представим дальнейшие технические обобщения леммы Бореля-Кантели, связанные с теорией цепей Маркова. Говорят, что последовательность Хі,Х2,... является цепью Маркова порядка к (или имеет память порядка к), если для всех п к справедливо: Определение 2.2.2. Мы скажем,, что последовательность событий Ап (п 1) обладает марковским свойством порядка к, если последовательность 1АП (п 1) является, цепью Маркова, порядка к. Глава 2. Обобщения леммы Бореля-Кантелли 38 Лемма 2.2.3 и лемма 2.2.4 могут быть легко обобщены на такие последовательности. Лемма 2.2.6. Пусть Ai,A2,... - последовательность событий, обладающих марковским свойством порядка к, такая что Р(Ап) — 0. Выберем, номер N достаточно большим таким, что при п max{fc, N} справедливы неравенства Р(Ап) ф 1. Рассмотрим ряд
В этом параграфе будем предполагать, что Х\,Х2,... ,Хп - независимые непрерывные случайные величины, имеющие функции распределения вида Fai, Fa2,... , Fan, где он 0 (г 2) и о \ = 1. Данная модель известна в литературе как Fa-cxeMa, где независимые Xi,X2,... ,Хп имеют общий носитель. Если ОІІ = 1, то Fa-cxeMa сводится к случаю независимых одинаково распределенных Xi. Fa-схема была впервые предложена Ян-гом [186] (Yang 1975). Данную модель можно считать одной из наиболее удачных для изучения последовательностей независимых нестационарных случайных величин. Среди многих работ, в которых обсуждалась Fa-cxeMa, упомянем работы Невзорова [10], [11] (Nevzorov 1985, 1986), Пфайфера [156], [157], (Pfeifer 1989, 1991), Байрамова и Степанова [198] (Bairamov and Stepanov 2013) и Степанова [227] (Stepanov 2014).
Пользуясь результатами этой главы, исследуем некоторые асимптотические свойства максимумов в случае Fa-cxeMbi. Пусть Мп = max{Xi,..., Хп}, Ап = 1 + 0!2 + ... + ап и хп - неубывающая последовательность вещественных чисел. Очевидно, что Р(Мп хп) = FAn(xn). Пусть справедливо неравенство
Отметим, что если Fan(xn) — 1, то ряд, стоящий в (2.3.2), сходится при более слабых предположениях, чем ряд в (2.3.1). Можно привести пример, в котором достаточные условия для выполнения равенства Р(Мп хп б.ч.) = 0 не могут быть получены с помощью леммы Бореля-Кантелли (лемма 2.1.1). В то же время лемма 2.2.5 позволяет получить желаемый результат с необходимыми и достаточными условиями. Такой пример предложен ниже.
Распределения рекордных времен с подтверждением
Поскольку величина RP(r) имеет дискретное распределение, для данного уровня значимости а не всегда можно подобрать соответствующее sp. Можно выбрать критическое значение sp равным наименьшему целому числу, удовлетворяющему равенству P{RP sp\H0 : Fx = Fy) = o а. В таблице 4.1 даны соответствующие критические значения Sp для различных уровней значимости а = 10%, 5% и 1% и г = 1(1)5. Отметим, что в простейшем случае (когда г = 1) критические значения могут быть найдены из равенства
Последнее соотношение означает, что величина RP(r) имеет отрицательное биномиальное распределение с параметрами (г, 1/2). Таким образом, распределение RP(r) было найдено без использования совместного распределения величин RMi,...,RMr. Такое возможно только для статистики RP(r) и невозможно для статистик RM и RW ry
Отметим, что величина RM также имеет дискретное распределение. Соответственно, заданный уровень а может отличаться от точного уровня значимости а . В таблице 4.2 представлены критические значения SM ДЛЯ соответствующих уровней значимости а = 10%, 5% и 1% и г = 2(1)5. В простейшем случае (когда г = 1) тест, основанный на статистике доминирования максимума У-рекордов, совпадает с тестом, основанным на статистике доминирования У-рекордов.
Статистические процедуры, связанные с рекордами 97 мается альтернативная Hi, если статистика критерия Wni n2 принимает большие значения. Мы предложим тест аналогичный тесту Вилкоксона - тест, основанный на статистике сумм рангов У-рекордов. Пусть Ыапк(У(г)) - ранги рекордных величин У (г) в последовательности X и У-рекордов. Например, для последовательности Х(1) Х(2) У(1) Х(3) У(2) Х(4) ... имеем: Rank(y(l)) = 3 и Rank (У (2)) = 5. Статистику критерия для такого теста определим равенством
В таблице 4.3 представлены критические значения sw и соответствующие уровни значимости а = 10%, 5% и 1% для г = 1(1)5. Отметим, что в простейшем случае (когда г = 1) справедливо: RW(i) = RM\ + 1 = RP{\) + 1 = RM(\) + 1. Последнее означает, что при г = 1 тесты основанные на статистиках RP ,RM(r) и RW(r) совпадают.
Леман [124] (Lehmann 1953) предложил простой класс альтернатив для исследования мощности непараметрических тестов, основанных на последовательных рангах величин Yi. Величины Yi берутся из совместной выборки, состоящей из наблюдений Х\,... ,ХП1 и Yi,...,Ym. Отметим, что все тесты этого параграфа основаны на последовательных рангах, то есть они удовлетворяют условиям класса тестов, исследованных Леманом. Идея Лемана состояла в рассмотрении класса альтернатив, определяемых равенством H1:FY = g(Fx), (4.2.6) где g - дифференцируемая функция, задаваемая на отрезке [0,1], такая что g(0) = 0 и д{1) = 1. Он показал, что распределения последовательных рангов при справедливости альтернативной гипотезы Hi зависят только от функции д и не зависят от Fx и Fy. Он также показал, что порядковые статистики, полученные из выборки независимых равномерно распределенных на отрезке [0,1] случайных величин. Анало Глава 4. Статистические процедуры, связанные с рекордами гичный результат справедлив и для тестов, основанных на величинах RMi и Rank(Y(j)).
Теорема 4.2.2. Пусть справедлива альтернативная гипотеза Лемана И\ : Fy = g(Fx), где g - дифференцируемая функция, определенная на отрезке [0,1], такая что g(0) = 0 и д{1) = 1. Тогда мощность любого теста, основанного на величинах RMi и Rank{Y(j)), зависит только от функции д. Распределения этих статистик задаются для к\,..., кг 0 и 1 ті ... тг равенствами: рекорды, полученные из последовательности случайных величин, имеющих стандартное экспоненциальное распределение, a U(l) U{2) ... - рекорды, полученные из последовательности величин, имеющих стандартное равномерное распределение.
Исследуем мощность теста, основанного на статистике доминирования У-рекордов. Пусть функция /Здр (7) (7 Є (0,1)) является мощностью такого теста при уровне значимости а и альтернативе Hi, определенной (4.2.10). Из следствия 4.2.1 следует, что статистика RP(r) является суммой г независимых одинаково распределенных геометрических
В вышеперечисленных работах, в частности, предлагалось сравнивать FI, содержащуюся в п первых рекордных величинах, с FI, содержащейся в п независимых наблюдениях. Работы [105], [106] и [108] предлагали сравнивать FI, находящуюся в п первых рекордных величинах и временах, с FI, находящейся в п независимых наблюдениях. Следует отметить, что выборка, состоящая из п независимых наблюдений, содержит приблизительно [Inn] рекордных величин, где [у] обозначает целую часть числа у. Таким образом, даже если FI, находящаяся в п первых рекордных величинах и временах, и превосходит FI, находящуюся в в и независимых наблюдениях, это не означает, что рекордные времена и величины более привлекательны для статистических выводов. Ясно, что рекордные величины и времена, порожденные некоторой выборкой, содержат информацию Фишера, которая не превосходит информацию, содержащуюся в самой выборке.
Отметим, что в некоторых случаях классическая выборка может быть недоступна. В то же время рекордные величины, возникающие в результате данного эксперимента, могут быть известны. Выборка, в которой рассматривается фиксированное число рекордных статистик, была предложена в работах [164] и [165]. Такую выборку было предложено называть обратной выборкой первого рода. Подобные выборки обсуждались во введение диссертации.
При проведении некоторых экспериментов даже рекордные величины могут быть недоступны. Предположим, что в результате эксперимента мы получаем информацию только о количестве рекордных величин, принадлежащих различным интервалам. В такой ситуации естественно изучать FI, содержащуюся в числах рекордных величин, принадлежащих соответствующим интервалам. В дискретном случае, когда Хг принимает значения
Пусть также In, In(Ru), In(RuTu), In(M) и I(Xhn,... ,Xi n) будут обозначать FI, содержащуюся, соответственно, в независимых одинаково распределенных Xi,... ,ХП, во всех верхних рекордных величинах, принадлежащих данной выборке, во всех верхних рекордных величинах и временах, принадлежащих данной выборке, в максимуме выборки Мп и в нижних порядковых статистиках Х\,П}... ,Xi n данной выборки. В случае исследования нижних рекордов будем использовать букву / вместо буквы и. Отметим, что информации Фишера зависит от параметра 9. Однако во всех обозначениях информации Фишера будем опускать эту букву.
Работая с обратными выборками первого рода, будем использовать обозначения Jn(Ru), Jn(RuTu) и JniW) для FI, содержащейся, соответственно, в п первых верхних рекордных величинах, в п первых верхних рекордных величинах и временах, а также в п слабых рекордных величинах. Для обратных выборок второго рода запись 1(ци(а,Ь)) будет обозначать информацию Фишера, содержащуюся в случайной величине ци(а,Ь), т.е. FI, определяемую числом верхних рекордных величин, принадлежащих интервалу (а, Ъ). Наконец, 1(Сп) будет обозначать FI, содержащуюся в величине , а 1(%) - информацию Фишера, определяемую величинами oV ,CJ.
Распределения тестовых статистик
Термин "серия успехов" был, по-видимому, впервые использован при описании испытаний Бернулли. Понятие "успеха" впоследствии варьировалось. "Успехом" называли попадание величин в заданную область, определенный порядок расположения величин и т.д. Главным образом "серии успехов" изучались в рамках теории цепей Маркова. Полученные результаты применялись в биостатистике, медицине, биологии, теории надежности. Подробная информация по данному вопросу содержится, в частности, в книгах [4], [19], [41], [57], [93]. В нашей работе вместо термина "серия успехов" мы будем использовать термин серия.
Серии, основанные на порядковых статистиках и рекордах, рассматривались в недавних работах: [83], [84], [85], [88], [208], [214], [224], [225], [226]. В наших работах [208] и [214] были предложены понятия серий, образуемых спейсингами порядковых статистик и рекордов, соответственно.
В этой главе будут рассматриваться выборки двух видов. Выборки первого вида - обычные выборки, состоящие из независимых одинаково распределенных величин Xi,... ,Хп с непрерывной функцией распределения F. Их них получены соответствующие порядковые статистики Х1;Г1 ... Хп п. Выборки второго вида (в данной работе они называются обратными выборками первого рода, см. [164] и [165]) будут выборками, состоящими из рекордных величин Х(1),... , Х(п). Они обычно используются тогда, когда классические выборки недоступны.
Серии, основанные на спейсингах порядковых статистик Х п — Xi_\,n и спейсингах рекордных величин X(j) — X(j — 1), определялись, соответственно, в работах [214] и [208]
Такие серии будем также называть сериями "малых" спейсингов. Отметим, что с увеличением размера обратной выборки п значения величин ? не меняются. Поэтому можно считать, что они не зависят от п.
Величины R v и Д назовем числом всех серий, образованных спейсингами данной выборки и обратной выборки первого рода, соответственно. Последовательность спейсингов порядковых статистик (или рекордов) образует всего одну серию, если vfn = 0 (или f = 0) для всех г = 2,... , п. Будем говорить, что длина серии равна нулю, если между двумя единицами нет нулей. Обозначения L v и L будем использовать для длины самой длинной серии, основанной спейсингами порядковых статистик и рекордов, соответственно.
Дальнейшее содержание главы 6 следующее. В параграфе 6.2 приведены распределения величин щ п и п. Там же дается дополнительная информация, касающаяся рекордных величин. В параграфе 6.3 рассматриваются распределения с ограниченным носителем. В этом параграфе показывается, что исследование формы функции распределения F можно проводить при помощи серий, основанных на спейсингах. Так, например, предельное поведение величины R u указывает на количество интервалов постоянства F. В параграфе 6.4 формулируются предельные теоремы для величин R u и R в случае неограниченного носителя. В параграфе 6.5 рассматриваются экспоненциальный и равномерный случаи, в которых спейсинги, образуемые порядковыми статистиками, соответственно, независимы и симметрично зависимы. В экспоненциальном случае, спейсинги, образуемые рекордными величинами, также независимы. Наконец, в параграфе 6.6 мы предлагаем статистический критерий, основанный на сериях, образуемых спейсингами порядковых статистик.
Материал диссертации, представленный в главе 6, опубликован автором диссертационной работы в следующих статьях: [208], [214], [224], [225] и [226].
В этом параграфе будем предполагать, что F - произвольное непрерывное распределение. Можно показать, что распределения величин vfn и математическое ожидание величины R f имеют вид:
Серии, основанные на порядковых статистиках и рекордах 181 В этом параграфе будем предполагать, что носитель распределения F ограничен. Серии, основанные на спейсингах порядковых статистик Остановимся вначале на асимптотических свойствах величины L v. Справедливо следующее утверждение. "Утверждение 6.3.1. Пусть носитель распределения F ограничен хотя бы с одной стороны. Тогда L v -Ц- оо.
Отметим, что если функция распределения, имеющая ограниченный с двух сторон носитель, постоянна на бесконечном числе интервалов, то для любого є 0 существует к О, такое что ЕЩ — к + 1 и Щ -V к + 1. Если же носитель неограничен и функция распределения постоянна на бесконечном числе интервалов длиной не менее є, то число всех серий "малых" спейсингов порядковых статистик для этого є стремится к бесконечности с вероятностью единица. Итак, мы выяснили, что интервал постоянства функции распределения вызывает прерывание серии спейсингов порядковых статистик.