Содержание к диссертации
Введение
1 Новая модель рекордных величин 24
Содержание главы 1 25
1.1 Понятие рекордов 25
1.1.1 Существующие рекордные модели 25
1.1.2 Некоторые результаты математической теории рекордов 27
1.2 Построение новой модели рекордов 31
1.3 Представления для рекордов с подтверждением . 32
1.3.1 Случай экспоненциального распределения 32
1.3.2 Равномерное распределение 35
1.4 Предельные соотношения для рекордов с подтверждением 36
1.4.1 Асимптотическая нормальность экспоненциальных рекордов 36
1.4.2 Класс всех предельных распределений Xj^L 38
2 Характеризации распределений свойствами упорядоченных случайных величин 44
Содержание главы 2 45
2.1 Результаты классической теории порядковых статистик 45
2.2 Обзор результатов по различным характеризациям . 47
2.2.1 Схемы случайного сжатия/расширения 47
2.2.2 Моментные свойства и характеризации. Рассмотренные задачи 49
2.3 Схемы случайного сжатия/расширения экстремальных порядковых статистик 52 -
2.3.1 Характеризации с помощью схемы расширения 52
2.3.2 Характеризации с помощью схемы сжатия 56
2.3.3 Двухсторонняя схема 59
2.4 Характеризации распределений равенством порядковых статистик 61
2.4.1 Основной результат 61
2.4.2 Примеры 66
2.5 Характеризации распределений свойствами сумм упорядоченных случайных величин 67
2.6 Обобщенный выборочный размах 74
2.6.1 Оценивание сверху 74
2.6.2 Предельные соотношения для Wk,n 84
2.6.3 Сравнение с выборочным дифференциалом 88
Заключение 92
Литература 94
- Существующие рекордные модели
- Случай экспоненциального распределения
- Обзор результатов по различным характеризациям
- Характеризации с помощью схемы сжатия
Введение к работе
1 Новая модель рекордных величин 1.1 Рассматриваемые модели рекордов
В первой главе диссертации речь пойдет о совершенно новой модели рекордных величин, названной "рекордами с подтверждением", которые включают в себя обычные рекорды (как нижние, так и верхние) как частный случай, кроме того, чем-то напоминают к-е рекорды. Сама теория математических рекордов имеет более чем 50-и летнюю историю. Первая публикация на эту тему появилась еще 1952-м году (см. [21]), и сразу попала в поле зрения многочисленных исследователей, занимающихся смежными проблемами, такими как теория порядковых статистик, экстремальные задачи и, в особенности, экстремальные порядковые статистики.
При изложении известных результатов теории рекордов мы будем придерживаться обозначений и формулировок, приведенных в монографии Невзорова В.Б. "Рекорды. Математическая теория" [5], которая, по сути, является первым изданием на русском языке, где систематизированы классические и современные результаты по математической теории рекордов.
Прежде чем описывать модели рекордных величин, приведем определения порядковых статистик и максимумов, которые очень тесно связаны с
рекордами. Теория порядковых статистик в наиболее полном объеме изложена в работах [3, 10, 16, 18, 22].
Рассматриваются п случайных величин Xi, Х2,..., Хп, полагая, не умаляя общности, что они заданы на одном и том же вероятностном пространстве (П, Т, Р). Расположив их в порядке возрастания, получаем вариационный ряд:
Х\,п < -^2,n 5-:---5-: Хщп, (1)
где для любого ш Q, ХггП(ш) = тіп{Хі(ш),Х2(и)),.. .,Xn(w)}, Хщп — max{Xi(w),X2{u),..-,Хп(и))}, a Xk,n — для некоторого к = 1,...,п, совпадает с к-ъш минимальным значением из набора Хі(ш), ^2(0;),..., Хп{иі). Определенные таким образом элементы вариационного ряда (1) называются порядковыми статистиками. Через Мп обозначается выборочный максимум Мп — Хщп = max {Хъ Х2,. .., Хп}.
Перейдем к описанию рекордов. Пусть Х±, Х2,... — последовательность одинаково распределенных случайных величин, с непрерывной функцией распределения F{x). Обозначим первый рекордный момент L(l) и положим L(l) = 1. Далее, из последовательности Х2, Хз,... выделим первую случайную величину (обозначим ее Хц2))> которая превосходит Х\. Величина Хц2)і выбранная таким образом, представляет собой второй рекорд, а L(2) соответственно, второй рекордный момент. Очередные рекордные моменты L(n) определяем рекуррентно следующим образом:
L(n + 1) = mm {j > L(ri) : Xj > Хцп)} , n = 2,3, (2)
Фактически, основываясь на выборке Xi,..., Хцп^ объема L(n) и максимуме Мцп) — XL{ji),L{n) = raax{Xi,.. .,Хцп)} , выделяем первую в последовательности Хцп)+і, Хцп)+2і случайную величину (обозначим Хцп+іу), которая больше Мцп)- Случайные величины
Х(П) = Хцп) = Хцп)^(п) = Мцп), га = 1,2,...,
называются верхними рекордными величинами.
Если в (2) знак > заменить на >, то приведенное определение будет соответствовать определению слабых рекордов, которые впервые были рассмотрены в работе Верваата [51]. Это та ситуация, когда повторение рекордного значения засчитывается как рекорд.
Очевидно, что в зависимости от ситуации, рекордами считаются не только наибольшие, но и наименьшие значения. В этом случае наряду с величинами L(n) и Х(п) рассматриваются величины L(n) и Х(п) = Хцп\, которые называются соответственно нижними рекордными моментами и нижними рекордными величинами и задаются с помощью выражений:
L(n + 1) = min [j > L(n) : Xj < Хцп)} ,
X{n) = XL{n) = min |Xl, X2, -. , Xl(jl)j .
Результаты теории рекордов большей частью получены для верхних рекордов, и вообще, под понятием "рекорд" в литературе чаще подразумеваются именно верхние рекорды. Это обстоятельство, является следствием очевидного соотношения, связывающего минимумы и максимумы:
min {Хъ Х2,..., Хп} - - max {Уі, У2, , Yn},
где Yk — —Хк, к — 1,2, Приведенная связь позволяет легко перенести
все результаты для верхних рекордов на случай нижних. Мы тоже будем придерживаться общепринятого стиля и под понятием "рекорд" подразумевать именно верхние рекордные величины.
К определению рекордных моментов и величин можно подойти и иным путем. Рассмотрим неубывающую последовательность максимумов:
-со < Mi < М2 < ... < Mn_i < М„ <
Из этой последовательности выделим все те индексы п, для которых выполняются строгие неравенства Mn_i < Мп. Выделенные индексы (обозначим их 1 = L(l) < L(2) < ...) будут совпадать с рекордными моментами, а
последовательность максимумов —со <'Мщ) < Мщ) < — < Мцп) < — — с последовательностью рекордных величин.
Естественным обобщением обычных рекордов явились к-е рекорды, (обозначаются X (п, к)),, которые были введены (вместе с к-ми рекордными моментами Ь(щ к)) Дзюбдзелой и Копоцинским [23] следующим образом:
L(l,k) = k,
L(n + 1, к) = min {j > L(n, к) : Xj > J^_fc;j_i} , n > 1
и . . ;
X(n, k) = Хцщк)~к+і,Цп,к), n'.> 1.
Иными словами, если рассмотреть последовательность к-х максимумов
— 00
и выделить из нее подпоследовательность тех* элементов, перед которыми стоит знак строгого неравенства:
Хг,к < Хп(2)-к+1,п(2) < Ді(3)-АН-1,п(3) < > (3)
то нетрудно убедиться^ что (3) совпадает с последовательностью к-х ре- .,„ кордных величин Х(1,к) < Х(2,к) < ....... а случайные индексы n(l) =
к, га(2), п(3)',— совпадают с последовательностью к-х рекордных моментов Ц1,к)
Очевидно^ что для к-х рекордов также применимы понятия "слабые" и "нижние", и при к = 1 к-е рекорды совпадают с обычными.
После публикации работы Чендлера [21] в; 1952 году было; издано і множе-ствостатей, где изучалась проблема рекордов; В ранний период были исследованы распределения рекордов, рекордных моментов и межрекордных времен, рассмотрены некоторые статистические процедуры^ основанные на рекордах (см: [24; 48, 49]). Позднее появились работы Реньи [36] и Таты [50]. В первой был получен важный результат о независимости рекордных
индикаторов, который позволил распределения рекордных моментов выразить через распределения сумм независимых случайных величин и получить различные предельные теоремы. В работе Таты [50] было найдено представление для экспоненциальных рекордов в виде суммы независимых слагаемых. После появления этих работ значительно увеличилась интенсивность исследований в данной области. На данный момент описано множество возможных предельных распределений для рекордов (см. например [42]-[4б] и [37]-[41]), введены и исследованы рекордные процессы, получен ряд предельных теорем для межрекордных времен и рекордных величин, имеется большое число характеризаций распределений свойствами рекордов (см. например [12, 4, 6, 29, 11, 30, 15, 28])и так далее.
1.2 Описание модели рекордов с подтверждением
Идея новой модели рекордов заключается в том, что при статистическом прогнозировании на основе достаточно больших по объему выборок, в рассмотрение не входят те значения, которые получаются при невероятных обстоятельствах. Другими словами, исключается возможность участия в прогнозировании единичных, чрезмерно больших (малых) значений, полученных при невероятном стечении обстоятельств. Это происходит потому, что рекорды с подтверждением строятся таким образом, что каждый новый рекорд, прежде чем быть объявленным, должен подтверждаться (фиксированное число раз). То есть, до тех пор, пока нет подтверждения, рекордом считается предыдущий, и появление одного единственного рекордного (в обычном смысле) значения не влияет на ход событий.
Приступим к построению модели. Пусть к — 1,2,... — произвольное фиксированное число. Наша модель строится таким образом, что каждый новый
рекорд объявляется таковым только после того, как подтвердился ровно к раз. Под словом "подтвердился" понимаем появление ровно & наблюдений, которые строго больше (меньше) предыдущего рекорда. Модель мы построим только для верхних рекордов с подтверждением, поскольку приведенная выше связь между минимумами и максимумами здесь так же дает возможность перенести все результаты с верхних рекордов на нижние.
Рассмотрим последовательность независимых случайных величин Х\,Х2-, -.., имеющих общую непрерывную функцию распределения Е (ж). Возьмем случайный вектор (Xl,X2, ...,) и упорядочим его компоненты в порядке возрастания: (-^ -^ -, Xk,k). Первым рекордным моментом с подтверждением считаем L^(l) — к , а соответствующей рекордной величиной — Xk,k- Вместе с этими величинами будем рассматривать также первый рекордный вектор {XLL, XLL,..., X^,L)y совпадающий, с вектором (Х^к, Х2,кі ? Xk,k)- Далее нужно получить к: случайных величин, превышающих Хк,к, упорядочив которые, получим второй: рекордный векторі Обозначим его (Х^2уХІ,1у..^Х^кЛ. Остальные рекордные моменты, величины и векторы получаются рекуррентно.
Определение. Рекордные моменты 1/№(п); соответствующие им рекордные величины,'.XU и рекордные векторы (^щ)?^ш)'"-'^Щ))' построенные по последовательности Хі, Х2,... , определяются следующим образом: ІЇкЦі) = к,
y№ - Y
<*>(«) = mm{j : Х^к+и > Х^%
Хцк) ='Піах{-Х'і, Х2,..., XL(k)(n)} = XZ(k)(n),L(k)(n)iпi= 2,3,...,
(^fe(i)'^fe(2)' —' -^) = (^(4(^-^,^)(^^--^^)(^^4^)^^^2^---
Из этого определения ясно, что при к: —-' Зі, наша модель совпадает с обычными рекордами:
Теоретически можно, конечно, и для новой! моделт ввести понятие слабых рекордов с подтверждением, однако интереса такая модель для нас
не представляет. Причина этого заключается в том, что слабые рекорды в нашем случае позволяют значениям, равным предыдущему рекорду, быть подтверждениями для нового. Что само по себе противоречит основной идее рекордов с подтверждением. Надо учесть и то обстоятельство, что исходную функцию распределения считаем непрерывной, поэтому даже формальное рассмотрение "слабого" случая нам ничего нового не даст.
1.3 Полученные результаты
Рекорды с подтверждением были изучены в тех случаях, когда искомые случайные величины распределены экспоненциально и равномерно. Важность этих частных случаев состоит в возможности применения к ним известных представлений, о которых мы упоминали выше. Имеются ввиду представления Таты, вероятностное интегральное преобразование Смирнова и некоторые обобщения этих результатов. Все эти представления и прочие известные результаты, которые мы использовали, будут вкратце приведены в первом параграфе главы 1.
Для новых рекордных величин из экспоненциального семейства была доказана теорема, которая дает выражения для рекордов с подтверждением (точнее для случайных векторов) через суммы независимых случайных величин, имеющих стандартное экспоненциальное распределение, и суммы к-х экспоненциальных рекордов.
Теорема (1.4). Пусть ^LL^U))»- - обозначают рекорды с подтверждением, построенные по последовательности Z\,Zi,... — независимых случайных величин, с общей функцией распределения Н{х) = тах{0,1 — е~х}, a {Z^1yZ^ly...,Z^hC), п = 1,2,... — соответствующие им рекорд-
ные векторы. Тогда, для любого п — 1,2,... имеют место соотношения:
0$). zm> - 3) = ft 2 ч*« + гзт 2 -»« + - + 2 ».
\ =0 =0 =1
- n—1 . n—1 n—1 - n—1 n \
T ^2 ^+1 + rZT X) ^*+2 + " + S ^'fe' "' I ]C ^+1 + - + X/ ^& ) '
=0 =0 =1 =0 =1 /
(3) (Zl&- гВД' -' -2) = ^п'fc) + 2(n - 1, fc - 1) + - + Z{n - 1.1). Ж». *)+ +2(n, fc - 1) +... + #(n -1,1),..., Z(n, k) + 2(n, k-1) + ... + Z(n, 1)),
(4)
где ?7i, 772,... - последовательность независимых случайных величин, име
ющих стандартное экспоненциальное распределение, a Z(n, к), п = 1,2,...
&-е рекордные величины, построенные по той оюе последовательности
Z\, Z
Следующий рассмотренный случай — равномерные рекорды с подтверждением. Для них получен похожий результат, который сформулирован в виде теоремы 1.5.
Теорема (1.5). Пусть ЩІ^Щ,^,... —рекорды с подтверждением, построенные по последовательности U\, U2, Тогда
где щ ,i — 1, ...,n,j = 1,.., k — независимые случайные величины с равномерным на отрезке [0,1] распределением.
Полученное в теореме (1.4) представление позволило показать асимптотическую нормальность экспоненциальных рекордов с подтверждением.
Теорема (1.6). При некотором фиксированном к — 1,2,..., при п —> оо имеет место
где Ф{х) функция распределения стандартного нормального закона.
Следующим шагом стало описание всех возможных предельных распределений для рекордов с подтверждением из произвольной выборки. Этот результат описан в следующих двух теоремах.
Теорема (1.7). Для того, чтобы при некотором выборе констант А(п) и В(п) существовала невырожденная предельная функция распределения
QW = i^P| А(п) <Х
необходимо и достаточно, чтобы существовала предельная функция
. Т(хА(п) + В{п)) - тп
g(x) = hm —^ к—+ к—^ ,
n-юо 0~п
где тп = nJ2i~o i~?> al — nX)i=o (зй^і пРичем функции Q(x) и g(x) связаны соотношением
Q(x) = Ф (g(x)).
Теорема (1.8). Предельная функция g(x) моэюет принадлеэюать только одному из следующих трех типов:
i. gi(x) = — оо, если х < 0 и gi(x) = -^j^-alnx, а > О, если х > 0. 2.д2(х) = —-д^-а\п(—х), если х <0 и д2{х) — оо, если х > 0.
2 Характеризаций распределений свойствами упорядоченных случайных величин
2.1 Рассматриваемые проблемы
Вторая глава диссертации посвящена проблеме характеризаций распределений различными свойствами упорядоченных случайных величин, в частности, с помощью схем сжатия, моментных свойств и равенств. Под понятием "упорядоченные случайные величины" будем подразумевать порядковые статистики и обычные математические рекорды.
В первой части этого введения мы уже приводили определения порядковых статистик и математических рекордов. Некоторые классические результаты из теории порядковых статистик будут приведены в первом параграфе второй главы. Здесь же приведем общие описания тех известных результатов, которые напрямую связаны с интересующими нас направлениями исследований, в частности, с проблемами характеризаций распределений различными свойствами порядковых статистик.
Ряд авторов рассматривали в своих работах так называемые схемы случайного сжатия случайных величин. Схемой случайного сжатия называется равенство по распределению:
X і YU, (7)
которое связывает три случайные величины. Распределение величины U сосредоточено на (0,1), (чаще всего степенное или стандартное равномерное), а произведение YU — называется случайным сжатием величины Y.
При рассмотрении подобных схем возникают вопросы, связанные с харак-теризацией распределений, при которых выполняется равенство (7). Примеры характеризаций с использованием такой схемы можно найти в работах
последних 20 лет, в частности, подобные вопросы рассмотрены у Пейкса и Хаттри [34], Пейкса [33], Пейкса и Наварро [35], Йео и Милна [53].
В последние годы схемы такого типа рассматривались также для порядковых статистик и математических рекордов, и именно такие схемы будут рассмотрены нами в работе. Результаты по характеризации распределений с помощью схем случайного сжатия для порядковых статистик, можно найти в работах Ахсануллаха и Весоловского [52], Бейтнера и Кампса [20] и Наварро [26]. Онсел и соавторы [32] рассмотрели такую схему для рекордных величин. Более подробно об этих результатах мы расскажем в первом параграфе второй главы.
Отметим, что в некоторых случаях, в зависимости от формы равенства (7) и типа распределения "сжимающей" величины U, говорят также о схеме случайного расширения.
Проблема случайных сжатий - первая* из интересующих нас задач по вопросу характеризации распределений, которую мы рассмотрели для выборочных экстремумов, предварительно немножко изменив исходную схему.
Следующая проблема, которая рассмотрена в работе, относится к равенству произвольных порядковых статистик. Имеется в виду равенство по распределению
связывающее две произвольные порядковые статистики, построенные по последовательности независимых случайных величин Xi, .. > с общей функцией распределения F(x). С характеризациями распределений посредством? таких равенств порядковых статистик дело обстоит сложнее. Автор диссертации не знает ни одной работы, в которой исследовался бы подобный вопрос. В нашей работе представлен результат, дающий характеризацию с помощью такого равенства.
Третья группа задач относится к проблеме изучения моментных свойств порядковых статистик и функций от них. Отправной точкой наших иссле-
'" ''..' ', .' " : ' 15'
дований явились как классические результаты, полученные для математических ожиданий экстремальных порядковых статистик и выборочного размаха, так и результаты для величин, представляющих собой суммы порядковых статистик и математических рекордов.
В первую очередь, речь идет о непараметрических оценках для математических ожиданий выборочных экстремумов Хщп и Хі)П, размаха — Wn = Хщп — XitTl, и основанных на этих оценках характеризациях, которые можно найти, например, в книге Дэйвида [3]. Далее, аналогичные оценки и характеризации для сумм рекордных величин получены в совместной работе Ахундова, Берреда и Невзорова [17], где были рассмотрены математические ожидания
EVn = Е (X(l) + ... + X(N(n)))
(N(n) — число рекордов среди Xi, Х2, - -., Хп) и
ЕТп = Е(Х{Х) + ... + Х(п)).
Следует упомянуть также работу Нагараджа [27], где автор получил результаты, аналогичные предыдущим, для величины
1 " 1 / Л
D(k, п) — — 2_^ ^г,п — Т ( Xn-k+l,n + ^п-к+2,п + + Хщп J ,
которую назвал "выборочным дифференциалом" (Selection Differential). Отметим, что во всех случаях (включая классические результаты Дэйвида) предполагается, что исходные случайные величины независимы, одинаково распределены и имеют нулевое математическое ожидание и единичную дисперсию.
Подробнее все эти результаты будут представлены во втором параграфе второй главы.
2.2 Постановка задач
В предыдущем пункте мы дали общее описание существующих результатов по интересующим нас направлением. Здесь приведем постановки задач, не меняя тематического порядка.
В контексте проблемы характеризации распределений с помощью схем случайного сжатия были рассмотрены равенства по распределению:
Y^Y^ + W, (8)
Yvt-W^Y^. (9)
Последовательные минимумы Y\^ = min{Yi, ...,} и Уі)П = min{Yi, ...,} построены по последовательности У, її, І2? независимых случайных величин с общей непрерывной функцией распределения F(x), a W имеет стандартное экспоненциальное распределение. Не умаляя общности, предполагается, что п > к (действительно, при п — к, задача теряет смысл). Была поставлена задача выяснить, при каких исходных распределениях выполняются равенства (8) и (9)? Отметим, что в случае равенства (8) целесообразнее говорить о схеме случайного расширения.
Далее, наряду с этими равенствами, в контексте характеризации распределения, рассматривалась также более общая схема двухстороннего сжатия (расширения)
Y1,k-W1=Yl,n + W2, (10)
где случайные величины И^і и W2 не зависят от У, УЇ, Yjj? и имеют экспоненциальное распределение с разными параметрами.
Для всех этих схем были получены характеризации соответствующих распределений.
Следующая проблема — равенство порядковых статистик. Как было отмечено в предыдущем пункте, в известной литературе не нашлось примеров
характеризаций с помощью равенства произвольных порядковых статистик. Эта задача сводится к следующему.
Рассматриваем последовательность Х±, Х2,... независимых случайных величин с общей функцией распределения F(x) и порядковые статистики для произвольных пит, Х^п < Х2)П < — < Хщп и Х\,т < Х2,т < — < Хт,т. Возникает вопрос, существуют ли такие невырожденные распределения и такие n, га, к, /, для которых выполняется равенство
Xk,n = Xijm, (11)
то есть равенство по распределению?
И наконец, последнее направление наших исследований касается изучения моментных свойств, получения оценок для математических ожиданий и характеризаций максимизирующих распределений. Точнее, исследовался вопрос оценки (сверху) математического ожидания определенных ниже величин и характеризаций исходных распределений, при которых математическое ожидание принимает максимальное значение.
Знакомясь с результатами статьи Ахундова, Берреда и Невзорова [17], был поставлен вопрос об аналогичных свойствах величины
Vn,m = X(N(m) + 1) + ... + X(N(n)).
Очевидно, Vnjn для некоторых фиксированных т < п, является обобщением величины Vn.
Более того, мы рассмотрели сумму
и частный случай этой суммы, когда т = 1, Тпд = Хід +^,2 + -\-Хщп, — сумма всех элементов последовательности выборочных максимумов, которая, как известно, содержит в себе последовательность рекордных величин, в качестве подпоследовательности.
Поскольку величина Тщт является обобщением выборочного максимума
(действительно, при п = т, Тп,п — ХП}П), a Vn,m — обобщением Vn, естественно было бы рассмотреть величину, обобщающую выборочный размах и (в некотором смысле), выборочный дифференциал Нагараджа [27]. Мы рассмотрели
Wn,k = (ХП]П + ... + Хп-к+1,п) — (ХііП + + Xk,n),
назвав эту статистику обобщенным выборочным размахом. Действительно, при к = 1, Wn>1 = Wn = ХПіП - ХігП.
Интересным оказался также вопрос о поведении математического ожидания EWUjk и максимизирующей функции распределения в ситуации, когда п, к —У оо.
2.3 Полученные результаты
Приведем формулировки полученных результатов в том же порядке, в каком были поставлены задачи в предыдущем пункте.
Для рассмотренных схем случайного сжатия (расширения) имеют место теоремы.
Теорема (2.1). Равенство по распределению (8) при некоторых фиксированных 1 < к < п выполняется тогда и только тогда, когда
F(x) = 1 - [(ес~х) "^ + і] *""" , -оо < х < оо, (12)
где С — произвольная константа.
Теорема (2.2). Равенство по распределению (9), при некоторых фиксированных 1 < к < п выполняется тогда и только тогда, когда функция распределения F(x) имеет вид
п-*--1
F(x) = 1 - [і - (ех~с) **"] п'к, -оо < х < С, (13)
где С — произвольная константа.
Из этих теорем вытекают следствия (приведем их в основном тексте главы 2), дающие аналогичные результаты для последовательных максимумов. Отметим лишь еще один результат, который отвечает случаю, когда распределение W зависит от некого параметра а > О, то есть в роли сжимающей (расширяющей) величины выступает Wa, с плотностью распределения fwa(x) ~ &е~ах- Мы ограничимся рассмотрением
Yltk = Y^ + Wat (14)
так как в остальных случаях результат выводится аналогично. Имеет место теорема.
Теорема (2.3). Равенство по распределению (14), при некоторых фиксированных 1<к<пиа>0 выполняется тогда и только тогда, когда
функция распределения F(x) имеет вид
(>(С-)) * +1
ft—п
, —со < X < со,
F{x) = 1 -
где С — произвольная постоянная.
Последняя теорема, относящаяся к проблеме сжатий/расширений, дает характеризацию по двухсторонней схеме. Приведем формулировку этого результата, положив в качестве "сжимающих" экспоненциальные случайные величины Wa и Wp, с параметрами а > 0, /5 > 0.
Теорема (2.4). Равенство по распределению
Y^-Wa^n + Wp,
при некоторых фиксированных 1<&<пиа:>0,/?>0 выполняется тогда и только тогда, когда функция распределения F(x), задается с помощью своей обратной, имеющей вид
(1-(1- x)n-k)^^)d
G{x) = In
(1 - x)i
Перейдем к вопросу равенства произвольных порядковых статистик (11). Справедлив следующий результат.
Теорема (2.5). Если выполняется равенство Х^)П = Х^т,7тг ф п, то исходная функция распределения является либо вырожденной, либо имеет лишь две точки роста.
Фактически, описан класс распределений, при которых может выполняться равенство (11). Открытым остается вопрос о существовании таких п, т, к, I, при которых исходная функция получается двухточечной. Ответ на этот вопрос получаем в доказательстве самой теоремы, и оказывается, что исходная функция распределения является двухточечной в том случае, когда индексы порядковых статистик в равенстве (11) удовлетворяют условиям п — т > к — I > 0, или т — п > I — к > 0.
Дальше следует задача об исследовании величин EVn!m, ЕТП}ТП и EWn7k. Следующие три теоремы дают оценки перечисленных величин и характе-ризации соответствующих максимизирующих распределений.
Теорема (2.6). Пусть X, Х\,Х2^... - независимые, одинаково распределенные случайные величины с непрерывной функцией распределения F(x), нулевым математическим ооюиданием и единичной дисперсией. Тогда для любых п, т = 1,2,..., О < т < п имеет место неравенство
ЕУщт < 7„>т, (15)
где
7п,т = I ] f 1-ж ' dX причем равенство в (15) достигается тогда и только тогда, когда
п хт-хп _ у> 1
1—re J—J к
и(х) = *=+*_ 0 < х < ^
Тга,т
где u(x) = F~1(x) — функция обратная функции распределения F.
Теорема (2.7). Для тех otce исходных случайных величин Х,Х±,Х2, — справедливо следующее неравенство
ЕТп (16)
1 ' n \2 \ *
0~n,m —
q \k=m
^fc^-1) dx-(n-m + l)2
kfc=m / ,
причем равенство в (16) достигается тогда и только тогда, когда
^2 kxk~x — (п — т + 1)
«(я?) = F~\x) =
0~плп
Теорема (2.8). Для любых к = 1,2,..., п = 2,3,..., к < п имеет место оценка
EWk,n < /і, (17)
2 \ 2
^А2 j [j vn-k-\l-vf-ldv\
li = knCl_1 I 2 / ( / «"-^(l-i;)*-1*; | du
2 /
Более того, равенство в (17) достигается, когда функция G(x) обратная функции распределения F(x), имеет вид
G(u) = -[knCkn_x j ^-k-\l-zf
1-й
При исследовании асимтотического поведения обобщенного выборочного размаха, при п -» оо, k ~ an, 0 < а < |, был получен результат, сформулированный в нижеследующей теореме.
Теорема (2.9). При п —> оо максимальное значение величины Е l—^2-) стремится к >/%&, а> последовательность F\,F2,... соответствующих максимизирующих функций распределения стремится к функции трехточечного симметричного распределения, сосредоточенного в точках —4=, 0 и -4=, с соответствующими весами а, 1 — 2а и а.
З Структура диссертации
Диссертация состоит из введения и двух глав, главы состоят из параграфов, параграфы — из пунктов. Номера параграфов двузначные: сперва номер главы, затем номер параграфа. Нумерация пунктов тройная: номер главы, затем параграфа, затем пункта. Формулы, теоремы, следствия и т.д. пронумерованы по тому же принципу, что и параграфы.
Результаты диссертации сформулированы в виде теорем и следствий. Результаты принадлежащие другим авторам сформулированы в виде теорем, представлений и лемм. Все результаты других авторов выделены в отдельные параграфы: 2.1 первой главы и 3.1 и 3.2 второй главы.
Существующие рекордные модели
Вкратце повторим описание рассматриваемых типов упоядоченных случайных величин. Рассмотрим п случайных величин Хь-Хг,... ,Хп, полагая, не умаляя общности, что они заданы на одном и том же вероятностном пространстве (Q, Т, Р). Расположив их в порядке возрастания, получаем вариационный ряд -Xi,n Х п . . . ХщП, (1-1) где для любого ш Є О, Х п{ш) = тіп{Хі(и}), Х2(ш),..., Хп(ш)}, Хщп = тах{Хі(ш), X2(OJ),..., Хп(ш)}, а Хк,п, для некоторого к — 1,..., п совпадает с fc-ым минимальным значением из набора XI(LO), (u;),... ,Хп(и ). Определенные таким образом элементы вариационного ряда (1.1), называются порядковыми статистиками. Через Мп обозначается выборочный максимум Мп — Хщп = max {Xi, Х2,..., Хп}. Опишем рекордные моменты и рекордные величины. Пусть Х\,Х2, ... — последовательность одинаково распределенных случайных величин с непрерывной функцией распределения F(x). Обозначим первый рекордный момент L(l) и положим L(l) = 1. Первой рекордной величиной считаем i(i) = - 1- Далее, из последовательности Х2,Х ,... выделим первую случайную величину (обозначим ее Хц2)), которая превосходит Х\. Величина Хц2), выбранная таким образом, представляет собой второй рекорд, a L(2) — соответственно, второй рекордный момент. Очередные рекордные моменты L(n) определяем рекуррентно следующим образом: L(n + 1) = min {j L(n) : Xj XL(n)} , n = 2, 3,.... (1.2) Фактически, основываясь на выборке Xi,..., Хцп) объема L(n) и максимуме Мцп) = Хцпщ„) = max {Х1}..., Хцп)} , выделяем первую в последовательности Хцп)+і, Хцп)+2,... случайную величину (обозначим ее Хдп+і)), которая больше Мцп). Случайные величины Х(п) — Хцп) = Хцп),ь(п) = Мцп)і га = 1,2,..., называются верхними рекордными величинами. Если в (1.2) знак заменить на , то приведенное определение будет соответствовать определению слабых рекордов. Наряду с величинами L(n) и Х(п) рассматриваются величины L{n) и Х{п) = Хцп , которые называются нижними рекордами и задаются с помощью выражений: L(n + 1) = min {j L(n) : Xj XL{n)} , X(n) = XL{n) = min {Xi, X2,..., XL{n)} .
Результаты теории рекордов большей частью получены для верхних рекордов, и вообще, под понятием "рекорд" в литературе чаще подразумеваются именно верхние рекорды. Это обстоятельство является следствием очевидного соотношения, связывающего минимумы и максимумы: min {Xi, Х2,..., Хп} — - max {Уь Y2,..., Yn] , где Yk = — Xk, к = 1,2, Эта связь позволяет легко перенести все ре зультаты для верхних рекордов на случай нижних. Мы тоже будем при держиваться общепринятого стиля и под понятием "рекорд" подразумевать именно верхние рекордные величины. К определению рекордных моментов и величин можно подойти и иным путем. Рассмотрим неубывающую последовательность максимумов -со М1 М2 ... Мп_! Мп Из этой последовательности выделим все те индексы п, для которых выполняются строгие неравенства M„_i Мпг Выделенные индексы (обозначим их 1 = Ir(l) L{2) ...) будут совпадать с рекордными моментами, а последовательность максимумов —со Мщ) Мц2) - Мцп) — с последовательностью рекордных величин.
В этом пункте, приведем ряд известных результатов из классических теорий рекордов и порядковых статистик, которые были использованы для доказа тельства наших теорем. Большей частью это известные представления для порядковых статистик и рекордов, которые позволяют переносить результаты для экспоненциальных и равномерных величин на более общие случаи. Вначале отметим, что вероятностное преобразование У = F(X), случайной величины X, не меняет упорядоченности1. Иными словами для любых к п, имеет место Yk,n — F(Xk,n)- Легко проверяется также свойство Yfc = F(Xk) = Uk, где Uk — равномерная на [0,1] случайная величина. Это преобразование также называют преобразованием Смирнова [47]. Приведем по очереди все известные представления, использованные нами, опуская при этом комментарии.
Вопрос асимптотического поведения наибольшего значения ХП}П в выборке объема п из распределения F(x) исследован довольно подробно многими авторами (см. например [1, 2, 25]). Однако, здесь мы приведем результат, касающийся класса всех предельных распределений Хщп. Отметим, что случайная величина Хщп из произвольного распределения, даже после соответствующей нормировки, вообще говоря, не будет обладать предельным распределением.
Случай экспоненциального распределения
Рассмотрим важный частный случай, когда исходные величины имеют экспоненциальное распределение. Для исходных экспоненциальных случайных величин Z\, Z4, ..., рассмотренных в представлении 1.1, докажем аналогичный результат, справедливый для рекордов с подтверждением Теорема 1.4 .
Применим результаты теоремы 1.4 для случая, когда рекорды с подтверждением построены по последовательности независимых случайных величин /i, С/2,... с равномерным на отрезке [0,1] распределением. Прежде используем следующее свойство преобразования Смирнова.
Пусть X — случайная величина, с непрерывной функцией распределения F(x). Вероятностное интегральное преобразование F(X), переводящее случайную величину X в равномерно распределенную на отрезке [0,1], не меняет упорядоченности случайных величин.
Поскольку к фиксировано, следовательно Е со, и таким образом, к Zj L можем применить центральную предельную теорему для независимых одинаково распределенных случайных величин. Сформулируем полученный результат в виде теоремы.
Теорема 1.6 . Пусть для некоторого фиксированного к = 1,2,...; Zj\L — обозначает рекорд с подтверждением, построенный по последовательности Z\,Z i,... независимых случайных величин, с общей функцией распределения Н{х) = max {0,1 — е х}.
В этом пункте мы докажем предельный результат для рекордов с подтверждением из произвольного распределения. Для этого мы используем результаты предыдущего пункта и метод, использованный в работе [37] для доказательства теорем 1.2 и 1.3.
Рассмотрим рекорд с подтверждением Х[щ, построенный по последовательности Xi, Х2,.. независимых случайных величин с общей функцией распределения F(x). Из определения рекордов с подтверждением следует, что Xj?L = ML(n), то есть последовательность (jLi- LjLj содержится в Mi, M2,... в качестве подпоследовательности. Это значит, что множество предельных законов для случайных величин совпадает с множеством предельных законов для величин (Мп-Цп)\.
Из выражения (1.23) и теоремы 1.1 следует, что функция h(x) может быть только трех типов Лі,Л2 и Лз, соответственно, и д(х) может принадлежать только трем типам 7і, дъ и дз, перечисленным в теореме. Из теорем 1.7 и 1.8 вытекает очевидное следствие.
Следствие 1.1 . Множество всех предельных невырожденных функций распределения для центрированных и нормированных рекордов с подтверждением XjjJL состоит (с точностью до линейных преобразований) из функций вида Ф(д(х)), где д(х) определены в теореме 1.8. Далее, в 2.2 проводим обзор существующих результатов по интересующим нас направлениям исследований. 2.3 посвящен схемам случайного сжатия, в частности, вводится новая схема на основе экспоненциального распределения и доказываются результаты по характеризациям распределений для этой схемы. В 2.4 исследуем общий вопрос равенства порядковых статистик, доказываем теорему, которая дает характеризацию класса распределений, обеспечивающих такое равенство, обсуждаем примеры. Затем, в 2.5 определяем суммы, обобщающие некоторые известные статистики, исследуем вопрос оценивания и характеризаций для этих сумм. Заключительный 2.6 посвящен обобщенному выборочному размаху, определенному в начале параграфа. Для этой статистики получены: оценка математического ожидания, характеризация максимизирующего распределения, исследовано предельное поведение и приведен результат сравнения с другой статистикой — выборочным дифференциалом.
Обзор результатов по различным характеризациям
Сама теория математических рекордов имеет более чем 50-и летнюю историю. Первая публикация на эту тему появилась еще 1952-м году (см. [21]), и сразу попала в поле зрения многочисленных исследователей, занимающихся смежными проблемами, такими как теория порядковых статистик, экстремальные задачи и, в особенности, экстремальные порядковые статистики.
При изложении известных результатов теории рекордов мы будем придерживаться обозначений и формулировок, приведенных в монографии Невзорова В.Б. "Рекорды. Математическая теория" [5], которая, по сути, является первым изданием на русском языке, где систематизированы классические и современные результаты по математической теории рекордов.
Прежде чем описывать модели рекордных величин, приведем определения порядковых статистик и максимумов, которые очень тесно связаны с рекордами. Теория порядковых статистик в наиболее полном объеме изложена в работах [3, 10, 16, 18, 22]. Рассматриваются п случайных величин Xi, Х2,..., Хп, полагая, не умаляя общности, что они заданы на одном и том же вероятностном пространстве (П, Т, Р). Расположив их в порядке возрастания, получаем вариационный ряд: Х\,п - 2,n 5-:---5-: Хщп, (1) где для любого ш Q, ХггП(ш) = тіп{Хі(ш),Х2(и)),.. .,Xn(w)}, Хщп — max{Xi(w),X2{u),..-,Хп(и))}, a Xk,n — для некоторого к = 1,...,п, совпадает с к-ъш минимальным значением из набора Хі(ш), 2(0;),..., Хп{иі). Определенные таким образом элементы вариационного ряда (1) называются порядковыми статистиками. Через Мп обозначается выборочный максимум Мп — Хщп = max {Хъ Х2,. .., Хп}. Перейдем к описанию рекордов. Пусть Х±, Х2,... — последовательность одинаково распределенных случайных величин, с непрерывной функцией распределения F{x). Обозначим первый рекордный момент L(l) и положим L(l) = 1. Далее, из последовательности Х2, Хз,... выделим первую случайную величину (обозначим ее Хц2)) которая превосходит Х\. Величина Хц2)і выбранная таким образом, представляет собой второй рекорд, а L(2) соответственно, второй рекордный момент. Очередные рекордные моменты L(n) определяем рекуррентно следующим образом: L(n + 1) = mm {j L(ri) : Xj Хцп)} , n = 2,3, (2) Фактически, основываясь на выборке Xi,..., Хцп объема L(n) и максимуме Мцп) — XL{ji),L{n) = raax{Xi,.. .,Хцп)} , выделяем первую в последовательности Хцп)+і, Хцп)+2і случайную величину (обозначим Хцп+іу), которая больше Мцп)- Случайные величины Х(П) = Хцп) = Хцп) (п) = Мцп), га = 1,2,..., называются верхними рекордными величинами. Если в (2) знак заменить на , то приведенное определение будет соответствовать определению слабых рекордов, которые впервые были рассмотрены в работе Верваата [51]. Это та ситуация, когда повторение рекордного значения засчитывается как рекорд.
Результаты теории рекордов большей частью получены для верхних рекордов, и вообще, под понятием "рекорд" в литературе чаще подразумеваются именно верхние рекорды. Это обстоятельство, является следствием очевидного соотношения, связывающего минимумы и максимумы: min {Хъ Х2,..., Хп} - - max {Уі, У2, , Yn}, где Yk — —Хк, к — 1,2, Приведенная связь позволяет легко перенести все результаты для верхних рекордов на случай нижних. Мы тоже будем придерживаться общепринятого стиля и под понятием "рекорд" подразумевать именно верхние рекордные величины.
Характеризации с помощью схемы сжатия
После публикации работы Чендлера [21] в; 1952 году было; издано І множе-ствостатей, где изучалась проблема рекордов; В ранний период были исследованы распределения рекордов, рекордных моментов и межрекордных времен, рассмотрены некоторые статистические процедуры основанные на рекордах (см: [24; 48, 49]). Позднее появились работы Реньи [36] и Таты [50]. В первой был получен важный результат о независимости рекордных индикаторов, который позволил распределения рекордных моментов выразить через распределения сумм независимых случайных величин и получить различные предельные теоремы. В работе Таты [50] было найдено представление для экспоненциальных рекордов в виде суммы независимых слагаемых. После появления этих работ значительно увеличилась интенсивность исследований в данной области. На данный момент описано множество возможных предельных распределений для рекордов (см. например [42]-[4б] и [37]-[41]), введены и исследованы рекордные процессы, получен ряд предельных теорем для межрекордных времен и рекордных величин, имеется большое число характеризаций распределений свойствами рекордов (см. например [12, 4, 6, 29, 11, 30, 15, 28])и так далее.
Идея новой модели рекордов заключается в том, что при статистическом прогнозировании на основе достаточно больших по объему выборок, в рассмотрение не входят те значения, которые получаются при невероятных обстоятельствах. Другими словами, исключается возможность участия в прогнозировании единичных, чрезмерно больших (малых) значений, полученных при невероятном стечении обстоятельств. Это происходит потому, что рекорды с подтверждением строятся таким образом, что каждый новый рекорд, прежде чем быть объявленным, должен подтверждаться (фиксированное число раз). То есть, до тех пор, пока нет подтверждения, рекордом считается предыдущий, и появление одного единственного рекордного (в обычном смысле) значения не влияет на ход событий.
Приступим к построению модели. Пусть к — 1,2,... — произвольное фиксированное число. Наша модель строится таким образом, что каждый новый рекорд объявляется таковым только после того, как подтвердился ровно к раз. Под словом "подтвердился" понимаем появление ровно & наблюдений, которые строго больше (меньше) предыдущего рекорда. Модель мы построим только для верхних рекордов с подтверждением, поскольку приведенная выше связь между минимумами и максимумами здесь так же дает возможность перенести все результаты с верхних рекордов на нижние.
Рассмотрим последовательность независимых случайных величин Х\,Х2-, -.., имеющих общую непрерывную функцию распределения Е (ж). Возьмем случайный вектор (XL,X2, ...,) и упорядочим его компоненты в порядке возрастания: (- - -, Xk,k). Первым рекордным моментом с подтверждением считаем L (l) — к , а соответствующей рекордной величиной — Xk,k- Вместе с этими величинами будем рассматривать также первый рекордный вектор {XLL, XLL,..., X ,L)y совпадающий, с вектором (Х к, Х2,кі ? Xk,k)- Далее нужно получить к: случайных величин, превышающих Хк,к, упорядочив которые, получим второй: рекордный векторі Обозначим его (Х 2уХІ,1у.. Х кЛ. Остальные рекордные моменты, величины и векторы получаются рекуррентно.
Теоретически можно, конечно, и для новой! моделт ввести понятие слабых рекордов с подтверждением, однако интереса такая модель для нас не представляет. Причина этого заключается в том, что слабые рекорды в нашем случае позволяют значениям, равным предыдущему рекорду, быть подтверждениями для нового. Что само по себе противоречит основной идее рекордов с подтверждением. Надо учесть и то обстоятельство, что исходную функцию распределения считаем непрерывной, поэтому даже формальное рассмотрение "слабого" случая нам ничего нового не даст.
Рекорды с подтверждением были изучены в тех случаях, когда искомые случайные величины распределены экспоненциально и равномерно. Важность этих частных случаев состоит в возможности применения к ним известных представлений, о которых мы упоминали выше. Имеются ввиду представления Таты, вероятностное интегральное преобразование Смирнова и некоторые обобщения этих результатов. Все эти представления и прочие известные результаты, которые мы использовали, будут вкратце приведены в первом параграфе главы 1.
Для новых рекордных величин из экспоненциального семейства была доказана теорема, которая дает выражения для рекордов с подтверждением (точнее для случайных векторов) через суммы независимых случайных величин, имеющих стандартное экспоненциальное распределение, и суммы к-х экспоненциальных рекордов.
В последние годы схемы такого типа рассматривались также для порядковых статистик и математических рекордов, и именно такие схемы будут рассмотрены нами в работе. Результаты по характеризации распределений с помощью схем случайного сжатия для порядковых статистик, можно найти в работах Ахсануллаха и Весоловского [52], Бейтнера и Кампса [20] и Наварро [26]. Онсел и соавторы [32] рассмотрели такую схему для рекордных величин. Более подробно об этих результатах мы расскажем в первом параграфе второй главы.
Отметим, что в некоторых случаях, в зависимости от формы равенства (7) и типа распределения "сжимающей" величины U, говорят также о схеме случайного расширения. Проблема случайных сжатий - первая из интересующих нас задач по вопросу характеризации распределений, которую мы рассмотрели для выборочных экстремумов, предварительно немножко изменив исходную схему. Следующая проблема, которая рассмотрена в работе, относится к равенству произвольных порядковых статистик.