Электронная библиотека диссертаций и авторефератов России
dslib.net
Библиотека диссертаций
Навигация
Каталог диссертаций России
Англоязычные диссертации
Диссертации бесплатно
Предстоящие защиты
Рецензии на автореферат
Отчисления авторам
Мой кабинет
Заказы: забрать, оплатить
Мой личный счет
Мой профиль
Мой авторский профиль
Подписки на рассылки



расширенный поиск

Некоторые задачи теории вероятностей и математической статистики, связанные с распределением Стьюдента У Да

Некоторые задачи теории вероятностей и математической статистики, связанные с распределением Стьюдента
<
Некоторые задачи теории вероятностей и математической статистики, связанные с распределением Стьюдента Некоторые задачи теории вероятностей и математической статистики, связанные с распределением Стьюдента Некоторые задачи теории вероятностей и математической статистики, связанные с распределением Стьюдента Некоторые задачи теории вероятностей и математической статистики, связанные с распределением Стьюдента Некоторые задачи теории вероятностей и математической статистики, связанные с распределением Стьюдента Некоторые задачи теории вероятностей и математической статистики, связанные с распределением Стьюдента Некоторые задачи теории вероятностей и математической статистики, связанные с распределением Стьюдента Некоторые задачи теории вероятностей и математической статистики, связанные с распределением Стьюдента Некоторые задачи теории вероятностей и математической статистики, связанные с распределением Стьюдента
>

Диссертация - 480 руб., доставка 10 минут, круглосуточно, без выходных и праздников

Автореферат - бесплатно, доставка 10 минут, круглосуточно, без выходных и праздников

У Да. Некоторые задачи теории вероятностей и математической статистики, связанные с распределением Стьюдента : Дис. ... канд. физ.-мат. наук : 01.01.05 : Москва, 2004 106 c. РГБ ОД, 61:05-1/343

Содержание к диссертации

Введение

ГЛАВА 1 Вспомогательные результаты 31

1.1 Распределение Стьюдента 31

1.2 Распределение Стьюдента как асимптотическая аппроксимация 35

1.2.1 Предварительные результаты 35

1.2.2 Распределение Стьюдента как предельное при случайном объёме выборки 38

1.3 Экстремальные энтропийные свойства распределения Стьюдента 42

1.4 Случай малого параметра 44

ГЛАВА 2 Оценки скорости сходимости распределений некоторых статистик к распределению Стьюдента 47

2.1 Оценки скорости сходимости отрицательно биномиального распределения к гамма распределению при 0 < г < 1 48

2.2 Оценки скорости сходимости некоторых статистик, построенных по выборкам случайного объёма, к распределению Стьюдена 57

2.3 Применения к U - статистикам и линейным комбинациям порядковых статистик 63

ГЛАВА 3 Оценивание центра распределения Стьюдента с малым числом степеней свободы 67

3.1 Статистическое оценивание центра распределения Стью-дента 67

3.2 Асимптотическая эффективность эквивариантных оценок 68

3.3 Оценивание центра в случае малого числа степеней свободы 74

3.4 М-оценки и оценки максимального правдоподобия . 83

ГЛАВА 4 Об аппроксимации необходимого резервного капитала страховой компании в случае большого числа различных клиентов 89

4.1 Описание модели страхования 89

4.2 Асимптотическое разложение для резервного капитала страховой компании 91

4.3 Примеры 98

4.4 Случай случайного числа клиентов страховой компании 99

Библиография 100

Введение к работе

Как хорошо известно, распределение Стьюдента, возникающее в задачах проверки гипотез о среднем значении нормального рапределения в случае неизвестной дисперсии, (см., например, (Леман 1964), глава 5, 2, 3), зависит от целочисленного параметра 7, называемого числом степеней свободы, и имеет плотность

где Г(-) - эйлерова гамма-функция (см., например, (Крамер 1948), стр. 263). Здесь параметр 7 тесно связан с объемом выборки и принимает натуральные значения. Однако можно сказать, что в таких задачах роль распределения Стьюдента в значительной мере вспомогательна, оно является в определенном смысле абстрактной идеальной теоретической моделью. (Отметим также здесь, что формально распределение Стьюдента определено при любом положительном значении параметра формы 7 и при 7 = 1 мы имеем "тяжёлохвостное" распределение Коши.)

Вместе с тем, в описательной статистике распределение Стьюдента практически не используется в качестве аналитической модели, "подгоняемой" к экспериментальным данным. Лишь относительно недавно появились работы, в которых распределение Стьюдента применяется (впрочем, без надлежащего теоретического обоснования) для описания динамики некоторых финансовых индексов, в частности приращений логарифмов биржевых цен. В первую очередь здесь следует упомянуть работы П. Прэтца (Praetz 1972) и Р. Блаттберга, Н. Гоундса

Введение

(Blattberg, Gonedes 1974). Лишним подтверждением этого служит то обстоятельство, что автором не удалось найти ни в одном руководстве по теории (или практике) статистического оценивания рассмотрения задачи оценивания параметра формы j распределения Стьюдента.

По-видимому, недостаточное доверие прикладных статистиков к распределению Стьюдента как к модели, описывающей статистическое поведение реальных данных, связано с тем, что, в отличие от, скажем, нормального или пуассоновского распределений, фигурирующих в качестве предельных соответственно в центральной предельной теореме и теореме Пуассона о редких событиях, распределение Стьюдента не считается асимптотической аппроксимацией.

В прикладной математике вообще и в статистике в частности, принято считать, что адекватной может быть лишь та аналитическая модель, в основе которой лежит какая-либо предельная теорема с довольно простыми и общими условиями, в то время как та асимптотическая схема, которая используется для обоснования возможности применения распределения Стьюдента в качестве предельной аппроксимации (в тех редких случаях, когда распределение Стьюдента используется в таком качестве) и связана с его безграничной делимостью (кстати, установленной сравнительно недавно), довольно сложна. А именно, известно, что любое безгранично делимое распределение может быть слабым пределом для распределений сумм независимых равномерно предельно малых случайных величин. Поэтому в принципе, если при статистическом анализе реальных данных можно предположить, что каждое наблюдение является результатом суммарного воздействия большого числа случайных факторов, которые вносят примерно одинаковый (в определенном смысле) вклад в наблюдаемое значение, то при выполнении условий, гарантирующих сходимость распределений сумм независимых равномерно предельно малых случайных величин к распределению Стьюдента, последнее вполне может быть использовано в качестве модели, описывающей статистическое поведение экспериментальных данных. Однако упомянутые условия формулируются в терминах элементов так называемого канонического представления безгранично делимой характеристической функции и имеют сложный вид, что серьезно затрудняет их практическую проверку. В результате в рамках такого подхода до сих пор не удалось найти достаточного обоснования возможности более или менее широкого применения рас-

Введение 5

пределения Стьюдента в задачах описательной статистики.

Отметим ещё раз, что аналитическая форма плотности распределения Стьюдента (0.1) формально определена для любых положительных значений параметра 7- Здесь следует отметить недавние результаты Бенинга и Королёва. Работа (Бенинг, Королёв 2004) посвящена математическому обоснованию возможности использования распределения Стьюдента, зависящего от параметра формы (число степеней свободы) 7 > 0, в качестве статистической модели, описывающей распределение наблюдаемых случайных величин.

Для обоснования такой возможности показано, что распределение Стьюдента с произвольным 7 > 0 может быть получено в качестве предельного в случае выборки случайного объёма. При этом особо выделен случай когда параметр формы распределения Стьюдента j > 0 мал. Этот случай представляет интерес как модель распределения с "тяжёлыми хвостами". В этом случае подчеркивается возможность использования семейства распределений Стьюдента в качестве удобной модели распределений с "тяжелыми хвостами", так как для него (в отличие от устойчивых законов) многие формулы, в частности, функция правдоподобия, приобретают явный вид.

Диссертация посвящена дальнейшему развитию идей работы (Бенинг, Королёв 2004).

Доказана общая теорема, позволяющая автоматически получать оценки скорости сходимости распределений статистик, построенных по выборкам случайного объёма, к распределению Стьюдента из оценок скорости сходимости к нормальному закону этих же статистик, но уже построенным по обычным не случайным выборкам.

В качестве иллюстрации возможностей статистического анализа, основанного на стьюдентовом семействе, рассматривается задача статистического оценивания центра распределения Стьюдента в предположении, что параметр формы (число степеней свободы) 7 > 0 известен. В диссертации рассматриваются эквивариантные оценки центра распределения Стьюдента, основанные на порядковых статистиках, оценки Ходжеса - Лемана, М-оценки и оценки максимального правдоподобия. Находится их асимптотическая относительная эффективность и изучается ее поведение при стремлении числа степеней свободы 7 > 0 к нулю.

Рассматривается также задача из теории риска, а именно, задача

Введение

оценивания необходимого резервного капитала страховой компании в случае большого числа неодинаковых клиентов. Для этой оценки также используется распределение Стьюдента.

Диссертация состоит из введения, четырёх глав и списка литера-руры, состоящего из 57 названий.

В работе приняты следующие обозначения

Ш, - действительная прямая, символ => будет обозначать слабую сходимость, Ф(х) и ср(х) - функция распределения и плотность стандартного нормального закона, ЛҐ(ц, о2") - нормальное распределение в Ж с указанными параметрами, р7(х) и F1(x) - соответственно плотность и функция распределения распределения Стьюдента с параметром 7 > 0, Г(ж) - эйлерова гамма-функция, NP>T, г > О, р Є (0, 1) -отрицательно биномиальная случайная величина с параметрами (р, г), Ga,\{x) - функция распределения гамма распределения с параметром формы а и 7 параметром масштаба. Символ означает конец доказательства.

В первой главе приведены и прокомментированы следующие основные результаты из работы (Бенинг, Королёв 2004).

Рассмотрим случайные величины N\, N^, ., Xi, Х2,... -, определенные на одном и том же измеримом пространстве (Q, Л). Пусть на Л задано семейство вероятностных мер {Р#, 9 Є 0}. Предположим, что при каждом п > 1 случайные величины Nn принимают только натуральные значения и независят от последовательности Хх, Х2,... относительно каждой из семейства мер {Pg, 9 Є 6}. Пусть Гп = Тп{Х\,... ,Хп) - некоторая статистика, то есть измеримая функция от случайных величин Х\,..., Хп. Для каждого п > 1 определим случайную величину Тдг„, положив

TNn(") = TNn(u>) (Хі{ш),. . . , Хл„(ы)И)

для каждого элементарного исхода и Є ft. Будем говорить, что статистика Тп асимптотически нормальна, если существуют функции о(9) > 0 и /х(0) Є IR такие, что при каждом 9 Є 0

Ре (a(0)Vn(Tn - (і(в)) <х) = Ф{х) (п -» со). (0.2)

Примеры асимптотически нормальных статистик хорошо известны. Свойством асимптотической нормальности обладают, например, выборочное среднее (при условии существования дисперсий), центральные

Введение

порядковые статистики, оценки максимального правдоподобия (при достаточно общих условиях регулярности) и многие другие статистики.

Лемма 0.1. (Бенинг, Королёв 2004) Пусть {dn}n>i - некоторая неограниченно возрастающая последовательность положительных чисел. Предположим, что Nn —> со по вероятности при п -> оо относительно каждой вероятности из семейства {Рд, 9 Є 0}. Пусть статистикаТп асимптотически нормальна в смысле (0.2). Для того чтобы при каждом 9 Є 0 существовала такая функция распределения F(x, в), что

Ре (Nn - ц{9)) <аг) = F{x, (?) (п -» оо),

необходимо и достаточно, чтобы существовало семейство функций распредления % = {Н(х, 9) 9 Є 0}, удовлетворяющее условиям

Н(х,9) =0, х < 0, 9 є в;

F{x, в) = J yH(y, 9), х JR., 9 є 0; о Pe{Nn < dnx) => H{x, 9), п -> оо, 9 Є 0.

Яри этом, если функция распределения случайной величины Nn не зависят от 9, то не зависят от 9 и функция распределения Н(х, 9), то есть семейство Н состоит из единственного элемента.

Пусть NPtr - случайная величина, имеющая отрицательное биномиальное распределение вида

HNP,r = k) = (fc+(^~ У-Т р'(1 - Р)к-\ к = 1,2,... (0.3)

Здесь г > 0 и р Є (0,1) - параметры, и при к = 1 первый множитель в правой части формулы (0.3) полагается равным единице. В частности, при г = 1 соотношение (0.3) задает геометрическое распределение. Известно, что

рлг - Г(1-Р) + Р

так что ЕіУр —> оо при р —> 0.

Введение

Отрицательное биномиальное распределение с натуральным г допускает наглядную интерпретацию в терминах испытаний Бернулли. А именно, случайная величина с распределением (0.3) - это число испытаний Бернулли, проведенных до осуществления г-й по счету неудачи, если вероятность успеха в одном испытании равна 1 — р.

Лемма 0.2.(Бенинг, Королёв 2004) Для любого фиксированного г > 0

lim sup p-> і є R

Gfe * *) - G-H= -

где Gr!r(x) - функция распределения гамма-распределения с параметром формы, совпадающим с параметром масштаба и равным г.

В подавляющем большинстве ситуаций, связанных с анализом экспериментальных данных, можно признать, что число случайных факторов, влияющих на наблюдаемые величины, само является случайным и изменяется от наблюдения к наблюдению. Поэтому вместо различных версий центральной предельной теоремы, обосновывающих нормальность распределения наблюдаемых случайных величин в классической статистике, в таких ситуациях следует опираться на их аналоги для выборок случайного объема (см. лемму 0.1).

Теорема 0.1.(Бенинг, Королёв 2004) Пусть 7 > 0 произвольно и {<і„}п>і _ некоторая неограниченно возрастающая последовательность положительных чисел. Предположим, что Nn —> оо по вероятности при п —> оо относительно каждой вероятности из семейства {Ре, в Є в}. Пусть статистика Тп асимптотически нормальна в смысле (0.2). Для того чтобы при каждом 9 Є в

?в {cr{e)yfdn{TNn - ц{в)) < х) =» F7(x) (п -> оо),

где Fj(x) - функция распределения Стъюдента с параметром 7, необходимо и достаточно, чтобы

Pe(Nn < dnx) =$> G7/2,7/2(z), n -> оо, в Є 0.

Следствие 0.1. Пусть г > 0 произвольно. Предположим, что при каждом п > 1 случайная величина Nn имеет отрицательное

Введение

биномиальное распределение с параметрами р — - и г. Пусть статистика Тп асимптотически нормальна в смысле (0.2). Тогда при каждом в Є О

Рв {a(d)V^i(TNn - м(0)) <х) =Ф- F2r(x) (п -> оо)

равномерно по х Є И, где F2r{x) - функция распределения Стьюдента с параметром у — 2г. Для иллюстрации возможности возникновения

предельных законов с "тяжёлыми хвостами" сделаем два замечания.

Замечание 0.1. Распределение Коши (7=1) возникает в ситуации, описанной в следствии 0.1, когда объем выборки Nn имеет отрицательное биномиальное распределение с параметрами р = , г = | и п велико.

Замечание 0.2. В ситуации, когда объем выборки Nn имеет отрицательное биномиальное распределение с параметрами р = -, г = 1 (то есть геометрическое распределение с параметром р = -), в пределе при п —> оо мы получаем распределение Стьюдента с параметром 7 = 2, которому соответствует функция распределения

ад =К1 + WW)' ХШ- (0'4)

(Эта формула подробно доказана в замечании 2.2.1.) Такое распределение впервые описано как предельное для выборочной медианы, построенной по выборке случайного объёма, имеющего геометрическое распределение, по-видимому, в работе (Гнеденко 1989) (следует отметить, что в этой работе не указано, что функция распределения, стоящая в правой части (0.4), соответствует распределению Стьюдента).

Таким образом, основной вывод из приведенных выше результатов можно сформулировать следующим образом. Если число случайных факторов, определяющих наблюдаемое значение случайной величины, само является случайноц величиной, распределение которой может быть приближено гамма-распределением с одинаковыми параметрами (например, является отрицательным биномиальным с вероятностью успеха, близкой к единице, см. лемму 0.2), то те функции от значений случайных факторов, которые в классической ситуации считаются асимптотически нормальными, в действительности являются асимптотически стьюдентовскими. Следовательно, в силу довольно широкой

10 Введение

применимости гамма-моделей с одинаковыми параметрами и отрицательных биномиальных моделей распределение Стьюдента может рассматриваться в задачах прикладной (описательной) статистики как вполне разумная модель.

Выше мы уже упоминали, что отрицательное биномиальное распределение (как мы убедились, тесно связанное с распределением Стьюдента следствием 0.1), при натуральном г может быть интерпретировано в терминах испытаний Бернулли, проведенных до r-й неудачи. В то же время, особенно в задачах, связанных с анализом больших рисков, большой интерес представляет изучение распределения Стьюдента с малым параметром формы, то есть с очень "тяжелыми хвостами". Более того, можно показать, что при у = 2г —> 0 максимум плотности р7(х) распределения Стьюдента (см. (0.1)) стремится к нулю как 0(у/ї)' Одновременно "хвосты" распределения Стьюдента становятся все более и более "тяжелыми". Поэтому распределение Стьюдента с малым параметром может рассматриваться как некий аналог равномерного распределения на бесконечном интервале.

Чтобы следствие 0.1 можно было использовать и в такой ситуации, следует разобраться, что из себя представляет отрицательное биномиальное распределение, то есть как оно может быть проинтерпретировано при 0 < г < 1. В главе 1 приводятся также два примера, иллюстрирующие возможность такой интерпретации.

В главе 2 доказана общая теорема (так называемая теорема переноса), позволяющая автоматически получать оценки скорости сходимости к распределению Стьюдента распределений статистик, построенных по выборкам случайного объёма, из оценок скорости сходимости к нормальному закону аналогичных статистик, использующих большой, но не случайный объём выборок. При этом предполагается, что объём выборок имеет отрицательное биномиальное распределение с малыми параметрами. Затем эта теорема применяется к линейным комбинациям порядковых статистик и U - статистикам, широко применяемым в теории риска и математической статистике.

Пусть NPir - случайная величина, имеющая отрицательное биномиальное распределение с параметрами (р, г), р Є (0, 1), 0 < г < 1, то

Введение

есть

Р(Хр,г = к) = (*+(][іі)!'"ГРг(1-Р)*"1. к = 1,2,... (0.5)

При /с = 1 первое выражение в правой части этого равенства полагается равным единице.

В частности, при г = 1 соотношение (0.5) задает геометрическое распределение.

Нас будет интересовать предельное поведение распределения нормированной случайной величины Np>r

n;, = ^- (0.6)

при р —> 0. Доказана следующая

Теорема 0.2

Пусть 0 < г < 1, тогда существует постоянная Сг > 0 такая, что

< Сгрїтт. (0.7)

х>0

Р (Лг < х) - Gr>r(x)

При г — 1 правую часть неравенства (0.7) можно заменить нар/(1 —

Р)-

Затем эта теорема применяется следующим образом. Пусть статистика

Тп = Тп (Xi ,, Хп)

построена по повторной выборке (Х\, , Хп) независимых одинаково распределённых случайных величин, является асимптотически нормально распределённой и для её распределения справедлива оценка скорости сходимости вида: существуют числа а > 0 и /л Є JR такие, что

sup|p(v/na(T„ - /х) < х) - Ф(ж)| = 0(n~1/2), п = 1,2,.... (0.8)

Пусть Nn = Ni/nir, г Є (0,1] - случайная величина, имеющая отрицательное биномиальное распределение (см. (0.5)) вида

р№ = ч = {k+{k~t'r* (1 - =Г- " = - (0J)

12 Введение

которая не зависит от исходных случайных величин Xi, Х2, и п —» со. Заметим, что

ENn = 1 + г(п - 1), (0.10)

N* = ^ -,. (0.11)

" 1 + г(п-1) к '

Пусть F2r (х) - функция распределения распределения Стьюдента с параметром формы 7 = 2 г.

Рассмотрим теперь статистику Т^п, построенную по выборке случайного объёма Nn, то есть

TNn = TNn(Xi,...,XNn).

Справедлива следующая теорема.

Теорема 0.3

Пусть распределение статистики Тп = Тп(Х\, , Хп) удовлетворяет соотношению

sup|p(^a(Tn - /j) < х) - Ф(х)| = 0(тГ1/2), п = 1,2,...,

тогда распределение статистики Т^п = Т^п(Х\,... ,Х^п), где случайная величина Nn имеет отрицательное биномиальное распределение вида (0.9) и п —> оо, удовлетворяет равенству (г Є (0, 1\)

Р (Vrn +l-ra{TNn - fi) < х) - F2t{x) = О(п-^т). (0.12)

Далее приведены два примера использования теоремы 0.3. Первый пример касается U - статистик, а второй - линейных комбинаций порядковых статистик, широко применяемых в статистике (см., например, (Королюк, Боровских 1989), (Serfling 1980), (Helmers 1984), (Bening 2000)). Совершенно аналогично, с учётом, например, результатов работы (Does 1982), могут быть рассмотрены ранговые статистики, статистика Стьюдента (см. (Bentkus, Gotze 1996)) и вообще достаточно широкий класс симметричных статистик (см. работы (Van Zwet 1984) и (Alberink 2000), теорема 3.1).

Введение

Пусть (Xi,-",Xn) - повторная выборка независимых одинаково распределённых случайных величин, имеющих общую функцию распределения F(x). Определим U - статистику Т^ по формуле (см., например, (Королюк, Боровских 1989))

п \п х.) x<i<:j<n

где h(x, у) - симметричная измеримая функция двух переменных. Определим формально также функции

g(x) = E(h(Xu Х2)\Х1 = х), Щх, у) = h(x, у) - д(х) - д(у). (0.14)

Теорема 0.4 ((Helmers, Van Zwet 1982))Яусть выполнены следующие условия

Eh(Xu Х2) = 0, E\h(Xu Х2)\р < со, р > 5/3,

Ед2г) > 0, Е|5(Х0|3 < оо. Тогда справедливо соотношение

sup|p(VnaiTW < х) - Ф(я)| = 0{п~112), п = 2,..., (0.15)

с\ = (Ед\Х,)\\

Определим теперь линейные комбинации порядковых статистик. Пусть [Х\.п < ... < Хп:п) - вариационный ряд, построенный по исходной выборке (Xi, , Хп). Тогда линейная комбинация порядковых статистик определяется по формуле

ті2) = -*«*«„, (0.16)

п i=l

гле Сіп - некоторые числа.

Теорема 0.5 ((Helmers 1981, 1984))і7?/сть выполнены следующие условия

E|Xi|3 < оо

Введение

и существует функция J(s), заданная на (О, 1), удовлетворяющая условию Липшица и такая, что

г/п

Сіп — п / J(s) ds = 0(n~lj.

(i-l)/n

Тогда справедливо соотношение 8щ>\р(^о-2(ТЮ - Д2) < х) - Ф(х)\ = 0(n-V2), п = 1,...,

fi = f J(s)F-l(s)ds, F_1(s) = ini{x: F{x) > s}, о

oo oo

o? = // J(F{x))J(F{y))(mm{F(x)tF(y)) - F(x) F(y)) dxdy.

oo oo

Пусть теперь Nn — Ni/niT, r Є (0,1] - случайная величина, имеющая отрицательное биномиальное распределение вида

р^ = fc> = %:?jrr (1 - )'" k=h2 (0Д7)

которая не зависит от исходных случайных величин Xi, X-i... и тг —> со. Рассмотрим теперь статистики (см. определения (0.13) и (0.16)) Тнп, і = 1,2, построенные по выборке случайного объёма Nn, то есть

тЩ = tjH(xu...,xnj.

Следующая теорема является непосредственным следствием теоремы 0.3.

Теорема 0.6

Пусть для статистикТп1\ і — 1,2 выполнены условия регулярности, сформулированные в теоремах 2.3.1 и 2.3.2. Тогда распределения статистик TJ^'n = T^'n(Xi,...,Х^п), і = 1,2, где случайная величина Nn имеет отрицательное биномиальное распределение вида (0.17) и п У со, удовлетворяет равенству (г Є (0, 1))

Р (Vrn + 1 - г Gi (7$ - к) < x)-F2r{x) = О(тГ^т), (0.18)

Введение

где величины о*, г = 1,2; [Лу = О, \x-i = ц определены в теоремах 0.4 и 0.5, a F2r{x) - функция распределения Стьюдента с параметром формы 7 = 2г.

В главе 3 рассматривается задача статистического оценивания центра распределения Стьюдента в предположении, что параметр формы этого распределения является известным и малым. Изучается асимптотика по этому параметру асимптотической относительной эффективности наиболее распространённых оценок центра этого распределения.

В качестве иллюстрации тех возможных преимуществ, которые предоставляет семейство распределений Стьюдента, если его использовать в качестве модели распределения с "тяжелыми хвостами", мы вычислим некоторые асимптотические характеристики статистических процедур оценивания параметров распределения Стьюдента.

Наиболее очевидной и естественной задачей статистического оценивания, связанной с распределением Стьюдента, является задача оценивания параметра формы 7 - числа степеней свободы. Для ее решения могут быть использованы различные процедуры, например, метод максимального правдоподобия, метод логарифмических моментов. Особо следует отметить, что так как распределение Стьюдента принадлежит к классу законов с "тяжелыми хвостами", а параметр 7 является показателем "тяжести хвостов", то для оценивания этого параметра могут также применяться известные процедуры оценивания степени тяжести хвостов, например, оценки Хилла (Hill 1975), Де Хаана (см, например, (Resnick 1995)) и другие (см., например, (Embrechts et al. 1997)). Оценки второй группы, как правило, вычисляются намного проще, нежели оценки максимального правдоподобия или оценки метода логарифмических моментов. Подробное сравнительное исследование упомянутых процедур не является целью данной диссертации.

Вместо этого, в соответствии с общей направленностью диссертации, ниже мы рассмотрим другую естественную задачу статистического оценивания, связанную с распределением Стьюдента, - задачу оценивания центра этого распределения, уделяя особое внимание асимптотическим свойствам соответствующих процедур при ^ —У О, что важно при использовании распределения Стьюдента для описания больших рисков.

Сейчас мы напоминаем основные сведения из теории эквивариант-ного оценивания и формулируем необходимые для дальнейшего резуль-

Введение

таты.

Пусть (Xi,- ,Хп) - независимые одинаково распределённые наблюдения, имеющие функцию распределения F(x — 9), в Є IR, причём функция распределения F(x) известна, симметрична и обладает положительной плотностью

F(x) + F(-x) = 1, р(х) = F'(x) > 0.

Рассмотрим задачу оценивания параметра сдвига в. С этой целью будем рассматривать эквивариантные оценки бп = 5пг, п), то есть такие, что при всех а Є JR

Sn{^i + а,..., Хп + о) = 6п(Хі, , Хп) + а.

Все традиционно используемые оценки параметра сдвига являются эквивариантными относительно сдвига, например, среднее, выборочная медиана или любое взвешенное среднее порядковых статистик с суммой весов, равной единице. Заметим, что оценка максимального правдоподобия также эквивариантна. Известно, что при квадратичной функции потерь при каждом п наилучшей эквивариантной оценкой является оценка Питмэна (см. (Леман 1991), теорема 3.1.5, стр. 148; (Ибрагимов, Хасьминский 1979), стр. 33)

+оо п

/ 9П р(Х{ -0)d9

К = =г=1 . (0.19)

/ П р(Хі - в) ив

-ОО 1=1

Однако эти оценки, являющиеся эталоном при сравнении оценок, как правило, являются трудновычислимыми и представляют в основном теоретический интерес.

В дальнейшем мы будем рассматривать асимптотический подход (при п -» со) и асимптотически нормальные последовательности эк-вивариантных оценок 5п:

^/п(5п - в) => М{0, а2), п -^ оо,

где => означает слабую сходимость, а //(ц, а2) нормальное распределение с математическим ожиданием // и дисперсией а2.

Введение

Для сравнения предельного качества таких оценок используем понятие асимптотической относительной эффективности (АОЭ) (см. (Леман 1991), стр. 305 - 307). Для двух последовательностей асимптотически нормальных эквивариантных оценок 5пд = n,i (-^1, * > Хп) и #п,2 = ^71,2(-^1, " , Хп)

у/п(6Пгі - в) => ЩО, af), п -+ оо, * = 1,2,

определим АОЭ оценки 5П)1 относительно оценки <5П)2 как

ем = Ц. (0.20)

Отметим, что если определить число наблюдений т = т(п) так, чтобы

л/п{6т>2 - 9) => N(0, a*), n -» 00,

то (см. (Леман 1991), теорема 5.2.1, стр. 306)

т(п) е12 = lim —^-4 n-уоо тг

Таким образом, чтобы получить предельное распределение, совпадающее с предельным распределением оценки 6п,1, оценке 6Ut2 требуется примерно п-е\2 наблюдений. Итак, если еіг > 1, то оценка 5П>2 асимптотически "хуже" оценки 5П|і. В случае еіг = 1 эти оценки асимптотически эквивалентны.

Рассмотрим теперь абсолютную АОЭ (ААОЭ), то есть асимптотическую эффективность относительно наилучшей оценки Питмэна #* (см. (0.19)). В работах (Stone 1974) и (Port, Stone 1974) показано, что при весьма общих условиях регулярности эти оценки асимптотически нормальны

у/п{6*п - в) =* Щ0, Г1), п -+ оо,

где / - фишеровская информация

Заметим, что асимптотическая дисперсия 1~1 оценки Питмэна 5* совпадает с нижней границей дисперсий из неравенства Крамера - Рао.

Введение

Обозначим ААОЭ последовательности эквивариантных асимптотически нормальных оценок 6Піі (у/п (6Піі в) => Л/"(0, of), п —> со) относительно оценки Питмэна 5* через

еі* = -щ ^ L

Рассмотрим теперь задачу оценивания параметра в по выборке независимых одинаково распределённых случайных величин [Х\, ,Хп), имеющих функцию распределения F(x — 9). Если функция распределения F{x) нормальна, то выборочное среднее

Xn = -jrXi (0.21)

п i=i

является несмещённой оценкой параметра 9 с минимальной дисперсией. Эта оценка обладает тем же свойством для всех распределений, имеющих плотность и нулевое математическое ожидание (см. (Леман 1991), стр. 99). Однако, если дополнительно предположить, что функция распределения F(x) симметрична, то оценка (0.21) уже не будет оптимальной (см. (Леман 1991), стр. 128, задача 4.4). Это связано с тем, что для симметричных распределений класс несмещённых оценок параметра сдвига значительно шире, чем без предположения симметрии.

Свойства оценки (0.21) существенно зависят от поведения "хвостов" распределения наблюдений. Например, для распределения Коши (имеющего столь " тяжелые хвосты", что не существует математическое ожидание), как известно, при каждом п > 1 оценка (0.21) имеет такое же распределение, как и отдельное наблюдение. Естественный путь получения более устойчивых оценок (см. (Bickel 1965)) состоит в отбрасывании крайних наблюдений. Особенно нечувствительной к поведению "хвостов" функции распределения F(x) является выборочная медиана

f ^Mi n = 2m- 1,

Mn = { )' (0.22)

[ 5 \X(m) +X(m+i))l n = 2m,

где X(i),... ,X(n) - вариационный ряд, построенный по исходным наблюдениям (Xi, , Хп).

Введение

Однако такое радикальное отбрасывание крайних членов выборки не всегда приводит к разумным результатам (см. (Bickel 1965), (Леман 1991), стр. 317 - 319). Естественным компромиссом между средним и медианой является отбрасывание, например, [па] наименьших и [па] наибольших наблюдений, где 0 < а < 1/2, то есть рассмотрение усечённых средних

Ln = ^(^1+1) + --- + ^-^1) ((Ш)

п 2[па]

или усечённых линейных комбинаций порядковых статистик

1 п
Ln = - ^. (0.24)

п Т=і

1 п

- У2 Сіп = 1) cin = 0, при і < [па] и і > п - [па],

п ТГл

1 / п-[па]

К = - \[п<*]Х(Ы) + S -) + [па]Х{п-[па]+і)j.

или а - уинзоризованных средних (см. (Bickel 1965))
і / п~ina]

' Е

i=[na]+l

Рассмотрим также оценку Ходжеса - Лемана (см. (Hodges, Lehmann 1963) и (Леман 1991), стр. 339 - 341)

Wn = med [X(i) +2X{J\ 1 < і < j < n}, (0.25)

то есть это медиана n(n + 1)/2 значений (Хщ + Х^)/2.

Всюду далее будет рассматриваться семейство рапределений Стью-дента с параметром 7 > 0, функциями распределения F^(x — 0) и плотностями р7(х) — F^x), определяемыми соотношением

, ч Г((7+ 1)/2) / х2л
рМ
= !—„, ,J (И ) , -со < х < со.

Введение

Параметр формы (число степеней свободы) 7 > 0 предполагается известным. При 0 < 5 < 7 У этого распределения существует абсолютный момент порядка д. При 2 < 7 У этого распределения существует дисперсия, которая в таком случае равна -. При 0 < у < 2 дисперсии не существует. Доказана следующая

Лемма 0.7

1. Для любого 7 > 0 существует фишеровская информация

1 = 7(*і)У _ 7 + 1

7 - \р7(Хі); 7 + 3'

2. Для любого х > 0 справедливо соотношение

7 Рііх) ~ —, 7 -> 0

Н\\ ч/7Г((7+ 1)/2) ,/Т _ п

^(O)=20Fr((7 +2)/2) ~~' 7^-

любого х > 0 справедливо равенство

Х77/2 Г((7 + !)/2)

ВД = 1 -

2^Г((7 + 2)/2)(7 + а:2)^ 7(7 + 1)

* (1 + ь^Ф) + г^-

где остаточный член г7(х) имеет вид

_ 72(7+1)(7+ 3)(7 + ^2)^ Г
ГЛ)~ xh + 2) 7*

Х+5 2

^7 + 2) Л (7 + i2):

Далее с помощью этой леммы находится АОЭ указанных выше оценок.

Теорема 0.8 Для оценок Мп, Wn, Ln и 6„ (см. (0.19), (0.22), (0.23), (0.25)) справедливы соотношения

Введение

a* .-^((7 + 2)/2) 1 . п

7 Г2((7+ 1)/2) ~ 7' 7

2 4тгГ4((7 +2)/2) Г2(7+1) 4

10 373Г4((7 +1)/2) Г2(7 +1/2) ~ 37%2' 7

,?. АОЭ оценки Мп относительно оценки Wn равна

_ ol 2((7 + 2)/2)Г2(7 + 1) 4

тш ^ 372Г2((7+1)/2) Г2(7 +1/2) ~ 37%2' 7

4- ААОЭ оценок Мп и Wn относительно оценки Питмэна 5п соответственно равны

- J_ - (7 +3)7 Г2((7+1)/2) _^

-т*

/7о* (7+ 1)тгГ2((7+ 2)/2) ~ 7 U'

v3^2

373(7+ 3)Г4((7 +1)/2) Г2(7+1/2) 97V

: : — —^ — : ~ , 7 ~+ U.

Єш* V2 4(7 + 1)тгГ4((7 + 2)/2) Г2(7 + 1)

5.

2 4 j*- x(i - ад) &

а' (1 - 2а)2

ау/7

*> /. л ч9 9 4а2Л_а3 а

" = (1 - 2Q)*' + ЇлЬ + S?(j ~ М2^> ^ - "

и АОЭ оценки Ln относительно оценок Мп, Wn, 5* и Ln соответственно равны

о2т {2ауіі{\ - 2а)22 4(2^ (1 - 2а)2

of асугІ2 ' w of За77/2 я"2

1 3(2а)1/т(1 - 2а)2 а,*2 (1 - 2а)2

/тсг/ ау7 erf 273/2 (2а) уп

Введение

Заметим также, что из теоремы 0.8 следует, что выборочная медиана Мп асимптотически "лучше" чем оценки Wn и Ln.

Как уже отмечалось, усечённое среднее Ln (см. (0.23)) является естественным компромиссом между средним Хп (см. (0.21)) и медианой Мп (см. (0.22)). Другой компромисс, предложенный Хьюбером (Huber 1964), подсказан тем фактом, что среднее и медиана являются величинами, минимизирующими по о Є IR соответственно функции

J2(Xi-a)2 и |Х4-а|.

і=1 г=1

Хьюбер предложил минимизировать более общее выражение вида

p(Xi - а) (0.26)

с некоторой разумно выбранной функцией р(х) (например, выпуклой и чётной). Оценки, минимизирующие выражение (0.26), будем называть М-оценками. Если функция р(х) дифференцируема, то при соответствующих условиях регулярности (см. (Huber 1964) ), М-оценка является решением уравнения

р'(Х{ - а) = 0.

t=i

Заметим также, что М-оценки являются эквивариантными, и оценки максимального правдоподобия (в случае параметра сдвига) являются М-оценками с функцией

р(х) = -log р(х).

Рассмотрим конкретную функцию р(х), предложенную в работе (Huber

1964):

2/2, \х\<к,

р(х) = {

l Jfe|x| - Л2/2, \х\>к.

Эта функция пропорциональна х2 при |х| < к, а вне этого отрезка заменяет ветви параболы на прямые линии. Эти куски согласованы так, что функция р{х) и её производная непрерывны. Оценки, минимизирующие выражение (0.26) с этой функцией, будем обозначать Нп.

Введение

При растущем к функция р(х) будет совпадать с х2/2 на всё большей части области её определения, так что оценка Нп будет сближаться с Хп. При уменьшении к оценка Нп будет сближаться с медианой Мп.

Обозначим оценку максимального правдоподобия через 5п. Справедлив следующий результат.

Теорема 0.9 Пусть случайные величины (Х\, , Хп) независимы, имеют одинаковую функцию распределения F7(x — в) и плотность р7(х) = Ffa) > 0. Тогда:

1. Оценка максимального правдоподобия 6п удовлетворяет уравнению

и при каждом С > 0 справедливо соотношение

sup \Рв(JnJyiSn - в) < х) - Фп(я)| = 0(п-3/2),

\х\<& 4V ' '

Фп(х) = Ф(х) + ^{йьаг - 12а2 + 9) - *-Д

t
п V724""1 —' ' "' 24

«і =

37(7 + 2)(7 + 3)

(7+1)(7+5)(7 +7)'

= 2(7+ 2)(7+ 3)(72+ 57+10) = Tj^

а2 ~ 7(7 + 1)(7 + 5)(7 + 7) ' 7 7 + 3*

. Для дисперсии М-оценки Нп справедливо соотношение

oi =

4А;2

о. 7 -+ 0,

72(log7 - 2log2A;)2'

и для АОЭ М-оценки Нп относительно оценок Мп, Ln, Wn, 5* и L* соответственно справедливы соотношения

Є-hm

oi 7(log7 - 21og2fc)2

/vj

4ifc2

Введение

_ а[ Q75/2(log7 - 21og2A:)2 Єм ~ ol~ {2ayh(l - 2<х)Чк2 '

al (log 7 - 21og2fc)2 1

ел- = ^ зт^де—' Gh* = v! ~

372(log7 - 2 log 2A:)2
4І2 '
of 7a(log7 - 21og2A;)2
eW
* = ~oJ 8k*(2a)Vr > ? "+ -

Заметим, что из теоремы 0.9 следует, что выборочная медиана Мп асимптотически "лучше" чем М-оценка Нп, но М-оценка Нп "лучше" чем оценки Wn и Ln.

В главе 4 рассматривается задача аппроксимации необходимого резервного капитала страховой компании в случае большого числа различных клиентов.

Рассмотрим простейшую модель страхования, в которой имеется большое число страховых контрактов (клиентов), п > со, и одна страховая компания, их обслуживающая. Страхование рассматривается с точки зрения страховой компании. Каждый контракт характеризуется величиной денежного "ущерба" ajn, j — 1,...,п (формально здесь не предполагается неотрицательность ajn) и вероятностью Pjn Є [0) 1], j = 1,.. , п, с которой этот ущерб может возникнуть. Тогда общий суммарный убыток страховой компании является случайной величиной вида

A = X>in^n, (0.27)

где мы предполагаем, что случайные величины V\n,..., Vnn независимы и принимают только два значения 1 и 0 соответственно с вероятностями pjn и qjn = 1 — pjn, то есть с математической точки зрения имеем так называемую схему серий. Заметим, что если контракты однородны, то есть

ajn = a, j = 1,...,п; и pjn = р, j = 1,...,п, (0.28)

то случайная величина Dn имеет вид

А = аВп(р),

Введение

где Вп(р) - биномиальная случайная величина с параметрами (п,р), и моделирование поведения случайной величины Dn при больших п сводится к имитационному моделированию биномиальной случайной величины или к использованию асимптотических свойств биномиального распределения (см. теорему 4.2.5 ниже).

Мы рассмотрим здесь также случай неоднородных контрактов, то есть случай, когда нарушаются условия (0.28). Для данного малого а Є (0,1) нас будет интересовать астимптотическое поведение резервного капитала страховой компании San, который определяется из условия малости вероятности того, что у страховой компании не хватит средств для покрытия общих суммарных убытков, то есть из условия

Р (А, > San) = а + oin'1). (0.29)

Здесь возможна так же следующая интерпретация. Пусть, например, на единичном отрезке "времени" [0,1] задана достаточно гладкая функция Ф(і), которая описывает "скрытый ущерб" в момент времени t. Предположим, что "ущерб" может проявиться только, например, в моменты времени вида

і 2- 1

п п и величина ущерба

%п = ФО'/п), 3 = 1,...,п

проявляется с вероятностью Pjn в момент времени j/n. Тогда Dn -величина суммарного проявившегося ущерба и San - неслучайный порог, за который величина Dn не выходит с большой вероятностью 1 — a + ofo'1).

Используя результаты работ (Albers et al. 1976), (Бенинг, Королёв 1998) и (Molenaar 1970), в главе получено асимптотическое разложения по п для необходимого резервного капитала San (см. (0.29)) (см. теоремы 0.11 и 0.12 ниже). Рассмотрен так же случай случайного числа контрактов Nn.

Предельное поведение резервного капитала страховой компании San (см. (0.29)) в случае, если случайные величины Уы,..., Vnn одинаково распределены (j)jn = р, j = 1,...,ті), может быть описано с использованием следующей предельной теоремы.

Введение

Теорема 0.10 (см. (Гаек, Шидак 1971), стр 198) Пусть Хъ Х2,...,Хп - независимые одинаково распределенные случайные величины с конечными математическими ожиданиями и дисперсиями

/і = ЕХи а2 Тогда для случайной величины

DXt.

j-n 2-і ajnXj

при выполнении условия

2-/j=i ajn maxi < j < n a]n

справедливо соотношение

оо,

(0.30)

P(Tn* Ф{х)

0, n —\ oo,

-x2/2

7 і _

Ф(х) = у du, ф) = -= e x

Поэтому в этом случае, при выполнении условия (0.30), справедливо следующее предельное соотношение для резервного капитала

p(i-p) Е а% + \

— Р 5Z %n + Щ-а.

, <, (0-31) \ i=l /

Ф(«і_в) = 1 - а.

Заметим, что условие регулярности (0.30) на константы {ojn} означает, что асимптотически (при п —» оо) они себя ведут примерно одинаково. Так, например, в случае, если

Ь

j, j = 1,2,..., n- 1 и a„

Введение

условие (0.30) нарушается.

Для случая однородных контрактов

а-зп = a, j = 1,...,п; и pjn = р, j = 1,...,п

формула (0.31) приобретает следующий простой вид

San = «ДО + u\-aa\Jnp{\ -р) + о(у/п).

Рассмотрим вопрос об уточнении остаточного члена в формулах подобного типа, которые получаются с использованием предельных теорем. Для получения асимптотического разложения резервного капитала страховой компании San используем условия регулярности на константы a,n, j = 1,.,.,пи Pjn, j = 1,..., п из работы ((Albers et аі. 1976), формулы (4.2.14) - (4.2.16)).

Обозначим математическое ожидание, дисперсию, третий и четвертый семиинварианты случайной величины Dn (см.(0.27)) соответсвен-но через

п п

Vn = ajnPjn, сІ = a"jnPjn(l - Pjn), (0.32)

3=1 J=l

кзп = -Vn3 S ^^(1 ~ Pin){2pjn - 1), (0.33)

Kin = na'4, Y, a}nPjn(l - P/n)(l - 6p,-„ + 6p%). (0.34)

J'=l Спаведлива следующая

Теорема 0.11 Пусть выполнены условия из работы ((Albers et al. 1976), формулы (4..2.Ц) - (4-2.16)), тогда (см. формулы (0.32) -(0.34))

San = Vn + <7n«l-a + --/=(ul-a -1) +

+тН#<5 -- j + т«- -з))+ Ш -35)

Ф(«1_а) = 1 - а-

Введение

Доказанная теорема показывает, что при больших п справедлива аппроксимация

San ~ / + nUi-Q + ,- (ц;_о - 1) +

+ ^ (%(5 - 2«?_«) + ^(«?_в - 3)) , (0.36)

которая может быть применена на практике.

Рассмотрим теперь однородный случай, то есть пусть

ajn = а > 0, j = 1,...,п; и pjri = р, j = 1,..., п, (0.37)

и случайная величина Z?n имеет вид

Dn = а5„(р),

где Вп(р) - биномиальная случайная величина с параметрами (п,р). Справедлива следующая Теорема 0.12 Пусть Dn = аВп(р), р є (0,1), тогда

San = а(\ + пр + v/^b^jui-a + (2Р 1)(16 UJ-a)

+

+ Щ-М-ЛУ - 2р- 1) - 14р» + 14р - 2)\ + 0т

72^пр(1 - р) / Vn7

Пусть теперь iVn - случайная величина, имеющая геометрическое распределение вида

P(Nn = к) = - (і - -) , = 1,2,..., (0.39)

которая не зависит от исходных случайных величин Vn, V12, V22... и п —> со. Предположим, что число клиентов теперь является случайной величиной и описывается случайной величиной Nn. Тогда общие нормированные потери страховой компании имеют вид

р, _ DNn - (j,Nn

'Nn^Nn

Введение

Рассмотрим симметричный случай

Pin =2' J" = 1.2,-.-,п. (0.40)

Справедлива следующая

Теорема 0.13

Пусть выполнены условия регулярности, сформулированные в теореме 0.11, случайная величина Nn имеет геометрическое распределение вида (0.39) и выполнено условие (0.40). Тогда

?(y/nD*Nn < х) - F2(x) = o(n-1/2), n -> oo, (0.41)

ВД = \ 11 +

VTT~2

В случае случайного числа (0.39) клиентов страховой компании определим необходимый нормированный резервный капитал S*n по формуле

Р (^ > S*Qn) = а + о(п-112). (0.42)

Тогда в условиях теоремы 0.13 имеем асимптотическую аппроксимацию

S*an = йі_Л + о(п"1/2), п -> со,

где ui_Q - (1 — а) - квантиль распределения Стьюдента ^(ж)

-Рг(йі-а) = 1-а.

Аналогичным образом, с учётом теорем 0.3 и 0.11, может быть рассмотрен общий несимметричный случай и случай, когда случайная величина Nn имеет отрицательное биномиальное распределение (0.9). Результаты диссертации докладывались на Международной Конференции посвященной 100 - летию со дня рождения академика А.Н.Колмогорова (Москва, 2003), на 24 Международной Конференции по Проблемам Устойчивости Стохастических Моделей (Юрмала, 2004), на научно - исследовательском семинаре Университета г. Нинбо (Китай, сентябрь 2004), на семинаре по теории вероятностей и математической

Введение

статистике факультета ВМиК Московского Государственного Университета под руководством академика Ю.В.Прохорова (октябрь 2004).

Основные результаты опубликованы в работах (У Да, Бенинг 2002), (У Да, Бенинг 2003), (Wu Da, Bening 2003) и (Wu Da 2003).

В заключение автор выражает глубокую благодарность профессору В.Е.Бенингу за постановку задачи и постоянную поддержку и помощь в написании диссертации.

Распределение Стьюдента как асимптотическая аппроксимация

Наши дальнейшие рассуждения будут основаны на двух следующих леммах. Рассмотрим случайные величины г/ь N2,..., Х\, Х2, определенные на одном и том же измеримом пространстве (П, Л). Пусть на Л задано семейство вероятностных мер {Ре, 9 Є 0}. Предположим, что при каждом п 1 случайная величина Nn принимает только натуральные значения и независима от последовательности Х\, Х2,... относительно каждой из семейства мер {Рд, 9 Є в}. Пусть Тп = Тп(Хх,.. .,Хп) -некоторая статистика, то есть измеримая функция от случайных величин Х\,..., Хп. Для каждого п 1 определим случайную величину Tffn, положив для каждого элементарного исхода о Є 1 Будем говорить, что статистика Тп асимптотически нормальна, если существуют функции 6(9) и t(9) такие, что при каждом 9 Є 0 Примеры асимптотически нормальных статистик хорошо известны. Свойством асимптотической нормальности обладают, например, выборочное среднее (при условии существования дисперсий), центральные порядковые статистики, оценки максимального правдоподобия (при достаточно общих условиях регулярности) и многие другие статистики. ЛЕММА 1.2.1. (Бенинг, Королёв 2004) Пусть {dn}n i - некоторая неограниченно возрастающая последовательность положительных чисел. Предположим, что Nn — оо по вероятности прип —» оо относительно каждой вероятности из семейства {Р#, в Є О}. Пусть статистика Тп асимптотически нормальна в смысле (1.2.1). Для того чтобы при каждом 9 Є О существовала такая функция распределения F(x,9), что необходимо и достаточно, чтобы существовало семейство функций распределения К = {Н(х,9) : 9 Є Э}, удовлетворяющее условиям Яри этом, если функция распределения случайной величины Nn не зависят от 9, то не зависят от 9 и функция распределения Н(х, 9), то есть семейство % состоит из единственного элемента. ДОКАЗАТЕЛЬСТВО. Данная лемма по сути лишь переобозначениями отличается от теоремы 3 из работы (Королёв 1995), доказательство которой, в свою очередь, основано на общих теоремах о сходимости суперпозиций независимых случайных последовательностей (Королёв 1994), (Korolev 1996). D Пусть NPtr - случайная величина, имеющая отрицательное биномиальное распределение вида Вспомогательные результаты Здесь г 0 и р Є (0,1) - параметры, и при к = 1 первый множитель в правой части формулы (1.2.2) полагается равным единице. В частности, при г = 1 соотношение (1.2.2) задает геометрическое распределение. Известно, что так что ENp r —ї со при р — 0. Отрицательное биномиальное распределение с натуральным г допускает наглядную интерпретацию в терминах и элементарного исхода о Є 1 Будем говорить, что статистика Тп асимптотически нормальна, если существуют функции 6(9) и t(9) такие, что при каждом 9 Є 0

Примеры асимптотически нормальных статистик хорошо известны. Свойством асимптотической нормальности обладают, например, выборочное среднее (при условии существования дисперсий), центральные порядковые статистики, оценки максимального правдоподобия (при достаточно общих условиях регулярности) и многие другие статистики. ЛЕММА 1.2.1. (Бенинг, Королёв 2004) Пусть {dn}n i - некоторая неограниченно возрастающая последовательность положительных чисел. Предположим, что Nn — оо по вероятности прип —» оо относительно каждой вероятности из семейства {Р#, в Є О}. Пусть статистика Тп асимптотически нормальна в смысле (1.2.1). Для того чтобы при каждом 9 Є О существовала такая функция распределения F(x,9), что необходимо и достаточно, чтобы существовало семейство функций распределения К = {Н(х,9) : 9 Є Э}, удовлетворяющее условиям Яри этом, если функция распределения случайной величины Nn не зависят от 9, то не зависят от 9 и функция распределения Н(х, 9), то есть семейство % состоит из единственного элемента. ДОКАЗАТЕЛЬСТВО. Данная лемма по сути лишь переобозначениями отличается от теоремы 3 из работы (Королёв 1995), доказательство которой, в свою очередь, основано на общих теоремах о сходимости суперпозиций независимых случайных последовательностей (Королёв 1994), (Korolev 1996). D Пусть NPtr - случайная спытаний Бернулли. А именно, случайная величина распределением (1.2.2) - это число испытаний Бернулли, проведенных до осуществления г-ж по счету неудачи, если вероятность успеха в одном испытании равна 1 — р. ЛЕММА 1.2.2. (Бенинг, Королёв 2004) Для любого фиксированного г 0 где Gr r{x) - функция распределения гамма-распределения с параметром формы, совпадающим с параметром масштаба и равным г (см. (1.14)). ДОКАЗАТЕЛЬСТВО. Характеристическая функция случайной величины NPir равна

Экстремальные энтропийные свойства распределения Стьюдента

Необходимо отметить, что в пользу большего внимания прикладных статистиков к распределению Стьюдента также свидетельствует и так называемый энтропийный подход, согласно которому в условиях неопределенности математическую модель стохастической ситуации следует выбирать так, чтобы выбранная модель соответствовала максимально возможной (при некоторых разумных условиях) неопределенности. При этом в качестве меры неопределенности выбирается (дифференциальная) энтропия абсолютно непрерывного вероятностного распределения. Хорошо известно, что при соответствующих ограничениях на носитель и моменты плотности р(х) "наиболее неопределенными" в смысле классической дифференциальной энтропии являются, например, равномерное распределение (среди всех распределений с ограниченным носителем), показательное распределение (ере ди всех распределений, сосредоточенных на неотрицательной оси и имеющих конечное математическое ожидание) и нормальное распределение (среди всех распределений, сосредоточенных на всей числовой оси и имеющих конечный второй момент). Как показано в книге (Kapur 1989), в классе плотностей р(х), положительных на всей числовой оси и удовлетворяющих условию зависит от числа с и удовлетворяет уравнению (г) - дигамма-функция, (Интересно отметить, что и в цитируемой книге (Kapur 1989) данное распределение не распознано как распределение Стьюдента, а названо "обобщённым распределением Коши".) Более того, в работе (Tsallis, de Souza 1995) показано, что если вместо (1.3.1) в качестве меры неопределенности рассмотреть обобщенную -энтропию (non-extensive entropy) (для которой функционал (1.3.1) является предельным случаем при q —ї 1), то для 1 q 3 максимум функционала Hq\p] при условиях доставляет распределение Стьюдента с параметром Выше мы уже упоминали, что отрицательное биномиальное распределение (как мы убедились, тесно связанное с распределением Стьюдента следствием 1.2.1), при натуральном г может быть интерпретировано в терминах испытаний Бернулли, проведенных до г-й неудачи. В то же время, особенно в задачах, связанных с анализом больших рисков, большой интерес представляет изучение распределения Стьюдента с малым параметром г, то есть с очень "тяжелыми хвостами". Более того, можно показать, что при 7 = 2г - 0 максимум плотности р (х) распределения Стьюдента стремится к нулю как 0(y/j). Одновременно "хвосты" распределения Стьюдента становятся все более и более "тяжелыми". Поэтому распределение Стьюдента с малым параметром может рассматриваться как некий аналог равномерного распределения на бесконечном интервале. Чтобы следствие 1.2.1 можно было использовать и в такой ситуации, следует разобраться, что из себя представляет отрицательное биномиальное распределение, то есть как оно может быть проинтерпретировано, при 0 г 1. Мы приведем два примера такой интерпретации. ПРИМЕР 1.4.1.

Этот пример хорошо знаком. Скажем, в книге (Кен-далл, Стьюарт 1966) он приведен со ссылкой на работу (Greenwood, Yule 1920). Рассмотрим случайную величину MPtT, имеющую смешанное пуассоновское распределение где С/г,р/(і-р) - случайная величина, имеющая гамма-распределение с параметром формы г и параметром масштаба р/(1—р). Легко убедиться, что безусловное распределение случайной величины МР)Г имеет вид Несложно убедиться, что при этом MPiT = Np r — 1, где, как и ранее, NPtT - случайная величина, имеющая отрицательное биномиальное распределение с параметрами гир (см. (1.2.2)). Таким образом, если сначала реализуется значение и случайной величины /r,p/(i_p) с гамма-распределением GriP/(i_p), а затем реализуется значение случайной величины МРіГ, имеющей пуассоновское распределение, параметр которого равен полученному значению и, то, прибавив единицу к итоговой реализации случайной величины Мр г, мы получаем реализацию отрицательной биномиальной случайной величины NPtr с параметрами гир. При этом требуемая асимптотика р — 0 (гарантирующая применимость следствия 1.2.1) и г —) 0 для Np r и F2r(x) естественно возникает как аналогичная асимптотика для С/ГіР/(і_Р). ПРИМЕР 1.4.2. Вновь наряду со случайной величиной iVPir, введенной выше, рассмотрим случайную величину МР)Г = NPiT — 1, имеющую распределение (1.4.1). Рассмотрим независимые одинаково распределенные неотрицательные целочисленные случайные величины Z\, Z2,.. каждая из которых имеет производящую функцию где р Є (0,1). Эта производящая функция задает так называемое логарифмическое распределение Фишера (см. (Кендалл, Стьюарт 1966)). Пусть N - случайная величина, имеющая распределение Пуассона с параметром \х 0, независимая от случайных величин Z\,Z2,... Положим Если N = 0, то полагаем 5 = 0. Можно показать (см. (Gurland 1957), (Quenouille 1949)), что в таком случае числа qn в представлении обобщенной пуассоновской производящей функции случайной величины S Другими словами, в рассматриваемом случае распределение пуассонов-ской случайной суммы S совпадает с распределением (1.4.1) случайной величины Мр г при г, удовлетворяющем соотношению (1.4.2). Таким образом, отрицательное биномиальное распределение с параметрами гир можно интерпретировать как сдвинутое на единицу распределение суммы случайного числа независимых одинаково распределенных случайных величин, в которой слагаемые имеют логарифмическое распределение с параметром р, а число слагаемых имеет пуассоновское распределение с параметром При этом требуемое соотношение г 1 выполняется, если ц log -, а распределение Стьюдента с 7 = 2г — 0 может выступать в качестве асимптотической аппроксимации, основанной на следствии 1.2.1, если при р — 0. В главе доказана общая теорема (так называемая теорема переноса), позволяющая автоматически получать оценки скорости сходимости к распределению Стьюдента распределений статистик, построенных по выборкам случайного объема, из оценок скорости сходимости к нормальному закону аналогичных статистик, использующих большой, но не случайный объем выборок. При этом предполагается, что объем выборок имеет отрицательное биномиальное распределение с малыми параметрами. Затем эта теорема применяется к линейным комбинациям порядковых статистик и U - статистикам, широко применяемым в теории риска и математической статистике

Оценки скорости сходимости некоторых статистик, построенных по выборкам случайного объёма, к распределению Стьюдена

Пусть статистика Тп = Г„ (Xi, , Хп) построена по повторной выборке (Xi, ,Хп) независимых одинаково распределённых случайных величин, является асимптотически нормально распределённой и для её распределения справедлива оценка скорости сходимости вида: существуют числа а О и \х Є IR такие, что Пусть Nn = Ni/nj, г Є (0,1] - случайная величина, имеющая отрицательное биномиальное распределение (см. (2.1.1)) вида которая не зависит от исходных случайных величин Х\, Х2,... и п —» со. Заметим, что (см. (2.1.2), (2.1.4)) Пусть F2r(x) - функция распределения распределения Стьюдента с параметром формы 7 = 2г. Тогда справедливо представление (распределение вида (2.2.2) и п — со, удовлетворяет равенству (г Є (0, 1]) Оценки скорости сходимости Интегрируя по частям, для правой части формулы (2.2.10), можно написать оценку Теперь применяя теорему 2.1.1 и неравенство (2.1.8), получим (заметим, что всегда -— \) и Оценим теперь величину 7г (см. (2.2.9)). Имеем Глава Для оценки правой части неравенства (2.2.14) применим предположение теоремы, а именно, соотношение (2.2.6). Получим (см. также (2.2.2)) внимание соотношение (2.2.15), можно записать Оценки скорости сходимости получим Для оценки правой части неравенства (2.2.18) применим неравенства типа получим Рассмотрим теперь случай 0 г . Формальное применение неравенства (2.2.17) не проходит, поскольку стоящий там интеграл расходится в нуле. Пусть сначала 0 г \. Аналогично неравенству (2.2.17) можно записать Рассмотрим наконец случай г = . Используя опять первую часть неравенства (2.2.17), можно написать Теперь из соотношений (2.2.7), (2.2.12), (2.2.13), (2.2.19), (2.2.20) и (2.2.21) следует доказываемая теорема. ЗАМЕЧАНИЕ 2.2.1 Заметим, что в случае г = 1, то есть если случайная величина Nn имеет геометрическое распределение, предельная функция распределения F2(x) вычисляется в явном виде. А именно, Оденки скорости сходимости У этого распределения нет моментов порядка 2. ЗАМЕЧАНИЕ 2.2.2 Заметим, что в случае геометрического распределения (г = 1) из доказательства теоремы 2.2.1 и замечания 2.2.1 непосредственно следует, что если для распределения статистики Тп — Тп(Х\, ,Хп) справедлива оценка скорости сходимости вида: существуют числа т О и ц Є Ж. такие, что ЗАМЕЧАНИЕ 2.2.3

Заметим, что доказательство теоремы 2.2.1 в идейном плане близко к доказательству теоремы 8.3.1 из книги (Круглов, Королёв 1990). В этом разделе будут приведены два примера использования теоремы 2.2.1. Первый пример касается U - статистик, а второй - линейных комбинаций порядковых статистик, широко применяемых в статистике (см., например, (Королюк, Боровских 1989), (Serfling 1980), (Helmers 1984), (Bening 2000)). Совершенно аналогично, с учётом, например, результатов работы (Does 1982), могут быть рассмотрены ранговые статистики или статистика Стьюдента (см. (Bentkus, Gotze 1996)), и вообще достаточно широкий класс симметричных статистик (см. работы см. (1.1.3)) где (?г,г(-) - функция распределения гамма распределения (см. (1.1.4)). Это представление будет полезно при доказательстве нижеследующей теоремы. Рассмотрим теперь статистику TVn, построенную по выборке случайного объёма Nn, то есть Справедлива следующая теорема. ТЕОРЕМА 2.2.1 Пусть распределение статистики Тп — Тп{Х\, ,Хп) удовлетворяет соотношению тогда распределение статистики Т п = Т п(Хі,..., Хцп), где случайная величина Nn имеет отрицательное биномиальное распределение вида (2.2.2) и п — со, удовлетворяет равенству (г Є (0, 1]) Оценки скорости сходимости Интегрируя по частям, для правой части формулы (2.2.10), можно написать оценку Теперь применяя теорему 2.1.1 и неравенство (2.1.8), получим (заметим, что всегда -— \) и Оценим теперь величину 7г (см. (2.2.9)). Имеем Глава Для оценки правой части неравенства (2.2.14) применим предположение теоремы, а именно, соотношение (2.2.6). Получим (см. также (2.2.2)) внимание соотношение (2.2.15), можно записать Оценки скорости сходимости получим Для оценки правой части неравенства (2.2.18) применим неравенства типа получим Рассмотрим теперь случай 0 г . Формальное применение неравенства (2.2.17) не проходит, поскольку стоящий там интеграл расходится в нуле. Пусть сначала 0 г \. Аналогично неравенству (2.2.17) можно записать Рассмотрим наконец случай г = . Используя опять первую часть неравенства (2.2.17), можно написать Теперь из соотношений (2.2.7), (2.2.12), (2.2.13), (2.2.19), (2.2.20) и (2.2.21) следует доказываемая теорема. ЗАМЕЧАНИЕ 2.2.1 Заметим, что в случае г = 1, то есть если случайная величина Nn имеет геометрическое распределение, предельная функция распределения F2(x) вычисляется в явном виде. А именно, Оденки скорости сходимости У этого распределения нет моментов порядка 2. ЗАМЕЧАНИЕ 2.2.2 Заметим, что в случае геометрического распределения (г = 1) из доказательства теоремы 2.2.1 и замечания 2.2.1 непосредственно следует, что если для распределения статистики Тп — Тп(Х\, ,Хп) справедлива оценка скорости сходимости вида: существуют числа т О и ц Є Ж. такие, что ЗАМЕЧАНИЕ 2.2.3 Заметим, что доказательство теоремы 2.2.1 в идейном плане близко к доказательству теоремы 8.3.1 из книги (Круглов, Королёв 1990). В этом разделе будут приведены два примера использования теоремы 2.2.1. Первый пример касается U - статистик, а второй - линейных комбинаций порядковых статистик, широко применяемых в статистике (см., например, (Королюк, Боровских 1989), (Serfling 1980), (Helmers 1984), (Bening 2000)). Совершенно аналогично, с учётом, например, результатов работы (Does 1982), могут быть рассмотрены ранговые статистики или статистика Стьюдента (см. (Bentkus, Gotze 1996)), и вообще достаточно широкий класс симметричных статистик (см. работы

Оценивание центра в случае малого числа степеней свободы

Всюду далее будет рассматриваться семейство рапределений Стью-дента с параметром 7 0, функциями распределения F7(ar — в) и плотностями р7(х) = F {x), определяемыми соотношением Параметр формы (число степеней свободы) 7 0 предполагается известным. При 0 8 7 У этого распределения существует абсолютный момент порядка 6. При 2 j у этого распределения существует дисперсия, которая в таком случае равна -. При 0 7 2 дисперсии не существует. ЛЕММА 3.3.1. Оценивание центра рапределения Как уже отмечалось в разделе 2, усечённое среднее Ln (см. (3.2.16)) является естественным компромиссом между средним Хп (см. (3.2.14)) и медианой Мп (см. (3.2.15)). Другой компромисс, предложенный Хьюбе-ром (Huber 1964), подсказан тем фактом, что среднее и медиана являются величинами, минимизирующими по а Є К соответственно функ Хьюбер предложил минимизировать более общее выражение вида с некоторой разумно выбранной функцией р(х) (например, выпуклой и чётной). Оценки, минимизирующие выражение (3.4.1), будем называть М-оценками. Если функция р(х) дифференцируема, то при соответствующих условиях регулярности (см. (Huber 1964) ), М-оценка является решением уравнения Заметим также, что М-оценки являются эквивариантными, и оценки максимального правдоподобия (в случае параметра сдвига) являются М-оценками с функцией Рассмотрим конкретную функцию р(х), предложенную в работе (Huber 1964): Эта функция пропорциональна х2 при ж /с, а вне этого отрезка заменяет ветви параболы на прямые линии. Эти куски согласованы так, что функция р(х) и её производная непрерывны. Оценки, минимизирующие выражение (3.4.1) с этой функцией, будем обозначать Нп. При растущем к функция р(х) будет совпадать с х2/2 на всё большей части области её определения, так что оценка Нп будет сближаться с Хп. При уменьшении к оценка Нп будет сближаться с медианой Мп. ТЕОРЕМА 3.4.1 ((Huber 1964), лемма 4). Пусть случайные величины (Х\,- ,Хп) независимы и имеют одинаковую функцию распределения F(x—в). Предположим, что функция распределения F(x) имеет непрерывную симметричную плотность р(х) = F (x) 0. Тогда Обозначим оценку максимального правдоподобия через 5п. Справедлив следующий результат. ТЕОРЕМА 3.4.2 ((Albers et al. 1976), лемма 7.1). Пусть случайные величины (Xi, -,Хп) независимы и имеют одинаковую функцию распределения F(x — в). Предположим, что функция распределения F(x) имеет строго унимодальную симметричную плотность р(х) = F (x) 0, которая имеет пять производных и Тогда для оценки максимального правдоподобия 5п, удовлетворяющей уравнению при каждом С 0 справедливо соотношение

Оценивание центра рапределения где х р(х) /х2. . щ — 3 Ф. п(х) = Ф(х) + Р( (5 -12772 + 9) - ), (3.4.9) Из этой теоремы, в частности следует, что и поэтому ААОЭ оценки максимального правдоподобия (см. (3.2.13)) равна единице. ТЕОРЕМА 3.4.3. Пусть случайные величины (Xi, , Хп) независимы, имеют одинаковую функцию распределения F {x—в) и плотность ру(х) = Ffa) 0 (см. (3.3.1)). Тогда: Глава З поэтому числитель дроби (3.4.17) стремится к к2. Рассмотрим знаменатель дроби (3.4.17). При фиксированном к 0 формула (3.3.7) позволяет написать Далее, по формуле Тейлора, имеем Отсюда следует формула (3.4.17). Теперь формулы (3.4.18), (3.4.19) следуют из соотношений (3.4.17), (3.3.4), (3.3.6), (3.3.17), (3.3.18), (3.3.22). ЗАМЕЧАНИЕ 3.4.1. Заметим, что из доказанной теоремы 3.4.3 следует, что выборочная медиана Мп асимптотически "лучше" чем М-оценка Нп, но М-оценка Нп "лучше" чем оценки Wn и Ln. В главе рассматривается простейшая модель страхования, связанная с большим числом неоднородных клиентов. Получены аппроксимации для необходимого резервного капитала страховой компании. Рассмотрен также случай случайного числа клиентов страховой компании. Рассмотрим простейшую модель страхования, в которой имеется большое число страховых контрактов (клиентов), п — со, и одна страховая компания, их обслуживающая. Страхование рассматривается с точки зрения страховой компании. Каждый контракт характеризуется величиной денежного "ущерба" aJn, j = 1,...,п (формально здесь не предполагается неотрицательность ajn) и вероятностью Pjn Є [0,1], j = 1,..., п, с которой этот ущерб может возникнуть. Тог да общий суммарный убыток страховой компании является случайной величиной вида

Похожие диссертации на Некоторые задачи теории вероятностей и математической статистики, связанные с распределением Стьюдента