Введение к работе
Актуальность исследования. Изучение распределений сумм независимых случайных величин - одна из традиционных задач теории вероятностей. Ее актуальность связана с тем, что, с одной стороны, суммы таких величин часто встречаются в практических задачах, с другой стороны, эти распределения являются свертками распределений слагаемых, а свертки в явном виде вычисляются лишь в исключительных случаях и даже в этих случаях расчеты по полученным формулам связаны с преодолением существенных технических трудностей. Сказанное объясняет актуальность получения приближённых формул для распределений сумм независимых случайных величин. Фундаментальным результатом в этом разделе теории вероятностей является центральная предельная теорема (ЦПТ), которая утверждает, что при достаточно широких условиях сумма многих независимых случайных величин имеет приближённо нормальное распределение.
В работе рассматривается простейшая схема суммирования, в которой исходные случайные величины Х\, Х2, независимы, одинаково распределены и их второй момент конечен. При выполнении последнего условия без ограничения общности можно считать, что математические ожидания исходных случайных величин равны нулю, а их дисперсии - единице. Для этой схемы суммирования ЦПТ утверждает, что при п —> оо
(
X 4- 4- X \
^= < х ) —> Ф(х), —ОО < X < оо,
причем эта сходимость равномерна по всем действительными, то есть при больших п функции распределения Fn(x) можно заменять на Ф(х). Здесь и далее
Ф(х) = /„(„)«*„, -оо < * < оо, - функция распределения
— ОО
стандартного нормального закона, (fi(u) = ~7к=е - ее плотность.
Замена функций распределения Fn(x) на Ф{х) обоснована лишь в том случае, когда известна оценка разности Fn(x) и Ф(х), поэтому одной из актуальных задач в теории суммирования независимых случайных величин является задача о точности аппроксимации в ЦПТ или, как иногда говорят, о скорости сходимости в ЦПТ.
Содержательные оценки близости Fn(x) и Ф{х) можно получать лишь для случайных величин Х\, Х2, , у которых существует
момент порядка выше второго, и самым известным результатом о точности аппроксимации в ЦПТ является теорема Берри-Эссеена, которая утверждает, что
РЙ,Ф)= sup \Fn(x) - Ф(х)\ ^ А ,
—оо<ж<оо
где / = Е \Х\\ = / \х\6 dF(x) - третий абсолютный момент исходных
—оо
случайных величин Х\, Х2, ... , а - с > 0 постоянная.
История улучшения верхних оценок постоянной с насчитывает не одно десятилетие. Среди последних работ по этой тематике отметим работы В.Ю. Королева, И.Г. Шевцовой1 и И.С. Тюрина2. Нижняя
оценка с ^ ^/^- = 0,4097... была получена К.-Г. Эссееном3 в 1956
г. Последняя оценка вместе с неравенством / ^ 1 (для распределений с нулевым средним и единичной дисперсией) показывает, что точность оценки Берри-Эссеена невелика: для того, чтобы р(і^п,Ф) ^ 10 необходимо п ^ 160 000, для п порядка нескольких сотен оценка Берри-Эссеена мало содержательна.
Малая точность оценки Берри-Эссеена связана с тем, что она справедлива для очень широкого класса распределений исходных случайных величин; в некоторых случаях скорость сходимости в ЦПТ оказывается существенно выше, чем в теореме Берри-Эссеена. Так, из одной теоремы И.А. Ибрагимова следует, что если у распределения
77" О Т"- I V IWI+2 / I \ГП-\-2 1Т7<( \
t конечен момент рт+2 = E|Ai| = \х\ аг{х), где т
натуральное число, и моменты <х,- = EXf = / xJdF(x) совпадают
—оо
с соответствующими моментами нормального закона Ф (х) для
Королев В.Ю., Шевцова И.Г. Уточнение неравенства Берри-Эссеена с приложениями к пуассоновским и смешанным пуассоновским случайным суммам. // Обозрение прикл. и промышл. матем., 2010, т. 17, в. 1, с. 25-56.
Тюрин И.С. О скорости сходимости в теореме Ляпунова. // Теория вероятностей и ее применения, 2010, т. 55, в. 2, с. 250-270.
Essen C.-G. A moment inequality with an application to the central limit theorem. // Skand. Aktu-arrietidskr., 1956, vol. 39, p. 160-170.
Ибрагимов И.А. Об асимптотических разложениях Чебышева-Крамера. // Теория вероятн. и ее примен., 1967, т. 12, выпуск 3, с. 596-619.
j = 1, 2,..., m + 1, то при некоторой гладкости F(:r)
и известны явные оценки этой величины О \—^/2)
Таких оценок уже при не очень больших т хватило бы для большинства практических расчетов, однако применению этих оценок препятствует упомянутое условие на совпадение моментов <х,-, j = 1, 2,..., т + 1, с соответствующими моментами нормального закона, а это условие является необходимым для справедливости (1). Однако, последнее ограничение можно обойти, если аппроксимировать Fn(x) суммами функции Ф(х) и слагаемых, которые убывают при росте п как —j= и быстрее, и связанных с моментами a.j, j ^ 3, функции
распределения F(x). Такие суммы называются асимптотическими разложениями Fn(x).
Исследованиями асимптотических разложений в ЦПТ занимались В.Ю. Бенткус, А. Бикялис, И.П. Грам, Б.В. Гнеденко, И.А. Ибрагимов, Г. Крамер, А.А. Марков, Л.В. Осипов, В.В. Петров, Ю.В. Прохоров, Л.В. Розовский, Л. Саулис, В.А. Статулявичус, П. Сурвила, В.В. Ульянов, П.Л. Чебышев, К. Шарлье, Ф. Эджворт, К.-Г. Эссеен. Они получили важные результаты, которые, однако, обладали существенным недостатком: оценки точности аппроксимации, которую гарантируют асимптотические разложения, было невозможно доводить до численных значений.
Первые результаты с явными оценками точности появились в конце 20-го века в работах R. Shimizy6 и V. Dobric, В.К. Ghosh , в которых к нормальному закону Ф (х) добавлялось только одно слагаемое. Точность такой аппроксимации (при некоторых дополнительных условиях) есть 0(-\ п —> оо, причем для величин О (-) были указаны явные оценки.
Асимптотические разложения более высокой точности с явными оценками были получены в самом конце 20-го века и их построение было связано с использованием сопровождающих зарядов. Основная идея состояла в следующем. Функции распределения Fn(x) нормированных сумм, введенные выше, суть многократные
Сенатов В.В. Центральная предельная теорема: Точность аппроксимации и асимптотические разложения. М.: Книжный дом Либроком, 2009, с. 90.
Shimizu R. On the remainder term for the central limit theorem. // Ann. Inst. Stat. Math., 1974, V.26, p. 195-201.
Dobric V., Ghosh B.K. Some analogs of Berry-Esseen bound for first order Chebychev-Edgeworth expansions, jl Stat. Decis., 1996, V.14, №4, p. 383-404.
нормированные свертки распределения F(x) исходных случайных величин, то есть Fn(x) = F*n(xy/n), где *п означает свертку п одинаковых распределений. Если для данной функции распределения F(x) подобрать заряд (знакопеременную меру) с функцией распределения G(x) такой, что многократные нормированные свертки Gn(x) = G*n(xy/n) вычисляются достаточно просто и такой, что функции Fn(x) и Gn(x) при росте п сближаются друг с другом быстрее, чем они сближаются с функцией распределения нормального закона Ф(х), то в качестве аппроксимации для Fn(x) можно взять функции Gn(x) или асимптотические разложения последних. Функции Gn(x) естественно назвать сопровождающими для Fn(x). Для некоторых функций распределения F(x) сопровождающие заряды для Fn(x) можно подобрать так, чтобы Gn(x) были функциями распределения, однако, в общем случае приходиться использовать заряды.
Выбирать заряды с указанными выше свойствами можно различными способами. Основное требование к ним, как подсказывает упоминавшаяся выше теорема Ибрагимова, состоит в том, чтобы они имели достаточное количество моментов, и первые несколько моментов совпадали с соответствующими моментами функции распределения F(x).
В.В. Сенатов для распределений F(x) с конечным абсолютным моментом порядка т + 2, где т ^ 2 - целое число, строил сопровождающие функции распределения Gn(x), используя функции распределения G с плотностями
т+1 д
где Hs(x) = (—l)s(p^(x)/(fi(x) , s = 0,1,2,.. , - многочлены
Чебышева-Эрмита, а числа 9S = 9S(F) = I Ha(x)dF(x) ,s =
—oo
3,...,?7i + 1, - моменты Чебышева-Эрмита функции распределения F(x). Моменты 6S (F) можно вычислять по формуле
e.(F) ^(-iy«,-2,(F) s! f- j\2> (s - 2j)! '
Сенатов В.В. Центральная предельная теорема: Точность аппроксимации и асимптотические разложения. М.: Книзкный дом Либроком, 2009, с. 128.
где as-2j(F) = xs 2i(lF{x) - обычные моменты функции
распределения F. Для моментов Чебышева-Эрмита справедливы равенства
i808(F)= (et2/2f{t)){S) ,s = 0,1,2,...ш+ 2,
v J t=0
где f - характеристическая функция функции распределения F, і мнимая единица, аналогичные равенствам
,s = 0,1,2,...771 + 2
t=0
i'a.(F) = (/(*))«
для моментов и
(s)
iX(F)=(in/W)
,S = 0,1,2,...777 + 2
t=0
для семиинвариантов. Характеристическая функция заряда с плотностью (2) есть
2 / т+1Й \
g(t) = e-* 1 + ЕІ^П ' №
4S[
то есть эта характеристическая функция есть произведение характеристической функции е~г ' стандартного нормального закона и отрезка ряда Тейлора функции е* ' f(t) в окрестности нуля.
С помощью таких зарядов были получены (при соответствующих ограничениях) асимптотические разложения для функций распределения Fn(x) и асимптотические разложения в локальных формах ЦПТ. Точность аппроксимации, которую гарантируют эти разложения, составляет О (-^72), 77 —> оо, для величин О {—^2) были указаны явные оценки, в которых участвовала величина абсолютного момента F порядка т + 2. При этом налагались ограничения, состоящие в том, что все значения |#s|, s = 3,...,777 + 1, невелики, а оценки остаточных частей разложений были очень громоздкими. Упомянутые ограничения на значения моментов можно ослабить, но для этого суммы Х\ + ... + Хп случайных величин необходимо разбивать на блоки, содержащие по несколько слагаемых.
А.Е. Кондратенко использовал заряды, определяющиеся с помощью семиинвариантов, а именно, заряды с характеристическими функциями
Кондратенко А.Е. Точность аппроксимации свёрток распределений асимптотическими разложениями. Кандидатская диссертация. М.: МГУ, 2001.
m+1
g(t) = e *=з то есть с характеристическими функциями, которые суть е в степени, совпадающей с разложением In f(t) в отрезок ряда Тейлора в окрестности нуля. С помощью таких зарядов были получены разложения, аналогичные тем, что упоминались выше и с более простыми оценками остаточных частей, но класс распределенийF, для которых можно использовать такие заряды, был достаточно узким. В частности, при т = 3 требовалось, чтобы величина /- = Щ — 3 была меньше нуля, то есть щ < 3, что является очень сильным ограничением.
Здесь надо отметить, что построением асимптотических разложений с использованием семиинвариантов в середине 1960-х занимался В.В. Петров . Сопровождающие заряды он не использовал, ограничения на значения семиинвариантов у него отсутствовали, но при этом оценки точности разложений содержали величины, для которых утверждалось лишь их существование.
Комбинируя идеи построения приведённых выше зарядов, В.В. Сенатов рассмотрел заряды с характеристическими функциями
(4)
9(t) = e-|2et^3 , g(t) = e-!2+#W3 (1 + |(й)4) , g(t) = e-|2 + tW3 + IW5
С помощью этих зарядов были получены асимптотические разложения в случае, когда распределение F имеет конечный момент /Зщ+2, для т = 2,3,4 и 5, эти разложения гарантировали точность 0(-^72), оценки остаточных частей разложений были относительно просты, а единственное ограничение для т ^ 4 на моменты состояло в том, что 04 = «4—3 < б (и это ограничение можно ослабить, разбивая суммы случайных величин на блоки из нескольких слагаемых).
Цель работы. Целью диссертации является решение следующих задач, связанных с оптимизацией асимптотических разложений в ЦПТ:
Снять ограничения на значения моментов в асимптотических разложениях, для которых известны явные оценки остаточных частей.
Построить асимптотические разложения с явными оценками остаточных частей, точность которых выше О у—щ), п —> оо.
Петров В.В. О локальных предельных теоремах для сумм независимых случайных величин. // Теория вероятн. и ее примен., 1964, т. 9, в. 2, с. 343-352.
3. Исследовать возможность построения асимптотических разложений в ЦПТ, которые дают сколь угодно высокую точность аппроксимации, если исходное распределение имеет достаточное количество моментов.
Научная новизна. Основные результаты работы являются новыми и состоят в следующем:
1. Предложен новый вид сопровождающих зарядов, которые
позволяют строить асимптотические разложения в ЦПТ без
ограничений на моменты исходных случайных величин. С помощью
этих зарядов получены новые асимптотические разложения в ЦПТ,
гарантирующие точность аппроксимации О (-), п —> оо, с явной
оценкой остатка.
Получены новые формы асимптотических разложений в ЦПТ, которые дают сколь угодно высокую точность аппроксимации, если исходное распределение имеет достаточное количество моментов. Эти формы разложений дают наилучшие из оценок остаточных частей, известных в настоящее время.
Получена новая формула для многочленов, участвующих в асимптотических разложениях Эджворта-Крамера. Получено новое представление для моментов Чебышева-Эрмита.
Методы исследования. В работе используются метод характеристических функций, в частности, формулы обращения для преобразования Фурье, метод сопровождающих зарядов, а также другие методы теории вероятностей и математического анализа.
Теоретическая и практическая ценность. Работа носит теоретический характер. Полученные результаты могут быть использованы специалистами в теории вероятностей и смежных областях, таких как математическая статистика, теория случайных процессов.
Апробация работы. Результаты диссертации докладывались на Большом семинаре кафедры теории вероятностей механико-математического факультета МГУ под руководством чл.-корр. РАН, проф. А. Н. Ширяева (мех-мат МГУ, 2010 г.), на семинаре "Прикладные задачи теории вероятностей, математической статистики и теории массового обслуживания" под руководством проф. Ю.С. Хохлова, проф. В.В. Рыкова, проф. А.В. Печинкина (РУДН, 2010 г.), на семинаре "Теория риска и смежные вопросы" на факультете ВМК МГУ им. М.В. Ломоносова под руководством проф. В.Ю. Королёва
(ВМК МГУ, 2010 г.), на "VIII Международных Колмогоровских чтениях" (Ярославль, 2010 г.).
Публикации. По теме диссертации опубликовано две работы в журналах из перечня ВАК, список которых приведен в конце автореферата.
Структура и объем диссертации. Диссертация состоит из введения, трех глав, разбитых на параграфы и пункты, заключения и списка литературы, включающего 96 наименований. Общий объем диссертации составляет 138 страниц.