Содержание к диссертации
Введение
Глава 1. Формула суммирования Пуассона в применении к задачам теории вероятностей 10
1.1. Формула суммирования Пуассона и условия ее применимости 10
1.2. Радиальные функции. Формула суммирования Пуассона для радиальных функций 14
1.3. Равномерное распределение и примеры сходимости к равномерному распределению 15
1.4. Применение формулы суммирования Пуассона в задаче оценки близости к многомерному равномерному распределению 19
Глава 2. Оценки близости распределения вектора дробных частей к многомерному равномерному распределению в гауссовском случае . 21
2.1. Применение формулы суммирования Пуассона для оценки близости распределения вектора дробных частей к многомерному равномерному распределению в гауссовском случае 21
2.2. Оценка близости распределения вектора дробных частей гауссовских случайных векторов в R8 к равномерному в кубе [0,1]8 24
2.3. Оценка близости распределения вектора дробных частей гауссовских случайных векторов в R16 к равномерному в кубе [0,1]16 26
Глава 3. Свойства проекций распределения, равномерного на сфере в Rs 35
3.1. Распределение, равномерное на поверхности сферы в Rs, его проекции и характеристические функции 36
3.2. Расстояние по вариации как мера близости распределений ... 38
3.3. Неравенство Диакониса-Фридмана 43
3.4. Нижняя оценка для интеграла рк 47
3.5. Уточнение верхней оценки для расстояния/9fc 55
Приложение. Таблица точных значений числа целых точек на сферах и в шарах в пространстве R16 57
Список литературы
- Равномерное распределение и примеры сходимости к равномерному распределению
- Применение формулы суммирования Пуассона в задаче оценки близости к многомерному равномерному распределению
- Оценка близости распределения вектора дробных частей гауссовских случайных векторов в R8 к равномерному в кубе [0,1]8
- Расстояние по вариации как мера близости распределений
Введение к работе
Главный объект исследования данной диссертации — распределения векторов дробных частей случайных векторов в многомерных евклидовых пространствах. Основное внимание в ней уделяется условиям, при которых эти распределения близки к многомерному равномерному распределению. С этой целью рассматриваются две задачи.
Первая — задача оценки близости распределения вектора дробных частей к многомерному равномерному распределению в гауссовском случае. Этой задаче посвящены первая и вторая главы работы.
Вторая — задача оценки близости А;-мерных проекций распределения, равномерного на сфере в s-мерном евклидовом простанстве, к распределению к-мерного вектора, компоненты которого суть независимые случайные величины со стандартным гауссовским распределением. Этой задаче посвящена третья глава работы.
Первая глава носит вспомогательный характер по отношению к содержанию второй главы. В ней приведена сводка известных результатов, сформулированных вне связи с теорией вероятностей, поскольку главными аналитическими средствами, используемыми в первых двух главах настоящей работы, в основном, для оценки близости распределения вектора дробных частей гауссовского случайного вектора в 5-мерном евклидовом пространстве R* к равномерному в кубе [0, 1]", будут кратные ряды Фурье и преобразования (интегралы) Фурье в Rs, а также формула суммирования Пуассона.
Дается краткий обзор результатов теории вероятностей, в которых предельным служит одномерное равномерное распределение.
Приводится следующее теоретико-вероятностное истолкование многомерного варианта формулы суммирования Пуассона.
Введение
Пусть Х(я) = (Xi,X2,..-,Xa) — случайный вектор, принимающий значения в R*, р(х(Л);Х(в)) (x(s) Є Rs) — функция плотности распределения вектора Х(„) и y>(t(s);X(4)) — ее характеристическая функция, а именно, v(t(.);x(.))= / e''(tc).-(.))p(X(s);xw)dx(e).
Если при некоторых А > О и 6 > О Kx(s);X(s))<(1 + |x^|)s+5 и |y(t(,);x(a))|<(i + |t^|)a+g, р(т(я)+хн;Х(а))= 53 e2*«(,nf).x(o)v,(_2,rm(.);X(.))> где ряд справа сходится абсолютно.
Ограничиваясь теперь только значениями Х(я) Є [О, l]s, в левой части этого соотношения получаем плотность распределения вектора {X(sj} дробных частей вектора X(s). Записывая правую часть этого соотношения в виде
1+ Є2"^«).Х(.))^(_2^т(я);Х(в)) m(,)6Z«,m(j)^0(,) и принимая во внимание, что плотность распределения, равномерного в кубе [0,1]", равна единице в этом кубе и нулю вне его, отклонение распределения случайного вектора {Х(я)} от равномерного в кубе [0, 1]" распределения можем измерять величиной
А= sup |р(х(я);{Х(я)})-1|, х(,,б[о, line превосходящей, согласно приведенному выше соотношению,
53 И-2тгт(в);Х(а))|= ] |^(2тгт(8);Х(в))|.
Ш(.)6Z', 111(,)/0(,) m(,)eZ' , Ш(,)^0(,)
Таким образом, получая те или иные границы для суммы
Е kPxmwjXw)! т(,)Єг',т(,)?!0(,) абсолютных значений характеристической функции |уз(27гт(Л);Х(5))| в точках вида 27ггп(я), Ш(3) Є Z"\0(4), можно количественно оценивать близость распределения вектора {Х(4)} дробных частей случайного вектора X(s) к равномерному.
Введение
Во второй главе данный подход к оценке близости к равномерному распределению используется для изучения представляющего определенный практический интерес случая гауссовского распределения случайного вектора в R". При этом в качестве управляемого параметра, влияющего на степень этой близости, выбран положительный масшабный множитель п, на который умножается гауссовский вектор.
Изучение этого случая методом, использующим приведенные в первой главе обоснования, было начато А.А.Куликовой и Ю.В.Прохоровым в работе Куликова А. А., Прохоров Ю. В. Распределение дробных долей случайных векторов: гауссовский случай. I. — Теория вероятн. и ее примен., 2003, т. 48, в. 2, с. 399-402, где рассматривались случаи s = 4,s = 8,s = 12 и излагались некоторые соображения по поводу случая произвольного s Є N. Представленные в данной главе исследования позволили несколько уточнить результат для случая s = 8 и разработать подход, позволивший перейти к случаю s — 16.
В основе рассмотрений всех перечисленных выше случаев лежит следующая оценка величины Д, проистекающая из приведенного выше теоретико-вероятностного варианта формулы суммирования Пуассона. В изучении гауссовского случая она играет главную роль.
Утверждение. Пусть Z^ — гауссовский случайный вектор в пространстве R" с нулевым средним и невырожденной ковариационной матрицей Е, А > 0 есть минимальное собственное значение матрицы Е.
Отклонение
Д= sup |p(x(e);{77Z(e)>) —1| плотности распределения вектора дробных частей {r]Z^} случайного вектора nZ(a) от плотности равномерного распределения в кубе [0, 1]* допускает оценку сверху оо оо
ЛГ=1т(0:|т(0|*=ЛГ N=1 где q = е-2*2''2*.
В правую часть этой оценки вошла величина ra(N), равная числу слагаемых во внутренней сумме предшествующей двойной суммы. Эта величина равна числу целых точек на сфере Ss{^/N) в R" (точек с целочисленными координатами, лежащими на поверхности сферы Sa(VN) в К" с центром в нуле и
Введение радиуса VW, т.е. таких т^ = (ті,гп2,...,та), что все m.j — целые числа и т\ + т\ + ... + т\ = N).
В теории чисел эта функция, весьма непросто выражающаяся через более элементарные функции типа суммы степеней делителей натуральных чисел, давно является предметом глубоких и утонченных исследований (следуя Г. Хар-ди (G. Н. Hardy), упомянем здесь имена Якоби, Успенского, Лиувилля, Эйзенштейна, Смита, Минковского, Рамануджана и Морделла; мы упомянем здесь также Вальфиша и Ломадзе). Автор не располагает какими-либо свидетельствами о прогрессе в области получения «точных» формул для этой величины при s свыше 32.
В нашей работе оценки именно этой функции сыграли основную роль при получении оценок близости распределения вектора дробных частей многомерного гауссовского вектора к равномерному в кубе [0, 1]а распределению.
Приведем здесь оценку для величины r3(N) при 5 = 8.
Утверждение. При любом натуральном N выполняются неравенства
14iV3^r8(JV)<16C(3)JV3, причем константы, входящие в них, неулучшаемы (т. е., каково бы ни было положительное є, в левом неравенстве 14 нельзя заменить на 14 +є, а в правом неравенстве 16 С(3) нельзя заменить на 16 С (3) - е); (3) = SjtLi ^-3 = 1,2020569031595942854... есть значение в точке и = 3 дзета-функции ((и) Римана.
Эта оценка приводит с следующему уточнению известного ранее результата для размерности 5 = 8.
Теорема 1. Пусть Z(8j — гауссовский случайный вектор в пространстве R8 с нулевым средним и невырожденной ковариационной матрицей Е, А > 0 есть минимальное собственное значение матрицы .
Отклонение
Д= sup |p(x(8);{77Z(8)})-l| х(в)Є[0,11« плотности распределения вектора дробных частей {t}Z^} случайного вектора 7/Z/8) от плотности равномерного распределения в кубе [0, I]8 допускает оценку сверху jv ^ 16((3)(1 + 4<7 + <72)„ „_„-2,tVa
Д<Е^)^< f -J g' ГДЄ q N=1 ^ q}
Введение
Из приведенной выше оценки для величины r3(N) при s = 8 выводится следующая оценка для величины rs(N) при s = 16.
Утверждение. При любом натуральном N для числа rie(N) точек тгщ = (ті,тп2,...,пгіб) с целочисленными компонентами ти Є Z,i/ = 1,2,...,16, лежащих на шестнадцатимерной сфере Su(VN) = {х(16) Є R16: х\ + х\ + ... + x216 = N}, где N Є Z, т.е. Лі.? числа решений уравнения х\ + х| + " + xi6 = N в целых числах, выполняются неравенства l|iV7 + 3l4^3~4|iV 5 15 3 ^r16(iV) <і||с2(з)лг7 + 32С(з) (l + ^ (3))^-6^(3)^, где (3) = Y^k=\ k~3 = !» 2020569031595942854... есть значение в точке и = 3 дзета-функции ((и) Римана.
Эта оценка позволяет получить следующий результат.
Теорема 2. Пусть Z(16j — гауссовский случайный вектор в пространстве R16 с нулевым средним и ковариационной матрицей , А — минимальное положительное собственное значение матрицы .
Отклонение Д = suPxne)e[o,i]ie |p(x(16j; {»7Z^i6j}) —1| плотности распределения вектора дробных частей {rjZt16\} случайного вектора п2^щ от плотности равномерного распределения в кубе [0, I]16 допускает оценку сверху
А < (1_48(32g + 3840g2 + 38112g3 + 77312g4 + 38112g5 + 3840g2 + 32g7) +^-aC_^8 (256 g +3840 g2 +46848 g3 +91648 g4 + 46848 q5 + 3840 q2 + 256 q7), zdeq = e-2*2r>2x.
Завершая обзор результатов второй главы, отметим, что при доказательстве теоремы 2 потребовалось разработать способ вычисления сумм рядов вида 5^=1 Nn qN для натуральных п > 4. Получена следующая формула.
Введение
Утверждение. При любом q, удовлетворяющем условию \q\ < 1, и любом натуральном п N=0 V Ч> 7=0 №Y-
Третья глава посвящена, в основном, изучению свойств проекций распределения, равномерного на сфере в многомерном евклидовом пространстве К3. Первоначально чисто вероятностный интерес к этой теме возник, насколько известно автору, в начале XX столетия в связи с развитием кинетической теории газа. Приведем характерное для этой проблематики утверждение.
Пусть X(s) = (Х\,Х2,.. .,Х3) — случайный вектор, имеющий равномерное распределение на сфере S,(r) = {xw: х\ + х\ + + х\ = г2}.
Тогда при фиксированном к и s —> оо распределение вектора X(fc) = (Xl,X2,...,Xk) «неограниченно сближается» с распределением вектора где Z\,Z2,.-.,Zk — независимые и нормальные с параметрами (0,1) случайные величины.
История этого утверждения, связанная с именами А.Пуанкаре, Э.Бореля, Дж. Максвелла, П. Леви и других, изложена в разделе б статьи Диакониса и Фридмана (Diaconis P., Freedman D.A. A dozen de Finetty-style results: in search a theory. — Ann. Inst. H. Poincare, 1987, v. 23, p. 397-423), в которой авторы установили, как они пишут, «a reasonably sharp bound» для расстояния по вариации рь (см. лемму 6 или формулу (45) ниже) между распределением Х\,...,Xk и распределением Zi,...,Zk, где, как прежде, Z\,...,Z^ — независимые нормальные (0,1) случайные величины.
Эта оценка сверху имеет вид
Введение
Оценка выводится из оценки для четных к, имеющей вид
Далее, авторы утверждают: «Порядок k/s является правильным, хотя, возможно, сомножитель [От авт.: в данной записи — единица] перед дробью может быть уменьшен».
Попытки применения этого и других результатов, накопленных в этой области, для изучения главного объекта нашего исследования в многомерном случае — распределения векторов дробных частей случайных векторов — натолкнулись на необходимость подвергнуть детальному анализу доказательства этих результатов. Это, с одной стороны, позволило «восстановить» выкладки, весьма отрывочно представленные в опубликованных доказательствах наиболее сильных результатов, а, с другой стороны, дало возможность существенно уточнить и развить сами результаты. По ходу изложения будет приведена развернутая сводка необходимых для дальнейших рассмотрений сведений, связанных с классическими понятиями «расстояние по вариации» между распределениями и «сходимость по вариации» применительно к многомерному случаю.
Доказаны следующие теоремы.
Теорема 3. При четном к (к = 2/), к ^ s - 4, к/s ^ \, s"^ 8 величина р^ (см. (11) и (12) удовлетворяет неравенству /^ і * 0,085.
Теорема 4. При s ^ 12 расстояние по вариации между случайными величинами y/sX\ и Z\ не меньше
Полученные оценки снизу для расстояния по вариации позволяют придать более определенный смысл утверждению Диакониса и Фридмана о «правильности» порядка скорости сходимости упомянутых распределений.
В третьей главе доказан также результат, подтвердивший предположение Диакониса и Фридмана о том, что сомножитель в их оценке расстояния по вариации может быть уменьшен. Действительно, он может быть уменьшен более, чем в два раза.
Текст снабжен таблицами точных значений числа целых точек на сфере в шестнадцатимерном пространстве с центром в нуле и с радиусом VW
Введение при N = 1,2,...,200. Эти таблицы были любезно предоставлены к.ф.-м.н. А. А. Куликовой.
Все основные результаты диссертации (теоремы 1-4) являются новыми.
Непосредственно по теме диссертации опубликовано 4 печатных работы и тезисы доклада. Результаты двух первых глав докладывались на научных семинарах в Московском государственном университете им. М.В.Ломоносова и в Математическом институте им. В. А.Стеклова РАН. Ряд технических приемов, использованных во второй главе, был представлен на VIII Международной Вильнюсской конференции по теории вероятностей и математической статистике (2002 г.) и на Шестом Всемирном конгрессе Общества им. Бернулли (Барселона, 2004 г.). Основные результаты третьей главы диссертации докладывались и обсуждались на VI Всероссийском симпозиуме по прикладной и промышленной математике (Санкт-Петербург, 2005 г.).
Автор считает своим приятным долгом поблагодарить академика Ю. В. Прохорова и профессора В. Ф. Колчина, под руководством которых поэтапно выполнялась эта работа, и выразить им свою искреннюю признательность.
Список основных обозначений
Ниже будут использоваться следующие обозначения: N есть множество всех натуральных чисел; Z есть множество всех целых чисел; Rs есть з-мерное евклидово пространство; \Х(„)\ = y/xl+x]-\ Yx\ есть норма вектора х^ = (хг,Х2,. . .,are)eRs; (t(s)>x(s)) = hxi + hx2 + Н tsxs есть скалярное произведение векторов *(я) = (*ь<2,><») Є R3 и x(s) = (xi,x2,...,xs) є Rs;
Ва(т) = {x(8j: |Х(8)| < г} есть шар в Ra радиуса г с центром в 0; Sa(r) = {x(8j: |Х(8)| = г} есть сфера в Rs радиуса г с центром в 0; {z} — дробная часть вещественного числа z; (z(s)} = ({^1))(^2)5.-4(^}) есть вектор дробных частей вектора Z(8) = (zi,z2,...,za) eRs; ip (t(sj; X(s)) — характеристическая функция случайного вектора X(s) є Rs; p(x(sj;X(e)) — соответствующая плотность распределения вероятностей (если она существует); ra(N) — число точек Ш(я) = (mi,m2,...,me) с целочисленными компонентами mv є Z, v = 1,2,... ,s, лежащих на многомерной сфере Ss(VN) = {x{s) eR3: x\ + xl + --- + xl = N}, где N Є N, т. е. число решений уравнения х\ + х\ -) \- х\ = N в целых числах;
Пв = 7r"/2/r(s/2 + 1) есть объем единичного шара в R*; иа = 27Гя/2/Г(а/2) есть площадь поверхности единичной сферы в R"; для х є R1 полагаем х+ = х при х > 0, х+ = 0 при а; < 0.
Равномерное распределение и примеры сходимости к равномерному распределению
В ходе развития целого ряда разделов математики, в том числе прикладных, заметное внимание уделялось вопросу о том, насколько равномерно (в том или ином смысле) заполняет исследуемую область значений совокупность данных, получаемая некоторым математическим (алгоритмическим) или статистическим способом. Так, например, в классическом анализе [29, отдел первый, гл. 4] и в теории чисел [60], [18] (см. также статью [46] и список литературы в ней) математически идеализируемая равномерность была формализована в понятиях регулярности и равномерного распределения последовательности чисел, s-равномерного распределения и вполне равномерного распределения последовательности векторов.
В теории вероятностей равномерное распределение возникло при распространении на непрерывный случай классических понятий «равновозможность исходов» и равновероятность. Они заняли в теории вероятностей и в ее приложениях особое место. Будучи в рамках теории вероятностей настолько наглядными и естественными «мало абстрактными» первичными понятиями, что их до сих пор однозначно подразумевают, используя образные выражения «случайный выбор» или «выбор наудачу», вне ее они зачастую представляются своего рода «идеалом», практической целью, ради достижения которой и общество в целом, и отдельные группы людей готовы затрачивать немалые усилия и ресурсы. Стремление «выравнивать шансы» замечается и в действиях игроков в азартные игры (тасование, перемешивание игральных костей), и в практике страховых и инвестиционных компаний (перераспределение риска, диверсификация портфеля), и в политической деятельности партий и групп государств (лозунг равенства, бабувизм, эгалитаризм), и во многих-многих других областях.
Сыграв едва ли не определяющую роль в становлении теории исчисления вероятностей, за более чем четырехвековую историю этой теории идея равновероятности, развиваясь, обогатила и ее саму, и ее многочисленные приложения как в науке, особенно в области приближенных вычислений, статистических выводов и дискретной математики (см., например, [13], [37]), так и в технике, где целые отрасли промышленности заняты разработкой и производством устройств, принципы действия которых должны обеспечивать получение как можно более равномерного, «однородного» конечного продукта, будь то выпадающие сочетания символов в игральных автоматах, лекарственные препараты, строительные смеси, сплавы или кодовые комбинации для средств защиты информации.
Равномерное распределение унаследовало от своего «дискретного» теоретико-вероятностного предшественника способность служить подходящим те оретическим идеалом качества получаемых на практике «равномерных рукотворных» продуктов, весьма востребованных в повседневной деятельности общества. Понятие равномерного распределения представляется настолько естественным непрерывным распространением понятия равновероятности, что, по-видимому, по этой причине это своего рода прото-распределение даже в рамках глубоко разработанных математических теорий было и остается «безымянным», не связанным напрямую с чьим-то отдельным именем.
В теории вероятностей (в том числе и в ее элементарной по А. Н. Колмогорову [16, с. 9] части) математически идеализируемая равновероятность формализована в таких давно употребляемых и устоявшихся понятиях, как равновоз-можность и связанный с ней принцип равновозможных случаев [54] (обсуждение см. в [20, с. 11-12], [42, с. 547-550]), равновероятность (равновозможность) [8, с. 24], равномерный закон [8, с. 135], прямоугольное распределение [19, с. 270, с. 407], равномерное распределение [39, с. 252, с. 298], [40, с. 35], [47, с. 171], равномерная мера [39, с. 424], распределение, равномерное на сфере [49, гл. IV], [59, с. 21]. Равномерное распределение появляется как предельное распределение в одних вероятностных задачах, и как точное — в других [30].
Задачи, которым посвящена следующая глава, примыкают к первому направлению; задача третьей главы примыкает ко второму направлению.
Неизбежным как с теоретической, так и с практической точек зрения оказывается вопрос о количественной оценке «качества» равномерности, достижимой или достигнутой при получении больших массивов данных. В промышленно-технических областях он решается посредством выработки и установления стандартов. В прикладных научных дисциплинах — применением рецептур техники статистических расчетов (типа [5], [35]).
В теории вероятностей такими оценками могут служить и служат оценки близости соответствующих случайных величин или их распределений. Как правило, эти оценки имеют вид оценок значений разного рода вероятностных метрик (расстояний). По-видимому, именно из-за большого разнообразия используемых в теории вероятностей метрик, а также (как правило, метризуе-мых) типов сходимости случайных величин и распределений (см. [3] и [12]) необходимости в систематической формализации приближенной равномерности не возникало, и здесь упомянем только понятие асимптотически равномерного распределения сумм последовательностей случайных величин [32, с 241]), потребовавшееся в связи с установлением условий справедливости локальных теорем для решетчатых распределений.
Список примеров с предельным равномерным распределением на сегодняшний день далеко не так богат, как, например, с предельными гауссовским или пуассоновским распределениями. В подавляющем большинстве случаев это примеры, в которых построение допредельных случайных величин включает в себя операцию взятия дробной части (приведение по модулю 1), например, суммы независимых случайных величин или суммы двух случайных величин с абсолютно непрерывным совместным распределением, одна из которых умножается на растущий масштабный множитель [30]. Упомянем здесь также классическую задачу Пуанкаре о рулетке [Феллер2, с. 79]. Предельным при этом оказывается одномерное равномерное распределение на отрезке [0, 1].
Этот список недавно пополнили примеры, рассмотренные в работах [23], [24], [26]. В перечисленных работах рассмотрен широкий класс параметрических семейств одновершинных абсолютно непрерывных распределений (односторонние устойчивые распределения, логарифмически нормальные распределения, гамма-распределения и прочие) случайных величин, распределения дробной части логарифма которых при стремлении параметров этих семейств к граничным значениям сходятся (в равномерной метрике) к равномерному на отрезке [0,1] распределению. Этот факт устанавливался на основе оценок максимумов плотностей этих распределений, справедливых для достаточно значимой области изменения параметров, включающей в себя окрестности граничных значений параметров. Для всей области изменения параметров такие оценки не годились; чтобы получить более точные и универсальные оценки близости к равномерному распределению, была использована применимая во всех рассмотренных случаях формула суммирования Пуассона (см., например, работу [50] и список литературы в ней). Весьма общая ситуация, в которой предельным также оказывается равномерное на отрезке [0,1] распределение, была рассмотрена в работе [22]. В ней установлены достаточные условия сходимости распределений случайных величин последовательности Х\,Хз,.. .,Хп,... со значениями в [0,1] к равномерному распределению, причем найденные условия обеспечивают скорость сходимости, равную положительной степени дроби 1/п.
Применение формулы суммирования Пуассона в задаче оценки близости к многомерному равномерному распределению
Эта глава посвящена, в основном, изучению свойств проекций распределения, равномерного на сфере в многомерном евклидовом пространстве R". Первоначально чисто вероятностный интерес к этой теме возник, насколько известно автору, в начале XX столетия в связи с развитием кинетической теории газа. Приведем характерное для этой проблематики утверждение.
Пусть X(s) = (Xi,X2,...,Xs) — случайный вектор, имеющий равномерное распределение на сфере Тогда при фиксированном к и s —юо распределение вектора «неограниченно сближается» с распределением вектора независимые и нормальные с параметрами (0,1) случайные величины. История этого утверждения, связанная с именами А.Пуанкаре, Э.Бореля, Дж. Максвелла, П. Леви и других, изложена в разделе 6 статьи [51].
Попытки применения результатов, накопленных с той поры в этой области, для изучения главного объекта нашего исследования в многомерном случае — распределения векторов дробных частей случайных векторов — натолкнулись на необходимость подвергнуть детальному анализу доказательства этих результатов. Это, с одной стороны, позволило «восстановить» (в 3.1 и 3.3) выкладки, весьма отрывочно представленные в опубликованных доказательствах, а, с другой стороны, дало возможность существенно уточнить и развить сами результаты, чему посвящены 3.4 и 3.5. По ходу изложения, в 3.2, приведена развернутая сводка необходимых для дальнейших рассмотрений сведений, связанных с классическими понятиями расстояния по вариации между распределениями и сходимости по вариации применительно к многомерному случаю.
Проверим эту формулу (найденную Стамом при помощи геометрических соображений) методом характеристических функций. Для этого сначала найдем характеристическую функцию распределения, заданного плотностью (28), а именно, в которой п — размерность евклидова пространства, (a(n), X(n)) есть скалярное произведение векторов а(п), х(п) Є Rn, x(n)2 = (x(n), x(n)).
Заменяя выражением (28) для А-мерной плотности, приходим к интегралу типа (30), в котором п = к, Ь = 0, г = 1, т = (s - к-2)/2, /(и) = cos При этом подынтегральное выражение в правой части (30) принимает вид Распределение, равномерное на многомерной сфере и, учитывая нечетность функции sin х и четность функции cos х, получаем: Расстояние по вариации и, производя очевидные сокращения и полагая t +i = ... = ta = 0, снова приходим к (31).
Распределение в многомерном евклидовом пространстве, как и в одномерном, однозначно определяется своей характеристической функцией, и согласно теореме единственности (ср., например, [19, с. 118]), из совпадения характеристических функций следует совпадение распределений (и плотностей, если они существуют). Утверждение Стама и формула (28) проверены. Расстояние по вариации как мера близости распределений
В теории вероятностей систематическое использование понятия расстояния (метрики) полной вариации между распределениями, а также изучение вопросов сходимости по вариации начались в конце сороковых годов XX века. Причины, подтолкнувшие тогда специалистов по теории вероятностей обратиться к этому понятию, наиболее полно раскрыты А. Н. Колмогоровым в работе [15]. (Полагаем достаточно уместным отметить здесь, что даже самое беглое знакомство с содержанием статей последних лет в главных вероятностных журналах не дает оснований говорить о том, что эти причины утратили свою значимость, напротив, вполне очевиден тот факт, что они вовсе не исчерпали свою способность влиять на выбор предмета, способа и языка новых исследований.)
Так, А. Н. Колмогоров, оценивая в начале 50-х годов XX века тенденции развития теории вероятностей в области предельных теорем классического типа, к которым он относил результаты о предельном поведении сумм большого числа независимых или связанных в цепь Маркова слагаемых, отмечал, что, несмотря на бытовавшее в середине 40-х годов мнение о завершенности данной проблематики (подытоженной им совместно с Б. В.Гнеденко в [10]), с конца 40-х годов наблюдалось значительное оживление работы именно в этих классических направлениях. Размышляя над причинами такого оживления, он выделил, в частности, три обстоятельства. Прежде всего, «стало выясняться», что точность оценок остаточных членов, полученных в известных к тому времени предельных теоремах теории вероятностей, «с практической точки зрения ... далеко не достаточна». Далее, «некоторые задачи, поддававшиеся ранее решению лишь при сложных и весьма ограниченных условиях, неожиданно получили весьма простое и вполне законченное ... решение». Исчерпывающее решение было
Расстояние по вариации получено, например, в задаче ««локализации» предельных теорем для случая одинаково распределенных слагаемых» (имелась в виду работа [31]). Наконец, «сами постановки задач, благодаря введению надлежащих расстояний между распределениями и заимстованной из теории наилучших приближений идеи вычисления точных верхних границ остаточных членов, получили большую отточенность и прозрачность».
Почти все включенные в рассмотрение в [15] результаты формулируются на языке расстояния или сходимости по вариации. Расстоянием (по вариации) между распределениями Pi и 7 А. Н. Колмогоров называет величину (ср. [15, с. 30]) где верхняя грань берется по всем А, для которых вероятности считаются определенными.
В дальнейшем изложении понятие «расстояние по вариации» между вероятностными мерами (распределениями вероятностей), определенными на одном и том же измеримом пространстве ($7,.4), а также понятие «сходимость по вариации» будут использоваться нами именно в такой трактовке, но ради полноты изложения вкратце остановимся на других часто встречающихся определениях расстояния по вариации и укажем, как эти определения соотносятся между собой.
После определения, данного А. Н.Колмогоровым в [15], расстояние по вариации между распределениями (вероятностными мерами) Р и Q определяли также как (при таком определении расстояние по вариации равно удвоенному расстоянию р(Р, Q) по Колмогорову, см. (33)) или эквивалентным образом как где верхняя грань берется по классу всех таких Л-измеримых функций ф(и), что 1 ( )1 1; за расстоянием по вариации в такой трактовке укоренилось обозначение Р - Q\\ (см., например, [47, с. 385 и далее], а также работы [51], [58] и [3]), являющиеся тематическими предшественницами рассмотрений 3.3— 3.5 этой главы).
Оценка близости распределения вектора дробных частей гауссовских случайных векторов в R8 к равномерному в кубе [0,1]8
Во второй главе данный подход к оценке близости к равномерному распределению используется для изучения представляющего определенный практический интерес случая гауссовского распределения случайного вектора в R". При этом в качестве управляемого параметра, влияющего на степень этой близости, выбран положительный масшабный множитель п, на который умножается гауссовский вектор.
Изучение этого случая методом, использующим приведенные в первой главе обоснования, было начато А.А.Куликовой и Ю.В.Прохоровым в работе Куликова А. А., Прохоров Ю. В. Распределение дробных долей случайных векторов: гауссовский случай. I. — Теория вероятн. и ее примен., 2003, т. 48, в. 2, с. 399-402, где рассматривались случаи s = 4,s = 8,s = 12 и излагались некоторые соображения по поводу случая произвольного s Є N. Представленные в данной главе исследования позволили несколько уточнить результат для случая s = 8 и разработать подход, позволивший перейти к случаю s — 16.
В основе рассмотрений всех перечисленных выше случаев лежит следующая оценка величины Д, проистекающая из приведенного выше теоретико-вероятностного варианта формулы суммирования Пуассона. В изучении гауссовского случая она играет главную роль.
Утверждение. Пусть Z — гауссовский случайный вектор в пространстве R" с нулевым средним и невырожденной ковариационной матрицей Е, А 0 есть минимальное собственное значение матрицы Е.
Отклонение плотности распределения вектора дробных частей {r]Z } случайного вектора nZ(a) от плотности равномерного распределения в кубе [0, 1] допускает оценку сверху
В правую часть этой оценки вошла величина ra(N), равная числу слагаемых во внутренней сумме предшествующей двойной суммы. Эта величина равна числу целых точек на сфере Ss{ /N) в R" (точек с целочисленными координатами, лежащими на поверхности сферы Sa(VN) в К" с центром в нуле и
В теории чисел эта функция, весьма непросто выражающаяся через более элементарные функции типа суммы степеней делителей натуральных чисел, давно является предметом глубоких и утонченных исследований (следуя Г. Хар-ди (G. Н. Hardy), упомянем здесь имена Якоби, Успенского, Лиувилля, Эйзенштейна, Смита, Минковского, Рамануджана и Морделла; мы упомянем здесь также Вальфиша и Ломадзе). Автор не располагает какими-либо свидетельствами о прогрессе в области получения «точных» формул для этой величины при s свыше 32.
В нашей работе оценки именно этой функции сыграли основную роль при получении оценок близости распределения вектора дробных частей многомерного гауссовского вектора к равномерному в кубе [0, 1]а распределению.
Приведем здесь оценку для величины r3(N) при 5 = 8. Утверждение. При любом натуральном N выполняются неравенства причем константы, входящие в них, неулучшаемы (т. е., каково бы ни было положительное є, в левом неравенстве 14 нельзя заменить на 14 +є, а в правом неравенстве 16 С(3) нельзя заменить на 16 С (3) - е); (3) = SjtLi -3 = 1,2020569031595942854... есть значение в точке и = 3 дзета-функции ((и) Римана.
Эта оценка приводит с следующему уточнению известного ранее результата для размерности 5 = 8. Теорема 1. Пусть Z(8j — гауссовский случайный вектор в пространстве R8 с нулевым средним и невырожденной ковариационной матрицей Е, А 0 есть минимальное собственное значение матрицы .
Отклонение плотности распределения вектора дробных частей {T}Z } случайного вектора 7/Z/8) от плотности равномерного распределения в кубе [0, I]8 допускает оценку сверху Введение Из приведенной выше оценки для величины r3(N) при s = 8 выводится следующая оценка для величины rs(N) при s = 16.
Эта оценка позволяет получить следующий результат. Теорема 2. Пусть Z(16j — гауссовский случайный вектор в пространстве R16 с нулевым средним и ковариационной матрицей , А — минимальное положительное собственное значение матрицы .
Отклонение Д = suPxne)e[o,i]ie p(x(16j; {»7Z i6j}) —1 плотности распределения вектора дробных частей {rjZt16\} случайного вектора п2 щ от плотности равномерного распределения в кубе [0, I]16 допускает оценку сверху Завершая обзор результатов второй главы, отметим, что при доказательстве теоремы 2 потребовалось разработать способ вычисления сумм рядов вида 5 =1 Nn qN для натуральных п 4. Получена следующая формула.
Расстояние по вариации как мера близости распределений
В теории вероятностей равномерное распределение возникло при распространении на непрерывный случай классических понятий «равновозможность исходов» и равновероятность. Они заняли в теории вероятностей и в ее приложениях особое место. Будучи в рамках теории вероятностей настолько наглядными и естественными «мало абстрактными» первичными понятиями, что их до сих пор однозначно подразумевают, используя образные выражения «случайный выбор» или «выбор наудачу», вне ее они зачастую представляются своего рода «идеалом», практической целью, ради достижения которой и общество в целом, и отдельные группы людей готовы затрачивать немалые усилия и ресурсы. Стремление «выравнивать шансы» замечается и в действиях игроков в азартные игры (тасование, перемешивание игральных костей), и в практике страховых и инвестиционных компаний (перераспределение риска, диверсификация портфеля), и в политической деятельности партий и групп государств (лозунг равенства, бабувизм, эгалитаризм), и во многих-многих других областях.
Сыграв едва ли не определяющую роль в становлении теории исчисления вероятностей, за более чем четырехвековую историю этой теории идея равновероятности, развиваясь, обогатила и ее саму, и ее многочисленные приложения как в науке, особенно в области приближенных вычислений, статистических выводов и дискретной математики (см., например, [13], [37]), так и в технике, где целые отрасли промышленности заняты разработкой и производством устройств, принципы действия которых должны обеспечивать получение как можно более равномерного, «однородного» конечного продукта, будь то выпадающие сочетания символов в игральных автоматах, лекарственные препараты, строительные смеси, сплавы или кодовые комбинации для средств защиты информации.
Равномерное распределение унаследовало от своего «дискретного» теоретико-вероятностного предшественника способность служить подходящим те оретическим идеалом качества получаемых на практике «равномерных рукотворных» продуктов, весьма востребованных в повседневной деятельности общества. Понятие равномерного распределения представляется настолько естественным непрерывным распространением понятия равновероятности, что, по-видимому, по этой причине это своего рода прото-распределение даже в рамках глубоко разработанных математических теорий было и остается «безымянным», не связанным напрямую с чьим-то отдельным именем.
В теории вероятностей (в том числе и в ее элементарной по А. Н. Колмогорову [16, с. 9] части) математически идеализируемая равновероятность формализована в таких давно употребляемых и устоявшихся понятиях, как равновоз-можность и связанный с ней принцип равновозможных случаев [54] (обсуждение см. в [20, с. 11-12], [42, с. 547-550]), равновероятность (равновозможность) [8, с. 24], равномерный закон [8, с. 135], прямоугольное распределение [19, с. 270, с. 407], равномерное распределение [39, с. 252, с. 298], [40, с. 35], [47, с. 171], равномерная мера [39, с. 424], распределение, равномерное на сфере [49, гл. IV], [59, с. 21]. Равномерное распределение появляется как предельное распределение в одних вероятностных задачах, и как точное — в других [30].
Задачи, которым посвящена следующая глава, примыкают к первому направлению; задача третьей главы примыкает ко второму направлению.
Неизбежным как с теоретической, так и с практической точек зрения оказывается вопрос о количественной оценке «качества» равномерности, достижимой или достигнутой при получении больших массивов данных. В промышленно-технических областях он решается посредством выработки и установления стандартов. В прикладных научных дисциплинах — применением рецептур техники статистических расчетов (типа [5], [35]).
В теории вероятностей такими оценками могут служить и служат оценки близости соответствующих случайных величин или их распределений. Как правило, эти оценки имеют вид оценок значений разного рода вероятностных метрик (расстояний). По-видимому, именно из-за большого разнообразия используемых в теории вероятностей метрик, а также (как правило, метризуе-мых) типов сходимости случайных величин и распределений (см. [3] и [12]) необходимости в систематической формализации приближенной равномерности не возникало, и здесь упомянем только понятие асимптотически равномерного распределения сумм последовательностей случайных величин [32, с 241]), потребовавшееся в связи с установлением условий справедливости локальных теорем для решетчатых распределений.
Список примеров с предельным равномерным распределением на сегодняшний день далеко не так богат, как, например, с предельными гауссовским или пуассоновским распределениями. В подавляющем большинстве случаев это примеры, в которых построение допредельных случайных величин включает в себя операцию взятия дробной части (приведение по модулю 1), например, суммы независимых случайных величин или суммы двух случайных величин с абсолютно непрерывным совместным распределением, одна из которых умножается на растущий масштабный множитель [30]. Упомянем здесь также классическую задачу Пуанкаре о рулетке [Феллер2, с. 79]. Предельным при этом оказывается одномерное равномерное распределение на отрезке [0, 1].
Этот список недавно пополнили примеры, рассмотренные в работах [23], [24], [26]. В перечисленных работах рассмотрен широкий класс параметрических семейств одновершинных абсолютно непрерывных распределений (односторонние устойчивые распределения, логарифмически нормальные распределения, гамма-распределения и прочие) случайных величин, распределения дробной части логарифма которых при стремлении параметров этих семейств к граничным значениям сходятся (в равномерной метрике) к равномерному на отрезке [0,1] распределению. Этот факт устанавливался на основе оценок максимумов плотностей этих распределений, справедливых для достаточно значимой области изменения параметров, включающей в себя окрестности граничных значений параметров. Для всей области изменения параметров такие оценки не годились; чтобы получить более точные и универсальные оценки близости к равномерному распределению, была использована применимая во всех рассмотренных случаях формула суммирования Пуассона (см., например, работу [50] и список литературы в ней). Весьма общая ситуация, в которой предельным также оказывается равномерное на отрезке [0,1] распределение, была рассмотрена в работе [22]. В ней установлены достаточные условия сходимости распределений случайных величин последовательности Х\,Хз,.. .,Хп,... со значениями в [0,1] к равномерному распределению, причем найденные условия обеспечивают скорость сходимости, равную положительной степени дроби 1/п.
В многомерном случае, насколько известно автору, список примеров, в которых в качестве предельного выступает многомерное равномерное распределение, еще скромнее. Два таких примера, начало изучению которых положено в работах [25], [23], [27], детально описаны в следующей главе. Предельным в этих примерах служит распределение, равномерное в кубе [0, l]s, где s — размерность евклидова пространства R".