Содержание к диссертации
Введение
Глава I. Вопросы аппроксимациошого оценивания интегралов позначенням 12
1.1. Основные обозначения. Проблема увеличения точности алгоритмов метода Монте-Карло 12
1.2. Аппроксимационные оценки по методу наименьших взвешенных квадратов 17
1.3. Сравнение оценок. Допустимость 28
1.4. Специальные распределения узлов и неслучайные равномерные последовательности для оценок по методу наименьших взвешенных квадратов 31
1.5. О реализациях оценок по методу наименьших взвешенных квадратов 36
Глава 2. Оценивание функций и их моментов по значениям в случайных узлах на классах функций 47
2.1. О возможностях проекционного оценивания функций по её значениям 47
2.2. Оценивание по значениям в случайных узлах для функций с убывающей в L((^) ошибкой конечномерной аппроксимации 52
.3. Алгоритмы оценивания функций и их моментов на классах С.Л.Соболева 61
2.4. Оценивание по значениям в случайных узлах с неизвестным законом распределения 68
Глава 3. Оценивание по нашюдениям со случайными оишщш. эмпирическое оценивание ошибок вычислений 78
3.1. Об оценивании регрессии и планировании регрессионных экспериментов 78
3.2. Оценивание по рандомизированным наблюдениям для функций с убывающей в L2 ошибкой конечномерной аппроксимации 86
3.3. Алгоритмы оценивания по рандомизированным наблюдениям остатка разложения и ошибок вычислений ЙФ/лМх) 93
Глава 4. Статистическое моделирование прохождения сильноточного пучка электронов в нейтральном газе 101
4.1. Постановка задачи 101
4.2. Методика численного решения задачи с использованием алгоритма оценивания плотности распределения электронов по методу наименьших взвешенных квадратов 105
4.3. Результаты численных исследований. Выводы. III
Заключение 121
Литература 123
Содержание 131
- Аппроксимационные оценки по методу наименьших взвешенных квадратов
- Специальные распределения узлов и неслучайные равномерные последовательности для оценок по методу наименьших взвешенных квадратов
- Оценивание по значениям в случайных узлах для функций с убывающей в L((^) ошибкой конечномерной аппроксимации
- Оценивание по рандомизированным наблюдениям для функций с убывающей в L2 ошибкой конечномерной аппроксимации
Введение к работе
В настоящее время в связи с прогрессом вычислительной техники все более широко используется и получает новые применения в вычислительной математике метод Монте-Карло (метод статистических испытаний). Первостепенное значение этот метод имеет для задач теории переноса, а также для численного интегрирования,решения краевых задач и многих других вычислительных задач [ " ] • Большие успехи в разработке статистических алгоритмов решения таких задач были достигнуты советской научной школой, возглавляемой академиком Г.И.Марчуком.
Алгоритмы метода Монте-Карло предназначены для численного оценивания функции и её моментов (интегралов) по результатам Л/ наблюдений этой функции, полученным с некоторой вероятностной точностью при помощи моделирования случайных величин. Среди других способов метод Монте-Карло выделяется рядом преимуществ: возможностью его использования для широкого класса интегрируемых функций -f Lp, р 1 , определенных на сложных многомерных областях; возможностью апостериорного оценивания погрешностей вычислений и последовательного увеличения числа J\l значений функции; простотой алгоритмов решения задач,допускающих вероятностное описание. В отличие от математической статистики, где также рассматриваются задачи оценивания характеристик случайных функций, в методе Монте-Карло имеется возможность выбора закона распределения случайных величин для получения более точных оценок. Использование метода Монте-Карло для решения задач, описывающих реальные процессы,зачастую приводит к необходимости получения значений сложных, трудоемких функций. Это стимулирует разработку новых более точных алгоритмов оценивания,т.к. сходимость простейших монтекарловских оценок с ростом J/ медленная,а возможности современных ЭВМ позволяют использовать сложные алгоритмы обработки полученных значений функции.
Проблема увеличения точности оценивания интегралов f є ь2(м) по значениям f в Ji случайных узлах занимает центральное место в теории метода Монте-Карло . Известные способы уменьшения вероятностных ошибок основаны на использовании апри -орной информации об интегрируемой функции, которую может иметь вычислитель. Медленная сходимость таких алгоритмов, имеющая место для функций из ц2 (М » может быть существенно повышена на более узких функциональных классах. Так, для гладких функций показана возможность построения оптимальных по порядку сходимости к,Цг статистических алгоритмов, по вероятности BJV раз более точ ных, чем любой детерминированный способ интегрирования [в,9 . Значимость этого свойства возрастает с ростом размерности задачи, когда точность детерминированных способов интегрирования резко падает. Поэтому существует необходимость в удобных для реализации асимптотически оптимальных на классах функций алгоритмах интегрирования, учитывающих априорную информацию об интегрируемой функции и позволяющих контролировать точность вычислений.
Часто встречающейся в вычислительной математике является задача восстановления неизвестной функциональной зависимости по результатам её наблюдений в отдельных точках. Ситуация, когда эти точки представляют собой случайные величины, возникает при использовании методов статистического моделирования для решения целого ряда задач [1-5] • При этом бывает необходимо оценивать функцию не только в отдельных точках, а на поле её значений [iO-II Использование статистических алгоритмов позволяет получать по наблюдениям в случайных узлах состоятельные оценки всех f е L2(М) .
В диссертации рассматривается задача численного оценивания функции f (х) векторного аргумента из ЦСр4) и её моментов ГГ(х)іР(хШ(с1х) по J\l значениям этой функции, полученным в случайных узлах. При этом значения функции могут быть получены со случайными ошибками, а вероятностный закон распределения случайных узлов может быть неизвестен. Целью работы является построение новых алгоритмов решения поставленной задачи, эффективных для функций повышенной вычислительной сложности из L2( и позволяющих численно оценивать погрешность вычислений, исследование свойств и особенностей применения этих алгоритмов, их сравнение с известными способами оценивания на классах функций Ф с L2tyA) , а также использование этих алгоритмов для решения задачи численного моделирования прохождения сильноточного пучка релятивистских электронов через нейтральный газ. Для функций -feL C проводится сравнение с известными способами вероятностных ошибок оценивания интегралов, выделение допустимых на L,(U) и эффективных оценок. Для функций -р с известным порядком убывания с ростом W ошибок их линейных ПО -мерных аппроксимаций исследуются порядки вероятных погрешностей оценивания при Д/- °о э в частности, на классах гладких функций ІІ2-І4І . В зависимости от точности линейной аппроксимации исследуемой функции определяется, какой из рассматриваемых способов обеспечивает лучший порядок вероятных погрешностей оценивания функции и её моментов.
Увеличение точности построенных в работе аппроксимационных алгоритмов по сравнению со стандартными алгоритмами Монте-Карло зависит от точности аппроксимации функции -р линейным разложением, которая ухудшается с ростом размерности задачи. Поэтому применение новых алгоритмов для функций большой размерности может оказаться неэффективным. Эти алгоритмы предназначаются для функций векторного аргумента повышенной вычислительной сложности, получение значений которых настолько трудоёмко, что увеличение затрат на реализацию по сравнению со стандартным алгоритмом Монте-Карло оправдывается сокращением числа Л значений функции, которое необходимо для обеспечения заданной точности оценивания. Применение новых алгоритмов не всегда целесообразно, однако есть задачи, которые традиционными методами решить не удается.
Одна такая задача возникает при численном моделировании динамики сильноточного пучка релятивистских электронов, транспортируемого в газе. Построенные в работе алгоритмы используются для расчета плотности распределения частиц по результатам статистического моделирования движения JV электронов пучка. В последнее время сильноточные электронные пучки получают широкое распространение для решения многих научных и технических проб -лем, таких как нагрев плазмы до термоядерных температур, возбуждение мощных электромагнитных колебаний СЕЧ диапазона и других [і5,Іб] . Процессы, имеющие место при прохождении сильно -точных пучков, описываются системами уравнений в частных производных и аналитические исследования большинства таких существенно нелинейных систем оказываются недостаточными. Полное экспериментальное исследование таких физических процессов представляет собой сложную техническую проблему. Поэтому во многих случаях наиболее рациональным методом исследования оказывается числен -ное моделирование _17—21] , хотя оно и требует значительных затрат ресурсов ЭВМ.
Научная новизна работы состоит в создании алгоритмов повышенной точности для оценивания функции -f(x)L2( ) векторного аргумента и моментов j"f фУМ(с/х) по наблюдениям этой функции в J\l случайных узлах, основанных на новом способе приближенного оце -нивания її\ коэффициентов разложения по заданной базисной системе. Способ требует обращения (КУ\хт)-матрицы, сходящейся при -V- - °° к единичной. Такое свойство матрицы позволяет получить явные выражения для ошибок оценивания, исследовать их на широком классе законов распределения узлов, а также использо -вать итерационные методы обращения, для которых получены условия и скорости СХОДИМОСТИ.
Построенные алгоритмы обобщают стандартный метод Монте-Карло и дают апостериорную оценку вероятной погрешности. Ошибка новых алгоритмов определяется остатком разложения -f(x) , они допустимы на L2(jjO по сравнению с известными способами интегрирования и эффективны для функций повышенной сложности.
Получены процедуры проекционного оценивания функций -р€ь. (М состоятельные на широком классе известных и неизвестных вычислителю вероятностных законов распределения узлов. Проведено сравнение порядков точности рассматриваемых оценок функций и их моментов на классах фь2( . Новые алгоритмы дают с точностью до логарифмического множителя оптимальные порядки вероятных погрешностей для функций классов С.Л.Соболева V2 .
Алгоритмы сохраняют свойства состоятельности, допустимости, эффективности и асимптотической оптимальности на V2 при наличии случайных ошибок наблюдений. Для некоторых задач оценивания параметрически заданных функций построены оптимальные непрерывные планы распределения узлов наблюдений.
С использованием построенных алгоритмов реализована методика статистического моделирования на основе новой самосогласованной физической модели процесса прохождения пучка электронов (с током 10 -100 кА и энергией 1 МэВ) в нейтральном газе (давлением I—100 торр). Результаты расчетов позволили объяснить процессы формирования плазменного канала и динамики пучка в зависимости от плотности тока и давления газа.
Практическая ценность работы определяется большим числом вычислительных задач восстановления функциональной зависимости и расчета интегралов, для которых рекомендуются новые алгоритмы. Шеется возможность численной адаптации алгоритмов к конкретной оцениваемой функции и контроля точности расчетов. Развитая методика численного моделирования может быть использована и используется при расчетах движения сильноточных пучков заряженных частиц под действием собственных и внешних электромагнитных полей в вакуумных и плазменных системах. Диссертация состоит из введения, четырех глав и заключения.
В первой главе излагается новый способ аппроксимационного оценивания интегралов -рфм(оіх) по Л значениям -рф с Ь2С , полученным в случайных узлах, закон распределения которых известен вычислителю и может быть выбран из широкого класса вероят -ностных законов распределения. Способ основан на вычислении по методу наименьших взвешенных квадратов коэффициентов разложения •f(x) по некоторой /U -ортонормированной системе функций Фі(х), L-i —,ftl . Получены выражения для вероятностной ошибки оценки интегралов (с точностью до членов малого порядка по Jl ) и закон распределения, минимизирующий главную часть ошибки данного интеграла. Проводится сравнение с известными статистическими способами интегрирования, выделение допустимых (см.например, \2Zj ) для функций из L2Cj№) и эффективных (см. [її] )оценок. Рассматриваются возможности применения в качестве узлов новой оценки расслоенной выборки (см. [3,5,б] ), специальных вырожденных распределений ( [з] , глава 4) и неслучайных равномерных последовательностей _23,6j . Исследуются вероятностные условия и скорости сходимости приближенных итерационных способов вычисления аппроксимационной оценки. Некоторые полученные результаты проиллюстрированы расчетами тестовых интегралов.
Во второй главе исследуется статистическая корректность в норме L2M (см. [24,5J ) задачи оценивания функции-f(X) по JJ её значениям в случайных узлах. Проводится сравнение порядков точности трех способов оценивания функции и её моментов, использующих стандартные монтекарловские оценки, интерполяционно-квадратурные формулы С.М.Ермакова - В.Г.Золотухина [26,27,з] и оценки, приведенные в первой главе. Кроме того, при неизвестном вероятностном законе распределения узлов используется проекционная оценка плотности распределения р(Х) , предложенная Н.Н.Чен-цовым [28,29] . Для таких оценок функции и её моментов порядки убывания с ростом Jv вероятных погрешностей исследуются в предположении, что известны порядки убывания остатков разложения неизвестных f и р по некоторой системе базисных функций. В зависимости от точности конечномерной аппроксимации функции -Р и плотности распределения узлов р определяется, какие из рассматриваемых способов дают лучшие порядки точности оценивания.
В третьей главе сформулированная выше задача оценивания рассматривается при наличии случайных ошибок в полученных наблюдениях функции. Обосновывается применение изложенных в первой главе оценок интегралов для -pCL ) , а также для функций -f , известных с точностью до конечного числа параметров. Для некоторых классов задач оценивания строятся оптимальные непрерывные планы распределения узлов наблюдений (см. [30,3lJ ). Получены сходящиеся по вероятности при Л- -оо процедуры оценивания всех -рІ2(м) по Jv наблюдениям со случайными ошибками на широком классе известных и неизвестных вероятностных законов распределения узлов. Проводится сравнение порядков вероятных погрешностей рассматриваемых способов оценивания на классах функций -р(х) и плотностей распределения р(Х) случайных узлов. Здесь же предлагаются алгоритмы получения приближенных значений ошибок оценивания по методу наименьших взвешенных квадратов. Они позволяют при доста -точно большомvA/ контролировать точность расчетов и численно подбирать для конкретной функции -f€L ((U) базисную систему.
В четвертой главе предложена новая методика численного моделирования процесса транспортировки сильноточного пучка релятивистских электронов в нейтральном газе. Приведена система уравнений, описывающая такой процесс и схема ее расчета с использованием разностных аппроксимаций [32] . Полученные в работе ап-проксимационные алгоритмы оценивания используются для расчета плотностей распределения электронов пучка по результатам статистического моделирования траекторий движения JV частиц. Исследуются порядки сходимости с ростом М таких оценок для функций плотности распределения и законов движения частиц, принадлежащих классам С.Л.Соболева. Параметры пучка и газа в задаче таковы,что движение частиц может быть описано гладкими, хорошо аппроксимируемыми законами, что позволяет получать достаточно точные проекционные оценки плотностей уже при сравнительно небольшом Л . Приводятся результаты расчетов и проводится их сравнение с имеющимися экспериментальными данными 133,34] .
В заключении даны краткие рекомендации по применению рассмотренных в работе алгоритмов.
Основные результаты, представленные в диссертации, опубликованы в работах [35-47] , доложены и обсуждены на У и УІ Всесоюзных совещаниях "Методы Монте-Карло в вычислительной математике и математической физике" (Новосибирск, 1976, 1979); на симпозиуме и конференции "Вероятностные методы и средства" (Москва, 1978, Новгород, 1983); на УІ Всесоюзном совещании по ускорителям заряженных частиц (Дубна, 1978); на Всесоюзном совещании "Применение случайного поиска" (Кемерово, 1979); на конференциях по физике плазмы (Звенигород, 1980, 1984); на Всесоюзном семинаре "Вычислительные методы математической статистики" (Москва, МІУ, 1980); на УП Всесоюзном семинаре по линейным ускорителям (Харьков,1981); на УП Региональной конференции по математике и механике ( Томск, 1981); на У Всесоюзном симпозиуме по сильноточной электронике (Томск, 1984); на научных семинарах в ГОШ ЯФ при ТЛИ, ВЦ СО АН СССР, ИПМ им. М.В.Келдыша АН СССР. На защиту выносятся следующие основные результаты, полученные в диссертации:
Предложен новый способ вычисления Yfl коэффициентов разложения функции fOO L fyO по J\l значениям этой функции (г) на широком классе законов распределения узлов х{ j = 1,---,Л/ . Способ требует обращения (Wх W )-матрицы, сходящейся при Jv - °° к единичной, что позволяет применять итерационные методы обращения, его ошибка определяется остатком разложения.
Построены алгоритмы повышенной точности для оценивания V-f о(д( допустимые на La(M) по сравнению с известными способами и эффективные для функций, получение значений которых требует значительных затрат.
Получены состоятельные процедуры проекционного оценивания •f€ L/jJi) по наблюдениям функции со случайными ошибками на широком классе известных и неизвестных законов распределения узлов xJ . При этом выделены способы с наиболее точными порядками вероятных ошибок оценивания функции и её моментов в зависимости от точности разложения функции. Новые алгоритмы дают с точностью до логарифмического множителя оптимальные порядки вероятных ошибок для функций классов С.Л.Соболева.
Предложены способы численного контроля вероятных погрешностей новых алгоритмов, что позволяет подбирать достаточно точные разложения исследуемой функции, последовательно увеличивая fl\ и
Реализована новая методика численного моделирования процесса прохозкдения сильноточного пучка релятивистских электронов в нейтральном газе. Это позволило за приемлемые времена работы БЭСМ-6 исследовать процесс формирования плазменного канала и влияние токовой нейтрализации на динамику пучка, объяснить экспериментально наблюдаемые потери части тока пучка.
Аппроксимационные оценки по методу наименьших взвешенных квадратов
Строгое равенство квадрата вероятностной ошибки оценки С (т, ) главному члену в правой части (1.2.II) (т.е. равенство с точностью до малых по порядку JV членов) выполняется для По условию (I.2.I) функции ФіМ (И - ограничены при М абсолютно непрерывной относительно А . Поэтому в этом случае с вероятностью единица ограничены некоторой постоянной К± 2 все исходы случайной величины Cj,(wi, j и Рассмотрим регулярные на # системы функций ф.(х), 1 = 4,--, 1 относительно меры [з] . Для такой системы мера Мт МНО ГОГО жества точек Ы , при которых определитель равна нулю. Если система функций регулярна, то матрица Л Вії npHJV IT) неособенная с вероятностью единица, так как (mod М) (сІМ %JAs)(Qns) = 0. К регулярным относительно меры Лебега на некоторой области П -мерного евклидова пространства относятся системы алгебраических и тригонометрических многочленов [з] , а к нерегулярным - кусочно-постоянные функции, функции Хаара [23J , сплайн-функции. Следствие I.I. Для регулярной системы функций ф«(х), = 1,-..,1Ппри«л 1П распределение независимых случайных узлов х J = -v-- V по закону обеспечивает несмещенность оценки (1.2.4) JWCOffl -C. Доказательство. В силу М -ортонормированности ]2іф1М(сІх) = П1. Если конечная матрица невырождена, то найдется такое о 0 , что . При этом представима в виде ряда по степеням . Раскладывая произведения сумм на час- тичные суммы и учитывая, что при распределении (1.2.12) и кв1,2,- получим (А ВЛ) Лт& Й, в виде произведения двух независимых величин В силу конечности последнего выражения и (1.2.16) получаем с выделением главной части по тем же значениям функции f(xJ),по которым получена оценка С(тД) (1.2.4). Такая оценка имеет вид 1.2.15) а отсюда с учетом (1.2.9) следует утверждение теоремы 1.2 как Выражение (1.2.14) справедливо и в случае ф =ф. [=1-..,171,так yz(м)\рм(dx)=0 (сравните с (1.2.5).При независимом распре - деления случайных узлов оценки (1.2.4), (1.2.13), как и стандарт ная монтекарловская оценка (1.2.3), имеют лучший порядок вероят ностной ошибки, равный JV , для , так как (1.2.11 (1.2.15) 1.2.3. Получен явный вид вероятностной ошибки (1.2.14) оценки С гоД) . Это позволяет выписать для конкретной -fOO закон распределения случайных узлов, минимизирующий главную часть ошибки, подобно тому, как для стандартной монтекарловской оценки (1.2.3) минимум дисперсии достигается с помощью метода существенной выборки [_3,5,б .
Следствие 1.2. В условиях теоремы 1.2 независимое распределение случайных узлов по закону обеспечивает минимум главной части вероятностной ошибки оценки C-b(m$, 1 = 1,-, ,1 . При этом с вероятностью { =1-()( -2) Доказательство. Рассмотрим главную часть (без малого члена порядка выражения (1.2.15). Обозначим её Ав(Х) . Минимум этого функционала для распределений с заданным числом зависимых случайных узлов П5 , S = l,—,К обеспечивает вероятностная Это следует из вариационного решения задачи минимизации J\t(ft) по Л при условии Ji$(clQ )=! При этом ,Здесь использовано неравенство Минковского. Утверждение следствия получим, сравнив последнее выражение с (1.2.18). Известно, что использование расслоённой выборки [57, 3,б] для стандартной монтекарловской оценки позволяет уменьшить её дисперсию для всех Lz(ti) . Подобный эффект имеет место и для аппроксимационной оценки (1.2.4), (1.2.13). Пусть на % , по которому производится интегрирование,задана вероятностная мера И(с1х). Пространство К представим в виде суммы х непересекающихся подпространств р, p = i,---,t .В каждом р распределим по Лр случайных узлов х\ j = 1,- в соответствии с вероятностной мерой A(dx) . Тогда для заданной системы базисных функций аппроксимационная оценка с расслоенным распределением узлов имеет вид Поскольку ZI ($р) = 1 , отсюда следует эффект расслоенной вы-P=i г борки. А именно: главная часть последнего выражения не меньше главной части (1.2.19) для любой fW La(w). При наличии некоторой априорной информации об оцениваемом интеграле можно распорядиться выбором Jvp так, чтобы главная часть вероятностной ошибки оценки СЕ(гоДр) была минимальна (см. 1_57). Если разделить = +и )( так, чтобы ,г(т)у)фе(х) 0 при Х +, (т,х)фв(х) 0 при Х У" , и на W Т взять
Специальные распределения узлов и неслучайные равномерные последовательности для оценок по методу наименьших взвешенных квадратов
Рассмотрим возможность применения к аппроксимационным оценкам по методу наименьших взвешенных квадратов специальных зависимых распределений случайных узлов. Хотя использование зависимых узлов ухудшает сходимость ошибки интегрирования -f L2([ ) ,мож-но расширить класс функций -f , для которых обеспечивается точное значение интеграла -рЛ1(с1х) . Примерами такого рода могут служить метод антисимметричной выборки [58] и обобщающие его случайные квадратурные формулы с одним свободным узлом, изложенные в [з]. Пусть задана несмещенная квадратурная формула со специальным распределением узлов Q =(Х,---;Х ), х У, ±=і,--,а для вычисления интеграла j-p(x)M(dx) Пусть оценка (I.4.I) точна для функций -f є Ф cLAl) а Для остальных ЄІ2(М) её вероятностная ошибка зависит от f-fn » f ф -проекция f на 3 . Поэтому функцию риска для аН обозначим Применим квадратурную формулу со специальным распределением узлов (I.4.I) при аппроксимационном оценивании интегралов. Пусть значения функции -f получены в каждом из мы независимых групп узлов Q =(x ---,X ЯЦ"" » и РаспРеДеление узлов в группе обеспечивает свойства квадратурной формулы (I.4.I). Для системы (I.I.5), построенной по таким значениям функции -f , весовую диагональную матрицу Вф выберем так, чтобы А ВфЛ сходилась по вероятности к единичной матрице, а именно, ь-л = Ш ) » где номер j узла х 1 определен номерами q , "t . Решение по методу наименьших квадратов системы Л Вф С=і\Ь Р имеет вид а оценка интеграла Се=д-р(х)ФеМ/ х » определяемого с помощью m /ч выделения главной части f(x) IE 60 , фг(х), имеет вид Отсюда и (1.4.9) следует утверждение теоремы (1.4.5) для оценок (1.4.3) при 1 = 1/--,)41. Используем последнее соотношение для получения вероятностной ошибки оценки (1.4.3) интеграла jf(x)4Ux) l(dx) для функций не входящих в систему базисных функций. Доказательство в этом случае аналогично доказательству теоремы 1.2. Получаем Сравним полученные результаты со стандартной оценкой интеграла Ce-j-ftPe/Ufdx) , полученной на основе той же квадратурной формулы (I.4.I) и точной для -Рфр Ф Оценка С (W, b) точна для -f Є Emc L2(M) , у которых (т}У)= 0 , если матрица ЛТВ неособенная, а для -рфеЄ Ф равна нулю главная часть её вероятностной ошибки.
Поэтому при вычислении ,J-p60 №) с помощью оценки (1.4.3) нужно выбирать квадратурную формулу 28 и систему функций Ф-Дх), I =!, № так, чтобы Ф и Ет не пересекались. Правда, не всегда бывает просто описать класс Оценки по методу наименьших взвешенных квадратов можно При вычислении оценки по методу наименьших взвешенных квадратов приходится получать и хранить псевдообратную к Л Вії матрицу, что может оказаться затруднительным уже при не слишком большом ІП . Сходимость jj J\ ВД с ростом Jj к единичной матрице позволяет упростить процедуру расчета оценки. При большом 171 значительные вычислительные преимущества могут быть получены, если вместо вычисления точного решения системы (I.I.5) использовать приближенные итерационные методы, сходящиеся к точному решению. Из таких методов рассмотрим: решение Н/1 по методу простой итерации с шагом с/ ; CI.O.I) и решение & М , использующее итерационный процесс получения обратной к J\TM матрицы Известно, (см.,например, [ЪЩ ), что итерационный процесс (I.5.I) и при %Q—ell. итерационный процесс (1.5.2) сходятся к решению С(w) по методу наименьших квадратов системы (I.I.5), если a(i\ 1У-1 1 . Определим условия выполнения этого неравенства.
Оценивание по значениям в случайных узлах для функций с убывающей в L((^) ошибкой конечномерной аппроксимации
Зададим функцию потерь в виде f(x)-Q( ,X) і , тогда функцией риска оценки (w;x) будет математическое ожидание функции потерь, и из неравенства -Чебышева I 5IJ Для функции риска в и СМ) ПО теореме Пифагора имеем (2.1.2) Можно оценивать интегралы С;, для любых -fCx Me L2(u) , если Xі, i = 4i- случайные узлы, распределенные в # так, чтобы в обозначениях п.1.1 выполнялось /И А, $ 2. .Для корректности задачи кроме требования убывания с ростом JJ веро-ятностных ошибок рандомизированных оценок Ci(J/) необходимо обеспечить такой закон возрастания Hfl = \) (JV) , чтобы их сумма сходилась к нулю. Систематическая часть функции риска (2.1.2) с ростом YY1 сходится к нулю, если для последовательности значений WI заданы подпространства m , все лучше аппроксимирующие -р(х) . Для функций из 1лг(М) такую последовательность подпространства задает любая полная система М -ортонормированных функций. Можно выделить такие классы функций (например, гладких) [I2-I4] , для которых известны порядки сходимости &ф\ї(иуОЛі(оІх) с ростом W .
В последнем случае важно выбрать такие оценки Ct(JV) и законы YY\=\)(J\/) , чтобы получить лучший порядок уклонения проекционных оценок на классе функций. Рассмотрим сначала проекционные оценки С т;х) = Х С-О)ф.(х), сконструированные на основе стандартных монтекарловских оценок (I.I.2) интегралов С; по значениям (х 1) в случайных узлах. Введем условие которое при (U абсолютно непрерывной относительно % выполняется для всех f ф. L fyO . Пусть С((у) - гладкая выпуклая неотрицательная функция, монотонно стремящаяся к нулю при U- оо . Тогда существует непрерывная монотонно возрастающая функция Г , обратная к ) , Говорят, что функция СО Cm) с ростом W убывает (или возрастает) как 5Г(т), (л)(т) х ЗГ(т) , если найдутся положительные числа Ь} В такие, что,начиная с некоторого m = rm0 l, Для быстро изменяющихся функций Ж(т) рассматривают еще убывание по типу ЖМ » с0(т) М 5Г(щ) , когда для положительных чи -сел С\УЛ Теорема 2.1. I. Задача оценивания -f(x) L2(]U) по её значениям в случайных узлах статистически корректна в норме и Ы) » если хотя бы для одной полной в L2(M) системы функций(PL(x)}i=lj, выполняется (2.1.3) и 2IHs = o(J/2) - 2. Если последовательность подпространств LmcL2(M) опреде ленных системами А -ортонормированных функций {ф1(х)?(=і;-« ,ІТ1} , которые удовлетворяют условию (2.1.3), задана так, что с ростом її\ J 2(WI,X)M(GU) порядка d2(m) , то при лучшем выборе Мх r(j\/2" ) уклонение по вероятности в норме 1л2(И) проекционной оценки (м,х) от -f(x) имеет с ростом Jl порядок и при .fis — o(j/ ) эта величина сходится к нулю с ростом Jl. ] 2(т,х)м(о1х) сходится при W- - к нулю как остаток сходящегося ряда, если в качестве базисных функций использовать любую полную в L2(M) систему.
Поэтому, можно подобрать такую зависимость \r\=)(Jl) , чтобы обе части функции риска (2.1.2) сходились к нулю с ростом J\/ . Отсюда и (2.I.I) следует первое утверждение теоремы. Если, кроме (2.1.4), известен закон убывания с ростом W систематической части функции риска, то лучшим законом YY\-HJJ) является тот, который обеспечивает равенство обеих частей функции риска (2.1.2). Второе утверждение теоремы получим, следуя рассуждениям работы Н.Н.Ченцова [29 j , 25, где оценка (I.I.2) применялась для получения проекционной оценки плотности распределения независимых случайных величин. Следствие 2.1. Пусть полная в L2(Vl) система М -ортонорми-рованных функций Ф-,(х), 1=1,2,.-. и Я(сКЗ ) заданы так, что для всех 1, S выполняется (2.1.3) и . Тогда для всех f (х) L2(H) , у которых при выборе W JV уклонение в норме L2(M) проекционной оценки 2:С &)(р.(х) от f (х) имеет по вероятности порядок Доказательство. По теореме Пифагора для С[ , удовлетворяющих (2.1.5), У (о(х)= . .г -От1"2 1 .Поэтому Щ1 убывает при и 1/2 и Г(«А0=Л/ 2 По теореме 2.1 для получения уклонения по вероятности оценки 0(їії,У) от f(x) порядка iV(M W Z =JV(2"W(l/№_i/a) нужно выбрать закон возрастания m P )=i )/(f Будем использовать для вычисления коэффициентов разло жения (интегралов Ci ) оценки, точные на конечномерных функцио нальных подпространствах EmcL2(iu) , заданных базисными систе мами функций Ф;,(х), 1 = 1,--ч W . При этом получаем проекционные оценки функции f(x), точные для -f uw Рассмотрим следующие вопросы, возникающие при оценивании по J\f значениям в случайных узлах функции и её коэффициентов разложения, когда имеется априорная информация о законе убывания ошибки конечномерной аппроксимации f
Оценивание по рандомизированным наблюдениям для функций с убывающей в L2 ошибкой конечномерной аппроксимации
Получение реальных наблюдений (V) = f (x )+6(xJ) функциональной зависимости -р(х) всегда связано с наличием ошибок , которые возникают из-за погрешности измерений в экспериментах, неточности расчётов и тому подобное. Поэтому все полученные выше результаты для оценок по наблюдениям в случайных узлах справедливы только, если (до тех пор, пока) влияние ошибок наблюдений мало. Будем рассматривать случай, когда ошибки наблюдений - случайные величины. Такая ситуация, в частности, имеет место, когда значения интересующей нас функциональной зависимости получаются методом статистического моделирования [4,5,65] , например, при оценивании в отдельных точках решения интегрального уравнения второго рода по схеме Улама-Неймана. Рассматриваемые задачи оценивания функций и их моментов в предположении известного с точностью до конечного числа параметров вида функциональной зависимости изучает классическая статистическая теория оценивания регрессии и планирования регрессионных экспериментов (ЗІ,66] . Наиболее развит случай линейной по неиз- т вестным параметрам зависимости, в наших обозначениях -f(x)=X.C .(x) Ъ ( 1 ) = О . Проблема состоит в выборе из некоторого множества оценок эффективной оценки параметров С и оптимального для этой оценки плана {х , j=1/-)- /} размещения наблюдений (экспериментов) с целью минимизации затрат на получение приближения к -f(x) с заданной точностью.
Такая ситуация на практике возникает, когда удается полностью рандомизировать влияние неучтенных в зависимости Необходимость исследования новых все более сложных явлений вынуждает выходить за рамки классического подхода, изучать новые постановки задачи оценивания по наблюдениям [30,67] . Особый интерес представляет задача оценивания линейной регрессии Вид эффективной оценки коэффициентов регрессии C зависит от неизвестного остатка (m,x). Поэтому для выбора оценки из достаточно широкого множества оценок для функций f(x) с априорно известным классом возможных (rfljX) приходится использовать минимаксные критерии эффективности. Случай оценивания по наблюдениям со случайными ошибками для функции -р(х) с известным порядком убывания ошибки её линейной аппроксимации рассматривается в п.3.2. Если же об оцениваемой функции известна лишь её принадлежность к достаточно широкому функциональному классу, например, L(M) » то возможность выбора оценки ограничена выделением допустимой оценки [3,22 . 3.1.2. Оцениваем коэффициенты разложения -f(x) Х У по заданной М -ортонормированной базисной системе ф.(х) І = І,—,ИІ определяющей EmcL (jU). Используем обозначения главы І. В некотором наборе узлов Х #,]=1;-уЛ/ получены наблюдения (х со ) функции f(x ) .со - случайные величины такие, что и б (х}\Л- М-интегрируема по обойм аргументам. Степень влияния статистической зависимости ошибок наблюдений определим параметром о (аналогично определению Ь ).
При j/- Здесь 2Є - число статистически взаимнонезависимых групп случай-ных величин С0 , У/ - число зависимых СО в Z-ой группе. Обозначим (JV JV) матрица ковариаций ошибок наблюдений с элементами б (х [х ). Для вектора неизвестных коэффициентов CL= if (Х ООмЫх) рассмотрим множество линейных по наблюдениям оценок (т.е. оценок вида ТИ » Т -(тх-Л0 матрица), которые при безошибочных наблюдениях точны для всех -f m (т.е. точны при Z = Г = Л С ). Для оценок из этого множества выполняется равенство ТЛ = I . Отметим, что к данному множеству оценок принадлежат и рассматриваемые в классической теории оптимального планирования регрессионных экспериментов так называемые наилучшие линейные несмещенные оценки [3I,22J. Ошибку оценки TZ вектора C=jf Q) (dx) будем измерять величи ной j[(cZ)(cZ)T] . Оценку С , которая для любого заданного выбора узлов Х х, = 1,---, удовлетворяет условию неотрицатель ной определенности матрицы для всех ТИ ЦуСЄЦ принято называть оценкой с равномерно минимальным риском среди Т Z LL [22J . При такой оценке достигается ми нимум риска JM[br(TZ C) оценивания величины jbTC среди всех Т Z Ц ; здесь f - произвольный заданный вектор размерности W . Имеет место утверждение, обобщающее на случай ( 1, )= 0 известную теорему Гаусса-Маркова о наилучших линейных несмещенных оценках и имеющее аналогичный путь доказательства (см.,например, [22], стр.209 . Теорема 3,1. Среди линейных оценок TZ » для которыхТЛ=1, оценкой с равномерно минимальным риском является оценка Здесь полагаем матрицы невырожденными, обобщение теоремы Гаусса-Маркова на случай произвольных матриц приведено в [53 J . Из (3.1.3), (І.І.6) следует, что среди функций достаточно широкого класса найдется такая -р(х), для которой совпадают оценка
С и аппроксимационная оценка по методу наименьших взвешен - ных квадратов С(m.) , например, когда B-fef+E)"1 - Более общие условия совпадения оценок приведены в [22] , стр.221.Следовательно, имеет место важное для нас утверждение Теорема 3.2. Аппроксимационная оценка по методу наименьших взвешенных квадратов (I.I.6) допустима на множестве линейных оценок TZ таких, что TJA=I , для класса функций L2(M) Эта теорема обосновывает возможность выбора оценок интегралов IfiPLjU(clx); L = ,..-,rn,l дляДО.ЄІа(\Й в виде (1.2.4),(1.2.13), который был сделан в главе I из соображений сходимости по вероятности матрицы (1.2.2) этих оценок к единичной матрице при J/- . При наличии случайных ошикок наблюдений (3.I.I) в оценках (1.2.3), (1.2.4) следует заменить вектор V на Z . При этом для аппроксимационной оценки C(m,0i) (1.2.4) выполняется следствие I.I, так как М у? f , а также результаты теорем 1.5, 1.6 и следствия 1.3.