Введение к работе
~ АктУалъностъ темы. Интенсивное развитие математического аппарата непараметрической статистики в последние три десятилетия оказало заметное влияние на тот ее раздел, который сей1, .с принято называть "функциональным оцениванием" или "оцениванием кривых и поверхностей" Две проблемы привлекли особое внимание исследователей - это оценивание плотности распределения вероятностей и поверхности регрессии. Изучение непараметрических оценок плотности и регрессии имеет большое теоретическое и практическое значение. Из важнейших областей применения этих оценок отметим следующие: непараметрический дискриминантный аналш,-кластер-анвлиз, генерирование наблюдений с заданной плотност^ч распределения, сглаженный бутстреп-ыетод, исследование зависимостей в непараметрических статистических моделях.
Одной из вакнейших характеристик, дающих представление о точности оценивания функций, является доверительная полоса. Для построения доверительных полос необходимо изучать распределение максимальных уклонений непараметрических оценок плотности и регрессии. Уклонение является суммой двух членов: "смещения", которое детерминировано, и "случайной ошибки". Для супремума "случайной ошибки" Штутэ (1985) и, в более общей постановке. Девелье и Мейсон (1991) получили результата типа закона повторного логарифма. Эти результаты позволяют определить уровень, около которого "флуктуируют" значения максимального уклонения. Дальнейшее, более детальное исследование, связано, о изучением распределения максимального уклонения в окрестности этого уровня. Значительная часть диссертации посвящена этому вопросу
Связь задачи изучения уклонений упомянутых оценок с задачей изучения высоких выбросов гауссовских процессов и полей впервые была обнаружена, по-видимому, П.Бикелом и М.РозенОлаттом (1973). Существенный вклад в исслэдование высоких выбросов гауссовск.іх процессов и полей внесли Ю.К.Беляев, С.Пврман, Д.Пикондс, К.Киолс, Х.Ватанабэ, В.И.Питербарг, Г.Линдгрон, П.II.Носко. Как уж'з отмечалось, эти исследования ишют ьгшюе значение дли нопараметрической статистики при и строении псиміпотичб"ких
дозерительных полос для неизвестной плотности распределения и поверхности регрессии, ибо задача построения доверительных полос сводится к исследованию распределения максимума гауссовского процесса или'шля. Предельные теоремы для максимальных уклонений непараметрическт ядерных оценок плотности и регрессии были получены в работах Н.Бикела и М.Розенблптта, М.Черге и n.FaBeco, П.Гевеба, М.Вудруфа, М.Розенблатта, Х.Вавдль, Э.А.Надарая, В.Кардле. Статистический интерес представляют те полосы, которые построены при баланса двух составляющих: "смещения" и "случайной оріибіси". Упомянутые авторы по существу ограничивались изучением лишь стохастической составляющей уклонения, для многомерных задач, также рассмотренных в диссертации, вопросы изучения распределения максимальных уклонений и скорости сходимости были почти полностью открытыми.'
В1 работе развивается метод исследования высоких выбросов гаусеовоких нолей с "большими" трендами; в случае, когда параметрическое множество устроено достаточно просто,- для распределения максимального уклонения таких далэй найден новый класс їігтроксимирущих законов, эти законы существенно улучшают точность аппроксимации. В применении. к исследованию скорости сходимости распределений максимальных уклонений ядерных оценок плотности и регрессии полученные аппроксимации позволяют перейти от логарифмической по п аппроксимации к степенной и охватить случай оптимального выбора параметра сглаживания. Для различных априорных функциональных классов, которым принадлежит функция плотности или регрессии, найдены оптимальные в минимаксном смысле скорости сходимости в метрике Ьда.
Целый ряд задач непарамвтрической статистики - изучение асимптотических свойств процедур рекуррентного оценивания, задачи, связанные с принципами инвариантности, изучение сходимости частичных сумм индуцировашшх порядковых статистик - приводят к обіцяй схеме последовательности марковских цепей, ваданшх на уплотняющихся моментах времени и к задаче построения соответствующих, диффузионных аппроксимаций. Важные результаты об ишогрольних тооремах. такого рода получены в работах А.Я.Хинчина, Л.В.Скорокода, Д.Струка и С.Варадвна, А.А.Боровкова, Г.Ш.Лилцера и
А.Н.ИІиряова, они хорошо известии и играют ванную роль при доказательство функциональных' предельных теорем. Доказательство локальных тэорэи в достаточно общей ситуации требует существенно Солее тонкой техники, что, впрочем, хорошо известна даже для сумм независимых случайных величин - оценка "хвостов" характеристической функции. Для решения упомянутых задач нбпарамэтрической статистики в диссертации для естественных достаточно широких классов цепей Маркова получены локальные предельные теоремы о сходимости к предельному диффузионному процессу.
Цель работы. Разработать методы аппроксимации случайных полей "уклонении'* непарвметрических статистических оценок плотности и регрессии гауссовскими полями. Исследовать асимптотику распределения и поправочные по и члены для вероятности Р( шах X(t) > и) в случае, когда гауссовскоэ поле X(t) имеет "большой", (т.е. сравнимый по порядку с уровнем и) тренд. Получить предельные теоремы для распределений максимальных уклонения непарвметрических
ЯДУрНЫХ ОЦеНОК ПЛОТНОСТИ I И ГЮВбрХНОСТИ реГрвССИИ Г ГфИ
оптимальном выборе параметра сглаживания h и, как следствие, вычислить оптимальные скорости сходимости в метрике L^ для различных априорных функциональных классов, которым принадлежит неизвестная плотность Г. Усилить и обобщить на многомерный случал результаты Н.В.Смирнова об асимптотическом распределении максимальных уклонений гистограмм. Для естественных классов цепей Маркова получить локальные предельные теоремы о сходимости к предельному диффузионному процессу, при этом охватить , достаточно широкий круг приложений. Рассмотреть задачу оценивания спектральной плотности как стохастически некорректную по А.Н.Тихонову задачу, показать, что асимптотика регуляризованных оценок может быть получена из асимптотики функции Ірина оператора Штурма-Лиушшш, связанного а нашей задачей.
Общая методика исследований. В диссертации испольгунтсн катоды теории вероятностей, функционального анализа, уравнений п честных производных параболического типа. Разработаны новые методы анализа больших выбросов гауосовскнх процессов с трендами и ноныд матймшический аппарат для получения локальних предельны/, пюуяи о сходимости цепей Маркова к продольному дифузис;ніг:.му процессу.
Научная новизна. Впервые получены: аппроксимации случайных полей "уклонений" непараметрических статистических оценок плотности и регрессии гауссовскими полями; асимптотические разложения для распределения максимальных уклонений многомерных гистограмм и последовательность сопрововдапцих распределений с уточненной оценкой остаточного члена; предельные законы и сопровождающие распределения с уточненной оценкой остаточного члена для распределения максимума гауссовского поля с трендом;. пределыше теоремы для распределения максимального уклонения ядерных оценок плотности и регрессии при оптимальном выборе параметра сглаживания; для естественных семейств цепей Маркова, заданных на уплотняющихся »*оментах времени, впервые получены локальные теоремы о сходимости к диффузионному процессу; асимптотика регуляризовшшых оценок Спектральной плотности получена как следствие асимптотики функции (рина соответствующего оператора Штурма - Лиувидпя. Практическая и теоретическая значимость. Полученные в диссертации асимптотические методы анализа случайных процессов и полей позволят развивать научные исследования в теории непараметрического статистического оценивания, в анализе больших выбросов гауссовских случайных полей, в теории стохастических дифференциальных уравнений. Совокупность полученных результатов образует новое направление - стохастический анализ максимальных уклонений непараметрических оценок кривых и поверхностей с применением методов теории гауссовских полей.
Апробация работы. Результаты диссертации докладывались:
- на Международных Вильнюсских конференциях по теории
вероятностей и математической статистике (1973,1977,1985 г.г.);
- на В"9Союзных школах-коллоквиумах по теории вероятностей и
математической статистике (Бакуриани, 1979,1981,1985,1986 г.г.);
-- на IV Советско-Японском симпозиуме по теории вероятностей и математической статистике (Тбилиси, 1982);
нв первом Всемирном Конгрессе Общества математической статистики и теории вероятностей им. Бернулли (Ташкент,1986 г.);
на семинаре по теории вероятностей и математической статистике Мзт"пятического института им.В.А.Стеклова (1984,1988 г.г.);
на семинаре "Асимптотические методы математической статистики"
- г -
В МГУ им. Н.В.Ломоносова (1980-1990 г.г.);
на семинаре по теории вероятностей и математической статистике при Ленинградском государственном университете и на семинаре Ленинградского отделения Математического института АН СССР (1990 г.);
на семинаре по теории вероятностей и математической статистике при Институте математики и кибернетики АН ЛитССР (1987 г.);
Публикации. Основные результаты диссертации опубликованы в 'работах автора [11 - С221.
Структура и объем работы. Диссертация состоит из введения и шести глгз, которые разбиты на 23 параграфа, и занимает 274 страницы машинописного текста. . Нумерация определений, лемм,, теорем, следствий и замечаний следующая: первая цифра соответствует номеру главы, вторая - номеру в главе. Список литературы содержит 146 наименований .