Электронная библиотека диссертаций и авторефератов России
dslib.net
Библиотека диссертаций
Навигация
Каталог диссертаций России
Англоязычные диссертации
Диссертации бесплатно
Предстоящие защиты
Рецензии на автореферат
Отчисления авторам
Мой кабинет
Заказы: забрать, оплатить
Мой личный счет
Мой профиль
Мой авторский профиль
Подписки на рассылки



расширенный поиск

Методы устойчивого оценивания параметров моделей по статистическим данным Гаврилов Константин Викторович

Методы устойчивого оценивания параметров моделей по статистическим данным
<
Методы устойчивого оценивания параметров моделей по статистическим данным Методы устойчивого оценивания параметров моделей по статистическим данным Методы устойчивого оценивания параметров моделей по статистическим данным Методы устойчивого оценивания параметров моделей по статистическим данным Методы устойчивого оценивания параметров моделей по статистическим данным Методы устойчивого оценивания параметров моделей по статистическим данным Методы устойчивого оценивания параметров моделей по статистическим данным Методы устойчивого оценивания параметров моделей по статистическим данным Методы устойчивого оценивания параметров моделей по статистическим данным
>

Диссертация - 480 руб., доставка 10 минут, круглосуточно, без выходных и праздников

Автореферат - бесплатно, доставка 10 минут, круглосуточно, без выходных и праздников

Гаврилов Константин Викторович. Методы устойчивого оценивания параметров моделей по статистическим данным : Дис. ... канд. техн. наук : 05.13.17 Новосибирск, 2005 144 с. РГБ ОД, 61:05-5/2587

Содержание к диссертации

Введение

ГЛАВА 1. Состояние вопроса и обоснование задач исследований 10

1.1. Задача построения математической модели явления 10

1.2. Линейные модели. Оценивание неизвестных параметров 13

1.3. Основные подходы к проблеме робастности 18

1.3.1. Задача оценивания параметров распределений 18

1.3.2. Обзор методов робастного оценивания 19

1.3.3. Принцип оптимальности на классе 23

1.4. Краткий исторический обзор 32

1.5. Выводы 34

ГЛАВА 2. Построение и исследование робастных локально-устойчивых методов 36

2.1. Стратегия робастного подхода 36

2.2. Исходные положения задачи 38

2.3. Критерий качества оценки 40

2.4. Локально-устойчивые оценки и их свойства 44

2.4.1. Конструирование локально-устойчивых оценок 44

2.4.2. Максимально устойчивая и условно-оптимальные оценки 46

2.4.3. Радикальные оценки 49

2.5. Выводы 54

ГЛАВА 3. Адаптивный робастный подход 57

3.1. Квазиправдоподобные оценки 57

3.2. Адаптивный Lv -метод 60

3.3. Адаптивные радикальные іу-оценки 63

3.4. Численная процедура получения робастных Lv -оценок 69

3.5. Выводы 72

ГЛАВА 4. Анализ финитной и приближённой финитной статистических моделей 73

4.1. Практическое применение 73

4.2. Выбор оптимальной на классе функции потерь 75

4.3. Оптимальность на классе финитных распределений 78

4.4. Исследование финитной модели... 80

4.4.1. Оценивание параметра сдвига 80

4.4.2. Оценивание параметра масштаба 86

4.5. Исследование приближённой финитной модели 88

4.5.1. Оптимальная модель ошибок 88

4.5.2. Оценивание параметра сдвига 92

4.5.3. Оценивание параметра формы 93

4.5.4. Оценивание параметра масштаба 94

4.6. Выводы 96

ГЛАВА 5. Численные исследования 99

5.1. Исследование финитной модели 99

5.1.1. Влияние асимметричного засорения на различные оценки 99

5.1.2. Нарушение финитности (неправильное значение /) 101

5.2. Исследование приближённой финитной модели 105

5.2.1. Исследования с использованием моделирования 105

5.2.2. Анализ экспериментальных данных 109

5.3. Выводы 125

Заключение 127

Список использованных источников

Введение к работе

Актуальность темы исследований. Измерение любой экспериментальной величины всегда осуществляется при воздействии некоторых помех, которые, несмотря на стремление исследователя свести их к минимуму, никогда не могут быть полностью устранены. В силу этого обстоятельства исследователь имеет дело не с детерминированными, а со случайными величинами. Во многих случаях измеряемые величины являются случайными по своей природе. С измерением подобных величин приходится сталкиваться в физических, биологических исследованиях, в некоторых задачах химической кинетики и ряде других отраслей науки.

Необходимость применения аппарата математической статистики при обработке результатов измерений, где случайной составляющей нельзя пренебречь, очевидна, и соответствующие методы успешно развиваются и внедряются в экспериментальную практику.

В настоящее время трудно представить себе область знаний, где бы ни использовались статистические методы обработки наблюдений, ибо на языке статистики удаётся в сжатом виде представить информацию, содержащуюся в серии измерений, наблюдений, экспериментов. Потребность описать наблюдаемое явление приводит к тому, что, наверное, одной из наиболее часто встречающихся задач, стоящих перед исследователем, стала задача оценивания параметров модели по результатам наблюдений.

Статистические выводы, связанные с анализом параметрических моделей, такие как оценивание параметров или построение доверительных интервалов, согласно классической теории, делались, исходя из предположения о каком-либо определённом виде распределения наблюдений. Наиболее известным является гауссовский статистический анализ, основанный на применении центральной предельной теоремы [5, 18, 25]. Теория сосредотачивалась на оптимизации точности получаемых результатов в рамках рассматриваемой модели.

На ограниченность такого подхода, пожалуй, впервые указал А. Н. Колмогоров [20]. Исследователи обнаружили, что реальное распределение наблюдений, как правило, расходится с принятым в модели, в результате чего могут серьёзно пострадать все статистические выводы. Возникла проблема устойчивого оценивания параметров моделей. В связи с этим получили развитие так называемые непараметрические методы [33], т.е. методы, свободные от предположения нормальности, как и любого другого определённого параметрического закона для ошибок. Известны, например, работы Т. П. Хеттманспергера по ранговым методам [36], а также сравнительно недавние работы Ю. Н. Тюрина и др. по знаковому статистическому анализу [4].

Другой известный подход к проблеме устойчивости, активно развивавшийся Б. Т. Поляком и Я. 3. Цыпкиным, называется принципом оптимальности на классе [38] и основан на минимаксном принципе построения оценок для некоторого множества возможных распределений. Его частным случаем является подход П. Хьюбера [37, 43], получивший название робастного и рассматривающий конечную окрестность модельного распределения.

Позже термин «робастность» приобрёл более широкое значение, его стали употреблять для обозначения устойчивости в каком-либо определённом, заранее оговорённом, смысле. Характерно, что и минимаксный, и непараметрический подходы теряют устойчивость при нарушении симметрии возмущения распределения наблюдений.

Локально-устойчивый подход Ф. Хампеля [35], основанный на использовании функции влияния, позволил качественно выделить оценки, обладающие свойством устойчивости к асимметричному засорению. Однако введённое им понятие Л-робастности не приводит к решениям, которые обладают указанным свойством.

Л. Д. Мешалкин [47, 1] предложил семейство оценок всех параметров многомерного нормального распределения, обладающих устойчивостью к асимметричному засорению, но это решение не привлекло заметного внимания статистиков. Возможно, это было связано с недостаточным объяснением

природы предложенных оценок. А. М. Шурыгин [40] развивал идеи Мешал ки-на, в том числе обобщил его результаты в рамках локально-устойчивого подхода к оцениванию параметров распределений. Однако локально-устойчивый подход, предложенный Шурыгиным, несмотря на очевидную полезность, до настоящего времени не получил должного теоретического обоснования. Исследованиями по проблеме устойчивости занимались также Дж. Тьюки [49], Дж. Пфанзагль [48], Л. Жакель [44], Э. Леман [46], Д. Эндрюс [41], С. А. Смоляк, Б. П. Титаренко [30, 31], А. И. Орлов [27], Ф. П. Тарасенко и многие другие учёные.

Сейчас существует целое направление в теории оценивания [30, 35, 37], которое изучает методы, устойчивые к тем или иным отклонениям от модельных предположений. Собирательное название для таких методов и соответствующих оценок параметров - робастные. Развитие теории робастности связано с дальнейшим совершенствованием применяемых статистических моделей, описывающих реальную ситуацию [38, 40].

В связи с тем, что теория робастности не завершена и находится в стадии активного развития, А. И. Орлов [26] назвал направление, связанное с построением робастных процедур статистического анализа, одной из главных «точек роста» прикладной статистики. Указанные тенденции нашли своё отражение и в данной диссертационной работе. Поднятые в ней вопросы разработки и исследования робастных методов оценивания параметров моделей представляются весьма актуальными.

Цель и задачи исследований. Основной целью диссертационной работы является дальнейшее развитие методов робастного оценивания параметров распределений и линейных регрессионных моделей независимых наблюдений с аддитивной помехой с точки зрения применения методов и моделей для более адекватного описания реальной ситуации. Основными задачами исследований являются построение, исследование и применение робастных подходов.

7 Методы исследования. Для решения поставленных задач использовался аппарат теории вероятностей, математической статистики, математического анализа, вычислительной математики, статистического моделирования. Обоснованность и достоверность научных положений, рекомендаций и выводов обеспечивается:

применением аналитического аппарата математического анализа, математической статистики и теории вероятностей для исследования свойств рассматриваемых оценок и методов;

подтверждением аналитических выводов и рекомендаций результатами испытаний методов с использованием статистического моделирования. Научная новизна и личный творческий вклад автора. Среди приведённого в диссертации материала автором были получены следующие основные результаты:

предложен вариант теоретического обоснования робастных методов, построенных по принципу локальной устойчивости к точечному засорению и развиваемых А. М. Шурыгиным [40];

проведены теоретические исследования локально-устойчивых методов оценивания параметров, в том числе введено понятие равнооптимальной оценки, сформулирован и доказан ряд теорем, касающихся свойств локально-устойчивых оценок;

предложено комбинирование принципа оптимальности на классе и робастных методов, на основе данного подхода исследованы финитная и приближённая финитная статистические модели, решена задача робастного оценивания параметров данных моделей;

предложена вычислительная процедура для оценивания параметров линейных регрессионных моделей адаптивным робастным Lv-методом;

проведены численные исследования предложенных подходов с использованием метода статистического моделирования;

— с использованием предложенных подходов построены модели процесса
струйного электрофоретического осаждения, применяемого для нанесения
композиционных покрытий на детали машин.

Практическая ценность результатов:

— разработанные подходы позволяют получать оценки, устойчивые к виду
распределения ошибок наблюдений, в том числе к наличию выбросов в масси
ве данных и к асимметричному засорению;

созданное программное обеспечение позволяет эффективно производить вычисление оценок линейных регрессионных моделей, применяя разработанные подходы к задаче робастного оценивания;

результаты исследований используются на ФПМИ НГТУ, разработаны модели реальных технологических процессов для ОАО «Завод дорожных машин».

Положения, выносимые на защиту. На защиту выносятся новые результаты, полученные автором в процессе проведения исследований. Краткое содержание работы.

В первой главе ставятся в математической форме задачи, проводится обзор современного состояния проблемы, краткий исторический обзор и обосновываются задачи исследований.

Во второй главе строятся и исследуются робастные локально-устойчивые методы оценивания параметров, использующие подход Шурыгина [40];

В третей главе рассматривается адаптивный робастный Lv -метод, предлагаются численные методы оценивания параметров регрессионных моделей данным методом.

В четвёртой главе исследуются финитная и приближённая финитная модели ошибок, предлагаются робастные оценки их параметров. Рассматривается адаптивный робастный подход в предположении приближённой финитности.

В пятой главе проводятся численные исследования с целью изучения предложенных робастных методов обработки наблюдений при использовании метода статистического моделирования. Рассматривается применение данных

9 методов для моделирования процесса струйного электрофоретического осаждения, используемого для нанесения композиционных покрытий на детали машин.

В приложении 1 приводится численный алгоритм, разработанный и использующийся для реализации итерационной процедуры оценивания параметров линейных регрессионных моделей.

В приложении 2 представлено описание программной системы для адаптивного робастного оценивания параметров линейных регрессионных моделей в предположении приближённой финитности ошибок наблюдений.

В приложении 3 представлены документы о внедрении результатов исследований.

Структура работы. Диссертация состоит из введения, пяти глав основного содержания, заключения, списка использованных источников из 49 наименований и приложений. Общий объём диссертации составляет 144 страницы, включая 16 таблиц и 32 рисунка

Публикации. Результаты исследований по теме диссертации опубликованы в восьми печатных работах, в том числе: научные статьи - 5, материалы конференций - 3.

Апробация работы. Результаты исследований, проведённых автором, докладывались и обсуждались: на студенческих конференциях в рамках дней науки НГТУ (Новосибирск, 1999 г. и 2000 г.); на всероссийской научной конференции студентов, аспирантов и молодых учёных «Наука. Технологии. Инновации» — 2003 г.; на Российской научно-технической конференции «Информатика и проблемы телекоммуникаций» - 2004 г.

Основные подходы к проблеме робастности

Исходной схемой в теории робастности, как правило, служит задача оценивания параметров распределений. Пусть х1,...,хт - наблюдения случайной величины 2;, распределённой с плотностью /(х,6), где х є Х (R и неизвестный параметр 9є@с . Определим оценку параметра в этой модели как т e = argminyA/(jt/se), (1.16) 9 ы\ где M(x,Q):Xx S)- tR - непрерывная, дифференцируемая почти всюду функция, называемая функцией потерь. Дифференцируя сумму в выражении (1.16) по параметру и приравнивая производную нулю, получаем оценочное уравнение т 2 ( i.9) = 0, (1.17) ы\ решение которого используется для нахождения оценки (1.16). Функция V]/ в уравнении (1.17) у( ,Є) = д (х,Є) (1.18) называется оценочной функцией (она определена с точностью до не зависящего от JC множителя).

Например, оценка максимального правдоподобия (ОМП) [5, 18] определяется как результат максимизации функции правдоподобия т На основании (1.19) можно записать т вомп = arg max Л(Є) = arg min [- In /-(9)] = arg min Y [- In /(x;, 8)]. (1.20) Є Є 6 ГІ j=l fJ& Сравнивая (1.16) и (1.20), получаем выражение для функции потерь ОМП Af0Mn(x,e) = -lii/(x,e), (1.21) отсюда, с точностью до не зависящей от х величины с = с(9), имеем oMnU0) = c— 1п/( ,Є). (1.22) Оценка, определяемая выражениями (1.16) или (1.17), была названа Хью бером [43] М-оценкой, была доказана состоятельность и асимптотическая нормальность при (не строго) выпуклой функции потерь. Кроме М-оценок вы делены Х-оценки [2, 13, 17, 29], являющиеся линейными комбинациями поряд ковых статистик, и ії-оценки, получаемые в ранговых критериях [36]. Жакель [44] доказал асимптотическую эквивалентность этих трех типов оценок, из ко u торых Дооценки наиболее удобны для анализа. Пфанзагль [48] назвал их оцен ками минимума контраста. В данной работе будут рассматриваться именно такие оценки.

Обзор методов робастного оценивания Говоря о робастности в теории оценивания, часто имеют в виду устойчи вость в некотором определённом смысле. Более строго под робастностью по нимается устойчивость результатов к отклонениям распределения наблюдений по любым направлениям в пространстве распределений (так называемая пол норазмерная устойчивость). Это понятие рассматривалось, например, Ф. Хам пелем и др. [35]. Существуют методы, не удовлетворяющие данному требова & нию, но обеспечивающие устойчивость в более узком классе распределений.

Эти методы также могут успешно применяться в тех задачах, специфика которых допускает подобное сужение условий. Выделяют три основных подхода к проблеме устойчивого оценивания параметров моделей. Непараметрические методы. Методы данной группы строятся безотносительно к конкретному виду распределения ошибок наблюдений. Фактически, они строятся для некоторого множества распределений, которое может задаваться явно или неявно.

При неявном задании множества мы для всех ошибок наблюдений считаем выполненными некоторые весьма общие предположения. В таких случаях обычно используется следующий подход: для проверки указанных предположений строится какой-либо критерий, оценки получаются в результате оптимизации статистики этого критерия. Например, требование случайности (т.е. ошибки наблюдений независимы, одинаково и непрерывно распределены) означает, что все ранговые последовательности ошибок равновероятны, и приводит к так называемым ранговым методам [36].

Для применения другого непараметрического метода - знакового метода [4] - достаточно, чтобы медиана распределения ошибок была равна нулю, т.е. для величины в выражении (1.3) должно иметь место Prob( 0) = Prob( 0) = 1/2. (1.23)

При этом ошибка может даже иметь бесконечную дисперсию и не иметь математического ожидания, как в случае распределения Коши [5, 18, 14]. В то же время МНК для этого распределения вообще не обеспечивает состоятельность оценок (для применения МНК необходима конечная дисперсия ошибок).

Ограничение (1.23) весьма слабое. Действительно, в величине ошибок при измерениях мы можем быть уверены гораздо меньше, чем в их знаке: если нет асимметричного засорения, можно при любом распределении ошибок с равным успехом ожидать, что наблюдение окажется больше или меньше фактического значения. Что касается потери информации, связанной с переходом от самих наблюдений к знакам, то она сравнительно невелика

Локально-устойчивые оценки и их свойства

Основной алгоритм получения робастных Ly -оценок. Мы предлагаем использовать метод получения оценок всех параметров при ограничении (3.18), основанный на итерационной процедуре, напоминающей метод Гаусса. Т.е. в цикле последовательно уточняются оценки каждого параметра в отдельности при фиксированных значениях остальных, найденных на предыдущей итерации. Шаг 1. Полагаем k = 0 - номер итерации. В качестве начального приближения рассмотрим значение v0 = 2, соответствующее МНК, и в качестве начального приближения параметра масштаба берём оценку (3.37). Шаг 2. Увеличиваем на единицу к. Находим текущее значение В как решение уравнения (3.21). Если 9 - 9 у, где у — малое положительное число, то заканчиваем вычисления. Шаг 3. Находим оценку Хк как решение уравнения (3.24). Шаг 4. Находим оценку vt как решение уравнения (3.25). Здесь же учитывается ограничение (3.18): если v 1, полагаем v = 1; если v . 2, полагаем v = 2; либо используем данное ограничение при задании области поиска решения, как в формуле (3.38).

Переходим на шаг 2. Усовершенствованный алгоритм получения робастных Ly -оценок. В основном алгоритме предлагается по методу Гаусса на каждом шаге циклически вычислять значение каждого параметра. Но, поскольку численные процедуры получения каждого параметра сами являются итерационными, целесообразно несколько видоизменить основной алгоритм. А именно, после каждой итерации для уточнения параметров регрессии по формуле (3.34) предлагается вычислять параметр формы по формуле (3.38) и делать одну итерацию методом Ньютона по формуле (3.36) для уточнения оценки параметра масштаба.

Пример. Рассмотрим задачу оценивания параметра 9 простейшей регрессионной модели у = в + $. (3.39)

Исследования проводились методом статистических испытаний Монте-Карло. При моделировании использовалось истинное значение параметра Є = 1. Приведённые ниже значения оценок и погрешностей усредняются по результатам 100 повторных экспериментов. Во всех экспериментах используется выборка объёмом 1000 наблюдений. Ошибка имеет стандартное нормальное распределение, засорённое распределением Коши с параметром масштаба і = 1. Плотность распределения Коши задаётся выражением (3.40) яа)= nX[\ + (t/X)2] Долю засорения обозначим а. Через 5 обозначим параметр радикальности, который будет принимать одинаковые значения для каждого параметра. Результаты экспериментов приведены в табл. 3.1.

Курсивом в таблице помечены лучшие результаты по строке. Анализируя полученные результаты, можно сделать вывод, что все рассмотренные оценки обеспечивают в целом близкую точность, однако точность радикальной оценки (5 = 1/2) часто оказывается выше, чем у других оценок. Данное обстоятельство можно объяснить сбалансированным соотношением между эффективностью и устойчивостью радикальной оценки и говорит в пользу использования этой оценки.

На рис. 3.1 показана зависимость оценок параметра формы v от уровня засорения. Чем менее устойчивый метод, т.е. меньше параметр радикальности 5, тем быстрее параметр формы снижается к единице. Это связано с тем, что когда робастных свойств метода недостаточно для описания тяжёлых хвостов распределения ошибок, алгоритм компенсирует это за счёт снижения параметра формы. Пока параметр формы больше единицы (это характерно для больших 5), можно считать, что метод неплохо описывает тяжёлые хвосты распределения ошибок, но, с другой стороны, слишком большой параметр радикальности снижает точность метода. Поэтому параметр радикальности лучше выбирать ближе к середине интервала между нулём и единицей или при его выборе ориентироваться на фактическую тяжесть хвостов.

Численная процедура получения робастных Lv -оценок

На практике в задачах, связанных с оцениванием неизвестных параметров моделей по результатам наблюдений, априорная информация о характере ошибок нередко состоит в том, что ошибка ограничена по абсолютной величине. Типичная природа возникновения такого ограничения - это использование измерительных приборов, для которых, как правило, известна абсолютная либо относительная погрешность измерений, а также обработка округлённых данных. В данных условиях возможно применение методов интервального анализа [7, 39] либо статистических методов, основанных на предположении финитности ошибок наблюдений и разрабатываемых в данной работе. Таким образом, финитная модель ошибок [23, 10] в ряде случаев может оказаться предпочтительнее других статистических моделей с точки зрения более адекватного описания реальной ситуации.

Проблема устойчивости результатов при обработке наблюдений в предположении финитности ошибок может решаться двумя основными путями: применением теории робастности [21, 40, 9, 10] и за счёт рассмотрения приближённой (засорённой) финитной модели [38, 6], что не исключает дальнейшей робастной обработки наблюдений [22]. Выбор модельной плотности предлагается осуществлять по минимаксному принципу [38, 37, 31].

Приближённая финитная модель активно используется исследователями [3, 38, 22]. В отличие от финитной, она позволяет описать наличие выбросов, которые могут появляться среди наблюдений в результате грубых ошибок. Применение робастных методов тоже справляется с этой задачей, однако приближённая финитная модель на практике лучше отвечает характеру ошибок наблюдений, потому что уже в самой модели заложена возможность нарушения финитности. Действительно, при анализе чистой финитной модели мы вынуждены полностью игнорировать аномальные наблюдения (считается, что они не могут появляться), но мы не можем с уверенностью сказать, является ли аномальным то или иное наблюдение, так как имеются неизвестные параметры. В приближённой финитной модели все наблюдения участвуют в формировании оценок.

Для разработки предлагаемых методов анализа в работе рассмотрена простейшая модель наблюдений, которая содержит один параметр сдвига. Тем не менее, полученные в результате методы могут быть распространены на более общие задачи, например на случай оценивания параметров линейных регрессионных моделей, подобно тому, как это сделано в главе 3 или в [8].

В рамках предположения приближённой финитности может применяться адаптивный подход [22, 8]. При этом по имеющейся выборке одновременно с оцениванием параметра сдвига (или параметров регрессии) оцениваются мешающие параметры: параметр масштаба, т.е. граница интервала финитности, и параметр формы, характеризующий степень отступления от финитности. Возможно также оценивать только один из указанных мешающих параметров, если другой известен. Во всех случаях, чтобы обеспечить устойчивость оценок к асимметричному засорению, при построении методов целесообразно применять теорию робастности.

Выбор оптимальной на классе функции потерь

Аналитические методы определения наименее благоприятного распределения на заданном классе в общем случае не известны. Однако в тех случаях, когда аналитическое решение этой задачи существует, для доказательства факта, что то или иное распределение является наименее благоприятным на классе, может быть использован подход, предложенный Я. 3. Цыпкиным и Б. Т. Поляком [38], основанный на использовании неравенства Коши-Буняковского.

Рассмотрим задачу оценивания параметра в модели (1.24). Пусть &"— выпуклый класс распределений ошибок с положительной информацией Фишера: О /(/) оо, / є &, Назовём функцию q (jc) = Af 0O (4.1) оценочной функцией, где М(х) - функция потерь, определённая в 2.1. От функции р потребуем выполнения условия Ф( )/( ) = 0 (4.2) в граничных точках множества % (или в точке х - ±о, если % - вся числовая ось).

Оптимальность на классе финитных распределений

Как и в случае оценивания параметра масштаба косинус-распределения, устойчивость и эффективность радикальной оценки в данном случае тоже не равны между собой, хотя разница между ними при всех а не превышает примерно 0,01.

Поскольку фактически ошибки наблюдений, как правило, не принадлежат КЭ семейству, оценки параметра масштаба (4.84) - (4.86) в каком-то смысле по выборке аппроксимируют распределение ошибок семейством распределений (4.70). При этом нельзя однозначно сказать, какое значение оценки параметра / является правильным. Но, так как распределение (4.70) получено по минимаксному принципу, оценка параметра / обладает замечательным свойством: независимо от выбора данного параметра, идентифицированное по выборке распределение из КЭ семейства будет иметь не большую информацию Фишера, чем фактическое.

Действительно, зафиксируем произвольное значение /. Для данного значения / по выборке найдём параметр а такой, что часть а ошибок наблюдений оказываются в /-окрестности бесконечности. Но среди всех распределений, удовлетворяющих условию, что часть а ошибок лежит в /-окрестности бесконечности, включая фактическое распределение ошибок, наименее благоприятным является КЭ распределение с соответствующими параметрами. Таким образом, предложенный метод является устойчивым к выбору параметра масштаба /, хотя надлежащий выбор данного параметра, основанный на использовании оценок (4.84) — (4.86), позволяет повысить точность оценивания интересующих параметров за счёт более точного подбора КЭ модели.

В данной главе исследованы финитная и приближённая финитная модели ошибок, рассмотрен вопрос обработки наблюдений для этих моделей. Приведён вывод наименее благоприятного распределения в предположении финитной модели. Для различных параметров этой модели получен ряд оценок, обладающих свойством робастности в смысле Шурыгина [40]

Среди рассмотренных локально-устойчивых оценок хотелось бы выделить радикальную оценку, представляющуюся наиболее удобной для практического применения. Она обладает следующими свойствами: — оценочная функция не содержит дополнительных параметров, в отличие от условно-оптимальной оценки; - оценочная функция имеет относительно простой аналитический вид; - радикальная оценка, как и равнооптимальная, имеет часто равные и достаточно высокие значения эффективности и устойчивости; — радикальная оценка обычно близка к классу условно-оптимальных оце нок, а именно - к равнооптимальной оценке (в примере оценивания параметра сдвига косинусной модели отличие составило около 3%).

Приближённую финитную модель предлагается использовать, в том числе, для описания ошибок наблюдений в регрессионном анализе. Во многих практических задачах предположение (4.69) приближённой финитности можно считать адекватной моделью. Для обработки наблюдений согласно рассмотренному предположению среди плотностей, соответствующих данному уровню априорной информации (см. [38]), выписана наименее благоприятная косинуси о-экспоненциальная плотность (4.70). Для указанной плотности получен ряд оценок, обладающих свойством робастности в смысле Шурыгина [40] и 5-робастностью по Хампелю [35], а также непараметрическая оценка параметра формы.

Среди возможных оценок рассмотрены оценка максимального правдоподобия, оценка максимальной устойчивости и радикальная оценка для параметров сдвига и масштаба, исследованы их основные характеристики [21]. Наибольший практический интерес, по-видимому, представляют радикальные оценки, поскольку они обладают одновременно высокими показателями эффективности и устойчивости. Оценку параметра формы, который характеризу 98 ет степень отступления от финитности, предлагается находить по не параметрическому правилу как отношение количества наблюдений, оказавшихся за границей финитности, к общему числу наблюдений.

Полученные выражения для оценок параметров косинусно-экспонен-циального распределения позволяют в условиях приближённой финитности устойчиво оценивать параметр модели наблюдений (4.68) или, в более общем случае, параметры линейных регрессионных моделей. При этом возможно применение адаптивного подхода.

Основные полученные результаты: - исследована финитная статистическая модель, решена задача робастно-го оценивания параметров косинус-распределения, исследованы свойства полученных оценок; - исследована приближённая финитная статистическая модель, решена задача робастного оценивания параметров косинусно-экспоненциальной модели, исследованы свойства оценок, предложен адаптивный робастныи подход к оцениванию параметров данной модели; - указаны теоретические предпосылки практического применения рассмотренных моделей, предлагается использовать их, в том числе, для оценивания параметров регрессионных моделей.

Похожие диссертации на Методы устойчивого оценивания параметров моделей по статистическим данным