Введение к работе
Актуальность темы. Исследование функционирования современных систем (технических, экономических, социальных, транспортных и т.д.) часто приводит к описанию моделей, характеристики которых представляют собой суммарный эффект действия большого числа различного рода факторов. При этом, как правило, и поведение факторов носит случайный характер, и количество самих факторов определяется некоторой случайной величиной. Поэтому суммы случайного числа случайных величин («случайные суммы») играют важную роль в математическом моделировании многих процессов и явлений. Модели, основанные на случайных суммах, рассматривают в своих работах Петраков Н.Я., Ротарь В.Щ1985), Круглов В.М., Королев В.Ю. (1990), Королев В.Ю., Бенинг В.Е., Шоргин С.Я. (2007).
В вероятностно-статистических методах исследования математических моделей важнейшую роль играют вопросы определения выборочного закона распределения. Для широкого класса моделей предпосылки применения нормального закона распределения обусловлены условиями центральной предельной теоремы. Однако, такая ситуация справедлива, если факторы действуют аддитивно и независимо друг от друга, внося малую долю в суммарный эффект.
Наряду с этим во многих прикладных задачах естественно предполагать, что условия функционирования систем характеризуются непостоянством интенсивности действия факторов, что становится следствием перемежаемости спокойного режима, характеризуемого низким уровнем событий, с возникновением редких, но очень крупных по величине событий. Эмпирические плотности распределения характеристик таких систем являются более островершинными и при этом «хвосты» распределений убывают гораздо медленнее, нежели это характерно для нормального закона. Анализ эмпирических распределений временных рядов, являющихся наблюдениями за функционированием реальных процессов, часто показывает несостоятельность моделей, основанных на нормальном законе, который традиционно используется в прикладных задачах. Вероятностные распределения, лежащие в основе аналитических моделей таких систем (называемые из-за принципиальной значимости редких событий, лежащих в хвостах распределения, распределениями с «тяжелыми» хвостами»), требуют подходов, отличных от применяемых в случае «обычных» распределений.
Точное нахождение вероятностных распределений случайных сумм чрезвычайно затруднено. Во-первых, необходимо знать точные распределения как числа слагаемых в сумме, так и самих слагаемых. Во-вторых, даже если указанные распределения полностью известны, сами вычисления, как правило, трудно реализуемы и конечные представления для распределений (или их эквивалентные преобразования) случайных сумм могут не существовать. Таким образом, весьма актуальной является задача изучения возможности использования тех
или иных аппроксимаций для определения асимптотического поведения распределений случайных сумм, поскольку в прикладных задачах необходимо вычислять некоторые характеристики распределений, например, квантили.
Все перечисленное обуславливает актуальность разработки статистических методов выбора приемлемой аналитической модели для распределений случайных процессов, использующих аппарат случайных сумм, и нахождения оптимальных оценок неизвестных параметров распределения.
Разработанность темы. В работах Королева В.Ю. и Круглова В.М. показано, что предельными распределениями случайных сумм при определенных условиях являются вероятностные распределения специального вида -сдвиг/масштабные смеси нормальных законов, которые определяются как усреднение нормального закона по математическому ожиданию и стандартному отклонению, являющихся случайными величинами с неизвестным заранее законом распределения.
Задача статистического анализа смеси сводится к анализу смешивающего распределения (разделению смеси на компоненты). Естественно искать адекватную аналитическую модель в семействе распределений, которые могут выступать в качестве предельных для сумм случайных величин при определенных ограничениях. При этом выбор закона распределения представляет собой весьма актуальную и трудоемкую статистическую задачу.
В работе исследуется использование двух альтернативных семейств распределений для построения аналитических моделей случайных процессов на основе эмпирических данных: класс строго устойчивых законов и семейство распределений Стьюдента.
Интерес к классу устойчивых распределений вызван работами Мандельб-рота Б. (1963), Фама Е. (1965). К классу устойчивых законов относятся все возможные предельные распределения сумм независимых одинаково распределенных случайных величин. Однако проблема идентификации параметров устойчивых законов по эмпирическим данным осложняется тем фактом, что выражение плотностей с помощью элементарных функций возможно лишь в отдельных частных случаях. Различные методы построения оценок для неизвестных параметров рассматривались в работах Фама Е., Ролла Р. (1971), Золотарева В.М. (1983), Нагаева А.В., Школьника СМ. (1985), Сапожникова П.Н. (2003).
Семейство распределений Стьюдента в описательной статистике практически не используется в качестве аналитической модели, «подгоняемой» к эмпирическим данным. Исключение составляют, например, работы Претца П. Д. (1972), Блаттеберга Р.К., Гоундса Н.Дж.(1974), Кон С.Дж.(1984), Королева В.Ю. (2007). Распределение Стьюдента, являясь безгранично делимым распределением, имеет схожее с опытными данными форму распределения, что позволяет его использовать в качестве альтернативы нормальному закону.
Цели и задачи исследования. Целью диссертационного исследования является разработка методов идентификации типа предельного распределения для математических моделей реальных процессов, базирующихся на масштабных смесях нормальных законов, и оценка возможности использования альтернативных нормальному закону семейств распределений. Для достижения поставленной цели в работе решены следующие задачи:
разработка метода оценки параметров аналитической модели, основанной на строго устойчивых масштабных смесях распределений;
построение критериев проверки гипотезы о соответствии модели распределениям Коши и Леви;
исследование структуры распределения смеси, имеющей распределение Стьюдента;
исследование вероятностных характеристик случайной компоненты регистрируемого сигнала в задачах оценки наличия поверхностных дефектов изделия методами магнитной дефектоскопии.
Научная новизна проведенных исследований заключается в том, что автором разработан метод расщепления масштабных смесей нормальных законов и идентификации типа предельных распределений для вероятностно-статистических моделей случайных процессов, основанных на случайных суммах, предельными распределениями для которых выступает класс устойчивых законов и семейство распределений Стьюдента.
Наиболее существенные результаты, выносимые на защиту:
Разработан новый метод оценки параметров аналитической модели для класса строго устойчивых распределений.
Получены аналитические представления распределений вспомогательных случайных величин, на основе которых строятся статистические решения о соответствии модели распределениям Коши и Леви.
3. Для семейства распределений Стьюдента установлено соответствие
между смешивающим распределением и распределением смеси. Предложен но
вый метод проверки критериев согласия, основанный на преобразовании исход
ной выборки наблюдений, который увеличивает меру расстояния между альтер
нативными моделями вероятностных распределений, что позволяет уменьшать
ошибку второго рода при построении статистических решений.
4. Построена аналитическая модель случайной компоненты, возникающей
при регистрации магнитного поля в задаче оценки наличия поверхностных де
фектов изделия, найдены доверительные интервалы для регистрируемой вели
чины, свидетельствующие о допустимости дефекта изделия.
Теоретическая и практическая значимость работы. Разработанный метод расщепления масштабной смеси, в том числе полученные в работе аналитические представления плотностей распределений исследуемых случайных вели-
чин, носит прикладной характер и позволяет строить аналитические модели реальных процессов, характеризующихся непостоянством интенсивности потока событий, предельными распределениями для которых выступают распределения с «тяжелыми» хвостами. Полученные значения оценки необходимого объема выборки позволяют строить статистические выводы о виде аналитической модели с выбранным уровнем значимости.
Методика исследования. Для решения поставленных в диссертационной работе задач использовались методы и результаты теории вероятностей, математической статистики, имитационного моделирования. При проведении диссертационного исследования применялись методы математического анализа и численные методы.
Достоверность результатов. Все сформулированные теоретические положения имеют строгие математические доказательства. Достоверность результатов подтверждена сопоставлением полученных аналитических выражений вероятностных моделей исследуемых случайных величин с результатами проведенных имитационных испытаний. Для оценки необходимого объема выборки использовались два альтернативных подхода, которые продемонстрировали сравнимые результаты.
Апробация работы. Основные положения диссертационной работы докладывались на «V Всероссийском симпозиуме по прикладной и промышленной математике» (Кисловодск, 2004), «XI Всероссийской школе-коллоквиуме по стохастическим методам» (Сочи, 2004), «XII Всероссийской школе-коллоквиуме по стохастическим методам» (Сочи, 2005), «VII Всероссийском симпозиуме по прикладной и промышленной математике» (Кисловодск, 2006), «XIV Всероссийской школах-коллоквиумах по стохастическим методам» (Сочи, 2007), V Всероссийской научно-практической конференции «Актуальные задачи математического моделирования и информационных технологий» (Сочи, 2009), научном семинаре кафедры высшей математики ПГТУ (Пермь, 2008), научном семинаре международной лаборатории конструктивных методов исследования динамических систем при кафедре информационных систем и математических методов в экономике ПГУ (Пермь, 2008), научных семинарах кафедры математического моделирования систем и процессов ПГТУ (Пермь, 2008, 2009).
Публикации. Основные результаты диссертации опубликованы в 10 печатных работах, перечень которых приведен в конце автореферата. Публикация в журнале, рекомендованном ВАК, содержит часть основных результатов диссертационной работы.
Структура диссертации. Диссертация состоит из введения, трех глав и заключения, списка литературы (83 наименования). Объем диссертации составляет 139 страниц, в работу включено 29 рисунков и 4 таблицы.