Электронная библиотека диссертаций и авторефератов России
dslib.net
Библиотека диссертаций
Навигация
Каталог диссертаций России
Англоязычные диссертации
Диссертации бесплатно
Предстоящие защиты
Рецензии на автореферат
Отчисления авторам
Мой кабинет
Заказы: забрать, оплатить
Мой личный счет
Мой профиль
Мой авторский профиль
Подписки на рассылки



расширенный поиск

Математические модели и методы оценки вероятностных характеристик реальных объектов при малых объемах экспериментальных данных Голушко Сергей Иванович

Математические модели и методы оценки вероятностных характеристик реальных объектов при малых объемах экспериментальных данных
<
Математические модели и методы оценки вероятностных характеристик реальных объектов при малых объемах экспериментальных данных Математические модели и методы оценки вероятностных характеристик реальных объектов при малых объемах экспериментальных данных Математические модели и методы оценки вероятностных характеристик реальных объектов при малых объемах экспериментальных данных Математические модели и методы оценки вероятностных характеристик реальных объектов при малых объемах экспериментальных данных Математические модели и методы оценки вероятностных характеристик реальных объектов при малых объемах экспериментальных данных Математические модели и методы оценки вероятностных характеристик реальных объектов при малых объемах экспериментальных данных Математические модели и методы оценки вероятностных характеристик реальных объектов при малых объемах экспериментальных данных Математические модели и методы оценки вероятностных характеристик реальных объектов при малых объемах экспериментальных данных Математические модели и методы оценки вероятностных характеристик реальных объектов при малых объемах экспериментальных данных
>

Диссертация - 480 руб., доставка 10 минут, круглосуточно, без выходных и праздников

Автореферат - бесплатно, доставка 10 минут, круглосуточно, без выходных и праздников

Голушко Сергей Иванович. Математические модели и методы оценки вероятностных характеристик реальных объектов при малых объемах экспериментальных данных : Дис. ... канд. физ.-мат. наук : 05.13.18 Саратов, 2005 115 с. РГБ ОД, 61:06-1/662

Содержание к диссертации

Введение

Глава 1. Состояние вопроса, постановка задачи построения моделей и методов оценки вероятностных характеристик реальных объектов 7

1.1. Выбор аппроксимирующего распределения 9

1.2. Оценка значимости числа моментов, по которым проводится аппроксимация 16

1.3. Методы оценки аппроксимирующего распределения и его параметров 19

1.4. Методы получения точечных оценок 23

1.5. Методы получения интервальных оценок 25

1.6. Оценка характеристик генеральной совокупности по малым выборкам 27

1.7. Эмпирические распределения, гистограммы и полигоны 28

1.8. Выводы к главе 1 30

Глава 2. Свойство монотонности и оценка генеральных моментов реального распределения по малой выборке 32

2.1. Свойство монотонности выборочных моментов 32

2.2. Экстраполяция значений выборочных моментов 34

2.3. Многокритериальный выбор аппроксимирующих гипербол 36

2.4. Погрешности оценки генеральных моментов по малым выборкам 41

2.5. Выводы к главе 2 47

Глава 3. Аппроксимация реальных распределений по К моментам обобщённым гиперэрланговским распределением 48

3.1. Метод моментов для обобщённого гиперэрланговского распределения 48

3.2. Решение задачи аппроксимации перебором в условиях избыточности параметров 50

3.3. Приближённое решение задачи аппроксимации по двенадцати моментам направленным перебором 53

3.4. Выбор наилучшего по множеству аппроксимирующего распределения по критерию согласия 61

3.5. Принцип аналогий и уточнение результатов аппроксимации 64

3.6. Выводы к главе 3 62

Глава 4. Методика оценки вероятностных характеристик реальных объектов 72

4.1. Методика аппроксимации реальных распределений положительно определённых случайных величин по малым выборкам 72

4.2. Исследование точности и области применимости аппроксимации по двенадцати моментам 79

4.3. Аппроксимация обобщённым распределением реальных распределений по малым выборкам 83

4.4. Выводы к главе 4 96

Заключение 97

Список используемой литературы

Введение к работе

На практике многие реальные объекты характеризуются случайными величинами, значения которых получаются в экспериментах. Число экспериментов может быть ограничено или из-за их сложности и стоимости, или ограничено из-за длительного времени проведения эксперимента. Количество значений случайной величины, полученных в эксперименте, назовём выборкой. Таким образом, мы сталкиваемся со случайными величинами, о которых можем судить лишь по выборкам их значений. Полная характеристика случайной величины - распределение вероятностей, но, как правило, это распределение, которое мы будем называть реальным, нам неизвестно. Причин тому много, но основная из них это недостаточность объёма выборки значений случайной величины.

Мы исключаем те немногие случаи, при которых вид распределения случайной величины известен на основании предыдущего опыта или, исходя из физических законов. В данной постановке, о случайной величине ничего не известно, кроме ограниченной выборки её значений.

Мы аппроксимируем, реальное распределение распределением заданного вида, но каким должно быть это аппроксимирующее распределение мы в точности не знаем, поэтому для аппроксимации мы выбрали обобщённое распределение, включающее в себя сразу несколько распределений пуассоновского типа: экспоненциальное, Эрланга к порядка, гиперэкспоненциальное и обобщённое Эрланга к порядка. Это распределение имеет К свободных параметров, что позволяет проводить аппроксимацию по К начальным моментам, при этом К может достигать значения в несколько десятков и сотен. В диссертационной работе рассматриваются только положительно определённые случайные величины. Такие задачи, как нам известно, ранее не ставились. Известно, что распределения Пирсона образуют семейство непрерывных распределений двенадцати типов, но все они однозначно определяются четырьмя начальными моментами и не обладают избыточностью параметров.

Мы исследовали достаточность четырёх моментов в задачах массового обслуживания и, оказалось, что на среднюю длину очереди влияют первые семь начальных моментов времени обслуживания и времени поступления заявок. Отбрасывание моментов старше второго, третьего или четвёртого приводит к недопустимо большим погрешностям для средней длины очереди. Поэтому мы поставили задачу аппроксимации по возможно большему числу моментов, исходя из того, что чем по большему числу моментов проводится аппроксимация - тем она точнее.

Аппроксимация по К моментам, как известно, составляет не разрешённую в общем виде, проблему моментов Чебышева. Эта проблема была решена нами алгоритмически для частного случая обобщённого распределения и положительно определённых случайных величин.

Чтобы аппроксимировать реальные распределения, необходимо знать его К генеральных моментов. По ограниченным выборкам, мы находим только выборочные моменты. Выборочные моменты, как известно, случайны и зависят от конкретной выборки, поэтому мы поставили задачу оценки генеральных моментов реального распределения по малым выборкам, полагая, что объём выборок не позволяет достоверно оценить генеральные моменты, во всяком случае, традиционными методами.

Для малых выборок задача оценки генеральных моментов может решаться только при условии отдельных допущений и соглашений. В качестве таковых мы принимаем, что малые выборки объёмом в 10-30 значений статистически устойчивы, что в свою очередь требует, чтобы коэффициенты вариаций не превышали существенно значение 1.

Для оценки генеральных моментов определено и доказано общее свойство монотонности выборочных моментов. Использована гиперболическая экстраполяция генеральных моментов. Применён многокритериальный выбор экстраполирующих гипербол и, наконец, процедура уточнения оценки генеральных моментов на основании принципа аналогий.

Таким образом, для решения задачи аппроксимации реальных распределений по малым выборкам, имеющих большое прикладное значение, нами разработаны специальные модели и методы, которые оказались пригодными и в общих случаях и дали хорошие результаты там, где их вообще было получить крайне затруднительно.

Решение этой задачи оказалось возможным только при условии применения быстродействующей вычислительной техники и разработки соответствующего программного обеспечения.

Целью диссертационной работы является разработка методов оценки значений К генеральных моментов реального распределения по малым выборкам с допустимой погрешностью. Аппроксимация реального распределения по К моментам многими обобщёнными гиперэрланговскими распределениями. Выбор из множества аппроксимирующих распределений наилучшего по критерию согласия.

Объект исследования. Положительно определённые случайные величины, имеющие выборочный коэффициент вариации в пределах от 0.1 до 1.4.

Методы исследований. Методы теории вероятностей, математической статистики, теории массового обслуживания, методы статистического имитационного моделирования и другие.

Научная ценность работы состоит в том, что найдено алгоритмическое решение проблемы моментов Чебышева, для частного случая обобщённого гиперэрланговского распределения.

Определено и доказано общее свойство монотонности выборочных моментов для положительно определённых случайных величин, а также методика гиперболической экстраполяции генеральных моментов, включающая в себя многокритериальный выбор экстраполирующих гипербол, что позволяет достоверно определить интервалы значений К генеральных моментов реальных распределений.

Практическая значимость работы заключается в том, что все разработанные методики позволяют достоверно прогнозировать вероятности реальных событий по малым выборкам, объёмы которых не позволяют сделать достоверный прогноз при использовании традиционных подходов.

В работе рассмотрены статистические материалы численности грызунов в прикаспийской низменности, любезно предоставленные РосНИПЧИ "Микроб" и статистические материалы производства и продаж печатной продукции ЗАО ЛА "Научная книга"

В диссертации также представлены обширные статистические материалы проведения машинных экспериментов в рамках рассматриваемых методик аппроксимации и оценок.

Автор защищает:

- обобщённое многопараметрическое гиперэрланговское распределение, имеющее К свободных начальных моментов;

- методику аппроксимации по К моментам, дающую точные и приближённые значения параметров обобщённого распределения;

- свойство монотонности выборочных моментов;

- методику гиперболической экстраполяции, с учётом многокритериального выбора экстраполирующих гипербол;

- модель оценки генеральных моментов по выбранным сечениям;

- принцип аналогий, компенсирующий погрешность экстраполяции.

Результаты работы внедрены в ЗАО "Научная книга". Работа написана в СГТУ на кафедре "Программное обеспечение вычислительной техники и автоматизированных систем".  

Оценка значимости числа моментов, по которым проводится аппроксимация

Степенная проблема моментов состоит в том, что если нам заданы нормированные моменты (Ml = 1) случайной величины Ml, М2, МЗ, ...., то необходимо найти плотность распределения этой случайной величины, т.е. f(t), которое бы отвечало уравнению: MK=\tkf(t)dt (1.18) где: Мк - начальный момент порядка К случайной величины t.

Эта проблема разрешима не всегда. Разрешимая степенная проблема моментов с единственным решением называется определённой, с неединственным решением - неопределённой. Необходимое и достаточное условие разрешимости сводится к теореме Гамбургера: все ганкелевы формы должны быть неотрицательны [5]: 5Ж/+г Л о (1.19) Достаточное условие определённости сводится к критерию Карлемана: М»=со (1.20) где: Мгк - начальный момент чётного прядка 2К.

Легко видеть, что условия теоремы Гамбургера всегда выполняются для положительно определённых случайных величин. Условие Карлемана необходимо проверять для каждого отдельного случая.

Предположим, что искомое реальное распределение однозначно представимо своими моментами, но число этих моментов в этом случае будет стремиться в бесконечность. Естественно, что этот бесконечный ряд следует оборвать, но на котором члене. В то же время, очевидно, чем по большему числу моментов мы будем проводить аппроксимацию, чем точнее она будет.

Мы провели исследование влияния старших моментов на результат моделирования - среднюю длину очереди заявок в системах массового обслуживания (СМО). Исследовавшаяся модель СМО с очередью и ожиданием имеет следующий вид: Рис. 1.8. СМО с очередью и ожидание. В качестве эталона мы выбрали известную формулу Поллачека-Хинчина для средней длины очереди заявок в СМО [6]. m = p + (p2/2)[(l + V /(l-p)] (1.21) где: Уц - коэффициент вариации времени обслуживания; р - коэффициент загрузки СМО; m - среднее число заявок.

Формула Поллачека-Хинчина выведена для простейшего входного потока заявок и произвольно распределённого времени обслуживания. Она замечательна тем, что устанавливает тот факт, что среднее число заявок в очереди L, зависит только от первых двух моментов времени обслуживания Mi иМ2.

Был запрограммирован процесс массового обслуживания в одноканальной СМО. В качестве входного потока выбирался поток Пальма, в котором время поступления заявок было распределено по обобщённому закону. Время обслуживания так же было распределено по обобщённому закону. Варьируя параметры распределений, мы могли получать простейший поток, в этом случае распределение времени поступления заявок было экспоненциальным (1.1), а время обслуживания оставалось распределённым по обобщённому закону (1.16). Справедливость формулы Поллачека-Хинчина полностью подтвердилась. Затем, мы стали варьировать параметры обобщённого распределения во входном потоке, в результате это распределение стало неэкспоненциальным, и формула Поллачека-Хинчина оказалась неприменимой, и оценка длины очереди проводилась статистически с погрешностью в пределах 1-2%.

Задача статистического имитационного моделирования СМО достаточно сложна сама по себе. Ей предшествовало моделирование обобщённого распределения с целью не только отрегулировать сам процесс, но и найти критерии, по которым процесс моделирования следовало прекратить за достаточностью. Всё это подробно описано в наших работах [3, 4, 8], а так же в работе [9]. Результаты моделирования приведены в приложении 3. Поэтому поясним только общую методику машинного эксперимента.

Мы за счёт выбора параметров обобщённого распределения получали распределения с фиксированными младшими моментами и различными старшими моментами, как для входящего потока заявок, так и для распределения времени обслуживания.

В результате мы оценивали влияние на результат старших моментов при неизменных младших.

Общие выводы оказались для нас весьма значимыми. Во-первых, на среднее число заявок в очереди существенно влияют старшие моменты, как потока поступающих заявок, так и времени обслуживания. Это влияние ослабевает с увеличением порядка моментов. Во-вторых, это влияние существенно зависит от коэффициента загрузки СМО - отношение среднего времени обслуживания к среднему времени поступления заявок. Чем меньше коэффициент загрузки, тем слабее старшие моменты влияют на среднее число заявок. Это влияние существенно только для полнозагруженных СМО, работающих с коэффициентами загрузок большими 0.9. Количественные результаты моделирования приведены нами в [10]. Влияние моментов с третьего по пятый существенно от 30% до 16% при коэффициенте загрузки порядка 0.7. Старшие моменты от шестого по девятый влияют на среднее число заявок от 5% до 2%. На дисперсия числа заявок в СМО старшие моменты влияют в большей степени, чем на среднее число заявок от 19% до 5%. Если же СМО работает с загрузкой, близкой к 1, то влияние старших моментов многократно усиливается.

Таким образом, мы не можем однозначно утверждать, сколько именно моментов необходимо учитывать при тех или иных исследованиях, но совершенно бесспорно, что отбрасывание старших моментов должно обосновываться в каждом отдельном случае. Для нас важен сам факт необходимости учёта старших моментов распределений.

Экстраполяция значений выборочных моментов

Свойство монотонности даёт нам возможность для любого вариационного ряда получить при выборке попарно больших для каждого из К начальных моментов два значения, и два значения при выборе попарно меньших плюс К-ые моменты для исходного ряда. Эти значения моментов будут монотонно возрастать или монотонно убывать.

Рассмотрим монотонно возрастающие моменты порядка К. Для них мы имеем три значения, через которые можно провести кривую второго порядка. Эта кривая устанавливает зависимость между объёмом выборки и значением момента порядка К. Если устремить объём выборки V в бесконечность, выборочные моменты устремятся к значениям соответствующих генеральных моментов. Таким образом, график кривой второго порядка не должен пересекать оси абсцисс, а монотонно приближаться к некоторой прямой, параллельной этой оси. Из всех монотонно убывающих кривых второго порядка, отвечающих этому свойству, наиболее подходит равнобокая гипербола

Как видно из графика (рис. 2.2), усреднённое значение генерального момента всегда хуже, значения, даваемого одной из двух кривых, за исключением того случая, когда искомое значение совпадает со средним значением. Кривые равносильны, оценки генерального момента так же равносильны.

Поставим задачу выбора наилучшей аппроксимирующей гиперболы по критерию меньшей погрешности результата.

Результаты, получаемые по (2.5) и (2.7) представим в виде двух различных точек на числовой оси. Бесспорно, что одна из двух точек будет ближе к искомому значению, чем другая, за исключением одного случая, когда искомое значение совпадает со средним значением, взятым по двум точкам. Мы не можем непосредственно оценить, какая кривая приводит к более точным результатам, но это можно сделать косвенно. Например, кривая, которая ближе к генеральному моменту, переходит в прямую параллельную оси абсцисс и, следовательно, она будет короче и с меньшей кривизной. Чем ближе кривая к генеральному моменту, тем меньше приращения моментов при изменениях объёмов выборки. На заключительном отрезке это приращение будет равно нулю. Это косвенные оценки и, по сути, они представляют собой гипотезы, которые могут выполняться или не выполняться в конкретных случаях. Но с помощью машинного эксперимента, мы можем оценить их достоверность статистически.

Мы выбрали девять критериев оценки кривых: 1 .Среднее значение коэффициента вариации, вычисляемое по трём точкам. 2.Среднее значение коэффициента вариации, отнесённое к длине кривой. 3. Средняя кривизна кривой. 4. Длина кривой. 5. Кривизна в последней точке. 6. Среднее значение выборочных моментов по трём объёмам. 7. Усреднённые моменты, отнесённые к длине кривой. 8. Среднее геометрическое выборочных моментов по трём объёмам; 9. Среднее геометрическое выборочных моментов, отнесённое к длине кривой.

Физический смысл этих критериев достаточно спорен. Поэтому в машинном эксперименте определялась вероятность того, что выбранный критерий корректен. Вероятность достоверности критерия должна быть по условиям эксперимента больше 0.5. Если эта вероятность оказывалась меньше 0.5, критерий инвертировался. Таким образом, мы статистически проверили все девять критериев и скорректировали их. После корректировки, нами было проведено исследование критериев, с целью установления вероятности достоверности выбора первой или второй аппроксимирующих гипербол. Для чего был проведён машинный эксперимент.

В эксперименте использовался программный генератор распределений. Суть генератора в следующем. Нами было выбрано обобщённое распределение с тридцатью девятью свободными параметрами, плотность которого определена выражением (1.16) при К = 13. Параметры этого распределение задавались стандартным генератором случайных чисел RANDOM. Затем методом обратной функции [20], генерировались случайные распределения, в соответствии с заданным в начале, случайным образом, обобщённым распределением. Обобщённое распределение имеет до 38 свободных моментов и до тринадцати мод, и включает в себя практически все распределения пуассоновского типа. Таким образом, вид конкретного распределения использовавшегося при машинном эксперименте: его модальность, его моменты определялись случайным образом через сочетание параметров обобщённого распределения. Общее число генерируемых распределений, таким образом, практически неограниченно велико. Справочники по теории вероятностей и математической статистике, включая и энциклопедию [14], содержат обычно до 15 различных распределений положительно определённых непрерывных, случайных величин. Стандартные пакеты программ [21] позволяют моделировать до 9 различных непрерывных распределений. Таким образом, использовавшийся в машинном эксперименте генератор распределений обладал необходимой общностью. Каждая предварительная установка начальной константы стандартного ГСЧ для эксперимента генерировала тысячу различных вариантов обобщённого распределения. В эксперименте критерии выбора оценивались для двенадцати моментов. Для каждого момента использовалась своя установочная константа г = 1, 2, ..., 12. Поэтому всего в эксперименте использовались 12 000 вариантов обобщённого распределения с коэффициентами вариаций от 0.1 до 1.4.

Приближённое решение задачи аппроксимации по двенадцати моментам направленным перебором

В тех случая, когда выборочные моменты получены неверно, или неверно была произведена оценка генеральных моментов, задача аппроксимации может не иметь решения, поскольку распределений с такими моментами может просто не существовать.

Если решение не получается, возникает дилемма: или метод аппроксимации неверен или неверны исходные данные. Чтобы разрешить эту проблему, нами был разработан приближённый метод, который всегда даёт наиближайшие к исходным данным результаты по множеству поиска.

Идея метода состоит в том, что параметрам обобщённого распределения Pi, ki и ЦІ присваиваются случайные значения из области определения. Затем аналитически вычисляются моменты получившегося распределения по уравнениям (3.4). Эти моменты сравниваются с заданными. Результат сравнения запоминается, если он был лучше предыдущих.

Поиск наилучшего решения осуществляется в четыре этапа.

На первом этапе ищется лучшее решение по множеству случайных выборок для pi с точностью до тысячных долей, kj выбираются из интервалов от 1 до 160, ЦІ из интервалов от 0,0001 до 160. Случайная выборка параметров позволяет получить распределения с коэффициентами вариаций от 0.4 до 1.4. Наилучшее решение находится при переборе от миллиона до трёх миллионов вариантов. Максимальная погрешность по всем двенадцати моментам не превосходит 12%, но чаще всего составляет, примерно, 5%.

На втором этапе берутся найденные значения параметров ki и ц, для наилучшего варианта, и они помещаются в интервалы ki—70, kj+70, аналогично и ЦІ в интервалы ЦІ-70 И ЦІ+70. После чего объём поиска утраивается. Наилучшее решение в этом случае имеет погрешность менее 2% по всем двенадцати моментам.

На третьем этапе проводится корректировка найденных значений по рі в пределах 0.01%. Найденные значения pi варьируются случайным образом в указанных пределах, и вновь выбирается лучшее решение. Погрешность на этом этапе, как правило, становится в пределах одного процента.

На четвёртом этапе для найденного наилучшего варианта аппроксимирующего распределения выбираются два наибольшие соотношения Pi ki / ЦІ, в которых циклически перебираются значения ЦІ С малым шагом в пределах двух миллионов различных сочетаний. Из которых опять выбирается наилучшее решение. Погрешность результата при этом, как правило, уменьшается на десятые доли процента.

На всех четырёх этапах производится корректировка двух значений \i\ и И2. Таким образом, чтобы первые два момента аппроксимирующего распределения совпадали в точности с заданными значениями, что всегда возможно, поскольку аппроксимация по двум моментам возможна без ограничений.

Значения ці и Ц2 находятся из системы: и KPJMI + hPilfh = т -ILKPtlto 1=3 „ (3.6) ад+\)PJrf+к2(к2+\)p2/ju22 =М2- хад+i)Pi/tf /=з

Аппроксимация по двенадцати моментам требует масштабирования исходных данных. Заданные моменты масштабируются таким образом, чтобы математическое ожидание всегда было равно единице. Масштабирование проводится по следующей формуле M K=MjMf ( = 1,К,12) (3.7) где: Мк - промасштабированное значение момента порядка К, Мк - заданное значение момента порядка К. Масштабный коэффициент равен Мі до масштабирования. Это значение запоминается. Для найденных параметров с учётом масштабирования, значения щ пересчитываются: М,=Мі/Мг (3.8)

Рассмотрим пять примеров аппроксимации обобщённым распределением для разных коэффициентов вариации от 0,17 до 1,41. Все примеры сформированы генератором случайных чисел.

Пример 1. Пусть требуется аппроксимировать по двенадцати моментам следующее распределение, заданное нам двенадцатью начальными генеральными моментами: М, = 1 М2 = 1,029206 М3 = 1,088906 М,= 1,183207 М5 = 1,319454 Мб =1,5091 M7= 1,769401 М8 = 2,125507 М9 = 2,614557 М,о = 3,291337 Мп =4,237381 Ми = 5,575169

Коэффициент вариации этого распределения равен 0,170897. Это достаточно малый коэффициент вариации, который редко встречается на практике. Мы рассмотрим этот пример, чтобы оценить возможности метода.

Поскольку математическое ожидание равно 1, то масштабирование не требуется.

Поэтапный поиск параметров аппроксимирующего распределение дал следующие результаты.

Поиск по всем 39 параметрам среди миллиона различных вариантов позволил получить параметры обобщённого распределения, начальные моменты которого отличаются от заданных на максимальную погрешность по всем 12 моментам равную 15,013389%.

Поиск по уточнённым интервалам для kj и uj дал максимальную погрешность 0,473833%.

Уточнение тринадцати вероятностей pi на третьем этапе понизило максимальную погрешность до 0,281989%. И, наконец, уточнение значений ці на четвёртом этапе ещё снизило максимальную по 12 моментам погрешность до значения 0,279228%.

Исследование точности и области применимости аппроксимации по двенадцати моментам

Область применимости данной методики аппроксимации по 12 моментам реальных распределений положительно определённых случайных величин достаточно широка. Во всех случаях, где имеют место случайные процессы, порождающие случайные величины их можно оценивать по этой методике. Полной характеристикой случайной величины является её закон распределения. К сожалению, во многих практических случаях этот закон нам не известен. Но мы можем оценить его через выборку. Желательно, чтобы выборка значений была, возможно, большего объёма, но часто большие выборки просто не возможно получить по разным причинам, на пример, если наблюдаются какие-то редкие события или значения случайных величин получаются в дорогостоящих экспериментах. Поэтому мы вынуждены ограничиваться малыми выборками, поскольку они доступны нам в большей степени.

Обобщённое гиперэрланговское распределение задаётся 39 параметрами и имеет 12 свободных моментов, поэтому чётко обозначить границы, в которых можно с успехом решать задачу аппроксимации не представляется возможным. Но многие свойства обобщённого распределения напрямую зависят от его коэффициента вариации, поэтому мы рассматриваем возможность аппроксимации реальных распределений в зависимости от их коэффициентов вариаций. Коэффициенты вариаций реальных распределений лежат обычно в интервале от 0,3 до 0,9. Поэтому мы выбрали интервал, в котором все программы аппроксимации надёжно работают от 0,1 до 1,4.

Объёмы выборок могут быть самыми различными, но методика требует, чтобы их объём был кратен четырём. Минимальный размер выборки 8 значений случайной величины, верхний предел 100 значений. Объём выборки сказывается на времени работы программ, чем больше объём, тем дольше работает программа. Для выборок больших 100 возможна разработка несколько иных методов.

Выборки малого объёма не стабильны, и величина малой выборки негарантирует хорошего результата аппроксимации. Поэтому мы рассмотрели выборки объёмом от 8 до 32 с шагом 4, но насколько удачна аппроксимация, это определяется в каждом конкретном случае. Надо сказать, что рассматриваемая методика аппроксимации всегда даёт лучший результат, чем оценка генеральных моментов по выборочным моментам. Но лучший результат не всегда означает хороший. Это объясняется тем, что малые выборки могут быть удачными, в этом случае случайный процесс приближается к идеальной модели, и не удачными. Поэтому так важна оценка в каждом отдельном случае. Рассматриваемая методика позволяет косвенно оценить качество аппроксимации по величине погрешности аппроксимирующего распределения относительно оценок генеральных моментов. Оценки генеральных моментов противоречивы по причине малости выборки, для больших выборок этих противоречий не будет, так же как и проблем с аппроксимацией.

Мы полагаем, что чем больше несогласованность оценок генеральных моментов, те менее информативна выборка. Эта несогласованность косвенно определяется через погрешность аппроксимации приближённым методом. В указанном диапазоне изменения коэффициентов вариаций погрешность приближённой аппроксимации относительно заданных моментов не превосходит 2.5% по 12 моментам, а в большинстве случае менее 1%. Поэтому, если погрешность аппроксимации существенно больше 2%, то это свидетельствует о малой информативности выборки.

Если погрешность приближённой аппроксимации порядка 20%, то погрешность моментов аппроксимирующего распределения по отношению к моментам реального распределения тоже примерно 20%. Вообще в интервале погрешности от 20% до 1% погрешность аппроксимации примерно совпадает с погрешностью моментов аппроксимирующего распределения по отношению к генеральным моментам. Это и позволяет в каждом отдельном случае судить от достоверности аппроксимации.

Мы проводим аппроксимацию в условиях избыточности параметров, поэтому в принципе мы получаем множество аппроксимирующих распределений с различными параметрами, но с общими 12 моментами. Мы полагаем, что реальное распределение единственно, поэтому и решение также должно быть единственным. Единственное решение получается путём перебора всех полученных и выбора наилучшего по критерию согласия Колмогорова. Эта процедура не вызывает затруднений, но она не гарантирует достижения глобального оптимума, поскольку оптимум найден по ограниченному множеству аппроксимирующих распределений.

В целом методика аппроксимации по малым выборкам достаточно трудоёмка, полный расчёт одного варианта занимает в среднем около одного часа машинного времени, поэтому собранный нами статистический материал применения, данный методики ограничен в объёме. Мы всего рассмотрели 70 различных примеров использования данной методики на машинных моделях. Сорок два результата содержатся в таблице 4.1. Остальные приводились ранее в тексте диссертации, или не приводились нами, поскольку были аналогичны уже рассмотренным. Специфика данной методики в том, что она позволяет оценить достоверность аппроксимации в каждом отдельном случае, что компенсирует малое относительно число экспериментов, на которые мы можем сослаться.

Таблице 4.1 приведены данные по аппроксимации моделируемых ГСЧ обобщённых распределений. При моделировании использовался стандартный ГСЧ Random фирмы Borland. Этот ГСЧ выдаёт серии псевдослучайных чисел, которые равномерно должны распределяться в интервале от 0 до 1. Но относительная равномерность наблюдается в сериях свыше 40 000. При малых выборках равномерности не наблюдается. Поэтому условия машинного эксперимента очень жёсткие. Реальные распределения аппроксимируются лучше.

В графах таблиц 4.1-4.2 верхнее значение процентов погрешность приближённой аппроксимации по отношению к оценкам генеральных моментов. Среднее значений процентов - погрешность метода в целом без применения принципа аналогии. Нижнее значение процентов - погрешность выборочных моментов, полученных по исходной выборке. Погрешности метода оценивались как максимальная погрешность по всем 12 моментам. При этом погрешность первых четырём моментов лежит пределах нескольких процентов практически во всех случаях. Погрешность существенно возрастает лишь к двенадцатому моменту. В тех случаях, когда в конкретных задачах не требуется большое число моментов, например, при моделировании СМО необходимо знать не более семи моментов, а для мало загруженных СМО или работающих со средними значениями коэффициентов загрузок можно обходиться двумя - тремя моментами [7, 10].

Похожие диссертации на Математические модели и методы оценки вероятностных характеристик реальных объектов при малых объемах экспериментальных данных