Содержание к диссертации
Введение
1. Обобщение вероятностной модели Бирибаума-Саундерса и его статистические свойства 11
1. Обобщенное распределение Бирибаума-Саундерса 11
2, Асимптотический анализ функции правдоподобия '. 24
3. Асимптотики распределения статистики Т 32
2. Статистические задачи обобщенной вероятностной модели Бирибаума-Саундерса 45
1. Оценка параметров 45
2. Выделение обратных гауссовских типов и распределения Бирибаума-Саундерса из семейства GBS-распределений 47
3. Выделение нормального распределения как предельного типа GBS и гамма распределений 54
4. Асимптотика необходимого объема выборки. Асимптотически (по параметру) точные оценки НОВ С2
Библиография
- Асимптотический анализ функции правдоподобия
- Асимптотики распределения статистики Т
- Выделение обратных гауссовских типов и распределения Бирибаума-Саундерса из семейства GBS-распределений
- Асимптотика необходимого объема выборки. Асимптотически (по параметру) точные оценки НОВ
Введение к работе
Выделение специальных семейств распределений из более богатого класса вероятностных моделей является классической задачей математической статистики, представляющей большую практическую ценность. Примером тому служат известные результаты о выделении нормального типа из семейств распределений, задаваемых рядом Грамма-Шарлье, проверка гипотезы отсутствия последействия (экспоненциальное распределение) в рамках модели старения и износа (гамма-распределение) или модели слабого звена (распределение Вейбулла). Наконец, более сложная задача - выделение распределений гамма и Вейбулла из обобщенного гамма-распределения. Однако, существует очень мало таких моделей, которые, с одной стороны, достаточно богаты, чтобы содержать как частные случаи известные одно и двухпараметрические семейства, и, с другой стороны, не являются чистой абстракцией, то есть имеют конкретный физический смысл. Поэтому построение новых моделей, обладающих вышеперечисленными свойствами, представляет несомненный теоретический и практический интерес. Обычно, в условиях, когда разработанная модель не обладает достаточными статистиками, применяется теория Ле Кама для построения асимптотически локально наиболее мощных (инвариантных) критериев выделения подсемейств из более общего семейства. Однако, если выделяемое семейство лежит на границе параметрического пространства общего семейства, то применение теории Ле Кама становится весьма нетривиальным и требует разработки новых методов построения критериев, а зачастую, и изменение понятия асимптотической оптимальности. Результаты в этом направлении могут послужить дальнейшим толчком в развитии теории статистического вывода и, таким
образом, являются актуальными в научном плане.
Основная цель диссертационной работы состоит в построении оптимальных критериев для выделения частных типов распределений (таких, как нормальное, обратное гауссовское, смещенное по долговечности обратное гауссовское, Бирнбаума-Саундерса) из общей вероятностной модели, происходящей от семейства распределений Бирнбаума-Саундерса. Разрабатываются новые методы асимптотического анализа мощностных характеристик критериев нормальности и планирования объема испытаний.
Наиболее важные результаты работы в кратком изложении выглядят следующим образом. Дано обоснование и предложено обобщение вероятностной модели (Jorgensen В., Seshadri V., Whitmore G.A., [37]), описывающей рост и развитие объектов под воздействием внешних факторов (рост организмов, развитие трещин при хаотических и циклических нагрузках, накопление усталости и т.п.); исследованы ее свойства. Дана содержательная трактовка физических процессов, лежащих в ее основе. Решена задача построения оптимальных критериев для выделения частных распределений из общего семейства. Для выделения распределений обратного гауссовского и смещенного по долговечности (length biased) обратного гауссовского при мешающем масштабном параметре и фиксированном значении параметра формы построены асимптотические локально наиболее мощные критерии, основанные на статистике вклада. В случае неизвестных значений всех мешающих параметров предлагается использовать критерий отношения правдоподобия. Поскольку гипотеза касается значения параметра смеси, то предельное распределение тестовой статистики может отличаться от хи-квадрат, - доказывается, что для данной задачи это распределение сохраняется. Особый интерес представляет проверка нормальности, что соответствует неограни-
ченному возрастанию параметра формы модели. При построении критерия и доказательстве его оптимальности имеет место полная аналогия с теорией Ле Кама асимптотически наиболее мощных критериев при локальных альтернативах, только вместо больших объемов выборки выступают большие значения параметра формы. Различаемые альтернативы являются близкими с точки зрения одинаковой скорости роста. Данный взгляд на проблему нов и неординарен, он расширяет понятие асимптотической оптимальности и позволяет строить оптимальные критерии там, где классическая теория оказывается бессильной. В качестве демонстрации разработанного приема проводится также проверка приближенной нормальности для пуассоновско-го и гамма распределений. Формулы для необходимых объемов выборок во всех перечисленных случаях имеют высокую точность, что подтверждается результатами статистического моделирования.
Рассмотрим теперь содержание диссертации более подробно.
Диссертация состоит из двух глав и семи параграфов. В первой главе вводится обобщенная вероятностная модель Бирнбаума-Саундерса и исследуются ее статистические свойства.
Первый параграф посвящен непосредственно построению модели и ее физическому обоснованию. Параметризация распределения Бирнбаума-Саундерса, отличная от предложенной авторами в (Birnbaum Z.W., Saunders S.C., [21]), позволила выявить интересные свойства данной модели, существенно расширяющие наши представления о специфике физических процессов, лежащих в ее основе. Анализ характеристической функции показал, что случайная величина, имеющая указанное распределение, представима в виде суммы двух независимых случайных величин, каждая из которых имеет собственное распределение. Первая случайная величина с вероятностью 1/2
принимает значение 0, тогда как другая половина вероятностной массы распределена по временной оси в соответствии с хи-квадрат распределением с 1 степенью свободы. Вторая случайная величина имеет обратное гауссов-ское распределение. Другими словами, распределение Бирнбаума-Саундерса есть равновесная смесь обратного гауссовского распределения и его свертки с гамма-распределением, параметр формы которого равен 1/2. Данный результат можно выразить в терминах "смещенного по долговечности" распределения (length biased distribution): распределение Бирнбаума-Саундерса есть ни что иное, как равновесная смесь обратного гауссовского и смещенного по долговечности обратного гауссовского распределений.
Таким образом устанавливается, что при справедливости модели распределения Бирнбаума-Саундерса разрушению образцов могут предшествовать различные по своей физической природе процессы развития трещины. Может случиться так, что глубина разлома изначально будет расти, следуя только за локальными максимумами траектории винеровского процесса с линейным сносом (в этом случае долговечность объекта будет определяться обратным гауссовским распределением), или же па этот процесс, (возможно, предшествуя ему) аддитивно накладывается другой по физической природе процесс, удлиняющий долговечность на величину, имющую гамма-распределение, параметр формы которого меньше единицы (такие гамма-распределения обычно используются при статистическом анализе данных о долговечности изделий, отказ которых вызывается дефектами их изготовления, а не процессами старения и износа).
В связи с этим предлагается более общая модель развития усталостных трещин: хи-квадрат распределение с одной степенью свободы заменяется на гамма-распределение общего вида. Можно также сделать различными
параметры масштаба у обратного гауссовского и гамма распределений , а также нарушить симметричность смеси, вводя весовой параметр р Є [0, 1].
В рамках этой модели мы полагаем, что ее гамма-составляющая отвечает за процессы, предшествующие развитию трещины и связанные с накоплением усталости, которая затем приводит к разрушению более твердого поверхностного слоя образца (поверхность часто подвергается специальной обработке - шлифовке, уплотнению и пр.) Тогда как р, в свою очередь, является параметром, характеризующим наличие в модели "хрупкой" составляющей (отражение того факта, что изделие может сломаться уже при первом в цикле нагружении).
К сожалению, введенное пятипараметрическое семейство оказывается слишком громоздким, поэтому дальнейшие исследования связаны с более простой моделью, ограниченной введением одного дополнительного весового параметра р [0,1]. Полученное семейство мы назвали обобщенным распределением Бирбаума-Сауидерса, или, более кратко GBS-распределением (сокращенно от Generalized Birnbaum-Saunders). Ради справедливости стоит отмстить, что первооткрывателями данного распределения нужно считать Jorgensen В., Seshdri V. и Whitemore G.A., в статье [37] которых это распределение вводится формально, без физических обоснований. Это же распределение изучалось с точки зрения оценки параметров в статье (Gupta R.C., Akraan И.О., [31]).
При р — 0 GBS-распределение вырождается в обратное гауссовское распределение, а при р — 1 - в смещенное по долговечности обратное гауссовское распределение. Дальнейшее изучение свойств полученного семейства показало, что случайная величина т, имеющая GBS-распределение, асимптотически (А -> со) нормальна со средним Ет = в(\ + р) и дисперсией
Dr = в2 (\-\-p(3 — p)). Указанный факт определяет проблематику и направление дальнейших исследований диссертационной работы.
В этом же параграфе вычисляются семиинварианты любого порядка предлагаемой общей модели и, в частности, GBS-распредсления.
Во втором параграфе проводится асимптотический анализ функции правдоподобия случайной выборки GBS-распределения и функция правдоподобия максимального инварианта. При п —> со параметр формы р заменяется на близкие к нулю либо к единице значения, выявляя тем самым асимптотические локально-достаточные по Ле Каму статистики. В результате показывается, что функция правдоподобия максимального инварианта при больших п, а также и А, асимптотически зависит от выборочных данных только
XjtYj ^%1. Это известная в статистических приложениях распределения Бирнбаума-Саундерса U-статистика (см. Pavur R.J., Edgeman R.L., Scott R.S. [43], где распределение этой статистики изучается в рамках обратного гауссовского распределения).
В 3 находятся асимптотики распределения статистики Т при п —> со и А -4 со. Устанавливается, что при соответствующих нормировках статистика Т в первом случае асимптотически нормальна, а во втором случае имеет асимптотическое распределение хи-квадрат с п — 1 степенью свободы. Приводятся числовые иллюстрации точности этих аппроксимаций.
Вторая глава посвящена решению статистических задач обобщенной вероятностной модели Бирнбаума-Саундерса.
Небольшой первый параграф посвящен оценке параметров GBS-распределения - теме, стоящей в стороне от основной проблематики диссертации. Исследуются некоторые свойства уравнения максимального правдоподобия и вычисляются оценки максимального правдоподобия для реальных данных,
приведенных в статье (Birnbaura Z.W., Saunders S.C, [22]). Устанавливается, что во всех трех случаях максимум функции правдоподобия достигается при значениях параметра смеси р, равных единице, так что цитированные авторами данные иллюстрируют не распределение Бирнбаума-Саундерса, а смещенное по долговечности обратное гауссовское распределение.
Оставшиеся три параграфа содержат основные статистические результаты диссертации.
В 2 строятся статистические критерии выделения обратного гауссов-ского и его смещенного по долговечности аналога из семейства GBS-pac-пределений. При известном А находятся асимптотические п —> со локально равномерно наиболее мощные инвариантные критерии, основанные на асимптотической нормальности статистики Т. В случае неизвестного значения всех мешающих параметров (в и А) предлагается использовать критерий отношения правдоподобия. Устанавливается, что предельное п —> со распределение статистики этого критерия есть хи-квадрат распределение с одной степенью свободы.
В 3 предлагается новый подход к построению асимтотически наиболее мощных критериев, специально предназначенный для типов распределений с областью притяжения нормального закона, когда один из параметров распределения стремится к бесконечности. Статистическая проблема состоит в проверки гипотезы о возможности замены исходного распределения нормальным, то есть проверки гипотезы о том, что параметр, отвечающий за асимптотическую нормальность, имеет достаточно большое значение. Развивается теория параметрической асимптотической наибольшей мощности критериев, параллельная теории Ле Кама с заменой п на А. В этом параграфе строятся асимптотически (А —У со) равномерно наиболее мощные крите-
рий выделения нормального типа из семейств GBS- и гамма-распределений. Естественно, такие критерии можно построить и для других семейств распределений, обладающих областью притяжения нормального закона.
В 4 строятся асимптотики объема выборки, необходимого для различения гипотез А > До и А < Аі (< Ао) о значении параметра формы гамма и GBS-распределепий с заданными ограничениями на ошибки первого и второго рода; асимптотический анализ проводит при А —> со, Xj/Xq = const. Полученные асимптотические формулы обладают тем свойством, что при больших гипотетических значениях параметра А они оценивают необходимый объем выборки с точностью до одного наблюдения. Приводятся числовые иллюстрации точности этих формул, подтверждающие справедливость теоретического результата даже при умеренных значениях До-
Таким образом, на защиту выносятся следующие результаты диссертационной работы.
Приводится физическое обоснование вероятностной модели обобщенного распределения Бирнбаума-Саупдерса и намечаются дальнейшие пути ее обобщения; вычисляются характеристики этого распределения и проводится асимптотический анализ функции правдоподобия максимального инварианта.
Строятся оптимальные критерии выделения специальных подсемейств этой модели: Бирнбаума-Саупдерса, обратного гауссовского, смещенного обратного гауссовского и нормального распределений.
Для ряда распределений с областью притяжения нормального закона предлагается новый подход к определению асимптотически наибольшей мощности критерия, приводящий к высокоточным асимптотическим формулам для необходимого объема выборки.
Асимптотический анализ функции правдоподобия
Сделаем небольшой обзор литературы, касающейся компонент GBS-распределения. Свойства обратного гауссовского распределения и область его применения обсуждаются в статье Tweedie М.С.К. [46] и монографиях Jor-gensen В. [36] и Chhikara R.S, Folks J.L. [26]. Стандартизированный вари ант (0 = 1) IG-распределения называется также распределением Валь-да. Последнее название часто используется в отечественных публикациях (см., например, таблицы Крапивина В.Ф. [11]), что, по видимому, связано с использованием этого распределения Вальдом А. при исследовании момента остановки последовательного критерия отношения вероятностей (см. Вальд А. [3]). Обзору свойств и приложений IG-распределения, а также решению статистических задач в рамках этой модели, посвящена монография Chhikara R.S. и Folks J.L. [25]; проблеме байесовской оценке А при сопряженном априорном распределении посвящена статья Pandey B.N., Malik H.J., Dubey Р.К. [41], библиография к которой существенно дополняет список публикаций по проблемам IG-распределения. Как отмечалось выше, свойствам BIG-распределеиия и статистическим выводам в рамках этого распределения посвящена статья Gupta R.C., Akman О. [32].
То обстоятельство, что BIG-распределение есть свертка гамма и IG распределений, указывает путь к обощению BS-распределения. Функцию плотности BS-распределения можно представить в виде что позволяет нам сформулировать
Предложение 1.1. Случайная величина г, имеющая BS-pacnpe-деление, представимо в виде суммы двух случайных величин: г — т\ + т , где Т\ имеет распределение, у которого половина вероятностной массы сосредоточена в точке х = 0, а другая половина "размазана" по положительной оси в соответствии с гамма-распределением G(x/2d; 1/2); случайная величина Т2 имеет IG-распределение W(x/9; А). BS-распределение является также смесью IG-распределения и свертки этого распределения с гамма 19 распределением, параметр формы которого равен 1/2 ( смещенное по долговечности IG-распределение ).
Таким образом, при справедливости модели BS-распределения разрушению образцов могут предшествовать различные по своей физической природе процессы развития трещины. Может случиться так, что глубина разлома изначально будет расти, следуя только за локальными максимумами траектории винеровского процесса с линейным сносом, или же на этот процесс, (возможно, предшествуя ему) аддитивно накладывается другой по физической природе процесс, удлиняющий долговечность на величину, имго-щую гамма-распределение, параметр формы которого меньше единицы (такие гамма-распределения обычно используются при статистическом анализе данных о долговечности изделий, отказ которых вызывается дефектами их изготовления, а не процессами старения и износа). Можно допустить, что вероятностная модель каким-то неведомым нам образом учитывает начальное состояние поверхности образца и, продолжая фантазировать в том же духе, заменить значение 1/2 параметра формы гамма-распределения на произвольное, сделать различными параметры масштаба у распределений IG и гамма, а также нарушить симметричность смеси, введя весовой параметр р Є [0, 1]. Полученное таким образом распределение, зависящее от пяти параметров, мы называем обобщенным распределением Бирнбаума-Саундерса (коротко - GBS-распределение); его характеристическая функция Pc{t) = [(1 - р) + р(1 - 2i i)-Al] ехр {А2 (І - ч/1 - 2Й02) }
В рамках такой обобщенной модели мы полагаем, что ее гамма-составляющая отвечает за процессы, предшествующие развитию трещины и связанные с накоплением усталости, которая затем приводит к разрушению более твердого поверхностного слоя образца (поверхность часто подвергается специальной обработке - шлифовке, уплотнению и пр.). Аналогичные рассуждения приводятся в четвертой главе монографии Богданоффа Дж. и Козина Ф. [1] при статистическом анализе данных долговечности с помощью нестационарных марковских моделей. Анализируемые при этом реальные данные представляют выборку из бимодального распределения, причем компоненты смеси соотносятся с различными состояниями поверхности испытуемых образцов. GBS-распределение также бимодально, если параметр формы гамма-составляющей резко отличается от параметра формы IG-распределения. Возможно, что анализ данных, приведенных в указанной монографии [1], в рамках модели GBS-распределения прольет новый свет на физическую природу усталостных испытаний, - подгонка марковскими моделями, как бы точно она ни соотвествовала выборочным данным, носит чисто формальный характер и соответствие достигается за счет увеличения числа параметров модели, к тому же переходные состояния марковской цепи не идентифицируются с возможными этапами развития трещины.
Обобщенное распределение Бирибаума-Саундерса (GBS-распределение) в дальнейшем будет обозначаться как GBS (#i, 62 , Ai, А2; р); при р — 1/2, 9\ = Q2 = 9, Xi = 1/2, А2 = А оно превращается в обычное распределение Бирнба-ума-Саундерса: BS(0;A) =GBS (9,$; 1/2, А; 1/2). GBS-распределение представляет собой смесь IG-распределения W{xj62\ А2) с весом 1— р и свертки этого распределения с гамма-распределением G{x/20\\ \\).
Асимптотики распределения статистики Т
Сначала изучим предельное распределение статистики Т при объеме выборки п — оо. Естественно, это нормальное распределение, и в качестве нормирующих констант следует использовать среднее значение и стандартное отклонение Т. Утомительные вычисления, которые мы опускаем, с использованием формул для моментов случайных величин X и Х-1 (см. предложения 1.2 и 1.4), приводят к следующему результату.
Предельное распределение нормированной статистики Т при п —ї оо находится стандартными для U-статистик методами. Справедлива Теорема 1.1. Яусть д = п2Л-2(А+р)(А + 1-р), a = n 2X-2y/2X2 + А(-V + Ар + 1) + (-4р + 8р3 - 7р2 + Зр). Тогда limPA,p ( - )= п-їоо [ (J J где Ф(ж) - функция распределения стандартного нормального закона. Доказательство. Представим нормированную статистику Т в виде Г = 1 , вд + «!т1 + Щ1 + ж 1 (L14) a a a a a где № = ЕТ2, аз /ОД, о-1 a-i
Заметим, что нормирующие константы /І И а есть главные по п члены среднего и стандартного отклонения случайной величины Т.
При выбранной нормировке разложение (1.14) можно представить в виде Т = afi + Ь% + 4=. (1.15) V» где множители а, 6 и с не зависят от п. Случайные величины 7\ и Т2 в силу центральной предельной теоремы асимптотически распределены по двумерному нормальному закону с нулевым вектором средних, единичным вектором дисперсий и коэффициентом корреляции Х+р2 -р р Д ТЩх ТТЩ 34
Следовательно, последнее слагаемое в (1.15) сходится по распределсшо к нулю при любых фиксированных А р, так что Т имеет то же предельное распределение, что и случайная величина TJ = аТі+бТг, которая, очевидно, нормальна. Непосредственные вычисления показывают, что Е77 = 0, a DT/ = 1.
Асимптотическое распределение статистики Т в случае Ю-распределе-ния (р 0), особенно при нулевом значении его параметра /5, требует особого рассмотрения. Сразу же заметим, что проблема проверки гипотезы об отсутствии сноса винеровского процесса хорошо изучена (см., например, Chhikara R.S., Folks J.L. [25], Jorgensen В. [36]); исследовалось также и распределение статистики Т (Pavur R.J., Edgeman R.L., Scott R.S. [43]). Мы приводим здесь вывод предельного совместного распределения нормированных статистик Ті и 7г и исследуем асимптотическое распределение нормированной статистики Т в случае /3 = 0 с целью полноты изложения рассматриваемой общей проблемы и иллюстрации общего подхода к асимптотическому анализу распределения статистик, у которых не существуют моменты.
Решение этих задач, а также исследование предельного распределения статистики Т при А — оо, основано на асимптотическом анализе совместной характеристической функции статистик Ті и Т . То, что предельное распределение статистики Т есть хи-квадрат распределение с п — 1 степенями свободы, известно - смотрите, например, статью Linhart Н. [39]. Ниже приводится подробный вывод этого распределения, который позволяет судить о виде зависимости остаточного члена от п. Это обстоятельство оказывается важным при выводе асимптотик для объема выборки, необходимого для различения гипотез о больших значениях параметра А (проверка гипотезы нормальности).
Доказательство. Совместная характеристическая функция случайных величин X и 1/Х устанавливается с помощью тех же выкладок, что и при выводе характеристической функции BS-распределєния (см. начало 1):
Обратимся теперь снова к IG-распределению, функция плотности которого индексируется параметром /3 в форме (1.11). Если /3 ф О, то полученные выше результаты после перепараметризации в я/3 2, А = /3 позволяют утверждать, что при а = 1 и /? = О Е21 = п/3"\ ЕТ2 = n(/3 + 1) DTi = n/r3, DT2 = n(/3 + 2), а совместная характеристическая функция статистик ТЇ и Т2 равна щ = (1 - 2ii2)-"/2exp {n/3 - nv/(l-2if2)(yS2-2iii)} Если же /3 = 0, то у статистики Ті моменты не существуют, ЕТ2 = п, DT2 = 2гг и Vo( i, 2) = (1 - 2if2)""/2exp {-п / 2ііі(1 - 2tt2)} . 1.16)
Теперь нетрудно убедиться, что справедлива
Теорема 1.2. Если @ 0,то статистика Т асимптотически нормальна со средним n2{(5 + 1)//3 и дисперсией n3(2/3 + 1)//33. Если же /3 = 0, то нормированные статистики Ті = Т\/п2 иТ2 = (Т2—п)/л/2п асимптотически {п — со) независимы, Т2 асимптотически нормальна (0,1), а распределение Ті при любом фиксированном п совпадает с распределением наблюдаемой случайной величины (Ю-распределсние (1.11) с (3 — 0 и a = lj. Асимптотика распределения статистики Т определяется соотношением Iim Р {Т/п3 я} = 2 (1 - Ф{\/у/х))
Доказательство. Первое утверждение теоремы есть частный случай утверждения теоремы 3.1. Второе утверждение теоремы, относящееся к асимптотике совместного распределения статистик Ті и Т2 при /3 = 0, вытекает из вида совместной характеристической функции нормированных статистик Ті и Гг ( см. (1.16)) . .. п п ( 2 \ / 2Й1 / 2Й2 ехр - - 2Ч1 - т у" nv v1" ж достаточно перейти к пределу при п — со в этом выражении. Наконец, утверждение об асимптотике распределения статистики Т/п3 вытекает из следующего асимптотического представления этой статистики, полученного по аналогии с построениями в доказательстве теоремы 3.1, когда ji = 0, а = п3, Ці — О, (Т\ — п2, \i2 = n, cr2 = s/2n: Т [2 - = \ -ТіТ2Л-Ті. пй V п После этого представления асимптотика распределения Т становится совершенно очевидной, если заметить, что статистика T\jn2 имеет при /5 = 0 то же распределение, что и наблюдаемая случайная величина г, - характеристическая функция г при /3 = 0 равна ехр {—л/—2it}.
Выделение обратных гауссовских типов и распределения Бирибаума-Саундерса из семейства GBS-распределений
Если из этой системы двух уравнений найти Ао — А и во —0, а результат подставить в разложение статистики Q, то мы получим представление Q в виде: Q = (р -Ро)2ІГЇ + Ор (l/y/n), где Ij I элемент матрицы, обратной к информационной матрице Фишера. Это представление обеспечивает предельное распределение хи-квадрат с одной степенью свободы для тестовой статистики Q.
Таким образом, этот результат останется справедливым и в нашем случае, если первые логарифмические производные z с } fi обращаются в нуль в точке І6, \,р). Это, очевидно, так для производных по А и 9 при любом значении р [0, 1]. Что же касается производной по р, то достаточно убедиться, что она обращается в нуль в точках р 0 и 1.
Действительно, если р = 0, то уравнение максимального правдоподобия имеет явное решение: п \ п / в данном случае используется оригинальная параметризация GBS-распределения, при которой функция плотности f(x) = (1 — p)fi(x) + /2(2:), где h(x) - fi{x\9tXtP) = jj=(e/x)Wexp - (у/в/Б- У/Ф)2) , h{x) = f2(x І Є, A,p) = 0/ 2 exp {- (v - V ) Нетрудно убедиться, что и, подставляя в правую часть приведенные выше оценки А, в, получаем нуль. Случай р = 1 рассматривается аналогичным образом.
Таким образом, решается задача выделения трех основных типов из семейства GBS-распределения: Бирпбаума-Саундерса (р = 0.5), обратного гауссовского (р — 0) и смещенного по долговечности обратного гауссовского типа (р = 1) при неизвестных значения параметров X к в. Если же значение параметра А известно, то можно воспользоваться результатами 2 Главы 1, из которых следует, что инвариантные относительно масштабных преобразований оптимальные критерии проверки ряда сложных параметрических гипотез, касающихся спецификации частных случаев GBS-распределения, должны быть основаны на статистике Т. Так, критическая область Т с определяет локально наиболее мощный инвариантный критерий проверки гипотезы HJG р — 0 (выбор производится из IG-распредслепия) при альтернативе KIQ : р 0 и известном значении параметра А. Критическая область Т с определяет аналогичный критерий проверки гипотезы HBIG P = 1 (выбор производится из смещенного по долговечности IG-распределения; в дальнейшем, коротко, BIG-распределение) при альтернативе Квю : р 1 и также известном значении параметра А.
Эта же область задает равномерно наиболее мощный инвариантный критерий проверки гипотезы HQ : /3 = 0 об отсутствии сноса винеровского процесса, определяющего вероятностную модель развития трещины, когда альтернативе Кр соответствует утверждение о том, что выбор идет из IG-распределения с произвольным положительным значением параметра формы /3 IG-распределения.
Наконец, критическая область Т с определяет критерий проверки гипотезы "нормальности" Ну : А AQ( 1), который обладает хорошими мощностными свойствами при любых (конечных) объемах наблюдений п и близких к точке А = А0 альтернативах К\ : А А0, причем критерий является не только инвариантным относительно масштабных преобразований, но также "нивелирует" влияние параметра р, когда Ао — со. Точные асимптотические утверждения, касающиеся этих критериев, и приближенные формулы для его мощностных характеристик, устанавливают следующие теоремы, в которых а фиксированный уровень значимости.
Теорема 2.2. Критерий Т с, где с = с(а) = tany/n(2\2 + А)/А2 + n2(A + 1)/А, tQ = Ф_1(1 - а). (2.1) является асимптотически локально равномерно наиболее мощным инвариантным критерием уровня а проверки гипотезы Ню : р — 0 при конти-гуальных альтернативах KJG : р = u/y/n, если А фиксировано, а в - мешающий параметр. Асимптотическая (п —) со) локальная мощность этого критерия m{u) = lim Ри/ллг{Т с} = 1 - Ф (ta - w/\/2A2 + л) . 2.2)
Критерий Т с, где с = с(1 — а) (см. (2.1)) является асимптотически локально равномерно наиболее мощным инвариантным критерием уровня a проверки гипотезы Ну р = 1 при контигуальных альтернативах Ку : р = 1—u/y/n, если А фиксировано, а 9 - мешающий параметр. Асимптотическая локальная мощность этого критерия равна (см. (2.2)) 1 - т(«) = Пт P ufVH{T с} = Ф (іг-a - U/\/2A2 + A) .
Доказательство. В силу теоремы 1.1 статистика Т при р — О асимптотически нормальна со средним JIQ = n2(X + 1)/А и стандартным отклонением CTQ — ns/n(2\2 -f А)/А2, откуда немедленно следует формула (2.1) для критической константы с, обеспечивающей асимптотический уровень а.
Асимптотика локальной мощности (2.2) получается с помощью перенормировки статистики Т на параметры р,Р и ир ее асимптотической нормальности при альтернативе, когда р = u/y/n: При П —» СО ffp _ . /2А2 + \{-4u2/n + 4«/V» + 1) + 0(іД/п) _ (г0 V 2А2 + А a / — МО —и2/л/тг + « г а0 л/2А2 + А л/2А2 + А 53 что дает выражение (2.2) для предельной мощности. Отметим, что т{и) есть возрастающая функция и, так что оптимальность критерия в указанном смысле следует из теоремы б Л книги Руссаса Дж. ([14], глава 4, 6, стр.128-131).
В случае проверки гипотезы HBIG при альтернативе KJJIG достаточно воспользоваться симметричностью вхождения р и 1 — р в формулы, определяющие параметры р, \\ о асимптотической нормальности статистики Т (см. теорему 1.1), и учесть то, что объединение критических областей обеих критериев совпадает с выборочным пространством.
Отметим, что попытка использования критерия, основанного на статистике Т, в проблеме различения гипотез р = 0 и р — 1 при неизвестных значениях параметров А и 9 терпит неудачу. Поскольку наши критерии при известном А асимптотически наиболее мощные в первом порядке, то подстановка вместо А оценки максимального правдоподобия при справедливости нулевой гипотезы превратит тестовую статистику в константу (в этом легко убедиться с помощью непосредственных расчетов). Это происходит из-за того, что статистика Т является тестовой как для проверки гипотез относительно р, так и относительно А. В качестве альтернативы можно предложить использовать другие тестовые статистики, а именнно Тз = Хл 1 Для проверки гипотезы р — 1 и Т — Y [ fc2 для гипотезы р — 0.
Асимптотика необходимого объема выборки. Асимптотически (по параметру) точные оценки НОВ
Необходимый объем выборки (НОВ) при различении двух гипотез определяется как наименьший объем наблюдений, при котором существует критерий различения этих гипотез, гарантирующий заданные ограничения на вероятности ошибок первого и второго рода. Существуют два основных подхода асимптотического анализа НОВ: подход, основанный на стремлении к нулю определенной меры близости гипотез, и исследование асимптотики НОВ при стремлении к нулю заданных ограничений на вероятности ошибок. Первый подход осуществляется в рамках лекамовской теории локальной асимптотической нормальности и использует меры контигуальной близости различаемых гипотез, в то время, как второй основан на теории больших уклонений для сумм независимых случайных величин. Оба этих подхода подробно излагаются и реализуются в обзорной статье Володина И.Н. и Новикова Ан.А. [6]. Синтез этих подходов, использующий схему асимптотического анализа, в которой одновременно происходит как сближение гипотез, так и стремление к нулю ограничений на вероятности ошибок, представлен в работе Боровкова и Могульского [2].
В нашей работе рассматривается еще один подход к получению асимптотических формул для НОВ, который не претендует на широкую область его применений, но приводит к исключительно точным асимптотическим формулам: асимптотическая ошибка в определении НОВ не превосходит единицы наблюдений. Основное применение подхода связано с проверкой возможности аппроксимации распределения, из которого берется выборка, нормальным законом, и применимо к распределениям, принадлежащим области притяжения нормального закона, таким как биномиальное, Пуассона, гамма, Бирнбаума-Саундерса и т.п. Такого рода распределения зависят, кроме прочих, от некоторого параметра Л, при стремлении которого к бесконечности распределение аппроксимируется нормальным законом. В связи с этим может возникнуть задача проверки гипотезы А Ло при альтернативе А Лі ( Ло). Предлагается исследовать, асимптотику НОВ, когда о, Аі — со. При этом, как и в лекамовской теории, можно ввести аналоги контигуальных альтернатив и строить асимптотически локально наиболее мощные критерии, соотвествующие при больших значениях Ло и Лі критериям, на которых достигается (асимптотически) НОВ.
Пусть Л - параметр формы GBS или гамма распределения. В этом параграфе мы будем решать задачу определения наименьшего объема выборки, при котором существует критерий различения гипотез Л Ло и Л Лі с заданными ограничениями а и /3 на вероятности ошибок первого и второго рода. Рассмотрим асимптотики НОВ при Ло —У оо и Лі = UXQ, где и = const. Критерий, соответствующий НОВ для параметра гамма-распределения, основан на статистике S, определенной в 3 главы 2 как (2.9). Что же касается GBS-распределения, то здесь мы имеем критерий, основанный на статистике AQ (Т — п2) /п, мощность которого асимптотически (при больших значениях параметра А) эквивалентна мощности критерия, соответствующего НОВ (см. Теорема 2.4). Рассуждая по аналогии с 1.2 статьи (Володин И.Н., Новиков Ан.А. [6]), можно высказать предположение, что асимптотика НОВ в случае GBS-распределения будет основана на хи-квадрат аппроксимации этой статистики. Поскольку для обоих распределений имеется одна и та же хи-квадрат аппроксимация для тестовых статистик, отвечающих за асимптотику НОВ, будем обозначать обо тестовые статистики одной и той же буквой S. Асимптотику НОВ устанавливает
Теорема 2.5. Пусть п = п (а, /?; Ао, Ai) - объем выборки, для которого существует критерий различения гипотез А Ао и А Ai = UXQ С ограничениями на вероятности ошибок первого и второго рода а и (3 соответственно. Тогда \п — п\ 1, для всех достаточно больших XQ И Х\, где n = n(a,P\u) есть наименьшее целое, удовлетворяющее неравенству
Доказательство. Покажем сначала, что при Ао — со и u — const наименьшее п = п(а, /3; и), при котором Рд0 (5 с) а и Рд} (S с) /?, ограничено. Необходимость доказательства ограниченности НОВ вызвана ухудшением точности хи-квадрат аппроксимации при больших значениях п как для гамма-, так и для GBS-распределения.
Из формул для средних значений и дисперсий статистики S, как в случае гамма-распределения (Володин И.Н., [4]), так и в случае GBS-распредслсния (см. предложение 1.7 из 3 первой главы), вытекает, что средние значения и дисперсии этих статистик имеют вид соответствующих моментов распределения хи-квадрат с п — 1 степенью свободы, умноженных на некоторые ограниченные функции от Аг-, і = 0,1 и п, мало отличающиеся от единицы при больших Aj, г = 0,1 и п.