Электронная библиотека диссертаций и авторефератов России
dslib.net
Библиотека диссертаций
Навигация
Каталог диссертаций России
Англоязычные диссертации
Диссертации бесплатно
Предстоящие защиты
Рецензии на автореферат
Отчисления авторам
Мой кабинет
Заказы: забрать, оплатить
Мой личный счет
Мой профиль
Мой авторский профиль
Подписки на рассылки



расширенный поиск

Некоторые задачи статистического вывода для конечных совокупностей Тимонина Елена Евгеньевна

Некоторые задачи статистического вывода для конечных совокупностей
<
Некоторые задачи статистического вывода для конечных совокупностей Некоторые задачи статистического вывода для конечных совокупностей Некоторые задачи статистического вывода для конечных совокупностей Некоторые задачи статистического вывода для конечных совокупностей Некоторые задачи статистического вывода для конечных совокупностей Некоторые задачи статистического вывода для конечных совокупностей Некоторые задачи статистического вывода для конечных совокупностей Некоторые задачи статистического вывода для конечных совокупностей
>

Данный автореферат диссертации должен поступить в библиотеки в ближайшее время
Уведомить о поступлении

Диссертация - 480 руб., доставка 10 минут, круглосуточно, без выходных и праздников

Автореферат - 240 руб., доставка 1-3 часа, с 10-19 (Московское время), кроме воскресенья

Тимонина Елена Евгеньевна. Некоторые задачи статистического вывода для конечных совокупностей : ил РГБ ОД 61:85-1/199

Содержание к диссертации

Введение

Глава I, Точечное и интервальное оценивание для конечных совокупностей, размер которых неизвестен 28

1.1. Обобщенная схема выбора и достаточная статистика для нее 28

1.2. Оптимальное оценивание параметрических функций .. 34

1.3. Оценка максимального правдоподобия 38

1.4. Линейное оценивание параметрических функций 42

1.5. Доверительное оценивание размера совокупности... 46

Глава II. Асимптотическая теория оценивания 48

2.1. Статистические выводы, основанные на асимптотической нормальности линейных оценок 48

2.2. Асимптотические статистические выводы ( продолжение ) 56

2.3. Асимптотически оптимальная оценка ( выбор без возвращения ) 61

2.4. Асимптотически оптимальная оценка ( выбор с возвращением ) 71

2.5. Эффективность оценивания размера совокупности... 78

Глава III. Некоторые специальные задачи оценивания для конечных совокупностей 82

3.1. Оценивание параметрических функций для конечной совокупности, состоящей из неизвестного числа классов одинакового объема 82

3.2. Оценивание вероятности появления нового элемента при выборе из конечной совокупности 93

Литература 105

Приложение

Введение к работе

В ряде прикладных задач, возникающих, например, в биологии, социологии, лингвистике, и связанных с выборочным обследованием конечных совокупностей, часто имеют дело с ситуацией, когда число элементов (объем) N исследуемой совокупности ЪС является априори либо неизвестной величиной, либо о нем известно лишь, что его значение находится в некоторых заданных пределах А/± А/*

4 /V,. В этом случае естественно возникают задачи получения тех или иных статистических выводов (построение точечных оценок, расчет доверительных интервалов, проверка статистических гипотез) относительно как самого неизвестного параметра /V , так и произвольных параметрических функций z(A/) от него, на основе имеющейся статистической информации об U . Такая информация представляет собой обычно выборку элементов из ЪС » извлеченную по некоторому заданному стохастическому закону,и, естественно, решение соответствующих задач существенно зависит от типа этого закона. Чаще всего в приложениях имеют дело со схемами повторной и бесповторной выборки с фиксированным или случайным объемом. Достаточно общая схема выбора может быть описана следующим образом: из совокупности извлекается 6? 2, независимых выборок объемами

Гц* ґп* соответственно (т в ЇШМС Ґґіі ^ /V), каждая из которых получена по схеме простого случайного выбора без возвращения (любая из С# 1 возможных комбинаций элементов совокупности может быть извлечена с равной вероятностью). В дальнейшем такую схему будем для краткости обозначать символом 1^ (/ZJS - 1^(/2^/72^...,/) (здесь /г= /Пл + ---+/П^ -общий объем выборки) и называть обобщенной схемой выбора. Обозначим че-ре3=/4(^) число элементов совокупности, каждый из которых вошел.ровно в 2 некоторых выборок, 1 = 0,i} ...j -і , а через ty = 1р(/г)~ lUs* + ft< ~ шоло различных элементов совокупности в выборке.

Частным случаем схемы І^уҐі) при fns =:ІҐПІ} 3 = И> , является классическая схема простой повторной выборки объема Jb , когда каждая из /V возможных комбинаций элементов совокупности может быть извлечена с равной вероятностью N . Для этого случая можно представлять себе (и на практике это часто реализуется), что выборка формируется последовательно, в /& этапов, причем на каждом этапе из совокупности с равной вероятностью и независимо от предистории может быть извлечен любой из А/ ее элементов (объем выборки It может быть как фиксированным, так и случайным, определяемым некоторым правилом остановки). Далее такую схему будем обозначать кратко символом А \Щ » а случайные величины, аналогичные введенным выше для схемы 1^ \ft>) , обозначим f^/tiC?1), t = 0,A-,1j У'^УХ1*)-

Имеется большое число работ как математических, так и сугубо прикладного характера, посвященных задаче оценивания неизвестного размера конечной совокупности (их список только за последние несколько лет насчитывает несколько десятков названий), в которых рассматриваются те или иные статистические эксперименты (как укладывающиеся в описанные схемы выбора, так и весьма специфические), "высвечивающие" некоторое случайное подмножество элементов совокупности %t . Не претендуя на исчерпывающую полноту изложения, дадим краткий обзор соответствующих результатов, ограничившись, в основном, работами, примыкающими к тематике диссертации.

Схема Л(щ . Данная схема выбора рассматривалась в работах [2, 12, 15, 19-22, 24-26, 28-30, 33, 34 ] . В [Ї2, 15, 20-22, 25, 26, 28, 29, 33, 34] предполагается, что число испытаний (объем выборки) /2, фиксирован, а в работах [2, 19, 24, 29, 30] рассматриваются последовательные процедуры, в которых ҐІ является случайной величиной, определяемым некоторым правилом остановки. Б L29J предлагаются следующие планы прекращения выборочного обследования (правила остановки).

План А. Объем выборки /2, фиксирован.

План В. Задано целое число В . Момент остановки П= ҐІ определяется условием: л* - ^К)= в.

План С. Задано целое число С . Момент остановки /2 - /2С определяется следующим соотношением

План Д. Выбирается число 2); - о < Ю * ^. Момент остановки hi = ҐІ имеет вид: іг^* м$> {^: it-y(fy* тая, (і, ffo)&?tty+tyPfy-

План Е. Задана последовательность чисел Ч); такая, что -&т> Я)у = ж . Момент остановки /=/ определяется следующим образом: ^ fiE = onf\hi- П-п(п) * тж(і, fafa я'(/і)+%{/г) У(п]

Оценка максимального правдоподобия (о.м.п.) N ~ /V(# (^/2),/2) для /V , как показано в [29] , не зависит от правила остановки и приближенно равна N _j /sbf/i~\\ > Ц) где Ш0 () - функция обратная к ftl0 (oi) = (У- Є )/^ Таблицы для вычисления ftl0 (^J приведены в [Д2 ] .

Перечислим основные результаты, полученные при использовании указанных планов выборочного обследования.

План А. Распределение статистики 10 = ff(h) в данном случае имеет вид PN (f-к) - (N)KS(K, N)N~* К-1,2,..., шн(л,А/\ где S(tn} /С) - числа Стирлинга 2-го рода, (A/)^s N(A/-i)-(N-K+І). Для такой схемы в [22] найдена о.м.п. N= ЙЫ, /г) для N , определяемая из условия &(",%')* *>* 3i(^>?'l

В [22J приведена также таблица наименьших целых, больших или равных Д (^Ч/ Ч » да3 t = 1(1)50, J = 1(1)20 , позволяющая находить N для тех случаев, когда значение статистики 7? не превосходит 50.

В работе [2l] предлагается более простая оценка /V для N /V*- "у'1г(ь-/*1У и показывается, что потеря эффективности при использовании /V вместо N мала.

Как показано в работах [20] и [2б] , случайная величина у является полной достаточной статистикой для параметра N , и оптимальная, т.е. несмещенная с минимальной дисперсией, оценка N*N(tf) ддя /V существует лишь в случае, когда ft? А/ , и имеет вид

Асимптотическое поведение данной оценки исследовано в работеJ25], где показано, что при /, /V—> <*», /z/V-» с> ? с вероятнос ть10 I , ЙАЧ , ./ч\ и /%0 (} определено в (I).

Некоторые вопросы доверительного оценивания параметра А/ рассматривались в работах [26] и [33] .

Б ряде случаев требуется оценить не сам неизвестный параметр /V , а некоторую параметрическую функцию t{N) . Такая задача рассматривалась в работах [15, 28, 34] .

Пусть JL обозначает популяцию, состоящую из некоторого числа различных видов, pi - вероятность того, что случайно выбранный из Л объект принадлежит L -му виду, -лД/^)- число объек- тов L -го вида, оказавпшхся в извлеченной из JL выборке объема /2-(^=^^...) , наконец, - условная вероятность ( при заданных Xi(h)t с =1,2.,... ) того, что в дополнительном (/2.-/-і) -м испытании будет обнаружен новый вид ( здесь ~Ц")- индикатор ). Предполагается, что как число видов, так и вероятности р± Рг)... , неизвестны, и рассматривается задача предсказания ненаблюдаемой величины Ц^ на основе информации, доставляемой расширенной выборкой объема /Ъ+ /71 ( к исходной выборке добавляются результаты /%?і независимых испытаний ). Пусть /if (/Ь+Ґґі) - число видов, каждый из которых имеет в расширенной выборке ровно К представителей, /К-1,2,.. .., п>+т .

В работе [28] показано, что оценка является "хорошим" предиктором для ип в том смысле, что и ,-/,,. .,,-чг , ч-і

В [34] вводится класс линейных относительно J4K {/1+/9Z), К=1,2Г.. ..,/2+/71, оценок и показывается, что в этом классе существует един- ственная статистика. к=± о среднее которой совпадает с U^ . миним

Случай /э±= = /DN = А/ (здесь /V - число видов) рассматривается в работе [15] , в которой строится несмещенная оценка с альной дисперсией (н.о.м.д.) для ?(/Vj= 9^ , имеющая вид к S(n+K,l'-d) (здесь # = -y'f/if/n)** //J(w/n)+ "+ М ' (/1+/71)- полная достаточная статистика для N ).

В этой же работе исследовано асимптотическое поведение оценки 1Л> при / /V—^ ; /г/zV' -* cLt CXoL^ & f и показано, что с вероятностью 1 W - е UmJ + (РЦ), где 7/їо f-\ определено в (I).

План В. Распределение числа испытаний / до момента ос- ————« g тановки для данного плана выборочного обследования получено в работе [29] : VN(vк) = (N\_B (к-ъ)6(к-в, к-х)М,*к-Ц вн,..., b+n.

В этой же работе исследовалось асимптотическое распределение ТЬ и о.м.п. N = ^ (У'(*%), ft ) W151 N и показано, что tmv P„(2BNB/N±xyFZB(x),-±x* - где F2B (x) - функция распределения эис -квадрат с 2В сте" пенягли свободы ( Y (ZB)j

В работе [24Jпоказано, что'^=9(^3) являегя полной достаточной статистикой для параметра N и существует н.о.м.д, /V = N^(/h\ для А/ , которая имеет вид где РЛ и р полиномн ог V степени 2B-J. другое выражение для N& получено в [21] : г ^' ЩК*)'' а в [25 ] исследовано асимптотическое поведение данной оценки в предположении, что /V -^ о , В - фиксировано. В этих условиях с вероятностью I

План С. Распределение числа испытаний tt до прекращения выборочного обследования в данном случае имеет вид [29] : где <ХУ - наименьшее целое, большее или равное X , и $с(Х) определяется следующим рекуррентным соотношением: ту-1, %(м)-і-2ісі(і) %(j),ju. Г'1 А/

Для данного плана также существует н.о.м.д. для /V , являющаяся функцией от статистики у (^Л Асимптотическое распределение ftc и о.м.п. А/с = /Ус (rfOl) їіЛ изучены в этой же работе : где $Р(х) - функция распределения стандартного нормального закона, /пс =/пі1 ((С+1)'1) , ЄІ= /пс (Ш-/?1С) (/пс-С)~* и /?2~ (^)- определено в (I).

Планы Д и Е. При использовании плана Д, как показано в [19], для любого oLt О ^ оС< і , можно найти такое ?) , что равномерно по N

Асимптотическое распределение /^ и о.м.п. Л^~ ^v? \^ъ)і ^ъ) для N получено в работе [29J:

Ф* :^(/^ =/Vv'^jW^7/"- /=^---, где И = Є и [ 3?J - целая часть числа Я2 .

Для плана Е - II - fan, Шив-Ы)~1. /V-> oo

Сравнение планов В, С и Д с точки зрения эффективности оценивания параметра N проведено в [30].

Схема Js (ft). Частный случай такой схемы для двуступеячатого выбора (1 =Z) , рассматривается в работах Гю, 17, 32, 35І. О.м.п. A/ = N(ti) для /V находится из соотношения [17] : №<_ ГПъ і Л */V< Л + і и является смещенной оценкой. В этой же работе предложено использовать оценку которая, как показано в [35] , при ҐІЇ N является несмещенной. Ее смещение при Ґ1< N равно и iN-*> о при m±mz/N -

Если (fZ N , то несмещенной оценкой для дисперсии Nt является статистика ^. (Ч^)(mz+i)(f?irA)(toz-А) .

Схема двуступенчатой выборки рассматривается и в работе [32], в которой предполагается, что между первым и вторым выбором возможна потеря "метки" с вероятностью В = 1~~ & , при этом каждый объект теряет свою "метку" независшло от других ( объекты, извлеченные на 1-ом этапе метятся и возвращаются в совокупность ). Обозначим ҐІ и Ґі0 = А/ - /Z число элементов во второй выборке, которые сохранили и потеряли свои "метки" соответственно. Заменяя в выражениях для ЛЛ и (ґ М на / получаем оценки /V л J- J 2. Т 7* и 1ґ соответственно. Показано, что

Е'/Vr = N+J$N t где уЗ = Єс/(і-90).

Рассматривается также влияние потери "метки" на дисперсию Nr и обсуждается схема, когда ҐҐІ. и /?2 являются биномиальны-ми случайными величинами.

Б работах [13, 14, 16, 20, 24, 27, Зі] рассматривается случай 3^2 . Как показано в [27] , распределение статистики 7? имеет вид Ы. СІІ1СЧЖ П С% и н.о.м.д. для /V , являющаяся функцией от w , определяется следующим образом: і П Ґс- S.fi Г*'+ Шпг*

В случае /2^/V для /V также существует н.о.м.д., имеющая вид ас- . - ІЗ -

Асимптотическое поведение ( при N hit "^ > ^«' /N ~ =Соіїа Is-fA ) среднего и дисперсии о.м.п. N исследовалось в работе [2d] , где показано, что EN-N- 77 -І^. 1 . /V L П (N-m) $*г(лн*У

1 = 1 (/V-/72.)"1 щ»4* -zc**)'1]-у») l=1 ' " i=j

Несколько модифицированная схема выбора рассматривается в [Зі] Предполагается, что перед тем, как будет извлечена с -ая выборка, к совокупности добавляется &с меченных объектов .и /7 - независимые биномиальные случайные величины В і ( N + 2LClj. ftV С=1,г-, 6. Б работе строятся о.м.п. N и рс- для /V и pi соответственно, /=±1 ..., 3 , которые являются функциями от статистики у = „2 2^ , где ^- - число непомеченных элементов в і -ой выборке.

Последовательная процедура выбора, в которой число выборок

6 является случайной величиной, определяемой некоторым правилом остановки, рассматривается в работах [16] и [24] . В [24] выборочная процедура заканчивается, когда число помеченных элементов /- У (ft) в объединенной выборке станет равным L > О. Показано, что статистика ^ = *УOb) = /~L является доста- N. = А/,

, являющаяся функцией от СС точной для параметра N и существует н.о.м.д ^±Л--,Г^ -т*+±. = < #msU) " ^ " ' u Г^1>

С(т±+L-±>m±+j-) lj ~ 1

П С(тет±у-і)

О , в остальных случаях,

С (A) vjsv./(o-u)\ и 0-(^) - наименьшее целое & такое , что 2-> ftl- & h + У,

В [іб] данная процедура выбора несколько модифицирована, а именно, процедура нанесения меток производится независимо от процедуры выбора и детерминирована. Обозначим через 7} - число помеченных элементов в совокупности в момент, когда извлекается О -ая выборка ( последовательность \Ti\} tsltZt... J задана ), L=lJt) .... . Процедура заканчивается, когда будет выбрано L помеченных элементов. Для такой схемы выбора в предположении, что /V-* таким образом, что /П^/л/-* О , а 21 /П,;Ті/Л/>0 получена ( асимптотическая ) н.о.м.д. /^(з) для N : ш - -^— при этом (здесь -6 - число выборок, извле- ченных до остановки).

Б работе [13] вводится модель, в которой вероятности выбора элементов различны. Множество вероятностей выбора элементов моделируется как случайная выборка из произвольного распределения вероятностей на единичном интервале. Предлагается непараметрическая оценка размера совокупности, основанная на статистике " складного ножа"; оказывается, что эта оценка является линейной комби- нацией выборочных частот.

Байесовский подход к решению задачи оценивания /У рассматривается в работе [l4j .

Расслоенные совокупности. Пусть элементы конечной совокупности lL разбиты по некоторому признаку на К классов (сло-ев) /tC±)...)К ( Ui (]U- =} i*j, и U^ =ЩЛ и при этом размеры классов A/i} ...; N к t их число, так же как и размер всей совокупности /V- N±+ + Nк (или часть этих параметров), неизвестны и должны быть оценены по имеющейся информации об ^,

В работе [з] рассматривается ситуация, когда размеры классов N±)...} /Vк и размер совокупности А/ неизвестны (параметр К известен) и из совокупности извлекается простая повторная выборка объема К . Пусть if .^ означает число элементов из класса Us. , появившихся в выборке ровно ^ раз, J=1j...JK) =?.<,...,/2. Показано, что вектор У ~ ( V ±) ..., *V ) » гДе 'р = /U. +... " * Hjn, J = Ij^j '> » является полной достаточной статистикой для N = (h/±i. Af/^j , и, основываясь на этом, строятся оптимальные I н.о.м.д.) оценки для параметрических функций

Если возможные значения параметра N ограничены условием N ^ ҐІ , то оптимальные оценки существуют для произвольных функций и имеют вид: г- f(f)-( А?- Ф)№/&'* где ^= ^-^-^, ^(х)=(Х1+-кТЧх), & - оператор разности: Ь^(Х)= ^(x-t±)-) X - единичный оператор:

If(z)-f(x) и оператор Aj определяется следующим образом:

Если fi/Ф 0 может быть любым целочисленным вектором, то оптимальные оценки могут быть построены только для функций t(N)s = f(Nj N , где 4(N) - многочлен от N±r..f NK степени не выше /2, и f(6) = О . Если Т( N) - такая функция, то оптимальная оценка для нее дается формулой:

В работах [і, II, 18, 23] подобная задача решается на основе простой случайной выборки без возвращения объема h, . Обозначим через U^ - число классов, каждый из которых имеет ровно і элементов в выборке, /= Ot lyfif* /КІМ(/г, Нъсус /V-) , а через у - число различных классов в выборке, так что у =

В работе [^Рассматривается случай, когда совокупность состоит из неизвестного числа К классов одинакового объема 1 (здесь % - известное фиксированное число). Показано, что при flf- К ДДЯ параметра К существует н.о.м.д., которая иглеет вид:

В [23J рассматривается ситуация, когда известным является только объем совокупности Л/ и строятся несмещенные оценки для К и Air..v Лд , где Кj - число классов, содержащих / элементов, j,-1,..., Q.t - )7Щ(С /VL* . Если выполняется условие /?, то несмещенная оценка 'к для К имеет вид:

1-1 ^ '< а несмещенные оценки Дл..., лл, для К4 К являются решениями І I гь IV Ч ft, системы линейных уравнений г1 N

Наконец, в работе [її] находятся некоторые асимтотические (при И}1г-*>оъ, /і//у-*оС ) оценки для К и К±}...,К<>.

Из приведенного обзора видно, что в литературе рассматривались в основном вопросы построения различных точечных оценок для параметра /V - неизвестного размера совокупности и сравнение эффективности этих оценок для различных схем выбора. Вопросы же оценивания произвольных параметрических функций Т(Л/) , а также вопросы доверительного оценивания и проверки гипотез исследованы в гораздо меньшей степени - здесь имеются лишь отдельные разрозненные результаты. Настоящая диссертация посвящена систематическому исследованию этих задач для схемы обобщенной Тъ (/г) и классической повторной Ц \И) выборок.

Следует отметить также следующее обстоятельство. На практике, как правило, объем исследуемой совокупности представляет собой априори весьма большую величину, и потому использование точных решений для практических расчетов требует трудоемких вычислений. Чтобы облегчить практическую сторону использования соответствующих результатов, в диссертации, с одной стороны, рассчитан ряд подробных таблиц для возникающих в данной теории функций и характеристик (эти таблицы приводятся в Приложении), а с другой стороны, систематически используется асимптотический подход, предполагающий неограниченное возрастание как параметра Л/ , так и объема выборки ҐІ . Этот подход опирается на хорошо развитую в настоящее время асимптотическую теорию задач размещения частиц по ячейкам [4-7] и позволяет получать имеющие достаточно простую форму асимптотические решения. Перейдем к изложению полученных в диссертации результатов.

Первая глава диссертации посвящена построению точечных и интервальных оценок для параметра Д/ и для произвольных функции Г (Л/) от него в схемах І^(ґі) и Л (it) . Основные результаты этой главы базируются на положениях теории достаточных статистик.

В I.I доказывается, что в схеме 1^ (ft) статистика у-- /Ц+ -* М. - число различных элементов совокупности в выборке, является полной достаточной статистикой для параметра N. В 1.2 строятся оптимальные (н.о.м.д.) оценки для произвольных параметрических функций ?(/V) . Доказаны следующие две теоремы.

Теорема 1.2. Если Л/ ^ ҐЬ , то оптимальная оценка существует для произвольной функции Х(М) и имеет вид: где yf(N)=\\C^ и А оператор разности: - f(x). l=i

Теорема 1.3. Если N(& /ТТЛ может быть любым натуральным числом, то оптимальная оценка существует лишь для функций <Г(/У) вида ?(N)= f(/V)yr~ty), где /C/V) - многочлен степени не выше ҐІ , удовлетворяющий дополнительным условиям f(x)= 0; Х= Otl} ..., hz-l . Если r(/V) - такая функция, то оптимальная оценка для нее дается выражением

Д* Що)

Приведенные теоремы обобщают результат работы [27] на случай оценивания произвольных функций Т(А/)

Основываясь на распределении 11 в 1.3 строится о.м.п. Н для /V . Эта оценка определяется при 11 ? Иъ из соотношения где функция Д^ ( A/j К) определяется следующим образом: у п N-m; +1 / ^ ъ4Ъ 7ГГ7" N-k+1 *(аь ХМ- -<" *" к, о / N+i при NZ К и 0fr ( К-1, К)=0 , а при ^ = /. оценка И/- /.

Этот результат обобщает результат работы [22] на случай более общей выборочной схемы,

В 1.4 вводится класс ^С линейных относительно U _ іц оценок и доказывается, что в нем существует единственная несмещенная оценка для X(n)= N , которая имеет вид: N> asm) "- к)^г(^А> где d.(/п)= 21 т.иг.-.

Случай подвыборок равных объемов ( /% = - ^/. = /? ) рассматривается в теореме 1.6.

Теорема 1.6. Несмещенная оценка- для в классе I существует лишь в случае, когда Г (А/) - полином от N степени К ^ ^~1 . Б этом случае, если "ТҐА/)- 22, Сі- /V , то единственной несмещенной оценкой для T(/V) является статистика

В частности, в классе существует единственная несмещенная оценка для

Аналогичный результат для схемы Л (п) формулируется следующим образом: единственной несмещенной оценкой для функции T(N)= 77 = оС в классе 5L линейных относительно /j... / оценок является статистика К - 7 ^ ^Х

Методика построения доверительного интервала для /V в схеме Х^(/Ь) с одинаковыми объемами подвыборок: /71 =---=/71=/71 описана в 1.5.

Асимптотическая теория оценивания, предполагающая неограниченное возрастание как объема N совокуцности, так и объема ft, выборки, развивается в главе П.

В 2.1 предполагается, что в схеме Л^ (/г) /: = = / = = /?г. /V-* таким образом, что р = /ті/А/ є L р±) Р^1 О < р± < р < 1 , где Ь± и р2 - заданные фиксированные числа ( 3 - фиксировано ). В этом случае статистика ST асимптотически нормальна и/ (р} 2.JbGL2y/Tzfi)^) f = ^~p-При этом сходимость к предельному закону равномерна по параметру .jb .

Пусть Т(/э) - непрерывно дифференцируемая функция, удовлетворяющая условию: Ъ(/э)ф О , рє(0,і) . Справедлива

Теорема 2.3. В указанных асимптотических предположениях статистика ^= ^(р^) является состоятельной равномерно асимптотически нормальной ^(^(р), ^рФ [?'(/>)]/)оценкой для 4>(р) ; более того случайная величина (Пб)г

ГтГ ?(Р) асимптотически нормальна *л1\9>±) и сходимость к предельному закону равномерна по параметру рв {,р1} р2~\ , а интервал ZP, m(6)z где V^(" ~к}т/ )= jf/2 , является асимптотическим доверительным интервалом для "//>) с доверительным уровнем і - flf

В 2.1 рассматриваются также задачи проверки гипотез о значении параметра Ь . Так г 1 Wifr ч zpD Ц задает критическую область уровня значимости -71 для проверки простой гипотезы р-р * а где 7Ґ(р) = ( #г ( ± + l/p1)) /ft(l- Vp1) - критическую область уровня значимости о для проверки сложной гипотезы

Р є / j p2 1 ^ ^A <Pz<l- Критерий 7?^ (fa ліявляется асимптотически несмещенным и выписывается вид его мощности для близких альтернатив порядка

Аналогичные задачи для схемы —(^) рассматриваются в 2.2. Предполагается, что /2, /V—> оо таким образом, что <^~ /у<= єЕоХ) ct^Jj 0±< dz< 0 сі±і oi^- фиксированные числа. В этом случае статистика cL^ ~ /2 Л1 (^з. Нг асимптотичес ки нормальна ; при этом сходимость к пре дельному закону равномерна по параметру cL . Пусть У^~(о(.) - - непрерывно-дифференцируемая функция и УГ(oL) і" Oj cL>0}тогда в сделанных асимптотических предположениях справедлива

Теорема 2.6. Статистика %,= ^Y0 является состоятельной асимптотически нормальной оценкой для llr(cL) . Более того, случайная величина асимптотически нормальна jf(o,l\ , и асимптотическим (V-^)- - доверительным интервалом для l/f(oC) является интервал % ± \ yrfc) iW

Так же, как и в 2.1, рассматриваются задачи проверки гипотез относительно значений параметра cL

Задача построения асимптотически оптимальной оценки для параметра Ь в схеме JZ^ (/г) с одинаковыми объемами подвыборок ҐП рассматривается в 2.3. Оценка Ь является единственной состоятельной оценкой для b в классе L^ [С^ = /# -2, 4(t)Мг J . Выделим в классе Ub подкласс L^ L0 статистик с монотонной (поуь) функцией &4 (р) = fi f(X) , где X - биномиальная случайная величина с параметрами 3 и /э и ^ (/6) ^ ^ t>(О,і). Рассмотрим класс статистик ОиС^= 7 ст ~ CL^ („J ' ^ Є L± J ( fr ЖСЛ ) , тогда произвольная статистика Ь^ из класса 2^ асимптотически нормальна а/(Д dp(i\ftf\ при этом и равенство достигается тогда и только тогда, когда \0jB остальных случаях . Справедлива оптимальная оценка для параметра h , кото-

Теорема 2.8. Б классе 00и существует и притом единственная асимптотически рая имеет вид г

Используя этот результат, далее решаются задачи интервально го оценивания параметра Ь , а также проверки гипотез о значе нии р . __

Аналогичные результаты ддя^схемы Л (ttj получены в 2.4. Пусть L± С L0 ~ 7 tfr ~ ti 2-, ffo)/l/^ J - подкласс статистик с монотонной (по gL ) функцией /7l(cL)~cL />(Х) t где л -пуассоновская случайная величина с параметром cLt т (v ^ > . Рассмотрим класс статистик : С Є ^1 } ( С^ ^) Доказана

Теорема 2.II. В классе ОиС существует и притом единственная асимптотически оптимальная оценка параметра cL . Эта оценка порождается функцией Ъ (я) =1 при Х=^-^}... } и имеет вид fe^= ?7l~0 ґ/?'/1 J , где Шо (zfj определено в (I).

Асимптотическим (i~]f) - доверительным интервалом ДЛЯ dC является интервал ^ %i(fO0ln j> .-24- гда 3 (e*l-j)~*

В этом параграфе решаются также задачи проверки статистических гипотез о значении параметра oL на основе асмиптотичес-ки оптимальной оценки р„

Сравнению схем І^(іг) и й(Л) с точки зрения эффектив ности оценивания параметра N посвящен 2.5. В качестве соот ветствующих оценок рассматриваются статистики Nx = /п //э^(схема 1^ (7г.) с подвыборками одинакового объема /71 ) и Nj = fr/cL^ (схема' Д(я) с /1 = ^ҐҐІ ). Показано, что при ҐІ ~ N/Z (основной случай в приложениях) оценка A/jасимптотически более эффективная, чем A/j~ » но при /t>/V/2 всегда можно указать значение 3 , при котором более эффективной является оценка /АЛ- . Аналогичное сравнение схем выбо-ра проводится, когда в качестве оценок для N рассматриваются статистики Nx = Mb/ h^ , где ч"^ - асимптотически оптимальная оценка для р= /71/'N в схеме -Ч (/2-) и N-g - /2/Ъ*, fe^ - асимптотически оптимальная оценка для cL~ /Ъ/Л/ в схеме Л- (ґі) .

В главе Ш рассматриваются некоторые специальные задачи оценивания для конечных совокупностей.

3.1 посвящен решению некоторых задач оценивания для конечной совокупности, состоящей из неизвестного числа А/ классов, каждый из которых включает в себя *t элементов (параметр известен). Из совокупности извлекается выборка по схеме-^(^)и пусть (Ц^ обозначает число классов, каждый из которых имеет

РОВНО V Представителей В Объединенной Выборке, ^'Q^JtPj - число различных классов в выборке.

Доказывается, что 1J является полной достаточной статис- тикой для параметра /V и ее распределение имеет вид: где ^ (/V) = П^ CJ.

Аналогично тому, как это было сделано в 1.2, строятся оптимальные оценки для произвольных параметрических функций t(N\. Справедливы следующие две теоремы.

Теорема 3.2. Если N^ ҐІ » то оптимальная оценка существует для произвольной функции ?(Л/) и имеет вид Л-iJс{WW).

Теорема 3.2 обобщает результат работы [18] на случай более общей выборочной схемы и оценивание произвольной функции t (Лу-

Теорема 3.3. Если Л/( yfv ) м0&ет быть любым натуральным числом, то оптимальная оценка существует лишь для f (А/) вида t (^=-^(//)1^ ///), где р(Л/) - многочлен степени не выше tl , удовлетворяющий условиям v(x)- О при Х-О^^ -" к^У-d.. . Если *Z(A/) - такая функция, то оптимальная оценка для нее дается выражением

Оценка максимального правдоподобия /V для параметра N 2> при v> \іг/ находится из условия где функция Д-_ f 1\] Ц t) определяется следующим образом: если N?к. и jS^ (к-ij к, г)= О . если же у~(т/г> , то /V= (m/t> .

Во втором параграфе главы Ш рассматривается следущая зада ча. Из конечной совокупности, размер которой /V неизвестен, извлекается выборка объема Уі по схеме -У-к/ь) Пусть &к~ 9К (N)= ( /~ /уJ обозначает вероятность появления нового элемента в К -ом испытании, /(=1,2.,... .Поскольку ' Nнеизвестно, то 9 (А/) является функцией от неизвестного пара метра и, следовательно, возникает задача получения для нее тех или иных статистических оценок. Применяя результаты главы I, до казаны следующие теоремы: /г,

Теорема 3.5. Единственной в классе с7С~(^~ ^. гЛг^] несмещенной оценкой для ' &(А/) при /(.=1, Z}...., /Ь является статистика

А т—1 / л \-1 9гХ(с:тсхм

Если же К> 1Ъ , то по такой информации величину &к (/V) несмещенным образом оценить невозможно.

Теорема 3.6. Несмещенной оценкой с минимальной дисперсией для Qf, //V) при К4 ҐІ является статистика где > ( /ty ҐУЬ\ - числа Стирлинга 2-го\рода.

Б предположении, что ҐІ, N ~~^ <* таким образом, что где oC1 и cLz - известные фиксированные константы, изучается асимптотическое поведение подученных оценок. Показано, что что для оценки Вц справедливо асимптотическое представление более того, закон распределения Эк асимптотически нормален U/~( Є* ftXe^(i-e*JJ-dL-

Проведено также сравнение эффективностей рассмотренных в данном параграфе оценок.

В Приложении приведены таблицы, позволяющие рассчитывать некоторые оценки, приведенные в диссертации, а также таблицы значений доверительного интервала для

Работа выполнена на кафедре теории вероятностей и математической статистики Московского института электронного машиностроения. Основные результаты опубликованы в [36 - 42J .

Оптимальное оценивание параметрических функций

Настоящий параграф посвящен решению задачи оценивания произвольных параметрических функций t\N) в схеме - "-s \ ч Дальнейшие выводы будут опираться на следующее свойство полной достаточной статистики [8 стр. 27б] : если существует полная достаточная статистика ( для данного семейства распределений Jr0J t/ Є \!у ), то всякая функция от нее является несмещен ной оценкой с минимальной дисперсией для своего математического одадания. Поскольку в силу теоремы І.І величина "V является в нашей схеме полной достаточной статистикой для параметра N , то построение оптимальной (т.е. несмещенной с минимальной дисперсией ) оценки для заданной функции (М) сводитвя к решению следующего уравнения несмещенности: ENf( )=r(N), \lN?tn, (I-7) где - искомая функция. Подчеркнем, что если уравнение (1.7) имеет решение, то оно единственно ( в нашей схеме на множестве Ж =уУІ//Пі-±)..., К jjt следовательно, в тех случаях, когда уравнение (1.7) разрешимо [при заданной функции Т - его решение, оптимальной оценкой для T /V) является статистика Х = ( ) Если же уравнение (1.7) не имеет решения, то это означает, что - 35: соответствушую функцию Т(А9 несмещенным образом оценить невозможно. Имеет место следующее утверждение. Теорема 1.2. Если N ft, , го уравнение (1.7) раз решимо для любой функции ( N) ; при этом оптимальной оценкой для является статистика где vr -ДС IfiSI112boTBo. Условие теоремы означает,что множество допустимых значений параметра N совпадает с множеством $к- Но для любого А/Є Ж уравнение (1.7) можно записать в виде м ъ, (N)=tcrf г (A/) -IL е( к с ), (1-9) где ,( ) определено в (1.5). Поскольку 6LN(N) Л уГ(о)фО при NC-Jb , то отсюда следует, что tf( ) однозначно выражается через и значения функции ф( ) в точ ках К /V # Таким образом (1.9) есть рекуррентное соот ношение, которое позволяет однозначно ( и линейно ) выразить f(ft) через значения Ч:(К) при К= ҐП, т+1 ..., N.

Полученные в предыдущем параграфе формулы для оптимальных оценок весьма сложны для практических расчетов, поэтому представляет также интерес построение и других оценок, не являющихся оптимальными, но которые просто вычислять. Один из методов получения таких оценок есть метод максимального правдоподобия, который и рассматривается в настоящем параграфе.

Единственность оценки (I.I7) следует из уравнения несмещенности которое эквивалентно условию - HV 6г (/V) = A/ , N?- Ш 9 и однозначности определения коэффициентов многочлена (здесь слева и справа стоят многочлены от /V ).

Естественно возникает вопрос, насколько широк класс параметрических функций Х(п) , для которых можно построить линейные несмещенные оценки, и как строить такие оценки в тех случаях, когда они существуют. Полное решение этих вопросов получено здесь для схемы - (/2-) при равных объемах подвыборок: / =-=/ =/72-.

Изложенные в данном параграфе результаты показывают, что в рассматриваемых моделях с помощью линейных оценок несмещенным образом можно оценивать лишь весьма узкий класс параметрических функций - полиномы от /V некоторой конечной степени, при этом соответствующее решение (когда оно существует) - единственно. Тем не менее, эти оценки представляют определенный практический интерес ввиду их простоты; к тому же они играют важную роль при построении асимптотической теории оценивания, которая развивается в главе П. В настоящем параграфе рассматривается задача построения и расчета доверительного интервала для. параметра N на основе выборки,полученной по схеме Х (/і) , в которой подвыборки имеют одинаковый объем ИЬ (в частности, по схеме классической повторной выборки IL {fi) , т.е. при иг-1 ).

В данной главе развивается асимптотический подход к задачам оценивания размера N совокупности, предполагающий неограниченное возрастание как параметра Н , так и объема выборки

Основываясь на асимптотических результатах, полученных в задачах размещения частиц по ячейкам, здесь устанавливается асимптотическая нормальность линейных оценок, введенных в 1.4, и используя этот факт, строятся состоятельные асимптотически нормальные оценки для широких классов параметрических «функций, а также асимптотические доверительные интервалы для них. Формулируются некоторые типичные гипотезы о параметрах рассматриваемых моделей и строятся критерии проверки этих гипотез, для которых исследуется асимптотическое поведение функций мощности.

Линейное оценивание параметрических функций

На практике часто объем совокупности представляет собой априори весьма большую величину, и поэтому представляет интерес также и асимптотическая постановка задачи, предполагающая неограниченное возрастание параметра N и ооъема выборки /, В настоящем параграфе исследуется схема J (ft) с равными объе - 49 мами подвыборок: ht= - =ЇЇІ=/71- , когда число подвыборок 6 фиксировано. Именно, далее мы предполагаем, что объем совокупности допускает представление N=JbK j где К » , а уб - неизвестный параметр, возможные значения которого принадлежат некоторому конечному невырожденному интервалу О J$± уЗ /в2 3, где /д ± и /За - заданные константы.

Из этого общего утверадения вытекает, в частности, асимпто тичеекая нормальность определенной равенством (І.2І) линейной несмещенной оценки р параметра Ь Теорема 2.2. В условиях теоремы 2.1 статистика р асимптотически нормальна U/ (A Zpfy Iftbft)z) . При этом сходимость к предельному закону равномерна по параметру Ь. Доказательство. Учитывая, что ffe) = = ( )л/( 1 шееы + Далее, используя равенства (1)= (typify), } (t)z = (t) + Ц(і) (j-)i и Формулу (1.20), получим, что в данном случае Теорема доказана. Введем класс Т параметрических функций (р) , удовлетворяющих условиям: (р) непрерывно дифференцирума и Х\&\40 при ЬЄ (Oj і) , и рассмотрим задачу оценивания про - 51 извольной функции ( ) Т В качестве оценки для t(p) будем использовать статистику f - t(p ). Теорема 2.3. Если при /# /[/—э оо выполняется условие (2.1), то статистика Х является состоятельной асимптоти чески нормальной иґ(?(р), 2pff[Ъ (р)\//Tift) ) оценкой для Z(p) ; более того, случайная величина ЛУ ft % ш\, асимптотически нормальна JJ \0,1) и сходимость к предельному закону равномерна по параметру Ь I b±) pz J .

Таким образом, предельное значение функции мощности критерия ри не зависит от выбора конкретной функции (р) В частности, если использовать функцию Т (/ ) ( см. (2.3)), го получим критическую область

На практике может возникнуть необходимость проверки и слож - 55 ных гипотез типа (2.1). На основании предыдущих результатов в качестве соответствующей критической области заданного уровня знаяимости О можно предложить, например, следующую область, задаваемую с помощью функции t (р) :

Таким образом, критерий (2.5) асимптотически имеет заданный уровень значимости "" и является асимптотически несмещенным. Отметим, что выбор другой функции т(р) лишь несколько изменил бы вид области g (Яl /), но никак не сказался бы на предельном поведении функции мощности. Рассмотрим с аналогичных позиций задачу оценивания произ-вольной параметрической функции ЧГ.(ск) от параметра оС j j по данным ( М±)....) // ,) в схеме -2/(/2-) . Дудем считать, - 57 .-что при lb, N — величина где cL± и cL - заданные фиксированные числа. Рассмотрим класс линейных статистик L = ( t = 2 /i )/4j, где "(&) - произвольная функция, определенная при всех неотрицательных целых значениях аргумента, и L0 С L есть подкласс "наблюдаемых" статистик: L0 = / f() = Oj.

Этот результат позволяет обычным образом решить задачи асимптотического оценивания произвольных достаточно хороших параметрических функций. Обозначим через j_ класс непрерывно дифференцируемых функций lff(cC) » Для которых ifr fjL) О при ot(О, оо) . Имеет место следующее утверждение, аналогичное теореме 2.3. Теорема 2.6. Пусть при /2,tf— 3 выполняется условие (2.7) и Vf(oL) X . Тогда статистика = 7) является состоятельной асимптотически нормальной ("р М, оценкой для 1fr(cl) . Более того, случайная величина асимптотически нормальна \А) (Of) , и асимптотическим " - доверительным интервалом для уОч является интервал Отметим, что в классе X существует единственная функ ция такая, что асимптотическая дисперсия слу -59 чайной величины 11Г (oL)№ зависит от параметра Л ( и равна 1 /&/г )..

Асимптотические статистические выводы ( продолжение )

Из теоремы 2.2 следует, что если оставаться в классе линей ных статистик, то можно построить лишь одну состоятельную ( и равномерно асимптотически нормальную ) оценку параметра р ( в случае 1=Z эта оценка имеет вид A "/ / ) Однако, если число выборок S Z , то множество состоятельных оце нок можно расширить с помощью следующей конструкции. Выделигл в классе Ь о подкласс L ± статистик с монотонной функцией & (р) ( см. (2.2)), удовлетворяющей условию ( )= О при р Є\_ р±)р2 \ .

Из теоремы 2.7 следует, что различные оценки из класса оиС можно сравнивать по величине соответствующих значений функционала cCp(f) . Определение. Пусть \ftii Ц 7 L lfi, и fi(p4 " - функции, порождающие соответствующие оценки, Дудем говорить, что оценка tn± ( асимптотически ) равномерно точнее оценки ът.2 9 если всех Р р\р±) p(fz) Если это неРа"" венство выполняется для любой оценки \fyto $fc . t то оценку Km назовем ( равномерно ) асимптотически оптимальной. Теорема 2.8. Б классе W& существует и притом единст-венная асимптотически оптимальная оценка параметра b . Эта оценка порождается функцией -ъ, (х)= 1 при Х- 4 ,%j ...,-3 и имеет вид f- е(%/ія) где A-i О) = (НІ/? при этом Предварительно докажем следующую лемму.

Легко видеть, что Pz(P) - ИсслВДем поведение р /р) для "ЬУ Z при малых значениях Ь . Несложные преобразования приводят к следующему асимптотическому разложению Лій і-Ч-Р + Щії-Р- 0 Соотношение (2.17) показывает, что в тех случаях, когда объем подвыборки fti мал в сравнении с объемом совокупности, оценка Ь близка по своей эффективности к оптимальной оценке У . Следовательно, в этих условиях можно использовать бо-лее просто вычисляемую оценку р . Следующие рассуждения устанавливают связь между оценкой г и результатами 1.3. Именно, будем рассматривать в качестве оцен - 68 ки для Ь величину р = /П/ /Vm t где /у определяется соотношением (1,16). Тогда в рассматриваемых нами асимпто л тических условиях величины у и /V , очевидно, будут по вероятности неограниченно возрастать, и поэтому соотношение (1,16) можно заменить приближенным соотношением Ч і/іЬ f Отсюда иг в или Р 4 Щ-ъ Таким образом оценку У можно рассматривать как асимптотический аналог результата 1.3. Основной результат, сформулированный в теореме 2.8 позволяет сравнительно просто получить решение и ряда других статистических задач: оптимальное оценивание параметрических функций, доверительное оценивание, проверка гипотез о параметре Ь Пусть (р) - произвольная, непрерывно дифференцируемая функция параметра р , удовлетворяющая условию: rt(p)=tO) рЄ ( О, 1) .В качестве оценки для t(p) будем использовать статистику X = t ( У ) .Из теоремы 2.8 и теорем сходимости для функций от случайных величин ( [8, стр. 335] ) вытекает Теорема 2.9. Бели при /71, /V выполняется уело А/ вие (2.1), то статистика Т является состоятельной равномерно асимптотически нормальной iM [/Т(р)) (f (p)L (p)] /ftl) - 69 оценкой для Х(р) ; более того, случайная величина равномерно асиглптотически нормальна ul fOt \ Из теоремы 2.9 следует, что интервал является асимптотическим доверительным интервалом для t(p) с коэффициентом доверия 1 Т Этот интервал будет иметь наименьшую длину ( при фиксированном У ) среди всех таких интервалов, порождаемых статистиками rV ч

Рассмотрим с аналогичных позиций задачу астштотически оптимального оценивания в схеме А(ґі) .Из теоремы 2.5 следует, что в классе линейных статистик и0 существует единственная состоятельная ( и равномерно асимптотически нормальная ) оценка параметра cL . Выделим в /-»0 подкласс L статистик с монотонной функцией 7Н,(Ж) ( см. (2.8) ). Тогда для произвольной статистики Є U± можно рассмотреть преобразование = /71 (#,) , где Ш (і) - функция, обратная к /?l( j . В дальнейшем будем считать, что выполнено условие т (А)+0 при Ы±сСг], а класс таких преобразованных статистик обозначать же .

Оценивание вероятности появления нового элемента при выборе из конечной совокупности

Настоящий параграф посвящен решению некоторых задач оценивания для конечной совокупности, состоящей из неизвестного числа /у классов, каждый из которых включает в себя " одинаковых элементов. Из совокупности извлекается 3 независимых выборок объемами /?ld)... /71 соответственно, каждая из которых получена по схеме простого случайного выбора без возвращения. Обозначим через /71 = /7UMC /71: и /1=/71 + -+/71 объем максимальной выборки и общее число наблюдений соответственно и будем предполагать выполненным естественное ограничение А/ \%/ » здесь \ХУ - наименьшее целое число, большее или равное X . Пусть Ц обозначает число классов, имеющих ровно С представителей в объединенной выборке, Of і, ...j /0 /0=- /7tl/t (iStj /l) Тогда всю совокупность данных можно представить в виде векторной статистики М (Mtyj Ар) » и по этой информации требуется оценить как сам неизвестный параметр п , так и параметрические функции Г(Л/) от него. Применяемый здесь метод аналогичен методу, использованному в главе I, и состоит в нахождении достаточной статистики для /V , установлении ее полноты и использовании свойств полных достаточных статистик для построения оптимальных оценок.

Обозначим у общее число наблюденных классов, так что УМ УЧг - 83 Теорема 3.1. Случайная величина Ф является полной достаточной статистикой для параметра /V ._ Доказательство. Пусть ь \ь±)..., 1 ) -вектор с целыми неотрицательными компонентами, удовлетворяющий условию: и /j N - совокупность всех таких векторов. Тогда при заданном N распределение статистики М сосредоточено на множестве В частности, при "6-1 из этой формулы следует результат работы [18]. Рассмотрим теперь общий случай, когда на возможные значения параметра N априори не накладывается никаких ограничений сверху.

Теорема 3.3, Если N ( \f/J может быть любым натуральным числом, то уравнение (3.5) разрешимо лишь для функций вида І-і/ч = -(М) У% (її), где jf(N) - многочлен степени не выше Н , удовлетворяющий условиям %фО)-0 при =0, t ..., [""/ 1 Бели X N) - такая функция, то оптимальная оценка для нее дается формулой (3.8).

Отсюда следует, что ь(М) есть многочлен от N степени не выше /. С другой стороны, общий вид многочлена степени не выше /- в точках N / есть (поскольку :;Д ъ(0) О при K tb ), что совпадает с (3.9) лишь при j/(0) 0) = 1(( - =0 Таким образом, соотношениям (3,9) удовлетворяют указанные в формулировке теоремы многочлены и только они. Но для таких функций "XtM) f(N) 1ІС (N) оптимальная оценка имеет вид, указанный в (3,8), что и требовалось. Следствие. 3.2. Несмещенной оценкой с минимальной дисперси-ей для функции (/\/)= N является статистика /±\ _ &(о1- Щ(о))

Действительно, в данном случае (/ )1/ ( ) есть многочлен степени ft l , обращающийся в ноль в точках ? ,..., - -І Следовательно, оптимальная оценка всегда существует и дается формулой (3.8).

Полученные оценки весьма сложны для практических расчетов, поэтому представляет интерес построение и других оценок, не являющихся оптимальными, но которые просто вычислять. Один из методов получения таких оценок есть метод максимального правдоподобия.

Пусть имеется конечная совокупность U некоторых объектов (элементов), число которых /V неизвестно. Предположим, что мы имеем возможность наблюдать элементы lA/ , извлекаемые последовательно по схеме простого случайного выбора с возвращением. Таким образом, если проведено И/ испытаний, го все N возможных вариантов выбора элементов равновероятны. Нас интересует вопрос, с какой вероятностью можно ожидать появления нового элемента в произвольном испытании. Обозначим эту вероятность для К -го испытания через fy( ), K=i,Zr.. . Нетрудно видеть, что для рассматриваемой схемы выбора

Если из конечной совокупности с неизвестным числом элементов N извлечена простая повторная выборка объема / , то единственной в классе несмещенной оценкой для вероятности & (/1/) обнаружения нового элемента в к. -ом испытании при /C=1,Z,. , tl » является статистика GK , определенная в (3.17); если же К ҐІ , то по такой информации величину (N) несмещенным образом оценить невозможно.

Замечание 3.1. Этот результат, как доказано в работе (34], остается в силе и для неравновероятной схемы выбора элементов при произвольных вероятностях р±г-., Д, \Ріф" /9У "0 извлечения соответствующих элементов совокупности в каждом испытании.

Для рассматриваемой нами схемы выбора, используя теорему 1.3, можно получить гораздо более сильный результат, дающий вид оптимальных оценок для величин &К (/V) , K=lt..4 (Ъ . В нашем случае (»= 9K(N) , поэтому f(/V)= //(N)= N foif1. Это есть многочлен от N степени /2, , и при любом К tb выполняется условие ъ,(о)- О .