Введение к работе
. . ;,А«-з . -Г-ртг'ї^і 'АЛЬНОСТЬ ТЕМЫ. Задача классификации ( Мы следуем терминологии Т.Андерсона ) состоит в том, чтобы основываясь на результатах имеющихся наблюдений, определить, какой из нескольких возможных генеральных совокупностей принадлежит объект, случайно извлеченный из одной из них. М.Кендалл и А.Стьюарт называли задачи такого вида задачами дискриминации , оставив термин "классификация" для задач разбиения данной выборки или всей совокупности на группы, по возможности однородные. При известных статистических характеристиках совокупностей задача классификации превращается в задачу различения нескольких простых гипотез, и для этого случая существует правило наилучшей классификации, минимизирующее функцию риска в случае известных априорных вероятностей, и множество таких правил образует полный класс, когда априорные вероятности неизвестны.
С точки зрения применений теории классификации наиболее важной является ситуация, при которой исходная информация о распределениях представлена выборками из них. Для этого случая в литературе предлагаются несколько правил классификации: подстановочные, максимального правдоподобия, байесовские и т.д. Мы будем рассматривать байесовские правила классификации, поскольку эти правила и их слабые пределы образуют в совокупности полный класс решающих правил.
Андерсон Т. Введение в многомерный статистический анализ. М., Физматгиз, 1963, 500с.
Кендалл М., Стьюарт А. Многомерный статистический анализ и временные ряды. М., Физматгиз, 1976, 736с.
Для детального исследования, построения и сравнения различных правил классификации необходимо знать распределения статистик классификации. Результаты А.Вальда, Р.Ситгривес4 и др. показывают, что уже в простейших случаях точные выражения распределений статистик классификации имеют довольно сложный вид, не позволяющий делать каких-нибудь качественных выводов. Поэтому стараются получить аппроксимации для распределений статистик, основанные на той или иной асимптотике. В настоящей работе рассматривается традиционная асимптотика, когда размерность пространства фиксирована, а объемы выборок стремятся к бесконечности. Существует целый класс асимптотически эквивалентных (их функции риска ведут себя асимптотически одинаково) правил. Возникает вопрос: какое из правил и насколько лучше? Ответ на такой вопрос можно получить, сравнивая асимптотические разложения для функций риска различных правил классификации. Такого рода результаты известны для подстановочных правил, для правила максимального правдоподобия (см., например, работы А.Мемона и М.Окамото , В.О.Гольцова и
Wald A. On a statistical problem arising In the classification of an Individual in one of two groups. AMS, 1944, 15, p.145-163.
Sitgreaves R. Some results on the distribution of the classification statistics. In: Studies In Item Analysis and Prediction, Stanford University Press, 1961.
Memon A.Z., Okamoto M. Asymptotic, expansion of the distribution of the Z statistic In discriminant analysis. J.Multivariate Anal., 1971, 1, p.294-307.
Е.В.Троицкого0, Ю.С.Харина'). Гораздо менее исследован класс байесовских правил. Статистика байесовского правила классификации имеет сложный для практических применений вид. Поэтому разработка методов построения удобных для применений аппроксимаций для статистики и функции риска байесовского правила классификации является актуальной темой исследований.
ЦЕЛЬ РАБОТЫ. 1) Получение аппроксимации (стохастического разложения) для статистики байесовского правила классификации. 2) Получение асимптотических разложений для функции риска байесовского правила классификации.
НАУЧНАЯ НОВИЗНА. Все основные результаты диссертации являются новыми.
ОБЩАЯ МЕТОДИКА ИССЛЕДОВАНИЯ. В ' работе используются асимптотические метода математической статистики.
ПРАКТИЧЕСКАЯ ЦЕННОСТЬ. Работа носит теоретический характер. На основе результатов диссертации могут быть построены удобные для приложения аппроксимации статистики и функции риска байесовского правила классификации.
АПРОБАЦИЯ. Результаты диссертации докладывались на семинаре "Избранные задачи теории случайных процессов и полей" (Москва, 1989г.), на Всесоюзном семинаре "Асимптотические методы математической статистики" (Москва, 1989г.), на Всесоюзной
Кольцов В.О., Троицкий Е.В. Асимптотическое разложение плотнссги вероятности адаптивной классифицирующей статистики. - В сб.: Статистические проблемы управления, Вильнюс, 1976, в.14, с.11-32.
Харин Ю.С. Исследование риска статистических классификаторов, использующих оценки минимального контраста. - Теория вероятн. и ее примен., 1983, T.XXYIII, в.З, с.592-598.
научно-технической конференции "Применение статистических методов в производстве и управлении" (Пермь, 1990г.).
ПУБЛИКАЦИИ. Основные результаты опубликовании в [1] - [4].
СТРУКТУРА И ОБЪЕМ РАБОТЫ. Диссертация состоит из введения, двух глав (всего 7 параграфов), приложения и списка литературы (из 59 наименований).