Введение к работе
В работе рассматривается новый класс многомерных дискретных распределений вероятностей, порожденный урновой схемой с шарами, помеченными векторами с произвольными целочисленными компонентами. Основными проблемами, рассмотренными в работе, являются: вычисление точных значений вероятностей и их статистических оценок, которое сводится к нахождению решений системы линейных диофаитовых уравнений в неотрицательных целых числах, или, что то же самое, к построению всех разбиений вектора г на точно п частей; вычисление значений вероятностей и их статистических оценок альтернативным комбинаторным методом, не требующим нахождения решений системы линейных диофаитовых уравнений; предельные распределения и свойства рассматриваемого класса распределения вероятностей и построение критерия хи-квадрата для проверки адекватности предлагаемой модели экспериментальным данным.
Актуальность проблемы. Описание радиоактивного загрязнения, обусловленного ядерными взрывами, необходимо, чтобы способствовать улучшению контроля и мониторинга. Эти поля, очевидно, имеют стохастическое происхождение и обладают довольно сложной пространственной структурой. Существует много подходов, которые могут быть использованы для такого описания, например, вычислительная геометрия, контурные и пространственные статистики, фрактальный анализ, мультифракта-лы и вероятностный. (Мульти)-фрактальный подход кажется наиболее многообещающим, потому что он позволяет учесть масштабную инвариантность полей радиоактивного загрязнения, открытую в последние годы. Однако, применение такого подхода для задач прогнозирования неочевидно, хотя бы из-за того, что пространственная плотность измерений, как правило, очень низка. Вот почему, вероятностный подход, рассматриваемый в данной работе, также интересен, поскольку он дает альтернативное и дополнительное описание полей радиоактивного загрязнения.
Класс одномерных дискретных распределений вероятностей, порожденный урновой схемой с шарами, помеченными произволь-
ньіші положительными числами, был введен сравнительно недавно. Такое вероятностное распределение на самом деле есть сумма полиномиальных вероятностей, которое подразумевает, что шары извлекаются из урны независимо и случайно. Идентифицируя каждый извлеченный шар с измерением в какой-то точке, можно видеть, что эти условия достигаются, если значения загрязнения, измеренные в различных точках, могут рассматриваться как независимые. Модель позволяет вычислить вероятность, что среднее значение радиоактивного загрязнения для каждых п точек из общего числа измерений в выборке превышает уровень опасности. Среди других преимуществ данной модели, помимо ее ясного вероятностного смысла то, что применяемое в ней усреднение уменьшает ошибки в оценивании вероятностей. Основной недостаток этой простой модели состоит в том, что она не может описать векторные пространственно зависимые события, особенно в случае очень больших ошибок измерения.
В настоящей диссертации рассматривается обобщенный класс многомерных дискретных распределений вероятностей, порожденный урповой схемой с шарами, помеченными векторами, компоненты которых есть произвольные целые числа, включая и отрицательные. Надо заметить, что вследствие довольно больших экспериментальных ошибок, эти компоненты могут принимать как положительные так и отрицательные целые значения. Предложенная в диссертации модель более пригодна для описания векторных полей радиоактивного загрязнения, чем модель, описанная выше . Во-первых, она позволяет принять в расчет зависимость между компонентами вектора измерений. Во-вторых, ее можно использовать для пространственно зависимых измерений полей радиоактивного загрязнения, производимого одним радионуклидом.
Данная модель находит применение не только в задачах радиоэкологии, но и при выборочном обследовании популяций. Предположим, что составляется анкета с целью сбора данных у респондентов. Ответ респондента на каждый пункт анкеты характеризует степень согласия или несогласия. Набор вопросов (пунктов анкеты) зависит от цели исследования. Степень согласия обычно
нумеруется, например, (1,2,...,10), где 1 соответствует полному согласию, а 10 соответственно полному отрицанию. Ответы на каждое утверждение могут иметь различные числовые шкалы. После сбора информации проводится статистический анализ данных.
В данной работе предлагается использовать вышеупомянутую многомерную вероятностную модель, которая является наиболее подходящей для такого анализа, потому что она принимает в расчет корреляцию между различными пунктами анкеты и обладает простым вероятностным смыслом.
В настоящее время задачи анализа многозональной видеоинформации аэрокосмического происхождения можно рассматривать как первостепенные. В качестве одного из средств создания признакового пространства для распознавания объектов на изображениях можно рассмотреть предлагаемую многомерную вероятностную модель, поскольку мз'льтизональный цифровой текстурный образ, полученный в различных частях спектра, можно описать, используя урновую схему с шарами, помеченными векторами с целочисленными компонентами. Затем оценить вероятности превышения заранее заданных чисел для сумм компонент векторов на извлеченных шарах и использовать их в качестве признаков объектов.
Проблему вычисления самих вероятностей, рассматриваемой модели, стоит выделить особо, поскольку она связана с решением систем линейных диофантовых уравнений в неотрицательных целых числах на современных компьютерах за разумное время. В настоящей диссертации для решения данной проблемы используется техника построения разбиений векторов. И хотя алгоритмы построения разбиений в данной работе приводятся в рамках рассматриваемого класса многомерных дискретных распределений вероятностей, техника построения разбиений представляет и самостоятельный интерес. В данной работе предложена формула для общего члена формального степенного ряда, который является произвольной комплексной степенью полинома с произвольными положительными целыми степенями. Используя этот результат и производящую функцию для композиций получена
формула для числа композиций диофантового уравнения
a\Xi + U2X-2 + ... + а^х/; = п,
где аі, аг,..., йк - любые целые числа, и формулы для самих решений.
Таким образом, предлагаемое исследование имеет теоретический и практический интересы для раздела аддитивной теории чисел и комбинаторики, связанного с построением и перечислением разбиений векторов, а также для дискретного линейного программирования. То, что касается вероятностной схемы то, как было описано выше, она имеет много очевидных приложений: в радиоэкологии при описании векторных полей радиоактивного загрязнения территорий; в социологии при выборочном обследовании популяций; в науках о Земле для описания и анализа текстурных изображений, получаемых с летательных аппаратов, и многие другие.
Целью работы является: исследование многомерных дискретных вероятностных распределений, порождаемыхурновой схемой, в которой шары маркируются векторами с целочисленными компонентами, разработка методов вычисления вероятностей событий для данного класса вероятностных распределений, основанных на построении алгоритмов разбиений вектора г на точно п частей, отыскание предельных (асимптотических) распределений в рамках данной урновой схемы, решение проблемы статистической оценки параметров исходного распределения вероятностей п ее ошибки, изучение различных свойств данного вероятностных распределений и применение рассматриваемого класса для исследования некоторых задач радиоэкологии и логистики. В качестве материала для численных исследований были использованы результаты анкетирования 45 зарубежных компаний, аккредитованных в Казахстане, и спектрометрические измерения в воздухе гамма-излучения 23o-23S[/) 232Th, i0K, l37Cs и общей гамма-радиации довольно большой территсрии Казахстана, расположенной к востоку от бывшего Семипалатинского ядерного полигона.
Научная новизна. Предложен новый класс дискретных мно-
гомерных распределений вероятностей, порождаемых урновой схемой с шарами, помеченными векторами с произвольными целочисленными компонентами. Разработаны два альтернативных алгоритма вычисления вероятностей и их оценок для предложенной модели: алгоритм, основанный на решении систем линейных дио-фантовых уравнении в неотрицательных целых числах (NP полная задача) или, что то же самое, на построении всех возможных векторных разбиений заданного вектора и комбинаторный алгоритм. Получены несмещенные оценки вероятностен для предложенного класса распределений с равномерно минимальной дисперсией. Доказаны предельные теоремы и изучены, связанные с ними асимптотические свойства предлагаемой вероятностной модели. Для проверки адекватности рассматриваемой модели экспериментальным данным построен критерий типа хи-квадрат.
Практическая ценность. Результаты диссертации имеют теоретический и практический интересы для дискретного линейного программирования, раздела аддитивной теории чисел и комбинаторики, связанного с построением и перечислением разбиений векторов, а также теории вероятностей и математической статистики. Их можно использовагь в радиоэкологии при описании векторных полей радиоактивного загрязнения территорий; в социологии при выборочном обследовании популяций; в науках о Земле для описания и анализа текстурных изображений, получаемых с летательных аппаратов, и т.п. К диссертации прилагается акт внедрения результатов настоящей диссертационной работы в учебный процесс Казахстанского Института Менеджмента, Экономики и Прогнозирования при Президенте Республики Казахстан.
Основные положения, выносимые на защиту:
-
Новый класс дискретных многомерных распределений вероятностей, порождаемых урновой схемой с шарами, помеченными векторами с произвольными целочисленными компонентами (Глава 1)
-
Два альтернативных алгоритма вычисления вероятностей и их оценок для предложенной модели: алгоритм, основанный на
рошений систем линейных диофантовых уравнений в неотрицательных целых числах (NP полная задача) или, что то же самое, на построении всех возможных векторных разбиений заданного вектора и комбинаторный алгоритм (Глава 1)
-
Несмещенные оценки вероятностей для предложенного класса распределений (Глава 1)
-
Предельные теоремы и связанные с ними асимптотические свойства предложенной вероятностной модели, позволяющие эффективно применять ее при выборках большого объема (Глава 2)
-
Критерий хи-квадрат для проверки адекватности модели экспериментальным данным (Глава 2)
-
Вероятностное описание полей радиоактивно загрязненных территорий, прилегающих к бывшему Семипалатинскому ядерному полигону (Глава 3)
-
Вероятностное описание цепей снабжения иностранных компаний в Казахстане (Глава 4)
Апробация работы. Основные результаты диссертационной работы докладывались на следующих семинарах и конференциях:
Семинары в Институте Математики МОиН и КазГНУ
Научная студенческая конференция, КазГНУ, Апрель 1999
Second International Research Workshop "Case Studies on Enterprises and Organizations in Transition Economics", 25-26 Sept. 1999, KIMEP, Almaty, Kazakhstan
Third International Research Workshop "Developing Research-Based Teaching Materials for Business Education", 2-3 June 2000, KIMEP, Almaty, Kazakhstan
Структура и объем диссертации. Диссертация состоит из введения, четырех глав, заключения, списка используемых источников, приложения, в котором приведено описание программы и акта внедрения результатов диссертационной работы.