Введение к работе
Для решения задач, связанных с анализом данных при наличии случайных воздействий, математиками и другими исследователями (биологами, психологами, экономистами и т. д.) за последние двести лет был выработан мощный и гибкий арсенал методов, называемых в совокупности математической статисткой (а также прикладной статистикой или анализом данных). Эти методы позволяют выявлять закономерности на фоне случайностей, делать обоснованными выводы и прогнозы, давать оценки вероятностей их выполнения или невыполнения. В настоящее время математическая статистика претендует на роль математического языка экспериментатора. Статистические методы занимают некоторое среднее место между полной (а потому недостижимой) объективностью и чисто субъективной оценкой на глаз, причем при правильном применении статистических методов и добросовестности субъективной оценки обычно не возникает противоречия между этими двумя подходами.
В подавляющим большинстве экспериментов важным моменте»: предварительного анализа данных является проверка соотзатствия результатов измерения закону нормального распределения. Это тем белее важно, что все параметрические критерии, применяемые в регрессионном и дис-криминантном анализах, являются очень чувствительными к отклонениям от предположения о нормальности. В реальности отклонения распределений статистических данных от нормального встречается довольно часто. Особый интерес представляют данные, которые можно описать, исходя лишь из предположения о наличии нескольких равновесных состояний объекта исследования. В связи с этим, большой перспективой для статистической обработки таких данных является применение мультимодальных законов распределения и использование математических моделей теории катастроф.
Мультимодальные распределения имеют тесную связь с распределениями нормированных сумм зависимых случайных величин: согласно центральной предельной теореме такие распределения в пределе представляют собой взвешенные нормальные распределения, количество мод
которых зависит от среднего уровня корреляций между слагаемыми. Новым направлением в исследовании мультимодальных распределений является предложенный в работах Л. Кобба метод, базирующийся на использовании в качестве эталонных распределений функций, применяемых для описания типичных многомодальных состояний в теории катастроф. Методы теории катастроф позволяют изучить топологию таких распределений, выявить условия смены мод, получать оценки по математическому ожиданию с устраненной аномалией дисперсии, возникающей при использовании классических распределений.
Применение таких методов в статистических исследованиях сложных объектов было предложено как одно из основных направлений уже в классических работах Р. Тома. Однако дальнейшее развитие прикладных методов теории катастроф более концентрировалось на качественных сторонах статистического анализа многомодальных распределений.
Теория катастроф предлагает развитый математический аппарат исследования физических систем. Но она не может заменить собой этап построения модели объекта или явления. Многочисленные попытки механического применения канонических форм катастроф для описания слабо формализуемых процессов не дали положительного результата и даже в какой-то степени способствовали дискредитации самой теории. Тем не менее, в последнее время наблюдается рост внимания к тем возможностям, которые предоставляет эта область математики. В первую очередь это связано с появлением методик проверки адекватности различных моделей катастроф, описываемым с их помощью явлениям.
Практика показывает, что для успешного применения аппарата теории катастроф в интересах статистической обработки данных исследователь должен решить следующие задачи:
-
обосновать выбор модели катастрофы (тип особенности);
-
оценить параметры модели в исследуемом диапазоне случайных величин;
-
оценить области применимости и достоверности построенного распределения.
Настоящее исследование посвящено разработке алгоритмов анализа данных, основанных на интеграции методов математической статистики и
математических методов теории катастроф, учитывающих сложный нелинейный характер изучаемых явлений и как следствие - множественность равновесных состояний изучаемого объекта.
ЦЕЛЬЮ РАБОТЫ явилась разработка методов статистической обработки данных с использованием нелинейных параметрических моделей кас-поидных катастроф, исследование их характеристик, количественного и качественного соответствия этих моделей сложным объектам экспериментальных исследований.
ЗАДАЧИ ИССЛЕДОВАНИЯ, решенные в ходе выполнения работы таковы:
-
Разработка методов оценки параметров статистических моделей катастроф каспоидного типа в исследуемом диапазоне случайных величин.
-
Разработка методов проверки гипотезы о наличии распределения заданного типа каспоидной катастрофы.
-
Разработка программного комплекса, позволяющего накапливать данные с учетом экспертных знаний об исследуемом явлении.
4. Создание программного комплекса для исследования статистических
данных с помощью предложенных методик.
НАУЧНАЯ НОВИЗНА работы заключается в следующем.
1. Предложены статистические методы обработки данных с использованием
математических моделей теории катастроф:
» метод моментов,
метод максимального правдоподобия,
результатом которых является построение вероятностной модели сложного
объекта, обладающего свойствами мультимодальности.
-
Разработаны критерии статистической проверки гипотезы о бимодальном распределении типа катастрофы "сборки".
-
Разработана технология обработки данных, имеющих выраженный многомодальный характер распределения.
4. Предложен метод тестирования программ построения коэффициентов
статистических моделей катастроф на основе аналитических моделей.
ПРАКТИЧЕСКАЯ ЗНАЧИМОСТЬ РАБОТЫ состоит в
-
Создании аналитически и экспериментально обоснованного способа построения систем обработки данных, имеющих многомодальный характер распределений.
-
Использовании разработанных методов в анализе медицинских данных, что позволило выполнить оценку достоверности выделения клинических признаков, определяющих тяжесть заболевания, развитие осложнений и оценить исход заболевания.
-
Метод моментов для обработки данных, который является адекватным для анализа статистических распределений, имеющих выраженный /^-модальный характер.
-
Метод моментов для анализа шазиунимодальных статистических распределений, имеющих сильное отлчие от нормального распределения вследствие внутренней многомодальное исследуемого процесса или объекта.
-
Метод оценки достоверности моделей каспоидных катастроф, являющийся основой для статистического анализа данных с многомодальным характером распределения на основе теории катастроф.
-
Комплекс вычислительных программ для обработки и хранения данных, основанный на экспертных знаниях об исследуемом объекте, который позволяет проверять гипотезы о достоверности связи зависимых параметров.
-
Методика тестирования программ построения моделей катастроф в статистическом анализе случайных данных, являющегося необходимым этапом для последующего их внедрения в практику статистического анализа.
Основные положения диссертации докладывались на всеармейской научно-практической конференции «Здоровье военнослужащих и статистические методы его изучения» (ноябрь 1999 года, Военно-медицинская академия), на научно-практической «Возможности и перспективы агрессивной, инвазивной терапии и пластической реконструктивной хирургии» (ГВКГ им. акад. Н.Н. Бурденко, декабрь 1999 года).
Созданная система анализа и хранения данных с 1998 года внедрена в практику математической обработки данных исследований врачей-ученых Главного военного клинического госпиталя имени академика Н.Н. Бурденко.
По теме диссертации опубликовано 11 статей в центральных журналах и сборниках научных работ.
ОБЪЕМ И СТРУКТУРА РАБОТЫ