Введение к работе
Актуальность темы. За последние 20-30 лет для решения задач регрессионного анализа создано большое число новых алгоритмов и критериев. Очевидно, что факт существования большого количества алгоритмов и критериев анализа данных превращает проблему их выбора в сложную задачу. Выбор усложняется также тем, что в общем случае результаты регрессионного анализа экспериментальных данных сильно зависят от положенной в основу анализа данных модели, вида выбранного алгоритма и критерия оптимизации. Все это приводит к тому, что исследователи начинают чувствовать себя неуверенно в области регрессионного анализа из-за присущей его результатам неопределенности и субъективности.
Особенно большое значение правильный выбор алгоритмов регрессионного анализа данных имеет в естествознании, где по результатам количественной обработки экспериментальных массивов судят о механизме исследуемого явления.
Цель работы - провести теоретическое и экспериментальное исследование наиболее часто используемых в естествознании алгоритмов и критериев регрессионного анализа данных для: а) выявления истинных причин зависимости результатов количественной обработки экспериментальных данных от используемых критериев и алгоритмов; б) уточнения области их применимости; в) составления четких рекомендаций по их выбору и использованию.
Задачи исследования:
проведение сравнительного анализа ряда схем и моделей, используемых в настоящее время в естествознании при количественной обработке экспериментальных массивов;
анализ проблемы выбора алгоритмов оценивания для линейных и нелинейных по параметрам моделей с учетом точности, предъявляемой к современным естественнонаучным исследованиям;
анализ проблем, связанных с разработкой, сертификацией и эксплуатацией программных систем, предназначенных для проведения регрессионного анализа результатов естественнонаучных исследований;
разработка и создание процедур, алгоритмов, схем и программных комплексов, предназначенных для анализа данных в условиях неадекватности ряда регрессионных моделей.
4 Научная новизна. Разработана современная концепция системно-операционального подхода к проведение количественного анализа результатов прецизионных экспериментальных исследований, благодаря которой
а) построена модель анализа данных, позволяющая при проведе
нии аппроксимации экспериментальных зависимостей регрессионными
уравнениями учитывать операциональные ошибки эксперимента;
б) введено Формализованное понятие прецизионности экспери
мента;
в) разработаны оригинальные алгоритмы и схемы количествен
ного анализа данных, позволяющие проводить идентификацию пара
метров регрессионных моделей в условиях их неадекватности (на
пример, в условиях малой выборки и неоднородности массивов дан
ных) с одновременным уточнением исходной модели;
г) для линейного и нелинейного регрессионных уравнений
определены правила выбора алгоритмов оценивания их параметров;
д) определены правила выбора алгоритмов количественной
обработки (дискриминанткый, корреляционный и регрессионный ана
лизы) результатов прецизионных исследований в условиях отсут
ствия теоретических моделей;
е) разработаны рекомендации по созданию, сертификации и
эксплуатации программных систем анализа данных, учитывающих
неадекватности регрессионных моделей;
Практическая ценность работы. На основании развитой концепции системно-операционального подхода к количественному анализу результатов современных естественнонаучных исследований
Разработаны новые схемы и алгоритмы для решения задач множественного линейного регрессионного анализа в условиях неадекватности аппроксимационных моделей. Предложенные алгоритмы использованы для разработки операциональной программной системы анализа данных АЛИСА и реализованы в виде набора программ на алгоритмическом языке Фортран.
Разработаны алгоритмы, позволяющие в условиях малой выборки и неоднородности экспериментальных массивов проводить аппроксимацию экспериментальных данных дробно-линейными
5 функциями (обобщенный закон Кюри - Вейсса). Предложенные алгоритмы использованы для разработки операциональной программной системы анализа данных ИЗА и реализованы в виде набора программ на алгоритмическом языке Фортран.
- С использованием программной системы ИЗА выявлена магнитная неоднородность ряда систем на основе оксидных Фаз переменного состава, что позволило предложить и обосновать новый подход к Физическому описанию дисперсных слабомагнитных систем.
Основные защищаемые положения:
-
Модель анализа данных, позволяющая при проведении аппроксимации экспериментальных зависимостей теоретическими уравнениями учитывать возможные операциональные ошибки эксперимента.
-
Формулировки условий и критериев прецизионности естественнонаучного эксперимента.
-
Схемы, алгоритмы и программная система для решения задач множественного линейного регрессионного анализа в условиях неадекватности аппроксимационных моделей.
-
Схемы, алгоритмы и программная система для проведения в условиях малой выборки и неоднородности массивов аппроксимации экспериментальных данных дробно-линейными функциями (обобщенный закон Кори - Вейсса).
3. Модель для аппроксимации температурной зависимости магнитной восприимчивости слабомагнитных систем, позволяющая учесть магнитную неоднородность исследуемых образцов.
Апробация работы. Результаты работы докладывались на VIII Всесоюзной конференции по планированию- и автоматизации в научных исследованиях (1986), VI Всесоюзном симпозиуме по изоморфизму (1988), X симпозиуме по проблеме избыточности в информационных системах (1989), Научно-технической конференции "Технология проектирования программных и аппаратных средств вычислительных систем" (1989), Научно-практическом семинаре "Технология проектирования программных и аппаратных средств вычислительных систем" (1990), III Всесоюзном семинаре "Качество прог^ раммного обеспечения" (1991), Международной конференции "Взаимодействие Человека с Компьютером" (1992).
Публикации. Основное содержание диссертации отражено в 15 печатных работах.
Структура и объем работы. Работа состоит из введения. 3 глав, приложения, заключения и указателя литературы, содержащего 94 библиографические ссылки. Содержит 130 страниц, 17 рисунков. 2 таблицы.