Введение к работе
Актуальность. Математическое моделирование - важный этап изучения объекта или явления. В условиях большой сложности или недостаточной изученности объекта исследования построение математической модели основывается на концепции "черного ящика", когда описание поведения объекта связывается с двумя группами характеристик - входных (факторы) и выходных (отклики). Отклики рассматриваются как функции факторов. Стохастический характер зависимости обусловлен наличием как ошибок измерения характеристик, так и неизвестных "латентных" воздействий. В такой ситуации построить модель можно с помощью статистических методов на основании наблюдений за поведением объекта.
При построении линейных по параметрам моделей в регрессионном анализе предполагается, что модель известна с точностью до параметров. В случае, когда неизвестна структура модели, т.е. множество регрессоров (факторов и их функций), описывающих отклики, необходимо воспользоваться какими-либо методами выбора структуры модели.
Известным приемом для уточнения структуры модели в "классическом" статистическом анализе является проверка гипотез о незначимости параметра. Однако такой подход имеет ряд недостатков, в частности, в этом случае необходимо постулировать закон распределения исследуемых величин и назначать уровень значимости.
Для выбора структуры модели разработан оптимизационный подход, основанный на поиске структуры, доставляющей экстремум критерию качества. Развитие этого подхода связано именами Н. Akaike, D.M. Allen, G.M. Furnival, M.J. Garside, R.R. Hocking, C.L. Mallows, B.H. Вапника, А.Г. Ипахненко, А.И. Орлова, И.III. Пипскера, B.C. Степашко. Метод пошаговой регрессии (М.А. Etroimson) сочетает в себе оптимизационный подход и проверку гипотез.
Сложный объект характеризуется наличием нескольких откликов, поведение которых интересует исследователя. Такие объекты называют многомерными или многоотклнковыми. Для построения моделей многомерных объектов необходимо использовать многомерные методы, учитывающие существующие статистические взаимосвязи между откликами. Подобные методы разработаны для проведения проверки гипотез в "классическом" статистическом анализе (Н. Hotelling, D.N. Lawley, C.R. Rao, S.N. Roy, S.S. Wilks). Однако оптимизационный подход к выбору структуры многомерной модели разработай недостаточно.
В некоторых ситуациях среди факторов, воздействующих на отклики, могут присутствовать факторы, измеренные в качественной шкале. При построении таких моделей обычно используется проверка гипотез о незначимости факторов; в одномерном случае предлагалось также использовать оптимизационный подход к выбору структуры (А.А. Попов). В многомерном случае задача оптимизации структуры при наличии качественных и разнотипных факторов ранее не решалась.
Оптимизационный подход позволяет выделить из заданного набора регрессоров те, которые наилучшим образом описывают поведение откликов. В то же время при построении модели может быть доступна априорная информация об объекте исследования, на основании которой можно сформировать линейные ограничения-равенства на параметры модели. Например, в виде линейного ограничения можно сформулировать предположение о прохождении графика зависимости через определенную точку; можно задать линейное ограничение, отражающее незначимость различий между двумя уровнями качественного фактора; посредством наложения системы линейных ограничений можно ввести в многомерную модель общин параметр, т.е. параметр, присутствующий одновременно в уравнениях нескольких откликов. Пели ограничения соответствуют экспериментальным данным, то учет ограничений делает модель более адекватной объекту исследования. Проверку соответствия ограничений экспериментальным данным можно осуществить с помощью механизма проверки гипотез. Другой путь может состоять в использовании критериев качества при формировании оптимальной системы линейных ограничений на параметры. Однако в рамках оптимизационного подхода такая задача ранее не ставилась.
Цель исследования. Данная работа направлена на разработку методов оптимизации состава регрессоров и системы линейных ограничений на параметры многомерных линейных моделей с факторами количественного и качественного типов.
Научная новизна диссертационной работы состоит в следующем:
-
сформулирована обобщенная задача выбора структуры модели, включающая, наряду с выбором состава регрессоров, выбор системы линейных ограничений на параметры модели;
-
предложены критерии качества структур для многомерных моделей;
-
построены эффективные вычислительные схемы для алгоритмов решения обобщенной задачи выбора структуры;
-
разработана методика проведения и проведено экспериментальное исследование, покачавшее работоспособность критериев и алгоритмов при выборе структур для моделей различного типа;
-
разработано программное обеспечение выбора структуры многомерной модели;
6) построены многомерные модели реальных объектов.
Практическая ценность и реализация результатов. Разработанные в
диссертации подходы позволяют эффективно решать задачу оптимизации состава регрессоров и системы линейных ограничений на параметры при построении многомерных моделей. Созданное программное обеспечение позволяет автоматизировать процесс построения многомерных моделей. Разработаны многомерные модели для реальных технологических и образовательных процессов. Полученные результаты нашли практическое применение на Новосибирском заводе химконцентратов, в отделе образования Центрального р-на г. Новосибирска, на факультете прикладной математики и информатики и на кафедрах технологии машиностроения и промышленной электроники Новосибирского государственного технического университета.
Личный вклад. Все результаты, приведенные в диссертации без ссылок на чужие работы, принадлежат лично автору.
Апробация работы. Результаты диссертационной работы докладывались и обсуждались на Российских научно-технических конференциях "Информатика и проблемы телекоммуникаций" 1994 и 1996 гг., на третьей Международной научно-технической конференции "Актуальные проблемы электронного приборостроения" АПЭП-96, на втором Сибирском конгрессе по прикладной и индустриальной математике ИНПРИМ-96, на Международной научно-технической конференции "Информатика и проблемы телекоммуникаций" 1997 г., на научных семинарах "Анализ и планирование экспериментов" кафедры прикладной математики Новосибирского государственного технического университета.
Публикации. Основные результаты диссертационной работы изложены в десяти публикациях.
Структура работы. Диссертация состоит из введения, пяти разделов, заключения, списка использованных источников из 124 названий и приложения. Работа изложена на 272 страницах, включающих 104 таблицы и 52 рисунка.