Введение к работе
Актуальность темы диссертации. Одним из важнейших направлений современной прикладной математики является разработка принципов и методов построения математических моделей, а также создание средств автоматизации научных исследований объектов, явлений и процессов различной физической природы на базе применения математических моделей с целью дальнейшего установления их свойств и прогнозирования их динамики. Принципы и методы математического моделирования и прогнозирования используются при автоматизации научных исследований в технике, физике, социологии и в других сферах научно-практической деятельности человека. Следует отметить, что согласно отчету ГВАК Российской Федерации за 1998 год паиболее перспективными направлениями диссертационных исследований по специальности 05.13.16 являются моделирование и создание систем оценки эффективности экономических инструментов управления, экологического мониторинга и т.д.
Для построения математической модели объекта и прогнозирования его динамики важно представить связи между элементами объекта пе только качественно, но и в сжатом виде количественно. Именно поэтому, многомерная линейная регрессия (МЛР) и системы одновременных уравнений1 (СОУ), обобщающие МЛР, нашли широкое применение в математическом моделировании сложных систем.
Для идентификации моделей МЛР и СОУ и прогнозирования используются методы, основанные на методе наименьших квадратов (МНК). Этот метод для обеспечения требуемой точности предъявляет достаточно "жесткие" требования как к моделям, так и к собраппым экспериментальным данным. Однако, на практике гипотетические модельные предположения часто нарушаются. Это связано с конечным объемом экспериментальных данных, ошибками при регистрации и при обработке наблюдений, аппроксимационной природой моделей и другими причинами. В таких случаях методы идентификации и прогнозирования, предложенные исходя из гипотетической модели, теряют свою эффективность, приводят к неудовлетворительным результатам, и не могут применяться на практике. Поэтому для построения более точных и надежных моделей объектов и явлений возникает необходимость создания новых робастпых методов моделирования и прогнозирования, устойчивых (робастпых) к "малым" отклонениям от гипотетических предположений.
В этом направлении работает ряд известных ученых: Хьюбер П., Хампель Ф., Раусеу Р., Лерой А., Айвазян С.А., Рудзкис Р., Ха-рин Ю.С. и многие другие. В области робастного моделирования
:от англ. "simultaneous equations systems"
и прогнозирования с использованием модели множественной линейной регрессии (являющейся частным случаем МЛР) уже получены существенные аналитические и прикладные результаты. Однако, количественные выражения для характеристик устойчивости моделирования и прогнозирования на основе МЛР не встречаются.
При идентификации СОУ подобные исследования только начинаются (Краскер В., Ронкетти Е., Уэлч Р.) и носят эвристический характер. Основные трудности здесь создают: высокая размерность СОУ, что значительно усложняет проведение аналитических исследований; сложная корреляционная структура зависимых переменных, требующая специальных методов оценивания параметров; подстановочный характер существующих методов идентификации СОУ.
Необходимость решения проблемы устойчивости при моделировании и прогнозировании с использованием МЛР и СОУ, возникающая в различных областях при автоматизации научных исследований, обуславливает актуальность темы диссертационной работы.
Связь работы с крупными научными программами, темами. Исследования проводились при выполнении в БГУ следующих научно-исследовательских работ (НИР, с указанием номера госрегистрации): г/б НИР 19972532 "Разработать систему проблемно-ориентированных пакетов прикладных программ в области статистического анализа данных и моделирования" (1997-1998 г.г.) по Республиканской научно-технической программе "Информатика", г/б НИР 19963454 "Разработка методов и алгоритмов робастного (устойчивого) статистического анализа многомерных и динамических данных при наличии функциональных искажений" (1996-1999 г.г.) по Государственной программе фундаментальных исследований РБ "Алгоритм", г/б НИР 19973433 "Разработать математическое и программное обеспечение эконометрического моделирования и прогнозирования динамики важнейших макроэкономических параметров" (1997-1998 г.г.) по Государственной научно-технической программе "Разработать экономические и социальные основы Белорусской государственности (Экономика и социальная политика)", г/б НИР 19982771 "Разработка методов, алгоритмов и программных средств устойчивого прогнозирования и восстановления зависимостей" (1998 г., грант поддержки аспирантов и студентов БГУ).
Цели и задачи исследования. Целью диссертационной работы является количественная оценка устойчивости моделирования и прогнозирования с использованием МЛР и СОУ при искажениях гипотетической модели, а также разработка и применение новых алгоритмов идентификации СОУ, устойчивых к заданным типам искажений, для моделирования и прогнозирования динамики сложных систем, что предполагает решение следующих основных задач:
-
Получить аналитические выражения характеристик устойчи-иости МНК-алгоритма моделирования и прогнозирования с использованием МЛР при нарушениях предположений гипотетической модели ("выбросы" Тыоки-Хыобера, аддитивные ошибки в независимых переменных, функциональные искажения).
-
Получить аналитические выражения характеристик устойчивости моделирования и прогнозирования с использованием СОУ и "аппроксимационного" метода идентификации СОУ для гипотетической модели и при нарушениях предположений гипотетической модели ("выбросы" Тьюки-Хьюбера, аддитивные ошибки в независимых переменных, функциональные искажения).
-
Построить новые робастные оценки параметров СОУ и провести анализ их устойчивости к различным типам искажений гипотетической модели ("выбросам" Тьюки-Хьюбера, аддитивным ошибкам в независимых переменных, функциональным искажениям), применить их для прогнозирования динамики зависимых переменных.
-
Разработать алгоритмы, реализующие робастные оценки параметров СОУ, использовать их в пакетах прикладных программ для моделирования и прогнозирования динамики сложных систем.
Объект исследования. Объектом исследования являются модели МЛР и СОУ, а также методы и алгоритмы их идентификации и прогнозирования.
Методика исследования. Предложенная в диссертациоппой работе методика исследования устойчивости моделирования и прогнозирования с использованием МЛР и СОУ к искажениям гипоте-типеской модели основана на аналитическом вычислении матрицы париаций и матрицы смещепия оценок, а также связанных с ними характеристик, и базируется на использовании: теории вероятностей и математической статистики, теории матриц, методов статистического моделирования, метода асимптотических разложений.
Научная новизна полученных результатов.
-
Впервые получены аналитические выражения для матрицы смещения и матрицы вариаций МНК-оценки параметров регрессии, для вектора смещения и среднеквадратичного риска МНК-прогпозирования при наличии искажений гипотетической модели МЛР ("выбросов" Тьюки-Хьюбера, аддитивных ошибок в независимых переменных и функциональных искажениях).
-
Для гипотетической модели СОУ доказана состоятельность "аппроксимационной" оценки параметров СОУ и получены аналитические выражения для вектора смещения и матрицы вариаций "аппроксимационной" оценки.
-
Впервые получены аналитические выражения для вектора смещения и матрицы вариаций "аппроксимационной" оценки пара-
метров СОУ при наличии искажений гипотетической модели СОУ ("выбросов" Тьюки-Хьюбера, аддитивных ошибок в независимых переменных и функциональных искажениях).
4. Разработаны новые оценки параметров СОУ — взвешеппая "аппроксимационная" и медианная "аппроксимационная" оценки — и с помощью вычислительных экспериментов проведен анализ их устойчивости к "выбросам" Тыоки-Хьюбера, аддитивным ошибкам в независимых переменных и функциональным искажениям.
0. Разработаны новые алгоритмы идентификации СОУ на основе
взвешенной "агшроксимационной" оценки и медианной "алпроксима-
ционной" оценки, осуществлена их программная реализация.
Практическая значимость полученных результатов. Разработанные в диссертационной работе алгоритмы вычисления оценок параметров СОУ ("ашгроксимационный", взвешенный и медианный) могут применяться в организациях, занимающихся моделированием сложных систем и прогнозированием их динамики, для получения более точных и надежных моделей и прогнозов.
"Аппроксимационный" и медианный алгоритмы оценивания параметров СОУ включены в систему эконометрического моделирования и прогнозирования СЭМП (созданный в рамках ГНТП "Разработать экономические и социальные основы Белорусской государственности " в 1997-1998 г.г.) и в пакет программ "Эконометрика" (созданный в рамках РНТП "Информатика" в 1997-1998 г.г.)
Пакет СЭМП внедрен в Национальном Банке Беларуси. Акт о внедрении прилагается в Приложении 2 диссертационной работы.
Экономическая значимость полученных результатов. Разработанные на кафедре математического моделирования и анализа данных пакеты прикладных программ (ППП) СЭМП и "Эконометрика" , в состав которых включены результаты диссертационной работы, могут рассматриваться как коммерческие продукты, на которые имеется спрос в организациях, занимающихся моделированием и прогнозированием динамики сложных систем в технике, физике, медицине, экопомике, экологии.
Основные положения диссертации, выносимые на защиту. На защиту выносятся:
-
Новые аналитические выражения для смещения и матрицы вариаций МНК-оценки параметров регрессии, смещения и среднеква-дратического риска МНК-прогноза для трех типов нарушений гипотетической модели МЛР: "выбросов" Тыоки-Хьюбера, аддитивных ошибок в независимых переменных, функциональных искажений.
-
Доказательство состоятельности "аппроксимациоппой" оценки параметров СОУ и аналитические выражения смещения и матрицы вариаций в условиях гипотетической модели.
3. Новые аналитические выражения для смещения и матрицы
вариаций "аппроксимаииоппой" оценки параметров СОУ для трех
тттпов нарушений гипотетической модели СОУ: "выбросов" Тьюки-
Хыобера, аддитивных ошибок в независимых переменных, функци
ональных искажений.
4. Новые робастпые оценки параметров СОУ — взвешенная "ап-
цроксимационная" оценка, медианная "аппроксимационная" оцен
ка — и построенные на их основе алгоритмы идентификации СОУ.
Личный вклад соискателя. Основные результаты, приведенные в диссертации, получены автором самостоятельно. Соавторам в совместных работах принадлежат предметные постановки задач, выбор направления исследований, обсуждение результатов.
Апробация результатов диссертации. Основные результаты диссертации неоднократно докладывались и обсуждались в 1997-1999 годах на научных семинарах кафедры математического моделирования и анализа данных, 5-ой Международной конференции "Компьютерный Анализ Данных и Моделирование" (8-12 июня 1998 года, Минск), научно-практической конференции "Формирование Экономических и Социальных Основ Белорусской Государственности" (1 июля 1998 года, Минск), 6-ом Международном симпозиуме по асимптотической статистике "Prague Stochastics'98" (23-28 августа 1998, Прага, Чехия), 4-ой Республиканской конференции студентов и аспирантов Беларуси "НИРСиА-98" (7-8 октября, Гродно), 6-ой Международной научной конференции "Актуальные проблемы информатики: математическое, программное и информационное обеспечение" (26-30 октября 1998 года, Минск), 3-ей Международной конференции "Новые информационные технологии в образовании — NITE:98" (12-13 ноября 1998 года, Минск), 5-ой Международной конференции но распознаванию образов и информационным процессам "PPJP'99" (18-20 мая 1999 года, Минск), 6-ой Международной конференции по многомерной статистике "Multivariate Statistics" (19-23 августа 1999 года, Тарту, Эстопия).
Опубликованность результатов. По теме диссертационной работы опубликовано 11 научных работ, из них 2 статьи в центральных периодических научных изданиях (журналах), 8 статей в рецензируемых сборниках научных трудов и 1 тезисы докладов на научных конференциях. Общее число страниц в публикациях — 75.
Структура и объем диссертации. Диссертация состоит из введения, общей характеристики работы, четырех глав, заключения, двух приложений, списка использованных источников, включающего 109 наименований. Общий объем диссертации составляет 124 страницы машинописного текста, включая 26 рисунков на 18 страницах, 2 таблицы на 1 странице, 2 приложения на 10 страницах.