Содержание к диссертации
Введение
ГЛАВА 1. Проблемы автоматизации процедур прогнозирования процессов, представленных короткими временными рядами 15
1.1. Цели, этапы и методы анализа временных рядов 15
1.2. Анализ временных рядов 17
1.2.1. Детерминированная и случайная составляющие временного ряда ... 17
1.2.2. Порядок анализа временных рядов 18
1.2.3. Методы сведения к стационарности 20
1.2.4. Методы исследования структуры стационарного временного ряда... 23
1.2.5. Линейные модели временных рядов 25
1.3. Существующие системы анализа данных (статистические пакеты) 27
1.4. Существующие пакеты анализа временных рядов 31
1.5. Недостатки традиционных методов и существующих систем анализа временных рядов и способы их устранения 36
1.6. Классификация формальных описаний процессов, применимых для прогнозирования процессов с детерминированной составляющей 40
1.7. Основные результаты 42
ГЛАВА 2. Разработка исчисления формальных мнений для квалификации результатов прогнозирования процессов 43
2.1. Предварительные замечания 43
2.2. Основные понятия и утверждения 44
2.2.1. Матрицы с нормализованными столбцами 44
2.2.2. Правильная матрица парных сравнений 47
2.3. Метрика в пространстве мнений экспертов. Объединение и вычитание мнений 49
2.4. Унификация мнений. Показатель однородности мнения эксперта.. 52
2.5. Альтернативные способы унификации мнений 54
2.5.1. Унификация мнений с помощью предела степени нормализованной матрицы парных сравнений 54
2.5.2. Унификация мнений с помощью усреднения столбцов нормализованной матрицы парных сравнений... 56
2.5.3. Унификация мнений с помощью собственного вектора матрицы парных сравнений (метод Саати) 57
2.6. Методика сравнения альтернативных способов унификации мнений 59
2.7. Согласование мнений группы экспертов 61
2.8. Ранжирование мнений экспертов 62
2.9. Отбраковка мнений 64
2.10. Группирование мнений , 66
2.11. Основные результаты 68
ГЛАВА 3. Разработка способов автоматического выбора значений свободных параметров прогнозирующих описаний и обобщения результатов альтернативного прогноза. 70
3.1. Постановка задачи 70
3.2. Варианты метода тестовой последовательности для определения наилучшего порядка модели 73
3.2.1. Метод последней точки 73
3.2.2. Метод тестовой последовательности фиксированной длины 75
3.2.3. Метод тестовой последовательности «оптимальной» длины 77
3.3. Оценка точности воспроизведения тенденций 80
3.4. Критерии качества прогноза. Выяснение адекватности модели прогнозируемого процесса 83
3.4.1. Векторный критерий качества прогноза 83
3.4.2. Характеристики прогнозирующих моделей 86
3.5. Уточнение наилучшего порядка модели по методу группирования результатов прогноза 93
3.5.1. Способ автоматического уточнения свободного параметра модели посредством группирования последовательных результатов прогноза 93
3.5.2. Результаты прогнозирования на основе уточненного порядка модели97
3.6. Балансовый метод 101
3.7. Консолидация прогнозов, полученных альтернативными моделями 103
3.7.1. Методика получения консолидированного прогноза 103
3.7.2. Результат консолидации прогнозов, полученных альтернативными моделями 105
3.7.3. Анализ тенденций изменения прогнозируемых показателей 108
3.7.4. Оценка консолидированного прогноза по балансовой схеме 110
3.8. Основные результаты 111
ГЛАВА 4. Программная реализация процедур прогнозирования процессов, представленных короткими временными рядами 113
4.1. Предварительные замечания 113
4.2. Формулировка требований к разрабатываемой системе 114
4.3. Архитектура интеллектуальной автоматизированной системы поддержки прогнозирования (ИАСПП) 116
4.4. Подробное описание модулей системы и их функциональное назначение И 9
4.5. Проектные решения 123
4.5.1. Выбор средств разработки 123
4.5.2. Общая структура программы и принцип ее функционирования 126
4.5.3. Систематическая работа с программой Авгур. Интерфейс пользователя 131
4.5.4. Технические и программные требования для создания и функционирования системы 135
4.5.5. Результаты внедрения 136
4.6. Основные результаты 137
Заключение 138
Библиографический список
- Детерминированная и случайная составляющие временного ряда
- Метрика в пространстве мнений экспертов. Объединение и вычитание мнений
- Варианты метода тестовой последовательности для определения наилучшего порядка модели
- Архитектура интеллектуальной автоматизированной системы поддержки прогнозирования (ИАСПП)
Введение к работе
Актуальность проблемы. Современный менеджмент - менеджмент постиндустриального периода развития общества - уже не может опираться на принципы организации более чем столетней давности. На смену реактивного управления эпохи индустриального развития приходит упреждающее управление постиндустриальной эпохи. Различия между реактивным и упреждающим управлением сводятся к тому, что в первом случае принятие решений опирается на анализ внешнего окружения, а во втором -на его прогнозирование.
Прогнозирование - это ключевой момент при принятии управленческих решений в постиндустриальном обществе. Конечная эффективность любого решения зависит от последовательности событий, возникающих уже после принятия решения. Возможность предсказать некоторые аспекты этих событий перед принятием решения позволяет сделать наилучший выбор, который, в противном случае, мог бы быть не таким удачным.
Базой упреждающего управления являются методы социально-экономического прогнозирования. Факт включения «прогнозирования и планирования» в качестве типовых элементов управленческого цикла зафиксирован еще в 1981 г. в государственном стандарте (ГОСТ 24525.0-80. Управление производственным объединением и промышленным предприятием).
Формирование рыночных механизмов в России в последнее время связано с целым рядом трудностей. Меняются организационные формы функционирования предприятий различных отраслей, усложняются экономические и социальные связи и отношения. Поэтому в деятельности менеджеров упор приходится делать не на стандартные решения, а на способность достаточно оперативно и правильно оценивать хозяйственную ситуацию и искать подход, являющийся оптимальным в конкретных условиях. Основой для такого подхода в принятии управленческих решений является экономическое прогнозирование, призванное выявить общие перспективы и тенденции организационно-структурного развития, обеспечить сбалансированность краткосрочных и долгосрочных программ. При этом важно суметь обнаружить всю совокупность факторов и причин, определяющих функционирование и развитие исследуемой хозяйственной структуры [59],
Изменчивость производственно-экономических отношений, неустойчивость, концептуальная непоследовательность и неполнота законодательной базы, регулирующей эти отношения, приводят к тому, что временные ряды, представляющие многочисленные социально-экономические процессы, имеют короткую актуальную часть. Многие новые процессы социальной и производственной сферы представляются физически короткими рядами, поскольку ранее не являлись предметом статистического учета.
Наиболее полно теоретические концепции подходов к проблеме прогнозирования изложены в научных трудах Айвазяна С.А, Андерсена Т., Бендита Дж., Бокса Дж., Бриллинджера Д., Вучкова И., Демиденко Е.З., Дженкинса Г., Джонсона М., Кендэла М., Монтгомери Б., Мхитаряна B.C., Пирсола А., Степанова B.C., Стьюарта А., Уолкера Г., Чатфилда К.
К числу наиболее известных статистических пакетов, получивших распространение в России, относятся STATGRAPHICS, SPSS, SYSTAT, BMDP, SAS, CSS, STATISTICA, S-plus, CART, MVSP, Forecast Expert, Predictor, STADIA, ЭВРИСТА, МЕЗОЗАВР, ОЛИМП:СтатЭксперт, Статистик-Консультант, САНИ, КЛАСС-МАСТЕР, Deductor [З, 11,12, 13, IS, 19, 126]. Однако они не могут быть эффективно использованы для прогнозирования процессов, представленных малым объемом статистического материала. Существующие системы прогнозирования представляют собой набор инструментальных средств анализа статистических данных и предлагают пользователям самим конструировать алгоритмы прогнозирования, что требует глубоких теоретических знаний в области статистики и эконо 7 метрики. Для подавляющего большинства реальных процессов, в силу их неустойчивости, невозможно построить эффективную процедуру автоматического выделения тренда из временного ряда. Многие алгоритмы используют для построения прогнозов предварительные оценки автокорреляционной функции, что само по себе представляет достаточно сложную задачу, учитывая необходимость выбора порядка модели и работы на коротких выборках [126]. К сожалению, почти все коммерческие программные продукты не содержат в себе элементы адаптивности и самообучения, несмотря на то, что техническая возможность и необходимый математический аппарат вполне достаточны [7].
В настоящих условиях развития экономики страны назрела необходимость повышения степени автоматизации процессов разработки прогнозов. Поэтому задача разработки алгоритмов и процедур повышения надежности и точности прогнозирования процессов, представленных короткими временными рядами, за счет автоматизации процессов экспертной квалификации прогнозов, выбора значений свободных параметров прогнозирующих описаний и обобщения результатов многоальтернативного прогнозирования, поставленная в данной диссертационной работе, является актуальной.
Целью работы является повышение точности и надёжности прогнозирования процессов с преобладающей детерминированной составляющей, представленных временными рядами с короткой длиной актуальной части, в условиях отсутствия априорной информации о вероятностных характеристиках процесса за счет повышения уровня автоматизации процедур построения адекватных формализованных описаний и их применения для решения задач прогноза.
Задачи исследования. Для достижения целей диссертационной работы необходимо решение следующих задач.
1. Разработать теоретические основы, позволяющие автоматизировать
процесс экспертного сравнения вариантов прогнозирующей модели и выбора наилучшего, по мнению эксперта, варианта прогнозирую лд щего описания изучаемого процесса.
2. Определить критерий качества прогнозирующей модели, позволяющий синтезировать описания, обладающие наибольшей прогностической силой; разработать методы определения наилучшего значения свободного (структурирующего) параметра прогнозирующей модели.
3. Разработать альтернативные способы прогнозирования, учитывающие специфику совокупности актуальных процессов и методику обобщения прогнозов, полученных альтернативными моделями.
4. Разработать концепцию построения интеллектуальной автоматизированной системы поддержки прогнозирования (ИАСГТП) процессов, представленных короткими временными рядами.
Методы исследования. При выполнении работы использовались теория вероятностей, математическая статистика, теория математического и статистического моделирования, методы вычислительной и прикладной математики, эвристическое и объектно-ориентированное программирование.
Научная новизна работы состоит в следующем:
1. Разработана теоретическая платформа для создания системы автоматизации процесса формирования экспертных заключений относительно качества прогноза процессов с целью повышения степени из влечения интуитивных знаний эксперта, основанная на исчислении формальных мнений.
2. Для определения наилучшего порядка модели, оценки точности и надежности прогноза предложено использовать методы тестовой последовательности фиксированной и оптимальной длины, а также способ автоматического уточнения наилучшего значения свободного параметра прогнозирующей модели посредством группирования по A следовательных результатов прогноза. 3. Разработан новый альтернативный способ прогнозирования, названный балансовой схемой, позволяющий учесть специфику совокупности актуальных процессов.
4. Предложена методика разработки прогноза, отличающаяся применением альтернативных прогнозирующих описаний, обеспечивающая наиболее полное использование информационного содержимого статистических данных за счёт консолидации альтернативных прогнозов.
5. Предложена концепция построения интеллектуальной автоматизированной системы поддержки прогнозирования (ИАСПП), функционирующей в автоматическом и полуавтоматическом режимах, включающая в себя экспертную систему, использующуюся для анализа результатов прогнозирования, а также адаптации алгоритмов определения свободных параметров прогнозирующих описаний и алгоритмов консолидации.
Практическая ценность. Результаты диссертации нацелены на повышение эффективности процессов разработки прогнозов процессов, представленных короткими временными рядами, и обеспечивают:
1) высокую надежность и точность прогноза процессов, представленных малыми объемами статистического материала; высокую скорость разработки прогноза;
2) высокую эффективность использования человеческого фактора в процессе разработки прогноза (экспертное сопровождение различных этапов прогнозирования); 3) формирование методологии систематического построения прогнозов.
Исследования, проведенные в рамках диссертационной работы, были применены при проектировании и внедрении системы Авгур v 1.1 прогнозирования процессов, представленных короткими временными рядами.
Указанная система внедрена в деятельность Федеральной службы государственной статистики. Результаты диссертации успешно использованы при разработке прогнозов показателей занятости населения РФ в экономике страны, показателей производственного травматизма («Численность пострадавших с утратой трудоспособности на 1 рабочий день и более и со смертельным исходом, чел.», «Численность пострадавших со смертельным исходом, чел.», «Численность пострадавших с утратой трудоспособности на 1 рабочий день и более и со смертельным исходом в расчете на 1000 работающих», «Численность пострадавших со смертельным исходом в расчете на 1000 работающих», «Число дней нетрудоспособности у пострадавших с утратой трудоспособности на 1 рабочий день и более и со смертельным исходом в расчете на 1 пострадавшего», «Численность лиц с впервые установленным в отчётном году профзаболеванием») в РФ, процессов спроса и предложения на оптовом рынке электроэнергии.
Результаты диссертационной работы являются основой для проектирования и создания интеллектуальной автоматизированной системы поддержки прогнозирования (ИАСПП) процессов, представленных короткими временными рядами. Предложенные методы и алгоритмы позволяют наиболее эффективно строить подобные системы.
Разработанные методы и средства построения ИАСПП могут быть приняты за основу при создании современных программных инструментальных систем подобного типа.
Достоверность и обоснованность научных положений, результатов, выводов и рекомендаций, приведенных в диссертационной работе, обеспечиваются использованием надежных методов исследования и подтверждаются: корректностью использования адекватного математического аппарата; совпадением полученных результатов в частных случаях с известными в теории результатами; хорошей апробацией материалов диссертации; успешным внедрением результатов в практику разработки прогнозов социально-экономических процессов в РФ. Реализация и внедрение результатов работы. Результаты диссертационной работы внедрены в деятельность Федеральной службы государственной статистики и используются для прогнозирования показателей занятости населения Российской Федерации (численность безработных, численность занятых в экономике, численность экономически активных и неактивных); в учебный процесс студентов специальности 220400, 351400 в Рязанской государственной радиотехнической академии.
Программный продукт имеет свидетельство №502005318 от 23.03.05 об официальной регистрации программы «Программная система прогнозирования процессов с детерминированной составляющей» (краткое название "Авгур" vl.l) для ЭВМ в Отраслевом фонде алгоритмов и программ (ОФАП) Государственного координационного центра информационных технологий Минобразования России.
Основные результаты, выносимые на защиту.
1. Основы исчисления формальных мнений - теоретическая платформа для создания системы автоматизации процесса формирования экспертных заключений относительно качества прогноза.
2. Алгоритм и программа определения наилучшего значения свободного (структурирующего) параметра модели методом тестовой последовательности оптимальной длины. Алгоритм и программа автоматического уточнения наилучшего значения свободного параметра прогнозирующей модели посредством группирования последовательных результатов прогноза.
3. Методика прогнозирования, учитывающая специфику совокупности актуальных процессов (балансовая схема).
4. Методика консолидации результатов альтернативных прогнозов.
5. Концепция построения интеллектуальной автоматизированной системы поддержки прогнозирования (ИАСПП), включающая в себя экспертную систему анализа результатов прогнозирования, а также адаптации алгоритмов определения свободных параметров прогнозирующих описаний и алгоритмов консолидации.
Апробация работы. По теме диссертации сделаны доклады на 8-ой, 9-ой и 10-й всероссийских научно-технических конференциях «Новые информационные технологии в научных исследованиях и в образовании», Рязань, 2003-2005 гг.; всероссийском конкурсе на лучшие научно-технические и инновационные работы творческой молодежи России по естественным наукам, Саратов, 2003 г.; 12-ой международной научно-технической конференции «Проблемы передачи и обработки информации в сетях и системах телекоммуникаций», Рязань, 2004 г.; межвузовской научно-технической конференции студентов, молодых ученых и специалистов «Новые информационные технологии в учебном процессе и производстве», Рязань, 2004 г.; 5-ой межрегиональной научно-практической конференции «Современные информационные технологии в образовании», Рязань, 2004 г.; 5-ой всероссийской научно-технической конференции «Проблемы информатики в образовании, управлении, экономике и технике», Пенза, 2004 г.; 13-ой международной научно-технической конференции «Проблемы передачи и обработки информации в сетях и системах телекоммуникаций», Рязань, 2004 г.; а также на научных семинарах кафедры ВПМ РГРТА.
Публикации. По теме диссертационной работы опубликовано 11 печатных работ, среди которых 2 статьи, 9 тезисов к докладам на международных и всероссийской научно-технических конференциях. Получено 1 свидетельство об официальной регистрации программы для ЭВМ.
Структура и объем работы. Диссертация состоит из введения, четырех глав, заключения, списка литературы и пяти приложений. Основной текст содержит 154 страницы, 16 таблиц, 29 рисунков. Список литературы состоит из 137 наименований. Приложения выполнены на 15 страницах.
Во введении дается обоснование актуальности темы работы, формулируются цели и задачи исследований, представляются основные положения диссертационной работы, выносимые на защиту. Первая глава посвящена обоснованию темы диссертации. В главе намечены направления исследований, определяются основные цели и задачи, решаемые в диссертационной работе. Приводится обзор работ по теме диссертации, вводятся основные понятия и определения.
Для достижения поставленной цели в диссертационной работе предложено использовать многоальтернативное прогнозирование, призванное компенсировать потенциальные ошибки частных прогнозов, обусловленные неполным восстановлением процессов частными описаниями, В качестве одного из прогнозирующих описаний предложено использовать рекуррентную схему, аппроксимирующую процесс в целом. Рекуррентная схема точно воспроизводит процессы, описываемые следующими функциями: 1) показательные; 2) полиномы; 3) гармонические; 4) произведение показательных функций на гармонические функции и полиномы; 5) линейные комбинации вышеописанных вариантов.
Во второй главе излагаются теоретические результаты, которые могут быть квалифицированы как начала теории исчисления формальных мнений. Определяется понятие формального мнения. Устанавливаются операции объединения, вычитания, унификации, согласования, упорядочения, отбраковки, коррекции и группирования мнений. Стимулом к созданию исчисления формальных мнений являются исследования возможных подходов к решению задачи квалификации проблемных процессов в алгоритмах автоматического построения формальных описаний. Базой исследований является один из продуктивных инструментов теории групповых решений - матрица парных сравнений, используемая для представления мнений экспертов относительно нескольких вариантов выбора. Применительно к рассматриваемой задаче речь идет как о реальных экспертах-субъектах, так и о некоторых критериях качества, вычисляемых в процессе автоматического построения модели.
Третья глава посвящена разработке способов автоматического выбора значений свободных параметров прогнозирующих описаний и обобщения результатов альтернативного прогноза. Рассмотрены альтернативные варианты метода тестовой последовательности для определения наилучшего порядка прогнозирующей модели, оценки точности и надежности прогноза. Вводятся новые показатели качества прогноза актуального процесса, наиболее полно отражающие точность воспроизведения знаков приращений процесса. Определен векторный критерий качества прогнозирующей модели, включающий дополнительные оценки надёжности прогноза. Предложен способ автоматического уточнения наилучшего значения свободного параметра прогнозирующей модели. Рассмотрено применение балансовой схемы прогнозирования в качестве дополнительного способа построения прогнозирующего описания. Предложена методика обобщения прогнозов, полученных альтернативными моделями. Все теоретические предпосылки и предлагаемые алгоритмы сопровождаются результатами вычислений, основанных на реальных данных Федеральной службы государственной статистики.
В четвертой главе излагается концепция построения интеллектуальной автоматизированной системы поддержки прогнозирования (ИАСПП) процессов, представленных короткими временными рядами. Формулируются требования, предъявляемые к разрабатываемой системе. Предлагается архитектура ИАСПП с подробным описанием модулей системы и их функциональным назначением. Приведена общая структура и принципы функционирования системы прогнозирования процессов с детерминированной составляющей "Авгур", реализующей отдельные принципы, идеи и положения концепции построения ИАСПП. Рассмотрены принципы систематической работы с программой "Авгур", приведены технические и программные требования, предъявляемые к ней, предложен интерфейс пользователя.
В заключении приводится обобщение основных результатов диссертационной работы.
Детерминированная и случайная составляющие временного ряда
Как и большинство других видов анализа, анализ временных рядов предполагает, что данные содержат систематическую (детерминированную) составляющую и случайный шум (ошибку), который затрудняет обнаружение регулярных компонент. Большинство методов исследования временных рядов включает различные способы фильтрации шума, позволяющие увидеть регулярную составляющую более отчетливо [28].
Аддитивной моделью временного ряда называют представление ряда в виде суммы детерминированной и случайной компонент, а именно: xt=dt+Et при t = ї,...,п или X = D + E Мультипликативной моделью временного ряда называют представление ряда в виде произведения детерминированной и случайной компонент, а именно: xt d(xzt при t = 1,...,и или X = DxE
Способы описания детерминированных компонент временного ряда сильно зависят от области приложений. В экономических (и многих других) приложениях в детерминированной компоненте временного ряда Добычно выделяют три составляющих части: тренд trn сезонную компоненту st и циклическую компоненту ct. d,=trt+st+cn при ґ = 1,...,и.
В последнее время к указанным трем компонентам все чаще добавляют еще одну компоненту, именуемую интервенцией. Под интервенцией понимают существенное кратковременное воздействие на временной ряд. Примером интервенции могут служить события «черного вторника» [33].
В теоретических исследованиях и практических задачах важную роль играют последовательности случайных величин, вероятностные свойства которых не изменяются во времени. Такие случайные последовательности называют стационарными. Их можно использовать для описания временных рядов, течение которых стабилизировалось и происходит в неизменных условиях [28, 31].
Случайный процесс X(t) называется стационарным, если для любых n,tx,t2 tn и г распределения случайных величин (X(tt),..., X(t„y) и (X(t{ + т), „., X(t„ + т)) одинаковы.
Целью статистического анализа временных рядов является построение математической модели ряда, с помощью которой можно объяснить поведение ряда и осуществить прогноз его дальнейшего поведения [49].
Построение и изучение графика. Анализ временного ряда обычно начинается с построения и изучения его графика. Если нестационарность временного ряда очевидна, то первым делом надо выделить и удалить нестационарную составляющую ряда. Процесс удаления тренда и других компонент ряда, приводящих к нарушению стационарности, может прохо дить в несколько этапов. На каждом из них рассматривается ряд остатков, полученный в результате вычитания из исходного ряда подобранной модели тренда, или результат разностных и других преобразований ряда. Кроме графиков, признаками нестационарности временного ряда могут служить не стремящаяся к нулю автокорреляционная функция (за исключением очень больших значений лагов) [49].
Подбор модели для временного ряда. Цель этого этапа — описание и учет в дальнейшем анализе корреляционной структуры рассматриваемого процесса. При этом на практике чаще всего используются два типа моделей: параметрические модели авторегрессии-скользящего среднего (ARMA-модели) и полигармонические модели [119].
Модель может считаться подобранной, если остаточная компонента ряда является процессом типа белого шума [126]. После подбора модели обычно выполняются: оценка дисперсии остатков, которая в дальнейшем может быть использована для построения доверительных интервалов про гноза; анализ остатков с целью проверки адекватности модели.
Прогнозирование или интерполяция. Последним этапом анализа временного ряда может быть прогнозирование его будущих (экстраполяция) или восстановление пропущенных (интерполяция) значений и указания точности этого прогноза на базе подобранной модели. Хорошо подобрать математическую модель удается не для всякого временного ряда. Неоднозначность подбора модели может наблюдаться как на этапе выделения детерминированной компоненты ряда, так и при выборе структуры ряда остатков. Поэтому исследователи довольно часто прибегают к методу нескольких прогнозов, сделанных с помощью разных моделей.
Метрика в пространстве мнений экспертов. Объединение и вычитание мнений
Для решения задач унификации и согласования мнений, сравнения различных способов унификации и согласования, а также для разработки методов ранжирования и классификации частных оценок целесообразно определить метрику в пространстве суждений экспертов.
Пространство мнений экспертов целесообразно представить множеством PSCN-матриц — матриц парных сравнений с нормализованными столбцами [36]. Для обозначения таких матриц используем букву В. В этом пространстве матрицы с одинаковыми столбцами выражают: 1) различные частичные мнения одного эксперта; 2) унифицированное мнение одного эксперта; 3) согласованное мнение группы экспертов.
Матрицы с различными столбцами представляют исходные мнения экспертов. Множества PSCN-матриц представляют собой групповое мнение, или мнение группы.
Количество различных частичных мнений эксперта равно количеству различных столбцов в PSCN-матрице. Это замечательное свойство и большая сопоставимость нормализованных значений является причиной использования для определения пространства мнений именно нормализованных матриц.
Определение. Назовём формальным мнением произвольную PSCN-матрицу В, т.е. матрицу размером «хл, элементы которой удовле творягот следующим требованиям: все элементы положительны, значение каждого элемента принадлежит интервалу (0; 1), сумма элементов каждого столбца равна единице. Формальным групповым мнением назовём множество В PSCN-матриц. Количество PSCN-матриц, ассоциированных с мнением , будем называть мощностью мнения, и обозначать \ Ё \
Взаимосвязь между мнениями и матрицами будем выражать записями: В = Matrix(); = Opinion(B).
Замечание: в определениях операций над мнениями отдельное мнение рассматривается как групповое, мощность которого равна 1.
Различные варианты мнений будем различать верхними индексами с дополнительными квалификаторами: , х, , М. Первый индекс всегда означает номер эксперта. Квалификатор символизирует частичное мнение эксперта. Если за располагается индекс, то он означает номер частичного мнения. Квалификатор х символизирует групповое мнение нескольких экспертов. Если за х располагается индекс, то он означает номер группы. Квалификатор символизирует унифицированное мнение одного эксперта и согласованное групповое мнение нескольких экспертов. Если за располагается индекс, то он означает номер способа унификации мнения или способа согласования группы мнений. Квалификатор М символизирует среднее мнение группы, получаемое усреднением PSCN-матриц, соответствующих отдельным мнения группы [36, 37].
Примеры обозначений: (gfi - мнение эксперта с номером /; w -у -е частичное мнение эксперта без номера; @хИ,1р] - мнение к-й группы экспертов, согласованное р-и способом.
Частичным мнениям экспертов соответствуют правильные матрицы парных сравнений С } 1= 1, и, производимые от исходной матрицы парных сравнений С следующим образом.
Определение: матрица С и является частичной правильной матри цей, произведённой от матрицы парных сравнений С, если справедливо -± следующее утверждение: (я є N)A(V/є {1,2,...,л} (((гє{1,2,...,п})л(7є{1,2,...,и})л Согласно этому определению частичная правильная матрица С и формируется из одного столбца матрицы С. Она выражает частичное мне ние 2 эксперта относительно базового варианта с номером /. Ей соот ветствует частичная матрица с нормализованными столбцами: В [Ч = CNor(C ). Различие частичных мнений эксперта можно количест венно выражать различием между их частичными матрицами В 1- 1 (/ = 1, п). 4 Определим евклидову метрику на множестве мнений экспертов следую щим образом.
Варианты метода тестовой последовательности для определения наилучшего порядка модели
Определить наилучший порядок модели можно, в частности, следующим образом. Путем отброса последней (финальной) точки заданной последовательности формируется y fm -yJtj-\t2st..tn-l обучающая по следовательность длиною п -1, где п - количество отчетов наблюдаемого процесса. По этой последовательности формируется прогнозирующая модель порядка L, Затем многократно, с постоянно нарастающим значением L решается задача прогноза на глубину одной точки h = 1, т.е. осуществляется многократный прогноз тестовой точки [42, 43]. Точность прогноза оценивается ошибкой прогноза тестовой точки, определяемой как модуль разности между значением процесса в тестовой точке и его прогнозом: = Уп-У где уп значение процесса в последней (тестовой) точке п\ у] - значение прогноза процесса в последней (тестовой) точке п.
В качестве наилучшего значения L порядка модели используется значение L, при котором минимальна ошибка прогноза є, т.е. = gUS?2.-.(e)) Функция, вычисляющая вектор значений ,L = l,2,...,и-1 и возвращающая значения Lopl и є, на языке программирования Mathcad может быть записана, как показано на рисунке 3.3.
Функция определения наилучшего порядка модели по методу последней точки Пригодность используемого инструментария для прогнозирования изучаемого процесса можно, в частности, оценить по значению є. Чем ближе оно к нулю, тем надёжней получаемый прогноз.
Данный метод целесообразно использовать только при малых объемах статистических данных 3 п 5.
Метод тестовой последовательности фиксированной длины
Для определения наилучшего порядка модели при средних и боль ших объемах статистических данных целесообразно использовать сле дующий способ. В финальной части заданной последовательности исход ных данных выделяется тестовый участок (тестовое окно) длиною h зна чений: yf" = y„.h+j, j = 1, 2,..., h. Оставшаяся часть данных yU = yitі = 1 2,...,71-h квалифицируется как обучающая последователь ность. По этой последовательности формируется прогнозирующая модель порядка L. Затем многократно, с постоянно нарастающим значением L ре шается задача прогноза на глубину h данных, представленных обучающей последовательностью, т.е. осуществляется многократный прогноз тестового участка. Качество прогноза может быть оценено с помощью относительной среднеквадратическои ошибки прогноза последних h значений [42,43].
Относительная среднеквадратическая ошибка прогноза определяется следующим образом: где eeff л\тУ (У -Уі)2 - среднеквадратическая ошибка прогноза про цесса на тестовом участке; s - среднеквадратическое отклонение процесса на тестовом участке.
Среднеквадратическая ошибка прогноза отражает степень близости значений процесса и его прогноза. Относительная среднеквадратическая ошибка прогноза отражает погрешность прогноза как долю показателя вариативности процесса на прогнозируемом участке. В качестве показателя вариативности процесса используется его среднеквадратическое отклонение от среднего значения. Эта форма представления погрешности прогноза более адекватна традиционному требованию надлежащей точности воспроизведения прогнозом вариативной составляющей процесса. Величина среднего значения процесса при оценке точности прогноза, как правило, не так важна.
В качестве наилучшего значения Lopl порядка модели используется значение L, при котором минимальна относительная среднеквадратическая ошибка прогноза teff, т.е. Lopt = arg( nrin_ (ее#)).
Функция, вычисляющая вектор значений Ъей, L = \, 2,..., п-Л и возвращающая значения Lopt и teff, на языке программирования Mathcad может быть записана, как показано на рисунке 3.4.
Архитектура интеллектуальной автоматизированной системы поддержки прогнозирования (ИАСПП)
Исходя из целей преследуемых реализацией интеллектуальной автоматизированной системы поддержки прогнозирования (п. 4.1) и требований, сформулированных в предыдущем параграфе, предлагается архитектура ИАСПП, включающая следующие элементы.
1. Система управления исходными данными: а) система архивирования статистических данных; б) архив статистических данных; в) система архивирования исходных данных; г) архив исходных данных; д) система формирования исходных данных из статистиче ских данных.
2. Система управления прогнозирующими моделями и алгоритмами подбора свободных параметров прогнозирующих описаний: а) банк прогнозирующих описаний; б) банк алгоритмов определения свободных параметров моделей; в) банк алгоритмов консолидации альтернативных прогно зов; г) система пополнения банков моделей и алгоритмов.
3. Система управления процессом построения моделей и процессом прогнозирования: а) система определения свободных параметров прогнози рующих описаний; б) система оценки параметров прогнозирующих описаний; в) система решения задач прогнозирования; г) система формирования финального прогноза (прогно зов),
4. Система поддержки экспертных заключений о качестве прогноза.
5. Система управления архивами прогнозов и архивами протоколов прогнозов: а) система архивирования результатов прогнозирования; б) архив результатов прогнозирования; в) система архивирования протоколов решения задач про гноза; г) архив протоколов решения задач прогноза.
6. Экспертная система анализа результатов прогнозирования, адап тации алгоритмов определения свободных параметров прогнози рующих описаний и консолидации альтернативных прогнозов: а) база знаний; б) машина извлечения знаний; в) система логического вывода; г) машина объяснений. 7. Система управления отчетной документацией: а) система формирования отчетов; б) отчеты, сформированные в различных форматах пред ставления данных.
В данном параграфе дается подробное описание и функциональное назначение модулей системы, схема которой представлена на рисунке 4.1, описываются основные этапы функционирования системы.
Система управления исходными данными предназначена для обеспечения ввода, хранения статистических материалов, а также для формирования на их основе исходных данных, предназначенных непосредственно для построения прогноза. Данная система позволяет пользователю производить ввод статистических данных на основе имеющегося статистического материала на предприятии и помещать их в архив. Размещение данных в архиве, а также их извлечение из него обеспечивается системой архивирования статистических данных. Исходные данные, на основе которых производится прогноз, формируются из статистических данных посредством системы формирования исходных данных. Исходные данные, так же как и статистические данные, помещаются в архив исходных данных, и это обеспечивается соответствующей системой архивирования. В результате совместного функционирования данных систем на вход системы управления процессом построения модели и процессом прогнозирования передаются исходные данные с целью последующего построения прогноза.
Система управления прогнозирующими моделями и алгоритмами подбора свободных параметров прогнозирующих описаний предназначена для использования экспертами, являющимися специалистами в области прогнозирования. Банк прогнозирующих описаний предусмотрен для хранения прогнозирующих моделей, используемых системой в целом. Банк алгоритмов определения свободных параметров прогнозирующих описаний предусмотрен для хранения алгоритмов, на базе которых проис ходит построение моделей прогнозирования. Банк алгоритмов процедур консолидации предназначен для осуществления хранения алгоритмов, на основе которых происходит формирование финального прогноза как результата обобщения прогнозов, полученных разными моделями. Система пополнения банков алгоритмов и моделей предназначена для пополнения и редактирования моделей и алгоритмов, размещаемых в соответствующих банках хранения.
Система управления архивами прогнозов и архивами протоколов прогнозов предназначена для осуществления хранения в архивах результатов полученных прогнозных значений, а также протоколов решения задач прогнозирования. Предусмотрено два архива: архив результатов прогнозов и архив протоколов прогнозирования. Помещение данных в архивы и извлечение данных из архивов осуществляются с помощью соответствующих систем архивирования.
Система управления процессом построения моделей и процессом прогнозирования предназначена для решения задач построения прогнозирующих моделей, подбора их свободных параметров, а также для формирования финального прогноза (прогнозов). Данная система на входе получает исходные данные, которые являются предметом прогнозирования. Система определения свободных параметров моделей осуществляет подбор этих параметров для моделей, предоставленных банком прогнозирующих описаний, на основе алгоритмов, содержащихся в банке алгоритмов определения свободных параметров. Система оценки параметров моделей определяет параметры моделей, не являющиеся свободными (например: коэффициенты полинома или порядок р модели RS(p)). Система задач прогнозирования решает задачу построения прогноза исходных данных на основе моделей, размещенных в банке прогнозирующих описаний, и их подобранных параметров, в том числе и свободных.