Содержание к диссертации
Введение
ГЛАВА 1. Аналитический обзор моделей и методов прогнозирования 15
1.1. Анализ и классификация видов прогнозов и методов прогнозирования 15
1.2. Анализ математических основ прогнозирования 22
1.3. Анализ временных рядов 25
1.4. Анализ моделей стационарных временных рядов 27
1.5. Анализ моделей нестационарных временных рядов 30
1.6. Прогнозирование производственных показателей на основе моделей временных рядов 32
1.7. Анализ метода группового учета аргументов (МГУА) 35
1.8. Проблемы прогнозирования с использованием структурных моделей 37
1.9. Прогнозирование с использованием нейронных сетей и генетических алгоритмов 39
1.10. Постановка задачи исследования 43
ГЛАВА 2. Прогнозирование временных рядов на основе нейрокомпьютерных технологий 47
2.1. Математическая постановка задачи прогнозирования 48
2.2. Классификация нейронных сетей, сравнительный анализ существующих методов и алгоритмов обучения нейронных сетей 51
2.3. Комбинированная нейронная сеть «многослойный перцептрон» - «карта Кохонена» 59
2.4. Анализ эффективности использования простых нейронных сетей для прогнозирования спроса на продукцию 63
2.5. Зависимость времени обучения нейронной сети от количества нейронов в скрытых слоях 66
2.6. Анализ эффективности использования комбинированной нейронной сети 69
2.7. Критерии оценки качества прогнозирования 72
2.8. Задача повышения скорости обучения нейронных сетей 74
ГЛАВА 3. Методика решения задачи прогнозирования состояния производственного предприятия 78
3.1. Этапы решения задачи прогнозирования 78
3.2. Анализ объекта прогнозирования с использованием теории динамических систем 80
3.2.1. Основные положения теории хаоса 82
3.2.2. Практические исследования стохастических характеристик динамики спроса на профилированный лист 84
3.2.3 Построение фазового портрета. Восстановление аттрактора по временному ряду 89
3.2.4. Вычисление корреляционного интеграла. Вычисление корреляционной (фрактальной) размерности аттрактора , 90
3.2.5. Вычисление корреляционной энтропии , 91
3.3. Выбор состава входных факторов. Предварительная обработка данных 92
3.4. Определение параметров модели прогнозирования 98
3.4.1. Исключение избыточности данных 98
3.4.2. Определение архитектуры и структуры нейронной сети 101
3.5. Обучение нейронной сети 103
3.5.1. Подготовка данных 103
3.5.2. Описание методики одношагового прогнозирования с применением комбинированной нейронной сети 105
3.6. Апробация методики 107
ГЛАВА 4. Система автоматизированного прогнозирования. оценка погрешности вычислений в нейронных сетях 109
4.1. Сравнительный анализ существующих систем автоматизированного прогнозирования на основе нейронных сетей. Общие требования к современным САП 109
4.2. САП как подсистема АСУП на предприятии ООО «Стальные конструкции -Профлист» 113
4.3. Сравнительная оценка качества прогнозирования спроса на продукцию классических моделей и нейросетевой модели 118
4.4. Эффективность применения нейронных сетей для прогнозирования рядов с выраженным трендом 123
4.5 Оценка погрешности многослойного перцептрона в комбинированной нейронной сети 124
Заключение 132
Список использованных источников 134
- Прогнозирование производственных показателей на основе моделей временных рядов
- Анализ эффективности использования простых нейронных сетей для прогнозирования спроса на продукцию
- Построение фазового портрета. Восстановление аттрактора по временному ряду
- САП как подсистема АСУП на предприятии ООО «Стальные конструкции -Профлист»
Введение к работе
Современное развитие человека и общества имеет направленность в будущее. Рынок требует от предприятий взвешенного подхода к планированию производственного процесса, к определению необходимых объемов производства продукции, выручки, объемов закупок сырья. Как недопроизводство, так и перепроизводство ведут к недополученным прибылям или потерям, что может привести к краху предприятия. Необходимость оперативного реагирования на конъюнктуру рынка и быстро меняющуюся экономическую ситуацию, стремительный рост объема информации, требующей обработки, неопределенность в поведении производственных систем, возможность использовать современные информационные технологии требуют перестройки внутренней микроэкономики предприятия, постановки управленческого учета, оптимизации процессов управления, что предполагает, прежде всего, процесс прогнозирования. Результаты прогнозирования являются одним из ключевых факторов при принятии управленческих решений на любом предприятии. Системы планирования и управления, обычно, реализуют функцию прогноза. Целью прогнозирования является уменьшение риска при принятии решений. [94] Вот несколько примеров, когда полезно прогнозирование на предприятии:
Планирование производства. Для того чтобы планировать производство семейства продуктов, возможно, необходимо спрогнозировать продажу для каждого наименования продукта, на несколько месяцев вперед. Эти прогнозы для конечных продуктов могут быть потом преобразованы в требования к полуфабрикатам, материалам, рабочим и т.д. Таким образом, на основании прогноза может быть построен график работы целой группы предприятий.
Прогнозирование также может быть важной частью систем управления технологическими процессами, в том числе АСУТП. Наблюдая ключевые переменные процесса и используя их для предсказания будущего поведения процесса, можно определить оптимальное время и длительность управляющего воздействия.
В общем виде процесс управления во всех сферах деятельности можно представить в виде так называемой «петли управления», включающей циклическую последовательность следующих этапов: прогноз - планирование - контролируемая
деятельность по реализации планов - учет и анализ результатов - коррекция прогнозов и планов (рис. 1).
Рис. 1. Обобщенная схема управления В прогнозировании большое значение имеет выбранный метод или прием. «Прием прогнозирования» - это одна или несколько математических или логических операций, направленных на получение конкретного результата. «Метод прогнозирования» - это способ исследования объекта прогнозирования, направленный на разработку прогноза [50, 95]. «Модель прогнозирования» представляет собой модель исследуемого объекта, записанную в математической форме.
Как следует из анализа методов и приемов прогнозирования, прогноз может быть, как качественным, так и количественным [3]. Методы качественного прогнозирования, такие как метод экспертного оценивания, особенно важны, когда статистические данные за прошедшие периоды времени недоступны и/или ненадежны. Все качественные методы крайне субъективны и подвержены высокой ошибке прогноза. Количественные методы прогнозирования, в том числе основанные на анализе временных рядов, предполагают существенное использование информации за прошедшие периоды времени, что позволяет выяснить основные взаимосвязи между величинами и дать более надежный прогноз на будущее. Если определяются значимые факторы и функциональная или стохастическая зависимость отклика от этих факторов с применением множественного регрессионного анализа, то, как правило, говорят об анализе многомерных временных рядов.
При прогнозировании любого процесса возможно использование двух типов моделей зависимостей: временных и причинных. Причинные зависимости, по сравнению с временными, обеспечивают большую точность и достоверность получаемого прогноза, но, в то же время, требуют тщательного выбора параметров и большего объема вычислений при выявлении зависимостей типа «вход-выход». Учитывая, что многие производственные процессы обладают свойством цикличности при краткосрочном прогнозировании возможно использование временных зависимостей.
6 Как известно, модели сложных производственных систем, таких как, производственные предприятия, не всегда могут давать однозначные рекомендации или прогноз. Эти модели всегда должны указывать, при достижении каких значений параметров, описывающих систему, или какого определенного момента времени может произойти нечто непредвиденное (непредсказуемое - «катастрофа» [82]). Порой они должны указывать и область непредсказуемости (т. е. область параметров, в которой поведение системы неконтролируемо и/или непредсказуемо). Среди факторов, характеризующих динамику производства и влияющих на нее, есть изрядное количество данных нечисловой природы, значения которых известны только с определенной долей уверенности. Можно выделить различные типы неопределенностей, из которых для анализа важны следующие:
Связанные с незнанием или неточным знанием некоторых факторов и/или процессов, влияющих на развитие ситуации;
Связанные с математической несоизмеримостью численных оценок величин, характеризующих динамику системы;
Связанные с нелинейностью и наличием у системы нескольких состояний равновесия и/или аттракторов;
Связанные с недостатком или неадекватностью понятийного аппарата и невозможностью отождествления фактов.
Для понимания того, какие же преимущества дают предлагаемые в работе новые модели и методы анализа данных и прогнозирования, необходимо указать на три принципиальные проблемы, возникающие при создании систем поддержки принятия решений и анализа на производстве, автоматизированных систем управления технологическими процессами (АСУТП) и производствами (АСУП).
Первая — это определение необходимых и достаточных параметров для оценки состояния производства, а также выбор критериев эффективности действий. Формализация поведения систем, включающих разнородные компоненты, требует единой метрики описания ситуации.
Вторая проблема заключается в так называемом «проклятье размерности». Желание учесть в модели как можно больше показателей и критериев оценки может привести к тому, что требуемая для ее решения компьютерная система вплотную приблизится к моменту ограничения быстродействия и размеров вычислительного
комплекса в зависимости от количества информации, обрабатываемого в единицу времени.
Третья проблема - наличие феномена надсистемности. Взаимодействующие системы образуют надсистему - систему более высокого уровня, обладающую собственными (надсистемными) свойствами, которых не имеет ни одна из составляющих систем. Феномен заключается в принципиальной недостижимости надсистемного отображения и целевых функций с точки зрения систем, входящих в состав надсис-темы.
В связи с широким распространением программных средств принятия решений, также особенную важность представляет разработка методов автоматизированного прогнозирования.
Существенными составными частями современных новых технологий, позволяющих в той или иной степени решать указанные проблемы, являются нейронные сети (НС), генетические алгоритмы, теория динамических систем (теория хаоса, истоки этого направления лежат в работах по синергетике [62] и теории катастроф [112, 113]), нечеткие логики и даже виртуальная реальность, позволяющие в явлениях, на первый взгляд случайных, обнаружить порядок и некоторую структуру. Тот факт, что хаотические модели дают хорошее приближение для временных рядов, говорит о возможности и важности изучения поведения производственных систем как нелинейных динамических систем и является дополнительным аргументом в пользу применения в задачах прогноза различных нелинейных методов, в том числе - нейронных сетей. Считается, что эти методы позволят увеличить глубину прогноза за счет выявления скрытых закономерностей и взаимосвязей среди плохо формализуемых обычными методами макроэкономических, политических и глобальных показателей.
Прогнозирующая система, в настоящее время, все чаще является необходимым блоком (подсистемой) любой АСУП (АСУТП) на производственных предприятиях, результаты которой используются далее подсистемами планирования и управления (рис.1). Прогнозирующая система должна выполняет функцию генерацию прогноза, которая включает получение данных для уточнения модели прогнозирования, проведение прогнозирования, учет мнения экспертов и предоставление результатов прогноза пользователю.
Существуют уже разработанные системы и методики, например, использующие аппарат нечетких логик. Оболочки экспертных систем, поддерживающие работу с нечеткими знаниями, такие, например, как Gold Works, Guru, Nexpert Object with Nextra, Flex, 1 stClass HT. Практически все они используют для генерации правил (после заполнения базы знаний) алгоритм Куинлена ID3. Созданы первые в мире электронные таблицы FuziCalc, способные работать с нечеткими данными. Существуют и достаточно мощные средства разработки приложений, использующих аппарат нечетких логик, - пакеты CubiCalc RTS и CubiCalc 2.0 для Windows фирмы Hyper-Logic.
Завоевали признание и нейросетевые технологии. На сегодняшний день известны и используются такие системы как: Fujitsu (используется в Японии фирмой Nikko Securities); система биржевых прогнозов HNC, работающая в Citibank; а также такие коммерческие продукты для работы на финансовых рынках, как Nestor DLS фирмы Nestor, программы NeuroShell 2 v.3, NeuroWindows v.4.6 и один из наиболее популярных в мире пакетов на основе генетических алгоритмов GeneHunter v. 1.0 и пакет Brain Maker Pro.
Актуальность темы. В условиях резкого увеличения требований к масштабам и темпам развития науки и техники для получения эффективных прибылей на российском рынке (в частности в производстве) становятся актуальными вопросы планирования и принятия решений на основе прогнозирования. Актуальность задач, связанных с прогнозированием состояния предприятия, основана на потребности изучения данных о состоянии предприятия и результатах его деятельности в прошлом с целью оценки будущих условий и результатов деятельности. Прогнозирование позволяет в значительной степени улучшить управление предприятием за счет обеспечения координации всех факторов производства и реализации, взаимосвязи деятельности всех подразделений, и распределения ответственности. Прогнозирующие системы являются частью современных АСУП и АСУТП. В условиях современного развития науки и техники многие классические методы прогнозирования исчерпали свои возможности.
Исследования обусловлены необходимостью внедрения в практику работы профессиональных руководителей, менеджеров, участников рынка методов научного управления, основанного на строгой формализации процедур принятия решений и
необходимостью использования на практике новых технологий. Существенными составными частями таких технологий являются нейронные сети и теория динамических систем, или теория хаоса, позволяющая в явлениях, на первый взгляд случайных, обнаружить порядок и некоторую структуру.
В работе исследуется эффективность применения нейронных сетей для прогнозирования объемов производства промышленного предприятия, в частности для прогнозирования спроса на продукцию. Предлагается комбинированная нейронная сеть (НС), позволяющая решить проблемы быстродействия и многофакторности, возникающие при прогнозировании с использованием простых нейронных сетей. Исследуется возможность применения теории хаоса для предварительного анализа данных на производстве. Предлагается методика решения задачи прогнозирования состояния производственного предприятия с использованием аппарата НС.
Объектом исследования являются показатели деятельности и состояния производственного предприятия (спрос на продукцию, объем производства, цены на выпускаемую продукцию).
Цель диссертационных исследований Разработка методики прогнозирования объемов производства на основе аппарата нейронных сетей; создание подсистемы прогнозирования в составе АСУП, позволяющей решать задачу краткосрочного прогнозирования.
Научная задача исследований состоит в разработке усовершенствованной методики решения задачи прогнозирования, используя преимущества методов прогнозирования на базе нейронных сетей и теории хаоса.
Основные задачи исследования.
Провести критический анализ проблемы прогнозирования, методов прогнозирования временных рядов, идентификация недостатков. Сформулировать потребность в совершенствовании методик, выявить перспективные направления в области их развития.
Исследовать применение искусственных НС для автоматизированного прогнозирования временных рядов. Провести сравнительный анализ известных моделей НС. Провести сравнительный анализ применения простых и предложенных в работе комбинированных НС. Определить ограничения применения комби-
нированных нейронных сетей для задач прогнозирования. Определить критерии оценки качества прогнозирования
Исследовать возможность применения теории хаоса для анализа данных на производственном предприятии.
Разработать общую методику решения задачи прогнозирования состояния производственного предприятия, основанную на применении аппарата НС. В рамках методики сформулировать конкретные практические рекомендации по решению рассматриваемого класса задач. Провести экспериментальные исследования.
Провести анализ существующих на сегодня систем прогнозирования, выявить основные недостатки, сформулировать общие требования к системам прогнозирования.
Создать информационную прогнозирующую систему, опирающуюся на данные производственного предприятия формата 1С.
Информационная база исследования включает данные формата 1С по продажам и производству профилированного листа ООО «Стальные конструкции - Проф-лист» (г.Москва), пиломатериалов 000 «Вологдатара» (г.Вологда).
Методы исследования. Разработки и исследования проводились на основе методов математического анализа, прикладной статистики, теории вероятностей, эконометрики, нечеткой логики, теории хаоса, теории нейронных сетей, технологий модульного и объектно-ориентированного программирования.
Наиболее существенные результаты и Научная новизна
Предложена комбинированная нейронная сеть на основе «многослойный перцептрон» - «Карта Кохонена» для решения задачи многофакторного прогнозирования состояния производственного предприятия. Определены ограничения применения данной архитектуры комбинированной НС для задач прогнозирования.
Разработана общая методика решения задачи прогнозирования состояния производственного предприятия на основе аппарата НС, определены ее основные этапы, сформулированы рекомендации по ее применению.
Предложено использовать теорию хаоса для анализа данных на производственном предприятии, с помощью которой показано, что временные ряды производственных показателей деятельности предприятия предсказуемы.
Предложены и нормированы критерии оценки качества прогнозирования,
11 позволяющие сократить время обучения НС.
Практическая значимость исследования заключается в разработанной методики, позволяющей получать нейросетевые модели прогнозирования и обеспечивающей возможность их использования широким кругом организаций. Создавать на основе этих моделей прогнозирующие подсистемы в составе АСУП. Для решения многофакторных задач предложена комбинированная модель НС на основе «многослойный перцептрон»-«карта Кохонена», позволяющая сократить время обучения НС.
Структура диссертационной работы. Работа состоит из введения, четырех разделов, списка используемых источников, заключения и приложений.
Во введении обоснована актуальность темы диссертации, сформулированы цель и задачи работы, научная новизна, практическая значимость, указаны основные положения выносимые на защиту.
В первой главе критически рассмотрены существующие методы и модели прогнозирования, предложена их классификация. В ходе исследований сделаны выводы о качестве возможностей классических методов прогнозирования, раскрыты причины их низкой эффективности для прогнозирования производственных показателей, определены их основные недостатки. Дано обоснование целесообразности применения нейронных сетей в прогнозировании, приводятся общие сведения о нейронных сетях. К одному из недостатков нейронных сетей отнесено отсутствие формализованных методик построения нейросетевой модели, а как следствие, высокая сложность ее построения. Поэтому большую практическую ценность приобретает разработка формальной методики настройки и обучения сети и выработка конкретных рекомендаций.
Таким образом, в результате проведенного исследования для решения задачи прогнозирования состояния производственного предприятия в данной работе принято решение использовать аппарат нейронных сетей.
Вторая глава посвящена вопросам нейросетевого прогнозирования. Осуществлена классификация существующих парадигм нейронных сетей по структуре, по особенностям моделей, по видам обучения. Проведен анализ применимости существующих архитектур нейронных сетей к решению различных задач. Для решения задач прогнозирования сделан выбор в пользу сети типа многослойный перцептрон
12 (MLP). Получены оптимальные простые нейросетевые структуры для исследуемых временных рядов. Доказана эффективность применения НС по сравнению с классическими методами прогнозирования.
Предложена комбинированная сеть на основе «многослойный перцептрон» -«Карта Кохонена» для решения задачи многофакторного прогнозирования (учет влияния нескольких факторов на прогнозируемую величину). Проведен сравнительный анализ простых и комбинированных сетей. Сформулированы ограничения применения предложенной комбинированной нейронной сети. Доказано, что применение предлагаемой в работе комбинированной НС целесообразно в случаях малых размеров обучающих выборок (до 500 - 600 значений), что наиболее часто встречается на производственных предприятиях.
Сформулированы общие критерии оценки качества прогнозирования. Для оценки качества прогнозирования состояния производственной системы с учетом специфики исследуемой области предложено использовать количество ошибок на обучающей выборке и количество (процент) угаданных знаков.
В третьей главе описана разработанная методика краткосрочного прогнозирования состояния производственной системы, основанная на применении аппарата НС. Представляемая методика состоит из пяти этапов, содержит рекомендации по применению и позволяет решать задачу прогнозирования на основе совместной обработки нескольких влияющих друг на друга временных рядов, не накладывая никаких ограничений на их характер.
На первом этапе проводится анализ исходных данных. Исследована целесообразность использования для анализа данных на производственном предприятии нелинейно-динамического подхода (теории хаоса). На втором этапе на основе экспертной оценки определяется избыточный набор факторов, влияющих на объект прогноза, осуществляется импорт данных из торговой системы, а также проводится предварительная обработка данных, исследуются различные способы нормировки, делается выбор в пользу нелинейной нормировки с изменяемым видом нелинейности. На третьем этапе производится определение параметров модели, а именно: нахождение глубины ретроспективной выборки, определение состава входных факторов и структуры сети (число слоев и нейронов), задание параметров обучения. Исследуются способы начальной инициализации весов нейронов. На четвер-
13 том этапе происходит формирование обучающих примеров, обучение сети и оценка качества модели. Пятый этап представляет собой получение реального прогноза на данных, ранее неизвестных сети, а также проведение процедур, обратных процедурам предварительной подготовки данных.
Предложенная методика обеспечивает возможность ее использования широким кругом предприятий, сталкивающихся с необходимостью учета неформали-зуемых зависимостей при прогнозировании производственных показателей.
В четвертой главе описаны эксперименты, проведенные на реальных данных. В работе проведены исследования по прогнозированию объемов спроса на профилированный лист по данным ООО «Стальные конструкции - Профлист». В качестве исходных взяты данные за последние 5 лет. Прогноз осуществлялся на один и два месяца.
В результате исследований доказана эффективность применения моделей на НС по сравнению с классическими моделями в САП как подсистемах АСУП. Для однофакторной задачи эффективно применять простую НС на основе «многослойного перцептрона». Для многофакторной задачи хорошие результаты продемонстрировала предлагаемая в работе комбинированная НС. Так, например, для многофакторной задачи: средняя ошибка прогноза по методу многофакторной регрессионной модели составила - 178,43, а с использованием комбинированной НС -135,24; а процент угаданных знаков по методу многофакторной регрессионной модели получился в 1,5 раза ниже, чем при использовании комбинированной НС.
Рассмотрена математическая модель для определения максимально допустимых погрешностей, возможных для сигналов и параметров каждого элемента сети, исходя из условия, что вектор выходных сигналов сети должен вычисляться с заданной точностью, используя два типа оценок погрешности: гарантированные интервальные оценки и среднеквадратические оценки погрешностей. Показано, что оценки допустимых погрешностей можно получить в ходе специального процесса "обратного распространения точности".
Разработана и предложена общая схема поступления данных в автоматизированную прогнозирующую систему, предусматривающая автоматический ввод данных из имеющихся на предприятиях баз данных с помощью специальных процедур загрузки/выгрузки, с WEB-серверов, а также ручной ввод данных.
В заключении обобщены итоги и результаты проведенных исследований. В приложении приведены блок схемы алгоритмов работы, описание математических методов прогнозирования.
На защиту выносятся следующие основные положения:
Модель прогнозирования состояния производственной системы на основе комбинированной нейронной сети «многослойный перцептрон»-«Карта Кохонена».
Методика решения задачи прогнозирования с применением аппарата НС, рекомендации по ее применению.
Критерии оценки качества прогнозирования нейронной сети.
Метод анализа производственных показателей деятельности предприятия с использованием теории хаоса.
Апробация результатов исследования. Основные положения диссертационной работы докладывались и получили одобрение на заседаниях кафедры «Автоматизация технологических процессов и производств» ВоГТУ, на заседаниях комиссий по аттестации аспирантов в 2000-2005гг., а также на международных и всероссийских конференциях: IX международная научно-техническая конференция «Информационная среда ВУЗа» (Иваново, 2002), Всероссийская научная конференция «Управление и информационные технологии» (Санкт-Петербург, 2003), XV международная конференция «Применение новых технологий в образовании» (Троицк, Московская область, 2004), международная конференция «Информационные технологии в образовании, технике и медицине» (Волгоград, 2004), НТК «Актуальные проблемы экономики и управления: Теория и практика» (Вологда, 2005), SMC 2005 Международная конференция по мягким вычислениям и измерениям (Санкт-Петербург).
Публикации. Автор имеет 10 публикаций.
Реализация результатов исследования. Теоретические и практические результаты диссертационной работы внедрены для практического использования на производственном предприятии ООО «Стальные конструкции - Профлист».
Прогнозирование производственных показателей на основе моделей временных рядов
Прогнозирование на базе ARIMA-моделей. ARIMA-модели охватывают достаточно широкий спектр временных рядов, а небольшие модификации этих моделей позволяют весьма точно описывать и временные ряды с сезонностью. Нач 33 нем обсуждение проблемы прогнозирования временных рядов с методов, основанных на использовании ARIMA-моделей. Мы говорим об ARIMA-моделях, имея в виду, что сюда входят как частные случаи AR-, МА- и ARMA-модели. Кроме того, будем исходить из того, что уже осуществлен подбор подходящей модели для анализируемого временного ряда, включая идентификацию этой модели. Поэтому в дальнейшем предполагается, что все параметры модели уже оценены.
Будем прогнозировать неизвестное значение xt+i, I 1 полагая, что xt - последнее по времени наблюдение анализируемого временного ряда, имеющееся в нашем распоряжении. Обозначим такой прогноз . .
Заметим, что хотя » и .- обозначают прогноз одного и того же неизвестного значения JC,+/, но вычисляются они по-разному, т.к. являются решениями разных задач.
Ряд хп анализируемый в рамках ARIMA(p, к, #)-модели, представим (при любом т к) в виде
Правые части этих соотношений представляют собой линейные комбинации р + к предшествующих (по отношению к левой части) значений анализируемого процесса х-р дополненные линейными комбинациями текущего и q предшествующих значений случайных остатков ST. Причем коэффициенты, с помощью которых эти линейные комбинации подсчитываются, известны, т.к. выражаются в терминах уже оцененных параметров модели.
Этот факт и дает возможность использовать соотношения (1.19) для построения прогнозных значений анализируемого временного ряда на / тактов времени вперед. Теоретическую базу такого подхода к прогнозированию обеспечивает известный результат, в соответствии с которым наилучшим (в смысле среднеквад-ратической ошибки) линейным прогнозом в момент времени t с упреждением / является условное математическое ожидание случайной величины xt+i, вычисленное при условии, что все значения хт до момента времени t. Этот результат является частным случаем общей теории прогнозирования [140].
Таким образом, определяется следующая процедура построения прогноза по известной до момента траектории временного ряда:
1. По формулам (1.19) вычисляются ретроспективные прогнозы -«-, -?,..., ы по предыдущим значениям временного ряда;
2. Используя формулы (1.19) для т t подсчитываются условные математические ожидания для вычисления прогнозных значений.
Описанная процедура выглядит достаточно сложной. Однако при реалистичных значениях параметров р, q и к эта процедура в действительности оказывается весьма простой.
Здесь не обсуждались вопросы оценки точности получаемых прогнозов. Теоретические аспекты этой проблемы рассмотрены, например, в [22].
Адаптивные методы прогнозирования. Метод экспоненциального сглаживания. Весьма эффективным и надежным методом прогнозирования является экспоненциальное сглаживание [9]. Основные достоинства метода состоят в возможности учета весов исходной информации, в простоте вычислительных операций, в гибкости описания различных динамик процессов. Метод экспоненциального сглаживания дает возможность получить оценку параметров тренда, характеризующих не средний уровень процесса, а тенденцию, сложившуюся к моменту последнего наблюдения. После появления работ Р.Брауна [26] наибольшее применение метод нашел для реализации краткосрочных и среднесрочных прогнозов. Для метода экспоненциального сглаживания основным и наиболее трудным моментом является выбор параметра сглаживания а, начальных условий и степени прогнозирующего полинома [7,8].
Параметр сглаживания а определяет оценки коэффициентов модели, а следовательно, и результаты прогноза. Выбор параметра а целесообразно связывать с точностью прогноза, поэтому для более обоснованного выбора а можно использовать процедуру обобщенного сглаживания, которая позволяет получить соотношения, связывающие дисперсию прогноза и параметр сглаживания [26]. Весьма суще 35 ственным для практического использования является вопрос о выборе порядка прогнозирующего полинома, что во многом определяет качество прогноза.
Отметим, что данный метод является одним из наиболее надежных и широко применяется в практике прогнозирования. Учитывая, что метод экспоненциального сглаживания является обобщением метода наименьших квадратов, можно надеяться, что он будет совершенствоваться и дальше как в теоретическом, так и в прикладном аспекте. Одно из наиболее перспективных направлений развития данного метода представляет собой метод разностного прогнозирования, в котором само экспоненциальное сглаживание рассматривается как частный случай. Главный недостаток этого метода в том, что он рассматривает временные ряды изолировано от других явлений. Кроме того, точность прогноза заметно падает при долгосрочном прогнозировании [26].
Как отмечено ранее, узким местом всех адаптивных методов, и методов экспоненциального сглаживания в частности, является подбор подходящего к данной конкретной задаче параметра сглаживания (адаптации) а. Даже при оптимальном подборе параметра модель Брауна уступает в точности прогноза ARIMA(0, 1,1)-модели. Развитием метода Брауна является метод Хольта и Хольта-Уинтерса. Хольт ослабил ограничения метода Брауна, связанные с его однопараметрично-стью, введением двух параметров сглаживания а.\ и а2 (О а/, а.2 1). Уинтерс развил метод Хольта так, чтобы он охватывал еще и сезонные эффекты. В экономической практике чаще встречаются экспоненциальные тенденции с мультипликативно наложенной сезонностью. Поэтому перед использованием аддитивной модели члены анализируемого временного ряда обычно заменяют их логарифмами, преобразуя экспоненциальную тенденцию в линейную, а мультипликативную сезонность - в аддитивную. Преимущество аддитивной модели заключается в относительной простоте ее вычислительной реализации. Данный подход реализован в модели Тейла-Вейджа.
Анализ эффективности использования простых нейронных сетей для прогнозирования спроса на продукцию
Для данной диссертационной работы основной интерес представляет прогнозирование состояния производственного предприятия. Так, например, объем продаж (спрос на продукцию) - один из ключевых показателей, характеризующих деятельность организации. Поэтому задача прогнозирования объема продаж представляет собой большой интерес, как для компаний, которые занимаются торговлей покупными товарами, так и для компаний, занимающихся торговлей собственной продукцией. В последнем случае задача прогнозирования спроса является, пожалуй, даже наиболее актуальной, поскольку она всецело связана с планированием производственного процесса.
Прежде чем приступать к исследованию сложных архитектур нейронных сетей (комбинированных сетей), исследуем эффективность использования методов нейронных сетей для прогнозирования спроса на производственном предприятии.
Отметим, что для сравнения качества прогнозирования для большинства приложений достаточно адекватной является среднеквадратическая ошибка
Р і Однако в большинстве случаев для прогнозирования спроса среднеквадра-тическая ошибка не имеет большого практического смысла, гораздо важнее правильно угадать знак изменения спроса. Прогнозируемое повышение спроса (положительный знак изменения) или снижение (отрицательный) свидетельствуют о необходимых повышениях (снижениях) закупки сырья для производства, повышения (снижения) объемов производства данного вида продукции.
Рассмотрим задачу прогнозирования спроса на профилированный лист (данные фирмы ООО «Стальные конструкции - Профлист») используя методы авторегрессии и простой нейронной сети на основе многослойного перцептрона, обучающейся по алгоритму обратного распространения ошибки. Для исследования использовались декадные данные спроса за период 2001-2004 г.г.
Выбор наилучшей структуры нейронной сети для решения поставленной задачи проводился опытным путем с помощью разработанной программы. Лаг, с которым значения подавались на вход, был принят равным 1, количество испытаний - 16. В таблице 2.4 приведены сравнительные данные для различных структур нейронной сети. В первом столбце - параметры НС, во втором - вид, в третьем - результаты.
Как видно из таблицы достаточно высокий процент угаданных знаков, наименьшая средняя (по модулю) ошибка прогноза и минимальное время обучения имеет сеть структуры 1:10:1, поэтому для дальнейших исследований использовалась данная структура.
В таблице 2.5 приведен сравнительный анализ результатов, полученных с помощью выбранной нейросети и регрессионного анализа, а на рис. 2.9 приведены полученные в результате исследования графики прогнозирования.
Как видно из таблицы и из графика нейронная сеть дает лучшие результаты по сравнению с методом авторегрессии, к тому же требует значительно меньших временных затрат для получения результата при использовании готовых программных средств. Значительно более высокий процент угаданных знаков является неоспоримым доказательством эффективности применения нейронных сетей.
Добавим в нашу задачу дополнительно один факторный показатель. Пусть в нашем случае это будет курс доллара. Наиболее оптимальную структуру нейросети также определяем опытным путем. В результате экспериментов выбрана лучшей структура типа 9:16:1.
Построение фазового портрета. Восстановление аттрактора по временному ряду
Мы можем проверить обоснованность наших результатов путем случайного перемешивания данных, в результате чего порядок наблюдений станет полностью отличным от исходного ряда. Ввиду того, что наблюдения остаются теми же, их частотное распределение также останется неизменным. Далее вычислим показатель Херста этих перемешанных данных. Если ряд действительно является независимым, то показатель Херста не изменится, поскольку отсутствовал эффект долговременной памяти, т. е. корреляции между наблюдениями. В этом случае перемешивание данных не оказывает влияния на качественные характеристики данных.
Если имел место эффект долговременной памяти, то порядок данных весьма важен. Перемешивая данные, мы тем самым разрушаем структуру системы. Оценка Н при этом окажется значительно ниже, даже если частотное распределение наблюдений не изменится [106].
Нами выполнен тест на перемешивание значений ряда динамики спроса на профилированный лист.
Исходный ряд дал результативную оценку Н = 0.72, перемешанный — Н 0.5. Такое резкое изменение величины Н говорит о том, что при перемешивании была разрушена структура процесса и соответственно процедура перемешивания данных для исследуемой задачи недопустима.
3.2.3 Построение фазового портрета. Восстановление аттрактора по временному ряду
На рис. 3.10 показано фазовое пространство для размерности вложения равной трем.
Полученный восстановленный аттрактор (рис.3.10) является «странным аттрактором». Результаты свидетельствуют о нерегулярном (хаотическом) поведении процесса, что говорит о значительном изменении динамики спроса при различных начальных условиях. Вместе с тем, внутренняя структура системы такова, что спрос стремится к определенной притягивающей траектории.
Как видно из рис. 3.10 на аттракторе мы имеем три области притяжения, которые связаны между собой фазовым переходом. Можно утверждать, что адекватные прогнозы можно сделать только для спроса, формирующего области притяжения, а не для всего временного ряда.
3.2.4. Вычисление корреляционного интеграла. Вычисление корреляционной (фрактальной) размерности аттрактора
Расчеты проводились в соответствии с описанной методикой. Во-первых, рассчитываются корреляционные интегралы для последовательно увеличивающихся размерностей вложения. При этом рассматриваются регрессии линейной области двойных логарифмических кривых. Фрактальная размерность должна сходиться к своей истинной величине, по мере увеличения размерности вложения. На рис. 3.11 показаны диаграммы сходимости фрактальной размерности.
На практике график корреляционного интеграла отклоняется от прямой линии в области больших г и очень малых г, когда количество пар точек становиться мало для хорошей статистической оценки. Интервал линейности тем больше, чем больше объем обрабатываемых данных. Чаще всего его выбирают «на глаз», а затем подвергают полученные точки обработке с помощью метода наименьших квадратов для нахождения аппроксимирующей прямой. Угол наклона этой прямой даст значение корреляционной размерности.
Реальный анализ показывает, что устойчивая сходимость к фрактальной размерности согласуется с теорией. Система является низко-размерной и для моделирования динамики этого спроса потребуется три переменные.
3.2.5. Вычисление корреляционной энтропии
Характерное время, на которое может быть предсказано поведение системы, обратно пропорционально энтропии Колмогорова [106]. Если энтропия достигает нуля, то система становится полностью предсказуемой. Для истинно случайных процессов энтропия неограниченно велика. Энтропия системы в режиме странного аттрактора положительна, но имеет конечное значение. Числовое значение энтро 92 пии является количественной характеристикой степени хаотичности системы. На рис. 3.12 хорошо видна сходимость корреляционной энтропии в зависимости от размерности вложения. Корреляционная энтропия системы примерно равна 2,338.
3.3. Выбор состава входных факторов. Предварительная обработка данных.
Целью этапа 2 является исключение при построении модели избыточных данных, ведущих к ее необоснованному усложнению и увеличению времени сходимости обучающего алгоритма. Выбор состава входных факторов в большинстве случаев осуществляется на основе экспертной оценки. В случае разнородности и разновеликости исходных данных, что определяет специфика задачи, возникает необходимость предварительной обработки исходных данных (стандартизации, нормализации) [107]. Также следует отметить, что на данном этапе абсолютные значения во всех временных рядах заменяются на относительные приращения по сравнению со значением в предыдущий момент времени, что позволяет повысить чувствительность сети к изменениям входного сигнала, и, в конечном итоге, увеличить точность прогноза.
Рассмотрим основной руководящий принцип, общий для всех этапов предобработки данных. Допустим, что в исходные данные представлены в числовой форме и после соответствующей нормировки все входные и выходные переменные отображаются в единичном кубе. Задача нейросетевого моделирования - найти статистически достоверные зависимости между входными и выходными переменными. Единственным источником информации для статистического моделирования являются примеры из обучающей выборки. Чем больше бит информации принесет пример - тем лучше используются имеющиеся в нашем распоряжении данные.
Рассмотрим произвольную компоненту нормированных (предобработанных) данных: Зс, . Среднее количество информации, приносимой каждым примером х",
равно энтропии распределения значений этой компоненты Я(х,). Если эти значения сосредоточены в относительно небольшой области единичного интервала, информационное содержание такой компоненты мало. В пределе нулевой энтропии, когда все значения переменной совпадают, эта переменная не несет никакой информации. Напротив, если значения переменной х" равномерно распределены в
единичном интервале, информация такой переменной максимальна. Общий принцип предобработки данных для обучения, таким образом, состоит в максимизации энтропии входов и выходов.
САП как подсистема АСУП на предприятии ООО «Стальные конструкции -Профлист»
Программное обеспечение, используемое в подсистемах АСУП и АСУТП, достаточно долго развивалось автономно и не предусматривало возможность стандартизации каналов обмена между ними. С приходом Ethernet и Web-технологий в структуру АСУТП предопределило интеграцию различных уровней автоматизации предприятия в единое информационное пространство. Появилась тенденция к совместному использованию данных современных программных разработок ERP, CRM, MES, SCADA-систем в своих расчетах. Это позволило проводить текущее и оперативное планирование затрат, себестоимости и оценки ресурсов предприятия. Существующая на многих предприятиях достаточная сетевая инфраструктура обеспечивает обмен информацией между подсистемами, а также оперативный сбор, учет и анализ информации, а системы хранения финансовой, экономической, управленческой информации на предприятиях обеспечивают систематизированное хранение данных. Необходимость оперативного реагирования на конъюнктуру рынка предполагает внедрение в практику работы профессиональных руководителей, менеджеров методов научного управления, основанного на строгой формализации процедур принятия решений и необходимостью использования на практике новых технологий. В условиях автоматизации процессов учета и деятельности на предприятии возникает вопрос об автоматизации этапа прогнозирования. На основе проведенного анализа (Глава 1) сделан вывод о низкой эффективности классических методов и сделан выбор в пользу автоматизированного прогнозирования на основе НС.
В качестве примера, была исследована база формата 1С: Предприятие фирмы ООО «Стальные конструкции - Профлист».
На рис. 4.1. представлена структура и состав АСУП ООО «Стальные конструкции - Профлист». является производство профилированного листа из оцинкованной и окрашенной рулонной стали. Производство профилированного листа ведется на четырех профилегибочных станах. Производительность всех станов - 10 тысяч тонн в месяц. Каждый стан обслуживает бригада минимум из 4 человек: крановщик, оператор, два прокатчика. В момент прокатки окрашенного профлиста по технологии требуются дополнительно 1 2 прокатчика. Станы работают в три смены. Ночная смена предусматривает работу только двух станов. В настоящее время прокатные станы укомплектованы быстросменным инструментом для изготовления профилированного листа 11 различных марок. Технология прокатки - самая современная. В отличие от традиционной схемы, когда сначала формируется центральная волна профиля с постепенным переходом на периферию листа, на заводе "Стальные конструкции" исходная заготовка подвергается обработке одновременно по всей ширине. Это создает наиболее оптимальные условия прокатки, обеспечивает повышенную точность соблюдения размеров и сохранность цинкового покрытия. Кассетный метод установки валков позволяет быстро заменять инструмент, переходя от одного типа профлиста к другому, благодаря чему обеспечивается максимальная эффективность работы при минимальных затратах времени. В период с апреля по октябрь ежегодно наблюдается повышенный спрос на данный вид продукции. Предприятие выпускает продукцию преимущественно под заказ. В свободную продажу выпускается только профилированный лист стандартной длины 6 м. Однако плавающий курс доллара, меняющаяся экономическая ситуация в стране, в результате которой меняются российские цены на сталь, на готовую продукцию, а также наличие конкурентов ведут к необходимости тщательного планирования производственного процесса. Как излишки, так и недостачи рулонной стали и свободного товара ведут к убыткам. В процессе управления производством руководство сталкивается со следующей основной проблемой: необходимо спрогнозировать объем спроса на продукцию, основываясь на который принять решение об объемах закупки сырья на следующий период (декаду, месяц), при этом учесть ограничения по мощности оборудования и рабочему персоналу.
Для решения поставленной задачи предлагается внедрение подсистемы автоматизированного прогнозирования (САП) в состав АСУП. На рис. 4.2 и 4.3 представлены схема управления производственным процессом до и после внедрения САП. На рис.4.4 предложена схема поступления данных в САП. В качестве прогнозируемой величины исследовался спрос на профилированный лист. В процессе работы написаны необходимые обработки для автоматизированной подготовки и выгрузки данных в систему.
Предложенная система предусматривает возможность учета влияющих факторов как непосредственно из используемой базы данных, так и путем ручного ввода.
Разработанная САП предназначена для прогнозирования поведения временных рядов (показателей деятельности и состояния предприятия) и использует для построения прогноза простую или комбинированную нейронную сеть, в зависимости от решаемой задачи. Особое внимание при создании данной системы было уделено предварительной обработке данных. Применение комбинированной сети позволяет в случае многофакторного прогнозирования получать прогноз более быстро и качественно. Проведенные эксперименты доказывают эффективность предложенной САП.