Содержание к диссертации
СПИСОК АББРЕВИАТУР 5
ВВЕДЕНИЕ. _ _ 6,
ГЛАВА 1- СРАВНИТЕЛЬНЫЙ АНАЛИЗ СРЕД МОДЕЛИРОВАНИЯ ИНС ПОСТАНОВКА
ЗАДАЧИ ИССЛЕДОВАНИЯ _Л1
1.1; ОБЗОР СРЕД МОДЕЛИРОВАНИЯ ИНС, ПРИМЕНЯЕМЫХ ДЛЯ РЕШЕНИЯ ЗАДАЧ
ПРОГНОЗИРОВАНИЯ „.„. _ 11
І.2.- СРАВНЕНИЕ СИСТЕМНЫХ ХАРАКТЕРИСТИК
РАССМАТРИВАЕМЫХ ПРОГРАММНЫХ ПРОДУКТОВ; 24
1-3- СРАВНЕНИЕ ФУНКЦИОНАЛЬНЫХ И ПОТРЕБИТЕЛЬСКИХ
ХАРАКТЕРИСТИК РАССМАТРИВАЕМЫХ ПРОГРАММНЫХ ПРОДУКТОВ: -.26
1.4- ОСНОВНЫЕ ОГРАНИЧЕНИЯ И НЕДОСТАТКИ.
АНАЛИЗИРУЕМЫХ ПРОГРАММНЫХ ПРОДУКТОВ _ «.32
1.5-ВЫВОДЫ -- ы _„38
ГЛАВА 2. РАЗРАБОТКА МЕТОДИКИ ПОВЫШЕНИЯ ОПЕРАТИВНОСТИ ПРОГНОЗА,
ОСУЩЕСТВЛЯЕМОГО С ИСПОЛЬЗОВАНИЕМ ИНС»« ~ -.40
2-1- ПОСТАНОВКА ЗАДАЧИ ПРОГНОЗИРОВАНИЯ С ИСПОЛЬЗОВАНИЕМ ИНС 40
2.1 Л, ОСОБЕННОСТИ ПРИМЕНЕНИЯ ИНС В ЗАДАЧАХ ПРОГНОЗИРОВАНИЯ
40
2-1,2. АНАЛИЗ ПРИМЕНИМОСТИ РАЗЛИЧНЫХ ТОПОЛОГИЙ ИНС В.
ЗАДАЧАХ ПРОГНОЗИРОВАНИЯ „ 42
2-1.3. ОПИСАНИЕ СЕТИ ТИПА МНОГОСЛОЙНЫЙ ПЕРСЕПТРОН; ОБУЧЕНИЕ
ИНС МЕТОДОМ НАИСКОРЕЙШЕГО СПУСКА 44 <
2.1.4. МЕТОДИКА ОСУЩЕСТВЛЕНИЯ ПРОГНОЗА С ИСПОЛЬЗОВАНИЕМ:
2J .5-ПЕРВИЧНАЯ ОБРАБОТКА ВХОДНОГО ВЕКТОРА ДАННЫХ --50
2.2, АНАЛИЗ ФАКТОРОВ, ПОВЫШАЮЩИХ ОПЕРАТИВНОСТЬ НЕЙРОПРОГНОЗА.
ПОСТАНОВКА ЗАДАЧИ ИССЛЕДОВАНИЯ - 51
2.2.1. ПРОБЛЕМЫ ИСПОЛЬЗОВАНИЯ МЕТОДА НАИСКОРЕЙШЕГО СПУСКА
5\
2.2.2, КРИТЕРИЙ ДОПУСТИМОГО УРОВНЯ ОШИБКИ ОБУЧЕНИЯ ИНС 54
2.2.3- КОНТРОЛЬ ПЕРЕОБУЧЕНИЯ ИНС. ВАЛИДАЦИЯ НЕЙРОННОЙ СЕТИ ;55
2.2.4: ИЗБЫТОЧНОСТЬ ВХОДНОГО ВЕКТОРА ДАННЫХ 57
2.3. РАЗРАБОТКА МЕТОДИКИ ОСУЩЕСТВЛЕНИЯ НЕЙРОПРОГНОЗА,
ОБЕСПЕЧИВАЮЩЕЙ ПОВЫШЕНИЕ ПОКАЗАТЕЛЕЙ ОПЕРАТИВНОСТИ 59
2.3.1. СРАВНИТЕЛЬНЫЙ АНАЛИЗ АЛГОРИТМОВ ОБУЧЕНИЯ ИНС —59
общее описание и принципы применения метода' обучения инс rprop: _ „ 64
адаптируемый критерий допустимого уровня ошибки инс при решении задач прогнозирования методом погружения..„.66
2.3.4. алгоритм использования метода контроля ошибки'
обобщения « 12.
понижение размерности входных данных. методика автоматизированного определения глубины погружения 74
процедура прореживания связей инс « 76
23.7- описание методики осуществления процесса
моделирования инс, обеспечивающей повышение
оперативности нейропрогноза. ~ 78
2.4. выводы по главе 2 _ « 82
главаз. разработка среды моделирования инс ориентированной на-
решение задач прогнозирования; _ _ 84-
3.1- разработка требований к программному
обеспечению среды нейропрогноза „84
разработка структур программного обеспечения среды: нейропрогноза 87
разработка подсистем среды нейропрогноза. 10г
разработка подсистемы предобработки и структурирования исходных данных 101
разработка подсистемы анализа и подбора наилучшей структуры входных данных и параметров инс 102
3.за разработка подсистемы сопровождения пользователями)?
за выводы по главе3 — ~ - но*
глава 4. практическая апробация среды моделирования инс при решении
прикладных задач прогнозирования ~ ~ 111
4.1- решение задачи прогнозирования качества переработки
льноволокна; - ш
4.1 л общая характеристика и постановка задачи
прогнозирования, « - ш
4.1.2 последовательность реализации и результаты
исследования. ~ - 114'
4,2. решение задачи прогнозирования котировок акций компании
сибнефть - - 122'
4.2л общая характеристика и постановка задачи
прогнозирования:: 122
4.2.2 ПОСЛЕДОВАТЕЛЬНОСТЬ РЕАЛИЗАЦИИ И РЕЗУЛЬТАТЫ
ИССЛЕДОВАНИЯ « „ _ 124
4.3- ВЫВОДЫ ПО ГЛАВЕ 4 „„ - „ 133
ЗАКЛЮЧЕНИЕ -. « « 135
СПИСОК ИСПОЛЬЗОВАННЫХ ИСТОЧНИКОВ 137
ПРИЛОЖЕНИЯ 147
ПРИЛОЖЕНИЕ 1. ФРАГМЕНТ ИСХОДНОГО КОДА СРЕДЫ МОДЕЛИРОВАНИЯ ИНС,
ОРИЕНТИРОВАННОЙ НА РЕШЕНИЕ ЗАДАЧ ПРОГНОЗИРОВАНИЯ 147
ПРИЛОЖЕНИЕ 2. АКТЫ ВНЕДРЕНИЯ РЕЗУЛЬТАТОВ ДИССЕРТАЦИОННОГО
ИССЛЕДОВАНИЯ „ - 156
ПРИЛОЖЕНИЕ 3- СВИДЕТЕЛЬСТВО ОБ ОФИЦИАЛЬНОЙ РЕГИСТРАЦИИ
ПРОГРАММ ДЛЯ ЭВМ "Система прогнозирования EIGHT** » —„Л58
СПИСОК АББРЕВИАТУР
ИНС - искусственные нейронные сети
ОВ - обучающая выборка
ОП - обучающая пара
ООП - объектоно-ореинхированный подход
ПК - персональный компьютер
ПО - программное обеспечение
ПБ - программный блок
ПП - программный продукт
ПСМНС — программная среда моделирования нейронных сетей
(нейро симул ятор)
СКЗ - среднеквадратическое значение
СППР - система поддержки принятия решений
ВаскРгор Метод обучения ИНС с помощью алгоритма
наискорейшего спуска
CLErr Метод использования допустимого уровня ошибки
обучения в процессе обучения ИНС, имеющего
постоянный характер
Согг Применение методов понижения размерности входного
вектора данных на основе анализа корреляций
составляющих входного вектора между собой и
прогнозируемой величиной
DLErr Метод использования критерия допустимого уровня
ошибки изменяющегося характера в процессе обучения
ИНС
Rprop Метод обучения ИНС с помощью алгоритма - RPROP
SNNS Stuttgart Neural Network Simulator (разработка
университета г. Штутгарт, ФРГ)
Valid Процесс валидации ИНС (коїпроль ошибки обобщения)
Введение к работе
Такая область применения систем поддержки принятия решений, как прогнозирование приобретает всё большую актуальность б самых различных направлениях человеческой деятельности, прежде всего в областях производства и финансов. На сегодняшний день для осуществления прогноза используется ряд методов, как то методы мат. статистики, технического анализа (графический анализ, трендовые индикаторы) и т.д., и, наконец - искусственные нейронные сети (ИНС), имеющие в случае осуществления краткосрочного прогноза ряд преимуществ по сравнению с вышеперечисленными методами.
Вместе с тем, проблемы на пути широкого применения ИНС в прогнозировании связаны необходимостью в высокой оперативности прогноза нестабильных систем; характеризующихся частой сменой экзогенных факторов, когда прогнозируемая величина имеет нелинейный, быстро изменяющийся характер, что требует изменения структуры и переобучения ИНС. В результате: чего время нейропрогноза может достигать многих часов, что недопустимо при прогнозе быстроизменяющихся процессов, например прогноз котировок акций, И что, тем. самым, нивелирует преимущества нейросетевого подхода к прогнозированию.
Существующее в настоящее время программное обеспечение (ПО), позволяющее осуществлять моделирование ИНС и решать, с помощью построенных моделей задачи прогнозирования можно разделить на два класса: универсальные среды моделирования ИНС (SNNS, Trajan, Matlab-NN Toolbox, и др.) и среды, ориентированные на решение с помощью РТНС узкого спектра прикладных задач, и в; частности задач прогнозирования, например, Neurodimension TradingSolutions.
Существующие же средства и подходы, к сокращению время моделирования ИНС, реализованы в основном только в универсальных
средах, существующие же среды нейропрогноза неспособны решать эту задачу, что приводит с одной стороны к невозможности использовать универсальные средства, не обладающих, в должной степени, механизмами, учитывающими, особенности применения - ИНС к задачам прогнозирования, а с другой - с нерешаемой в рамках ПО сред нейропрогноза задачей повышения оперативности прогноза.
Таким образом, представляются актуальными разработка и создание среды моделирования ИНС, ориентированной на решение задач прогнозирования, обладающей более: высокими показателями оперативности прогноза по сравнению с аналогами и обеспечивающей полный цикл обработки и анализа данных. А. также исследования и разработки в области нейросетевого моделирования, позволяющие повысить оперативность, т.е. сократить время, затрачиваемое на осуществление нейропрогноза.
В настоящее время, аппарат ИНС и методы его использования активно развивается и совершенствуется, так активные разработки и исследованиями в области создания систем моделирования ИНС, в том числе и для решения задач прогнозирования в, России связаны с деятельностью таких коллективов как BaseGroup Labs (Москва), Alpha System (Санкт-Петербург). Кроме того,. наиболее часто цитируемыми и авторитетными российскими работами в последние годы, в области теории и практики применения ИНС считаются труды Ежова А.А., Галушкина А.И., Горбань А.Н., Шумского С.А., Шахнова В.А., вместе с тем появился ряд диссертационных работ, посвященных проблемам использования ИНС в различных предметных областях, и в частности, в области прогнозирования, - Родионова П.Е. "Методика извлечения знаний в задачах анализа рядов. динамики с использованием нейронных сетей", а также Олешко Д.Н., Дубровина В.И., Алексеева А.В.
Целями настоящей диссертационной работы являются:
Разработка и создание среды моделирования ИНС, ориентированной на решение задач прогнозирования, обеспечивающего; полный цикл обработки и анализа данных и обладающего более высокими показателями оперативности прогноза по сравнению с аналогами.
Разработка и. развитие методов осуществления прогноза с использованием аппарата ИНС, позволяющих обеспечить повышение точности и оперативности неиропрогноза;
Исследование разработанной среды и предложенных, методов повышения оперативности прогноза при решении ряда задач прогнозирования на производстве и в области финансов.
Для достижения поставленных целей решаются следующие
основные задачи диссертационного исследования:
1. Исследование и анализ сред моделирования ИНС, применяемых для решения задач прогнозирования и принятия решений, выявление их недостатков и ограничений при решении данного класса задач.
2\ Исследование методов и алгоритмов осуществления прогноза с использованием технологии ИНС.
Выявление факторов, оказывающих наиболее существенное влияние на временные показатели процедур обработки и нейросетевого анализа данных выполняемых в целях осуществления прогноза;
Разработка методики осуществления неиропрогноза, основанной на использовании совокупности подходов обеспечивающих лучшие временные характеристики процесса нейросетевого моделирования.
5; Развитие методов использования критерия допустимого уровня ошибки при обучения ИНС типа многослойный. персептрон, ориентированных на сокращение времени обучения ИНС при решении задач прогнозирования методом погружения.
6. Разработка среды моделирования. ИНС, ориентированной на решение
задач прогнозирования, реализующей разработанные методы и подходы к осуществлению нейропрогноза, и имеющую лучшие показатели оперативности прогноза по сравнению с аналогами. 7. Внедрение и практическая апробация разработанной среды и реализованных в её рамках методов повышения оперативности прогноза при решении прикладных задач прогнозирования.
Методы исследования применяемые в диссертационной работе, основаны, на использовании элементов искусственного интеллекта: нейросетевых технологий, и компьютерного моделирования.
Научная новизна работы обусловлена следующими факторами:
Разработана методика осуществления нейропрогноза, основанная на использовании совокупности методов оптимизации процесса, построения нейросетевой модели, обеспечивающая повышение показателей оперативности прогноза.
Разработан, критерий допустимого уровня ошибки, имеющий адаптируемый в процессе обучения ИНС характер, обеспечивающий сокращение времени обучения, с меньшими потерями в точности прогноза, при решении задач прогнозирования методом погружения.
Предложено использование сочетания процедур валидации и прореживания ИНС, как средства повышения оперативности нейропрогноза.
Разработанная автором среда моделирования искусственных нейронных сетей, для решения задач прогнозирования, обеспечивает более высокую оперативность прогноза по сравнению с аналогами, что позволяет расширить круг прикладных задач прогнозирования, имеющих высокие требования к оперативности, решаемых с помощью ИНС и существенно сократить временные затраты на осуществление нерйропрогноза.
Разработанная методика осуществления нейропрогноза, а также разработанный в её рамках адаптируемый критерий допустимого уровня
ошибки при решении задач прогнозирования методом погружения позволяет специалистам, занимающимся нейропрогнозом, повысить оперативность и точность нейропрогноза.
Созданная автором среда нейропрогноза применяется в ООО "Торговая компания СТАНДАРТУ' как средство поддержки принятия решений, в ООО «Сонковский льнозавод» для осуществления прогноза сельхоз производства: доли и качества выхода длинного льноволокна.
В обеих организациях внедрение принесло положительный результат, что подтверждено соответствующими документами.
Результаты; исследований,, составляющих содержание диссертации докладывались на: VII' всероссийской научно-технической конференции «Новые информационные технологии в научных исследованиях и образовании» (Рязань, РГРТА, 2002 г.), IX международной' научно-технической конференции. (Москва, МЭИ, 2003 г.), международном форуме информатизации - 2002 «Информационные средства и технологии» (Москва, 2002 г.), Международном научно-техническом семинаре «Современные технологии в задачах управления, автоматики и обработки информации» (Алушта 2003 г.), XV международной конференции «Применение новых технологий в образовании» (Троицк 2004 г.).
По результатам, диссертационного исследования опубликовано 6 печатных работ. На разработанные продукты получено 3-свидетельства об официальной регистрации программ для ЭВМ в Российском агентстве по патентам и товарным знакам. (РОСПАТЕНТ). В том числе на «Систему прогнозирования EIGHT» № 2004610915 от 15.04.04.
Диссертационная работа состоит из введения, четырех глав, заключения, списка литературы из 106 наименований (в том числе 29 ссылки на ресурсы Internet); содержит 135 страниц машинописного текста, 48 рисунков, 21 таблиц и приложения на 13 страницах.