Содержание к диссертации
Введение
1. Проблемы и перспективы нейросетевой о моделирования и прогнозирования поведения сложных систем, описываемых многомерными временными рядами 10
1.1. Обзор методов построения прогностических моделей и их применение к исследованию поведения многомерных стохастических объектов, описываемых временными рядами 10
1.2 Сложность задачи прогнозирование в условиях неполной информации. Нейронные сети как инструмент решения нечетких задач 18
1.3. Выбор архитектуры искусственной нейронной сети и алгоритма обучения для решения задачи прогнозирования многомерных временных рядов 25
1.4 Цель и задачи исследования 38
2. Оптимизация параметров прогнозирующей нейронной сети с учетом запаздывания выхода относительно многомерного входа 39
2.1. Формализация задачи построения нейросети для ненулевого запаздывания 39
2.2. Определение величины запаздывания для одной независимой переменной (входа) 47
2.3 Верификация методики определения многомерного лага на основе анализа чувствительности нейросети в задаче прогнозирования многомерных временных рядов 54
2 4 Выводы по главе 2 63
3. Структурный синтез базы данных для системы прогнозирования 64
3.1 Формирование информационной базы для прогнозирования. Предварительная обработка статистических данных и определение состава входов нейросети 64
3.2. Алгоритмизация процедур неоднородною нейросетевого анализа 75
3.3. Алгоритмизация процедур множественною регрессионного анализа с оптимизацией вектора запаздываний доя значимых факторов 82
3.4. Выводы по главе 3 89
4. Программная реализация системы прогнозирования набора в высшее учебное заведение 90
4 1. Структура системы и механизмы взаимодействия ее компонент 90
4.2. Применение методов нейросетевого анализа для поддержки принятия решений при управлении сложными системами 95
4 3. Прогнозирование набора в негосударственный вуз на основе традиционных нейросетевых процедур 101
4.4. Сравнение результатов прогнозирования на основе нейросетей с результатами статистического анализа 107
4.5. Результаты оптимизации вектора запаздываний и сравнение с традиционными (нулевое запаздывание) результатами статистического и нейросетевого прогнозирования 110
4.6. Выводы по главе 4 116
Основные результаты работы 118
Литература 120
Приложение 132
- Сложность задачи прогнозирование в условиях неполной информации. Нейронные сети как инструмент решения нечетких задач
- Верификация методики определения многомерного лага на основе анализа чувствительности нейросети в задаче прогнозирования многомерных временных рядов
- Алгоритмизация процедур неоднородною нейросетевого анализа
- Прогнозирование набора в негосударственный вуз на основе традиционных нейросетевых процедур
Введение к работе
Актуальность темы.
При решении задач, связанных с большими системами, особое внимание уделяется построению адекватных моделей, учитывающих такие особенности, как стохастичность, нестационарность, отсутствие полного математического описания объекта исследования. Ввиду невозможности построения математической модели, описывающей все аспекты функционирования таких систем, основной задачей становится исследование определенных параметров, которые характеризуют поведение сложной динамической системы и выявление влияющих на эти параметры факторов, целенаправленное изменение которых позволяет обеспечить требуемое направление развития процессов системы. Основой решения данной задачи является разработка моделей поведения сложной системы с учетом влияния различных факторов, позволяющих предсказывать значения контролируемого параметра и планировать развитие процесса на основе выявленных закономерностей.
В настоящее время вопросам прогнозирования показателей, описываемых временными рядами, уделяется значительное внимание. Теоретическим аспектам прогнозирования временных рядов посвящены работы А. В. Прасолова, в которых подробно исследованы математическая модель и проблемы исследования многомерных временных рядов с применением методов статистического анализа. Немалый интерес исследователей вызывает возможность применения нейросетевых методов анализа и прогнозирования параметров сложных систем, описанных многомерными временными рядами, в частности, В.Г. Царегород-цева, П.Е. Родионова, СО. Восьмирко. Известно большое число публикаций, посвященных различным методам прогнозирования для широкого класса задач: прогнозирование на финансовых рынках (Я.Г. Бучаев, А.И. Галушкин, А.А.Ежов); прогнозирование событий в многомерных временных рядах, описывающих космофизические данные (Ю. С. Шугай, С. А. Доленко); прогнозирование грузооборота на железной дороге (И. А. Лаптев) и др. Для исследования поведения систем, описанных временными рядами, традиционно используются статистические методы, включая методы многофакторного анализа, с учетом требований к объему, однородности, полноте статистических выборок и известных законов распределения исследуемых признаков. Величина запаздывания может быть оценена по величине кросскорреляции, однако такой расчет проводится для пар временных рядов и обобщение указанного метода для произвольного количества факторов, значимо влияющих на исследуемую величину, отсутствует. Именно указанные ограничения традиционных методов прогнозирования привели к использованию для построения прогнозов методов нейросетевого анализа, не накладывающих строгих ограничений на исходные данные и не требующих полного формального описания функционирования системы.
В этой связи актуальность темы исследования продиктована необходимостью дальнейшего развития математических и инструментальных средств,
применяемых для нейросетевого анализа параметров сложных систем, описывающихся временными рядами с учетом запаздывания влияния значимых факторов с целью получения наиболее точного прогноза, используемого в контуре принятия решений системы управления.
Диссертационная работа выполнена в рамках основного научного направления Воронежского государственного технического университета - «Вычислительные системы и программно-аппаратные электротехнические комплексы».
Цель работы. Целью диссертационной работы является разработка специального математического и программного обеспечения принятия решений в сложных системах с многомерным входом и запаздывающим выходом на основе реализации методов нейросетевого моделирования и прогнозирования.
Для достижения указанной цели исследования необходимо решить следующие задачи:
Провести анализ и сформулировать проблемы нейросетевого прогнозирования поведения сложных систем, изменение параметров которых описывается временными рядами, с учетом запаздывания.
Осуществить формальную постановку задачи построения вектора оптимальных временных лагов в нейросетевом базисе с учетом ограниченного количества наблюдений.
Провести алгоритмизацию построения вектора оптимальных временных лагов и верификацию разработанных алгоритмов.
Реализовать специальное программное обеспечение системы прогнозирования многомерных временных рядов с учетом временных лагов (для решения задачи прогнозирования набора в высшие учебные заведения).
Методы исследования. При выполнении работы использованы методы математического моделирования, информационных технологий, статистического анализа, теории искусственных нейронных сетей.
Научная новизна работы. В результате проведенного исследования были получены результаты, характеризующиеся научной новизной:
формализованное описание задачи построения прогнозирующей нейро-
сети в контуре принятия решений, отличающееся учетом вектора временных
лагов и позволяющее установить однозначное соответствие наборов входных и
выходных параметров;
в алгоритм оптимизации параметров нейросети, обеспечивающий построение вектора оптимальных временных лагов, отличающийся ранжированием входов, описывающих историю влияющего фактора, в порядке уменьшения чувствительности нейросети;
алгоритм функционирования линии задержки на входе нейросети, отли
чающийся учетом найденных временных лагов для каждой независимой пере
менной и позволяющий сформировать корректные множества для обучения,
тестирования нейросети и получения уточненного прогноза;
« состав и структура специального программного обеспечения системы прогнозирования в контуре принятия решений, позволяющего повысить точ-
ность планирования показателей набора студентов и эффективность планирования деятельности негосударственного вуза, отличающаяся учетом запаздывания влияния значимых факторов.
Практическая значимость работы. Предложенный в работе комплекс алгоритмов неиросетевого прогнозирования многомерных временных рядов на основе анализа многомерного лага обеспечивает получение уточненных прогнозов контролируемого параметра сложной системы, повышение эффективности планирования развития процессов в системе, уменьшение корректив, вносимых в расчетные показатели. Учет отсроченного влияния факторов позволяет планировать управляющие воздействия на систему таким образом, чтобы получить требуемое значение контролируемого параметра в заданной временной точке. Использование современных информационных технологий в контуре принятия решений системы управления сложным объектом позволяет планировать позитивные изменения факторов, регулируемых в рамках системы, обеспечивая компенсацию негативного влияния внешних факторов.
Реализация и внедрение результатов работы. Основные результаты диссертации реализованы в Международном институте компьютерных технологий при создании системы прогнозирования набора студентов, обеспечивающей получение краткосрочного прогноза количества студентов и определения состава значимо влияющих на набор факторов.
Эффектом от внедрения результатов диссертации стало уменьшение корректив, вносимых ежегодно по результатам работы приемной комиссии МИКТ, в утвержденную нагрузку преподавателей и штатное расписание, более четкое планирование профориентационной деятельности и ценовой политики вуза, выявление наиболее существенных факторов, влияющих на количественные характеристики набора в негосударственный вуз, и определение мероприятий, снижающих влияние негативных факторов.
Апробация работы. Основные положения диссертации докладывались и обсуждались на Всероссийской научно-технической конференции «Информационные технологии» (Воронеж, 2005), Международной научно-практической конференции «Составляющие научно-технического прогресса» (Тамбов, 2005), Всероссийской конференции «Новые технологии в научных исследованиях, проектировании, управлении, производстве» (Воронеж, 2005), XI Международной открытой научной конференции «Современные проблемы информатизации» (Воронеж, 2006), IV Всероссийской научно-технической конференции "Вузовская наука - региоігу" (Вологда, 2006), III ежегодной межвузовской научно-практической конференции «Тенденции развития современных информационных технологий, моделей экономических, правовых и управленческих систем» (Рязань, 2006).
Публикации. Основные результаты диссертации опубликованы в 12 научных работах, в том числе 1 - в изданиях, рекомендованных ВАК РФ. В работах, опубликованных в соавторстве и приведенных в конце автореферата, лично соискателю принадлежит в: [1] - алгоритм оптимизации вектора временных лагов; [2] - состав факторов, значимо влияющих на количественные показатели
набора; [4, 10] - исследование качественного поведения критерия оптимальности временного лага; [5] - постановка задачи нейросетевого моделирования набора в негосударственный вуз; [6] - способы кодирования нечисловых переменных на этапе предобработки исходных данных; [7] - способ реализации модуля сдвига и структура линии задержки; [9] - способ верификации процедуры поиска оптимальных временных лагов и результаты вычислительных экспериментов; [11, 12] - методы и технологии создания компонент системы прогнозирования.
Структура и объем работы. Диссертация состоит из введения, четырех глав, заключения, списка литературы из 123 наименований и приложения. Основная часть работы изложена на 119 страницах, содержит 7 таблиц и 40 рисунков.
Сложность задачи прогнозирование в условиях неполной информации. Нейронные сети как инструмент решения нечетких задач
В условиях неполной информации задача прогнозирования значительно усложняется. Неполнота информации может появляться в отсутствии данных наблюдений в определенной временной точке одного или нескольких значимых факторов или экспертных оценок. Кроме тою, как отмечается в [100], сбор, первичная обработка, передача и хранение статистических сведений ведутся по большей части устаревшими и неэффективными методами, в том числе с применением бумажных носителей и почтовой пересылки. Недостаточен, а в ряде случаев и отсутствует, необходимый контроль достоверности представляемых данных. Это иногда приводит к необъективности и даже к искажению информации. Применение комбинированных методов приводит к необходимости одновременного анализа качественных и количественных факторов, следовательно, возникает проблема выбора системы измерений
Информационные модели по своей природе всегда являются неполными [83]. Пространства входных и выходных переменных в общем случае не могут содержать все важные для описания параметры системы. Это связано как с техническими ограничениями, так неограниченностью представлений о моделируемой системе. Кроме того, при увеличении числа переменных увеличивают требования к объему экспериментальных данных, необходимых для построения модели. Эффект неучтенных (скрытых) параметров может повлиять на однозначность моделирования системы.
Экспериментальные данные, как правило, имеют произвольное распределение в пространстве неременных задач. Как следствие, получаемые модели будут иметь неодинаковую достоверность и точность в разных областях изменения параметров.
Экспериментальные данные могут содержать изъятые значения (например, вследствие потери информации или невозможности проведения полного набора экспериментов). Произвол в интерпретации их значений ухудшает свойства модели.
В ряде работ показано, что влияние одного события на другое проявляется по прошествии некоторою времени, величину которого называют временным лагом А. Временной лаг обнаруживается при определении связей между явлениями в социальной, финансовой, медицинской и других сферах. Например, было обнаружено запаздывание влияния неблагоприятных экологических факторов на заболеваемость раком почки, определен временной лаг между объективным положением дел в России и доверием политическим лидерам [24]. При наличии неизвестною временного лага задача прогнозирования многомерных временных рядов существенно усложняется, так как во всех рассмотренных ранее методах предполагается однозначное соответствие между результатами наблюдений значений влияющих факторов в конкретной временной точке и значением исследуемой зависимой величины. Проблема учета временного лага при исследовании сложных систем в таких предметных областях, как промышленность, сельское хозяйство, распределительная и потребительская сферы исследовалась в работах А. В. Прасолова [83]. Отмечена сложность идентификации запаздывания по наблюдениям за динамикой экономической деятельности, в особенности при необходимости учета влияния социальных и психологических факторов на исследуемую величину. Для одномерных временных рядов приведена методика построения авторегрессии с запаздыванием при условии, что временной лаг определяется соотношением А=і-8, где і = (I, .N), а 8 - шаг дискретизации, причем 8«Д. Однако при обобщении полученных результатов на случай многомерных временных рядов автор признает, что доказать сходимость многомерного аналога решения для одномерного случая не представляется возможным.
Кроме того, при использовании традиционных моделей в прогнозировании предполагается, что основные факторы и тенденции прошлого периода сохраняются на период прогноза или можно обосновать и учесть направление их изменений в перспективе. Однако если исследователь имеет дело с новыми явлениями и с короткими временными рядами, устаревшие данные часто оказываются бесполезными и даже вредными. Следовательно, возникает необходимость строить модели, опираясь в основном на малое количество самых свежих данных, наделяя модели адаптивными свойствами.
В условиях определенное прогнозирование сложных систем успешно осуществляются на основе традиционных методов математической и экономической статистики. Это позволяет строить обоснованные модели систем в случае большою набора экспериментальных данных, достаточного для доказательства статистических гипотез о характере распределения, и при относительно равномерном их распределении в пространстве параметров. Однако, в условиях неопределенное і и при высокой стоимости экспериментальных данных, или невозможности получения достаточною их количества, или их высокой зашумленности, неполноте и противоречивости, такие модели являются неработоспособными [68]. В особенности опасно использование этих моделей при малых статистических выборках [113], так как полученные на них законы распределения могут быть неустойчивыми [61]. В таких условиях наилучшими оказываются модели, построенные на базе нейронных сетей. Нейронные сети представляют собой универсальный математический аппарат для решения различных задач [22, 96, 108, 121, III, 118, 120] (таких как классификация, распознавание образов, аппроксимация функций, прог позирование временных рядов, сжатие информации, фильтрация сигналов, адаптивное управление, диагностика, выявление скрытых зависимостей в массивах данных). Настройка нейронной сети на решение конкретной задачи происходит в процессе ее обучения. Обучение представляет собой процесс модификации внутренней структуры нейронной сети по определенному алгоритму [114] с целью получения требуемой по смыслу задачи реакции сети на предъявляемые исходные данные. В большинстве задач процесс обучения заключается в циклической подаче на вход сети различных наборов входных данных, для каждою из которых известен требуемый выход сети. Обучение продолжается до тех пор, пока значение критерия, характеризующего различиє между требуемыми и реально полученными выходами сети, не станет меньше определенной величины. После окончания обучения сеть готова к работе и может обрабатывать новые, ранее не предъявлявшиеся ей наборы данных.
Нейронные сети - это обобщенное название нескольких групп алгоритмов, способных обучаться на примерах, извлекая скрытые закономерности из по і ока данных [99, 121, 123]. При этом данные могут быть неполны, противоречивы и искажены. Если между входными и выходными данными существует какая-либо связь, пусть даже не обнаруживаемая традиционными корреляционными методами, нейронная сеть способна настроиться на нее с заданной степенью точности. Кроме того, современные нейронные сети обладают рядом дополнительных возможностей и с их помощью можно оценивать сравнительную важность различных видов входной информации, уменьшать ее объем без потери существенных данных, распознавать симптомы приближения критических ситуаций.
С математической точки зрения нейронная сеть представляет собой многослойную сетевую структуру [18, 21], состоящую из однотипных и сравнительно простых элементов - нейронов, структура и принципы функционирования которой представлены на рис. 1.2.
Синапсы осуществляют связь между нейронами, умножают входной сигнал на число, характеризующее силу связи, - вес синапса. Сумматор выполняет сложение сигналов, поступающих по синаптическим связям от других нейронов, и внешних входных сигналов. Нелинейный преобразователь реализует нелинейную функцию одного аргумента - выхода сумматора. Эту функция называют функцией активации или передаточной функцией нейрона. Нейрон в целом реализует скалярную функцию векторною аргумента.
Верификация методики определения многомерного лага на основе анализа чувствительности нейросети в задаче прогнозирования многомерных временных рядов
Для проверки математических выкладок, положенных в основу методики определения оптимальных временных лагов, был проведен вычислительный эксперимент, цель которого состояла в исследовании принципиальной возможности нахождения временного лага с помощью анализа чувствительности. Специально подобранные примеры гарантируют наличие искомого лага в данных, а аналитически заданные зависимости Y(x) позволяют избежать неточностей, связанных с особенностями натурных наблюдений. В ходе вычислительного эксперимента были исследованы функциональные зависимости различной степени сложности, размерность входного вектора также изменялась.
Рисунок 2.5 иллюстрирует взаимное расположение графиков X(t) и Y(t), рисунок 2.6 - выбор ширины временного окна для X по графику автокорреляционной функции на основе методики, изложенной в [17J с учетом следующих соображений.
Как известно, для стационарного временного ряда с увеличением лага т взаимосвязь членов временного ряда xt и xtn ослабевает и автокорреляционная функция должна убывать по абсолютной величине. Однако для выборочной автокорреляционной функции особенно при небольшом числе наблюдений, свойство монотонного убывания при возрастании т может нарушаться [43]. При этом необходимо учитывать, чго с увеличением т число пар наблюдений уменьшается, поэтому при решении практических задач ориентируются на соотношение т N/4, где N -длина ряда.
Необходимо заметить, что найденное по графику значение т() не может быть применено для непосредсгвенного оценивания временного лага Д, так-как не отражает взаимосвязь Х(г) и Y(t), а используется лишь для начального выбора состава входов нейронной сети.
Исходя из графиков автокорреляционный функций, представленных на рис.2.6, ширина временною окна независимой переменной первоначально была принята равной шести, но после предварительных исследований это значение было уменьшено до четырех.
Нейросетевое моделирование проводилось с помощью пакета STATISTICA Neural Networks 4 0. Была построена нейронная сеть типа многослойный персепгрон с одним скрытым слоем, логистической функцией активации структуры 4-4-1. Обучение проводилось методом обратного распространения ошибки.
Результаты анализа, проведенного средствами STATISTICA Neural Networks, представлены в таблице 2.1. Наиболее значимым является вход, соответствующий X(t-3). При сдвиге ряда X «назад» относительно Y на три временные точки, наиболее значимым становится X(t), а точность прогнозирования увеличивается практически вдвое (структура сети и условия обучения оставались неизменными).
Для того, чтобы убедиться, что найденное значение временного лага является оптимальным, глубина погружения была увеличена на 1. Анализ чувствительности показал, что дополнительный вход X(t-4) не является наиболее значимым.
Далее была рассмотрена функция двух переменных, имеющая вид Y(t) = 101og(x12(t-3) + 3x2(t)), (2.20) график которой, как и зависимости Xt(t) иХгф представлены на рисунке 2.7.
Сеть имеет 5 входов VAR1 - VAR5, на которые поступают значения Xi (чю соответствуеі ширине временного окна, равной четырем), и 3 входа VAR6 - VAR8 для отражения исюрии изменения переменной Х2 (ширина временного окна равна двум).
Результаты анализа чувствительности нейросети для двух независимых переменных и ошибка прогнозирования без учета временного лага и с его учетом сведены в таблицу 2.2.
Результаты анализа чувствительности набора нейросетей приведены на рисунке 2.10. В рядах, изначально не обладавших временным лагом, наибольшая чувствительность отмечена для входов X,(t). Для рядов Хз(1), X5(t), Х7О) наиболее чувствительными оказались входы X,(t-A) (Дг=1, Д5=3, Д7=2).
С учетом найденных временных лагов были сформирован смещенный массив исходных данных, использованный для обучения, тестирования и верификации нейросети. Нейросеть имела структуру 8-5-1, обучалась методом обратного распространения. Результаты обучения и прогнозирования на несмещенных и смещенных массивах представлены в таблице 2.3.
Качество обучения оценивалось параметром S.D. Ratio - отношением стандартного отклонения ошибки к стандартному отклонению данных [67].
Анализ оценки ошибок обучения, обобщения и прогнозирования на исходных и смещенных рядах, представленных в таблице 2.3, а также сравнение с результатами, приведенными в табл.2.1, 2.2, позволяют сделать следующие выводы.
1. Ошибка обучения на смещенных временных рядах уменьшается вследствие установления однозначного соответствия примеров (x,(t), y(t)) и построения корректного обучающего множества, наиболее полно характеризующего реальные зависимости между переменными.
2. Ошибка обобщения изменилась незначительно, что свидетельствует о корректном подборе структуры нейросети и отсутствии структурных эффектов в изменении качества прогноза.
3. Ошибка прогнозирования уменьшилась практически вдвое (2.78/1.37 2.03), что свидетельствует о корректности теоретических положений, на которых основана процедура поиска оптимальных временных лагов
Таким образом, проведенные вычислительные эксперименты доказали, что нейросетевая модель действительно чувствительна к наличию временного лага, характеризующею задержку влияния независимой переменной на прогнозируемую величину. Анализ чувствительности входов позволил определить величину временного дала для каждой значимо влияющей переменной и построить уточненное множество исходных данных для обучения, тестирования и получения корректного прогноза.
Алгоритмизация процедур неоднородною нейросетевого анализа
Для решения задачи прогнозирования с учетом оптимальных временных лагов по каждому значимому фактору необходимо решить следующие подзадачи:
1) предварительный выбор состава входов и глубины погружения по каждому из них;
2) обучение неиросети с минимально допустимой глубиной погружения по каждому фактору;
3) определение оптимальною временного лага по каждому временному фактору;
4) сдвиг рядов наблюдений и получение скорректированных обучающею, контрольного и тестового множеств;
5) коррекция состава входов нейронной сети и обучение на сдвинутом множестве;
6) получение прогноза на значениях независимых переменных, не участвовавших в обучении и тестировании.
Предварительный выбор состава входов производится на основе экспертной оценки влияющих факторов и анализе частных корреляций зависимой и каждой из независимых переменных. Качественные переменные включаются в рассмотрение на основе анализа предметной области. Как вспомогательная, применяется процедура определения чувствигельности неиросети к удалению входа, основанная на вычислении абсолютной ошибки аппроксимации сети при исключении переменной из состава входов. Однако окончательное решение о составе входных переменных принимается экспертом, так как удаление совокупности переменных, вносящих минимальный вклад в общую ошибку, может привести к резкому возрастанию ошибки предсказания из-за возможно сложной нелинейной формы зависимости между зависимой и независимыми переменными [67].
Процедура определения чувствительности нейросети к удалению каждого входа входит в состав стандартных процедур в средствах неиросетевой о моделирования.
Обучение нейросети проводится в среде нейросетевого моделирования по стандартному алгоритму обратного распространения ошибки, подробно рассмотренному в главе 1.
Для определения оптимального временною лага по каждому временному фактору предложена процедура оценки чувствительности нейросети к значениям независимой переменной в различных временных точках с увеличением глубины погружения по анализируемому фактору. Максимальная глубина погружения определяется как N,/2, где N, - длина временного ряда і-ой независимой переменной. Блок-схема алгоритма представлена на рисунке 3.3.
Анализ чувствительности проводился по следующей схеме.
1 этап. Определение максимальной глубины погружения по графикам автокорреляционных функций независимых переменных и установление предельной ширины временного окна.
2 этап. Построение и обучение набора нейросетей с различным составом входов: глубина погружения исследуемого ряда принимается максимальной, остальные ряды представлены одним входом на ряд.
3 этап. Определение временного лага для каждого ряда с помощью анализа чувствительности.
После определения оптимальных временных лагов была построена новая совокупность данных, использованная для обучения сети с целью получения уточненного прогноза значения зависимой переменной.
Найденные значения оптимальных временных лагов использовались для сдвига временных рядов независимых переменных и построения скорректированного множества исходных данных по следующей схеме:
1) определение максимального лага;
2) сдвиг каждого ряда на величину оптимального лага данной независимой переменной;
3) выбор тактики продолжения процесса: редукция рядов исходных данных на величину максимального лага или дополнение недостающих значений.
Сдвиг рядов исходных данных осуществляется с помощью линии задержки [49], принцип действия которой представлен на рисунке 3.4. Здесь лгД/j) - значение /-ой независимой переменной в к-ои временной точке,
А(Д(...Дм) - вектор оптимальных временных лагов.
Для получения уточненной выборки для обучения и прогноза предлагается следующий алгоритм.
Шаг 1. Выбирается первый параметр Х.
Шаг 2. Выбирается соответствующий временной лаг А/.
Шаг 3. Если значение временного лага А, равно нулю, то значения /-ой независимой переменной в выбранные моменты времени переносятся в результирующую выборку без изменений. Иначе ряд сдвигается. При этом анализирустся каждое значение. Если значение X, в момент /-Д отсутствует, то выбирается тактика редукции или дополнения временного ряда, и в соответствии с выбранным вариантом получают либо укороченные ряды наблюдений, либо ряд дополняется обработанным значением наблюдений, «виртуальным» значением - результатом прогнозирования «в прошлом», или расчетным значением в соответствии с выбранным алгоритмом заполнения пропущенных значений.
Шаг 4. Присвоение нового значения X, в каждой временной точке.
Дополнение недостающих данных велось с использованием одной из трех тактик получения «виртуальных» значений.
Тактика I - производится дополнение временного ряда данными непосредственных наблюдений в данной точке.
Тактика II - дополнение временною ряда расчетными данными по алюри імам, описанным в 3.1.
Укрупненный алгоритм построения скорректированной выборки с дополнением пропущенных значений представлен на рисунке 3.5.
Рисунок 3.6 иллюстрирует построение скорректированного множества исходных данных в случае принятия решения о редукции. Ограничением этого способа продолжения процесса служит необходимость поддержания количества обучающих примеров на уровне, достаточном для обучения нейронной сети.
Тактика сохранения подразумевает наличие в рядах исходных данных пропущенных значений, которые должны быть заполнены до начала обучения и прогнозирования на скорректированном множестве исходных данных. Дополнение может вестись одним из способов, описанных в п.3.1 и доступных для выбора на этапе предобработки данных.
Прогнозирование набора в негосударственный вуз на основе традиционных нейросетевых процедур
Разработанная проіраммная система была использована для решения задачи прогнозирования количества вновь набранных студентов в негосударственный вуз. Данная задача является актуальной, так как основным показателем, на основе которого строится планирование и управление деятельностью негосударственного вуза, является количество обучающихся и вновь принимаемых студентов. Прогнозирование количественных показателей приема в вуз, таким образом, становится важнейшей задачей, от решения которой зависит принятие стратегических и тактических решений управления образовательным учреждением как сложной системой, обеспечивающих устойчивое развитие вуза.
Основной особенностью рассматриваемой предметной области является сравнительно недолгая история негосударственною образования в России, вследствие чего временные ряды, описывающие историю изменения как количества набранных студентов, так и многих влияющих на него факторов, являются короткими.
На набор влияют различные факторы, причем влияние может оказываться с определенным временным интервалом, который условно назван временем отсрочки. Анализ, классификация, определение степени влияния и времени отсрочки каждого фактора являются начальным этапом решения задачи прогнозирования набора в негосударственный вуз [48].
В ходе анализа предметной области первоначально были выделены три группы факторов, оказывающих влияние на количественные показатели набора [51] - внутривузовские, макроэкономические, социально-психологические.
К внутривузовским факторам были отнесены следующие:
- соотношение стоимости обучения и уровня благосостояния населения в регионе (Xi);
- относительная цена обучения за учебный год (Хг);
- формы обучения, принятые в вузе (Х7);
- наличие альтернатив высокорейтинговым специальностям (Xg);
- наличие аспирантуры (Х ),
- уровень требований к поступающим в вуз (Xs).
Макроэкономические факторы, влияющие на количество абитуриенюв:
- демографическая ситуация в регионе (Xj);
- востребованность специалистов на рынке труда (Х4);
- уровень оплаты труда специалистов (Х10);
- конкуренция на образовательном рынке (Х 0
В группу социально-психологических факторов можно включить престиж вуза (Хп), который может быть оценен на основе рейтинга, наличие у образовательного учреждения государственной аккредитации (Х ).
Исследования проводились на базе Международного института компьютерных технологий (г. Воронеж). Информационную базу моделирования и прогнозирования составили абсолютные значения количества абитуриентов по каждой специальности за период 1998-2005 г, а так же статистические данные открытой печати, характеризующие сферу образования, занятость и благосостояние населения региона [25, 69-77, 86, 88]. Целью прогнозирования являлось получение абсолютной величины количества абитуриентов в 2006 году по каждой специальности. Точность прогнозирования оценивалась по данным о количестве абитуриентов, представленным Приемной комиссией МИКТ.
На первом этапе был проведен анализ временного ряда, описывающего изменение количества вновь набранных студентов с применением стандартных алгоритмов предобработки данных и методов анализа временных рядов, реализованных в пакете Statistica Neural Networks. Особенностью стандартного анализа временных рядов является использование в качестве входа и выхода единственной переменной, то есть получение прогнозного значения переменной на основе ее предыдущего значения.
Был проанализирован набор из 36 сетей структуры «многослойный персептрон с одним скрытым слоем» с различным количеством скрытых нейронов. Наименьшая ошибка была получена для нейросети структуры 1-8 1, иллюстрация которой приведена на рис. 4.7.
Исходный массив данных содержал 162 обучающих примера. Было выделено обучающее множество из 130 примеров, тестовое и контрольное множества содержали по 16 примеров. Расширить обучающее множество за счет заполнения пропусков в данных не представлялось возможным, так как некоторые специальности отсутствовали в вузе в более ранние годы.
Минимальная ошибка обобщения, характеризующая точность предсказания набора в 2006 году, составила 36%. Однако столь высокий уровень ошибки обобщения не является результатом переобучения сети. Природа исходных данных такова, что набор на специальности инженерного профиля увеличивался в последние годы, а количество абитуриентов, желающих обучаться на специальностях экономического профиля, снижался. Поэтому получить корректный прогноз без учета влияющих на набор факторов, отражающих специфику каждого направления подготовки, оказалось невозможно. Дальнейший анализ проводился на массиве исходных данных, подготовленных с помощью разработанной программной системы, каждая строка которого содержала для выбранного года т; значений, где т, которого содержала для выбранного года ш, значений, где т, - глубина погружения по фактору X,.
Количество входов, определенное на основе анализа графиков автокорреляционных функций с помощью графиков автокорреляционных функций, составило 36. предварительный состав входов нейросети представлен в таблице 4.1. Добавочные входы по переменным, характеризующимся нулевой шириной временного окна, обусловлены принятым ме-юдом кодирования нечисловых переменных, а именно кодированием n -»т, описанным в пункте 3.1.
Был проанализирован набор из 150 сетей, наименьшая ошибка соответствует структуре 36-19-1, представленной на рис 4.8. Однако обучить сеть такой структуры не удалось из-за эффекта переобучения. Ошибка прогнозирования составила 45% при ошибке обучения 0,008.
Сложность данной сети превышает количество обучающих примеров. Особенности предметной области, описанные выше, не позволяют увеличить количество обучающих примеров путем уменьшения шага дискретизации или обратной экстраполяции. Поэтому сеть подверглась редукции с уменьшением глубин исторической выборки и исключении ряда факторов, имеющих наименьшую значимость. Состав входов с указанием глубин исторической выборки приведен в таблице 4.2.