Содержание к диссертации
Введение
1. Теоретические и методические основы прогнозирования урожайности на основе нейросетевых информационных технологий 14
1.1. Прогнозирование урожайности, как основа планирования и управления в аграрной экономике 14
1.2. Экономико-математические методы и алгоритмы прогнозирования урожайности 23
1.3. Инструментальные средства и информационные технологии для нейросетевого моделирования и прогнозирования урожайности 43
Выводы по разделу 50
2 Моделирование урожайности с использованием технологий искусственных нейронных сетей 52
2.1 Отбор статистических данных для анализа и моделирования 52
2.2. Предпрогнозный экономико-статистический анализ временных рядов урожайности сельскохозяйственных культур 59
2.3. Общая методика моделирования урожайности с использованием искусственных нейронных сетей 71
Выводы поразделу 80
3 Прогнозирование урожайности сельскохозяйственных культур на основе нейросетевых информационных технологий 81
3.1 Формирования инс для прогнозирования урожайности различных зерновых культур 81
3.2 Информационная технология для прогнозирования урожайности сельскохозяйственных культур 91
3.3. Оценка погрешностей при прогнозировании урожайности на основе нейросетевых информационных технологий 97
Выводы по разделу 100
Заключение 101
Литература 104
- Экономико-математические методы и алгоритмы прогнозирования урожайности
- Предпрогнозный экономико-статистический анализ временных рядов урожайности сельскохозяйственных культур
- Общая методика моделирования урожайности с использованием искусственных нейронных сетей
- Информационная технология для прогнозирования урожайности сельскохозяйственных культур
Введение к работе
Актуальность темы исследования. Рост и развитие сельскохозяйственного производства и повышение эффективности управления требуют адекватного представления прогнозного уровня урожайности сельскохозяйственных культур, которая формируется как результат взаимодействия совокупности различных организационно-экономических и природно-климатических факторов. Урожайность зерновых в России существенно ниже, чем в основных странах-производителях - Китае, Индии и США, а также в странах ЕС. В острозасушливых условиях рискованного земледелия, характерных для Нижнего Поволжья, проблема достоверности экономико-математического прогнозирования приобретает особую важность вследствие значительной доли неурожайных лет и высокого коэффициента вариации, превышающего 30%, что во многом определяет низкую эффективность аграрного производства.
Многообразие известных методов прогнозирования обусловлено отсутствием достаточно гибкого подхода к решению данной задачи, допускающего адаптацию к конкретным природно-зкономическим условиям аграрного производства. Значительное количество разнообразных групп факторов, формирующих уровень урожайности, сложно поддается формальному описанию, что усложняет решение проблемы адекватного моделирования динамических процессов ее межгодовой изменчивости. Существенная изменчивость уровней урожайности, асинхронность их циклических колебаний для различных сельскохозяйственных культур, обуславливают экономические риски в засушливых регионах Юга России и, особенно, Нижнего Поволжья.
Многообразие известных экономико-математических методов используемых для прогнозирования урожайности, основано как на линейных экономико-статистические подходах, так и на различных современных нелинейных алгоритмах - фрактальном анализе, клеточных автоматах, сплайн-аппроксимациях, фазовых портретах, ARIMA-моделях, теории распознавания образов. Можно считать перспективным подходы, основанные на искусственных нейронных сетях, реализуемых на ЭВМ.
Искусственные нейронные сети (ИНС) представляют собой компьютерные системы, которые моделирует работу биологических нейронов с возможностью параллельной обработки информации, способностью к обучению и обобщению накопленных знаний. Однако, применительно к
отмеченным особенностям временных рядов (ВР) урожайности сельскохозяйственных культур, возделываемых в засушливых условиях рискованного земледелия, отсутствую методики выбора архитектуры и параметров ИНС.
В связи с этим, разработка методики построения нейросетевых моделей урожайности, обоснования их архитектуры и технологических параметров является важной теоретической и прикладной задачей, решение которой позволяет повысить эффективность планирования и управления аграрным производством за счет принятия более обоснованных управленческих решений на основе использования инструментальных средств для многовариантного анализа альтернатив.
Степень научной разработанности проблемы. Проблемы совершенствования методологии экономико-математического моделирования и прогнозирования в аграрном производстве разрабатывались в трудах экономистов-аграриев С.А. Андрющенко, Г.А. Бабкова, Л.С. Воробьевой, A.M. Гатаулина, А.В. Голубева, Е.П. Денисова, С.Н. Дементьева, А.С. Дулова, И.Б. Загайтова, А.П. Зинченко, О.В. Иншакова, В.А. Кардаша, В.А. Королева, Р.Г. Кравченко, Э.Н. Крылатых, К.П. Личко, В.В. Милосердова, И.А. Наталухи, B.C. Немчинова, P.M. Нижегородцева, В.В. Ивантера, СБ. Огнивцева, А.В. Петрикова, В.Г. Раскина, СО. Сиптица, В.И. Тиняковой, Е.И. Царегородского, А.А. Черняева, Е.В. Шуйской, Л.П. Яновского и др.
Эконометрические и экономико-статистические методы прогнозирования ключевых экономических показателей, включая урожайность, рассматривались С.А. Айвазяном, В.Н. Афанасьевым, Л.Ю. Богачковой, А.Н. Герасимовым, А.В. Гладилиным, A.M. Дубровым, Т.А. Дубровой, И.И. Елисеевой, А.Н. Ильченко, М.С. Крассом, Ю.П. Лукашиным, B.C. Мхитаряном, А.И. Орловым, Е.А. Петровой, Г.Н. Хубаевым, Е.М. Четыркиным, М.М. Юзбашевым, 3. Бадевшдем, Э. Берндтом, К. Дугерти и другими исследователями.
Синергетические нелинейные подходы к прогнозированию показателей экономической динамики разрабатывались И.Г. Винтизенко, И.Ю. Глазковой, В.А. Долятовским, В.И. Лебедевым, И.А. Наталухой, В.А. Перепелицей, Е.В. Поповой, А.И. Пригожиным, Т. Андерсеном, Г. Дженкинсом, В.Б. Зангом, Э. Петерсом, Д. Фишером и другими отечественными и зарубежными учеными.
Различные подходы к решению задач обработки данных, основанные на использовании нейросетевых методов ивейвлет-анализа, развиты в работах Н.М.Астафьевой, К.В.Анисимовича, В.И Васильева, В.И.Гадзиковского, А.Ю. Дорогова, И.Л. Дремина, А.И Галушкина, АЛ.Горелика,
В.Н. Гусятникова, В.П.Дьяконова, С. Оссовского, В.Г. Редько,
П.В. Терелянского, В.А. Терехова, Н.И.Червякова, Г.В. Тимофеевой, Б. Видрова,
А. Кохена, С. Мандата, Ф. Розенблатта, Дж. Хопфилдаи других ученых. '"'"'
Вопросы компьютерной математики и программной поддержки прогнозирования рассматриваются и развиваются В.П. Боровиковым, А.Н. Васильевым, Л.В. Кальяновым, ЮЛ. Кетковым, В.Ф. Минаковым, С. Поршневым, Ю. Тарасевичем, Г.Н. Хубаевым, Д. Химмельблау, Д. Кнутом и другими авторами.
В то же время, проблемные вопросы получения, верификации и программной реализации методов и моделей прогнозирования временных рядов урожайности сельскохозяйственных культур, в том числе на основе искусственных нейронных сетей, адаптированных к особенностям агарной экономики в условиях рискованного земледелия, а также адаптации алгоритмов и инструментальных средств программной реализации нейросетевых технологий на ЭВМ требуют дополнительных исследований и разрешения.
Цели и задачи исследования. Целью исследований является разработка алгоритмов построения и адаптации нейросетевых информационных технологий и" инструментальных средств для моделирования урожайности сельскохозяйственных культур на основе автокорреляционных функций временных рядов.
Для реализации поставленной цели были поставлены и решены следующие задачи:
выявить, на основе системного подхода, статистические характеристики процесса циклической изменчивости урожайности сельскохозяйственных культур в условиях рискованного земледелия для обоснования применения нейросетевых технологий к её моделированию с учетом эндогенной структуры ' временных рядов урожайности;
провести анализ применимости методов нейросетевого моделирования и прогнозирования урожайности сельскохозяйственных культур в условиях рискованного земледелия для различных видов зерновых культур;
- разработать методику нейросетевого моделирования урожайности
зерновых культур на .основе предварительного построения
автокорреляционных функций с целью' обоснования архитектуры и параметров
искусственных нейронных сетей для прогнозирования урожайности;
- построить систему нейросетевых" ' моделей^ учитывающих параметры
эндогенной цикличности исследуемых' ВР, и разработать концептуальные
основы системы поддержки принятия решений для кратко- и среднесрочных прогнозов урожайности;
- обосновать методику оценки качества неиросетевых моделей для прогнозирования уровня урожайности зерновых культур в засушливых условиях рискованного земледелия с использованием ансамбля нейронных сетей.
Объект и предмет исследования. Объектом исследования являются аграрные предприятия и экономические регионы с развитым производством зерновых культур в условиях рискованного земледелия, формирующие временные ряды урожайности.
Предметом исследования являются динамические процессы вариации урожайности зерновых культур под влиянием организационно-экономических, природно-биологических и технико-технологических групп факторов.
Рабочая гипотеза диссертационного исследования. С целью повышения надежности экономико-математического прогнозирования урожайности сельскохозяйственных культур в условиях рискованного земледелия на основе применения неиросетевых технологий требуется обоснование выбора архитектуры и адаптация параметров ИНС для моделирования таких характеристик временных рядов урожайности, как период априорной цикличности и эмпирического распределения их уровней. Это может быть реализовано л применением искусственных нейронных сетей и их ансамблей, для которых необходимо обоснование архитектуры, технологических параметров и адекватных методов обучения.
Соответствие темы диссертации требованиям паспорта специальностей ВАК. Диссертационное исследование соответствует п. 1.8 «Математическое моделирование экономической конъюнктуры, деловой активности, определение трендов, циклов и тенденций развития» и п. 2.3. «Разработка систем поддержки принятия решений для рационализации организационных структур и оптимизации управления экономикой на всех уровнях»Паспорта специальности 08.00.13 - Математические и инструментальные методы экономики ВАК Минобрнауки.
, Теоретико-методологическая основа исследования. Теоретической и методологической основой проведенного исследования являются диалектический метод, труды классиков экономической теории о закономерностях и цикличности экономического развития, в том числе в области аграрной экономики, работы современных экономистов-математиков в области создания и применения нейросетевого моделирования.
В рамках системного подхода использовались такие методы, как экономико-математическое моделирование, экономико-статистические методы, корреляционно-регрессионный, спектральный анализ; а также нейросетевое моделирование на основе специализированных средств компьютерной математики.
Информационной и эмпирической базой исследования послужили опубликованные данные Федеральной службы государственной статистики (Росстат), Территориального органа Федеральной службы государственной статистики по Волгоградской области (Волгоградстат), открытые информационные ресурсы глобальной сети INTERNET, первичные данные сельскохозяйственных предприятий зернопродуктового сектора АПК Волгоградской области, а также материалы авторских наблюдений.
Научная новизна исследования состоит в разработке технологии и методики построения, обучения и верификации системы нейросстевых моделей на основе выявленных статистических характеристик временных рядов урожайности зерновых культур в условиях засушливого климата, а также адаптации инструментальных средств для прогнозирования урожайности в условия рискованного земледелия.
Полученное приращение научного знания включает следующие элементы новизны:
-
Обосновано, что для прогнозирования динамических процессов продуктивности зерновых культур в условиях рискованного земледелия, на основе моделирования временных рядов (ВР) урожайностей, необходимо предпрогнозное выявление эндогенной межгодовой изменчивости ВР, включая циклическую вариацию урожайности под воздействием совокупности организационно-экономических, биолого-климатических и технико-технологических групп факторов, что позволяет обосновать структуру и выбор начальных параметров инструментальных средств.
-
Осуществлена типизация, с применением методов экономико-статистического анализа сельскохозяйственных культур, групп зерновых культур, характеризующимся ключевыми параметрами эмпирических распределений многолетних рядов урожайностей, которые, в условиях рискованного земледелия, значимо отличаются от нормального закона, что ограничивает применимость методов эконометрического анализа, основднного на МНК-оценках, для моделирования ВР урожайности и подтверждает обоснованность выбора нелинейных нейросетевых моделей и алгоритмов.
-
Разработана методика формирования и «обучения» нейросетевых моделей урожайности с использованием параметров цикличности ВР, выявляемых на этапе предпрогнозного анализа, что позволило снизить остаточную дисперсию нейросетевых моделей для выполнения последующего прогнозирования.
-
Предложена информационная технология прогнозирования урожайности зерновых культур, включающая формирование обучающей, контрольной и тестовой выборок исследуемого ВР урожайности, выбор архитектуры и числа скрытых слоев ИНС, вида функций активации нейронов и размеров временных окон с учетом результатов предпрогнозного автокорреляционного анализа для повышения адекватности нейросетевого прогнозирования.
-
Обоснована методика нейросетевого прогнозирования урожайности с использованием ансамбля нейронных сетей и разработана на концептуальном уровне компьютеризованная система поддержки принятия решения для краткосрочного прогнозирования, позволяющая выявлять и учитывать циклические закономерности моделируемых ВР урожайности зерновых, что обеспечивает повышение достоверности прогнозов и, соответственно, качество управленческих решений в аграрном производстве.
Теоретическая значимость работы заключается в совершенствовании методики и адаптации инструментария нейросетевого моделирования урожайности сельскохозяйственных культур в условиях рискованного земледелия. Полученные теоретические результаты могут быть использованы для совершенствования научных исследований и информационных технологий нейросетевого моделирования в области планирования и управления аграрной экономикой, основанных на использовании кратко- и среднесрочных прогнозных моделях.
Практическая значимость результатов работы. Разработанное семейство нейросетевых моделей для прогнозирования урожайности сельскохозяйственных культур может применяться органами управления сельскохозяйственным производством различного уровня при планировании объемов производства на основе кратко- и среднесрочных прогнозов. Кроме того, внедрение предложенных моделей позволит повысить оперативность и многовариантность анализа различных сценариев развития аграрного производства.
Апробация результатов проведенного исследования. Основные положения и результаты диссертационного исследования обсуждались на V
Международной студенческой электронной научной конференции
«Студенческий научный форум» (15 февраля - 31 марта 2013 г.), XVII
региональной конференции молодых исследователей Волгоградской области
(Волгоград, 6-9 ноября 2012 г), VII Международной научно-практической
конференции молодых исследователей, посвященной 70-летию Победы в
Сталинградской битве «Наука и молодежь: новые идеи и решения» (Волгоград,
май 2013 г.), Международной научно-практической конференции, посвященной
70 -летаю Победы в Сталинградской битве«Интеграция науки и производства —
стратегия устойчивого развития АПК России в ВТО» (Волгоград, 30 января -1
февраля 2013 г.), «Научных чтениях РГЭУ («РИНХ») «Математическая
экономика и экономическая информатика» (Кисловодск, 2013), на Научно-
методической конференции Волгоградского ГАУ «Профессиональное аграрное
образование XXI века: новые стандарты, методики, технологии» (Волгоград,
20-23 марта 2012 г.). "?
Разработанная в рамках диссертационного исследования компьютерная система на основе SNN v. 4.0 и практические рекомендации по ее применению для прогнозирования урожайности представлен во Всероссийский НИИ гидротехники* и мелиорации Россельхозакадемии. Разработки автора использованы также в учебном процессе экономического факультета ФГБОУ ВПО «Волгоградский государственный аграрный университет по дисциплинам «Экономико-математические модели», «Эконометрика», «Математическое моделирование в агробизнесе».
Публикации. По теме диссертации автором опубликовано 9 печатных работ (объемом 2,9 п.л., в т.ч. автора - 2,1 п.л.), в том числе 3 - в ведущих рецензируемых журналах, включенных в Перечень ВАК.
Объем и структура диссертации. Диссертационная работа включает введение, три основных раздела, заключение, библиографический список источников, перечень условных обозначений, приложения. Диссертация выполнена на 131 странице текста, содержит 13 рисунков, 17 таблиц. Библиографический список включает 203 отечественных и зарубежных публикации.
Экономико-математические методы и алгоритмы прогнозирования урожайности
В агропромышленном производстве важнейшую роль играют зерновые культуры, эффективность производства которых влияет не только на экономику отраслей АПК, но и определяет продовольственную безопасность и независимость регионов. Многообразие зерновых сельскохозяйственных культур (рожь, пшеница, кукуруза на зерно, гречиха, зернобобовые и др.) различается реакцией на природно-климатические условия (тепло- и влагообеспеченность), чередованием предшественников, требованиями и особенностями агротехники. Межгодовая изменчивость уровней урожайности зерновых культур, возделываемых в условиях рискованного земледелия, обусловлена совместным влиянием основных групп организационно-экономических, биолого-климатических и технико-технологических факторов, многие из которых являются трудно формализуемыми и не всегда поддаются строгому математическому описанию. Поэтому применение для моделирования различных факторных методов, базирующихся на эконометрическом регрессионном описании множественных взаимосвязей, не всегда достаточно. В последние десятилетия активно развиваются методы и подходы, учитывающие закономерности (память) предшествующих уровней моделируемых ВР.
Исследование экономических или природно-экономических ВР, с целью выявления их внутренних характеристик, которые позволили бы применять для моделирования и/или прогнозирования наиболее адекватные методики, производится на этапе с помощью предпрогнозного анализа.
В агропромышленном производстве важнейшую роль играют зерновые культуры, эффективность производства которых влияет не только на экономику отраслей АПК, но и определяет продовольственную безопасность и независимость регионов. Многообразие зерновых сельскохозяйственных культур (рожь, пшеница, кукуруза на зерно, гречиха, зернобобовые и др.) различается реакцией на природно-климатические условия (тепло- и влагообеспеченность), чередованием предшественников, требованиями и особенностями агротехники. Межгодовая изменчивость уровней урожайности зерновых культур, возделываемых в условиях рискованного земледелия, обусловлена совместным влиянием основных групп организационно-экономических, биолого-климатических и технико-технологических факторов, многие из которых являются трудно формализуемыми и не всегда поддаются строгому математическому описанию. Поэтому применение для моделирования различных факторных методов, базирующихся на эконометрическом регрессионном описании множественных взаимосвязей, не всегда достаточно. В последние десятилетия активно развиваются методы и подходы, учитывающие закономерности (память) предшествующих уровней моделируемых ВР. 1.1.3. Основные факторы изменчивости и рисков возделывания зерновых сельскохозяйственных культур в засушливых условиях
Исследование сложившегося уровня развития зернового производства в острозасушливых условиях, определение основных групп факторов и научное обоснование перспективных направлений повышения его эффективности требует совершенствования научного обоснования прогнозирования урожайности [188].
Основы экономики аграрного производства и воспроизводства, реализации зерна сельскохозяйственных культур рассматриваются в трудах российских ученых, среди которых отметим А.И. Алтухова, А.Г. Белозерцева, А.С. Васютина, В.В. Гарькавого, A.M. Гатаулина, И.Б. Загайтова, К.Б. Карсанова, И.А. Кошкарева, В.В. Кузнецова, В.И. Нечаева, П.М. Першукевича, Г.А. Романенко, А.И. Трубилин и др. Прогноз урожайности сельскохозяйственных культур является базисом для планирования объемов производства сельскохозяйственных предприятий различных форм собственности, определяя эффективность их функционирования. Урожайность определяется различными группами факторов, научная классификация которых обеспечивает достоверность их учета и моделирования.
По влияния на урожайность факторы обычно подразделяют [26] на условно постоянные («экономическое» плодородие почвы, сложившаяся агротехника, биология сортов) и условно переменные (солнечная радиация, температура, атмосферные осадки, экология), хотя это деление является весьма условным. С позиции возможности воздействия на объект труда и управления, совокупность факторов, определяющих урожайность сельскохозяйственных культур, может быть разделена на управляемые (организационно-экономические, агротехнические) и неуправляемые [42, 100].
К управляемым могут быть отнесены: севообороты; сортовые и биологические особенности (потенциальная продуктивность, потребность в тепле и влаге, сроки созревания); потребность в минеральном питании; устойчивость к сорнякам и вредителям; техническое состояние систем мелиорации и защиты, фондо- и энергообеспеченность, организация и оплата труда, уровень обеспеченности сельскохозяйственной техникой, соблюдение агросроков и агротехнологических требований и др.
К неуправляемым факторам относят солнечную радиацию и продолжительность осадков с учетом тепло- и влагообеспеченности фенологических фаз периода вегетации. С позиции системного подхода к агроэкономической оценке продуктивности сельскохозяйственных земель перечисленные факторы, определяющие урожайность сельскохозяйственных культур, непосредственно влияют на процедуру прогнозирования урожайности, величина которой непосредственно используется в экономических расчетах при стратегическом, тактическом и оперативном планировании.
В то же время, имеются многочисленные исследования по влиянию природно-климатических факторов, например на урожайность озимой пшеницы в Ставропольском крае (рис. 1.2).
Предпрогнозный экономико-статистический анализ временных рядов урожайности сельскохозяйственных культур
В качестве функции активации нейронов могут выбираться скачкообразные индикаторные зависимости, линейные, логистические сигмоидальные и др.
Объединяя отдельные нейроны, выходы одних из которых соединяются с входами других, образуют сеть, в которой сигнал от одного нейрона передастся другим нейронам. В такой искусственной нейронной сети последовательно для каждого из нейронов вычисляется значение активации, берется взвешенная сумма выходов элементов предыдущего слоя и вычитается пороговое значение. После этого значения активации преобразуются с помощью передаточной функции, и в результате формируется выход нейрона, поступающий на вход нейронов, с которыми он соединен. В процессе работе сети на входные элементы подаются значения входного сигнала, затем возбуждаются нейроны первого промежуточного слоя, далее - второго промежуточного слоя, в итоге преобразованный сигнал поступав на выходной слой.
Такие структуры, в том числе многослойные персептроны (MLP), радиальные базисные функции (RBF) и линейные сети, позволяют моделировать многомерные нелинейные преобразования, обеспечивающие решение ряда прикладных задач - классификации, распознавания образов, прогнозирования.
На этапе обучения нейронная сеть моделирует целевую функцию по множеству наборов обучающей выборки, т.е. решает задачу интерполяции. Среди известных методов обучения ИНС наибольшее распространение получил метод обратного распространения ошибок (ОРО). Сущность метода ОРО сводится к следующим этапам: а) Алгоритм ОРО последовательно обучает сеть на данных обучающего подмножества. На каждой итерации все наблюдения из обучающего множества (в данном случае оно совпадает со всем набором данных) последовательно подаются на вход сети. Сеть в процессе обработки выдает выходные значения преобразованных сигналов. b) Эти выходные значения сравниваются с имеющимися целевыми значениями, которые также содержатся в наборе исходных данных. Формируемая невязка - как разность между желательным и фактическим выходом, применяется для модификации весов сети с целью снижения этой ошибки. c) Обучающий алгоритм должен находить компромисс между различными наблюдениями и менять весовые коэффициенты так, чтобы снизить суммарную ошибку на обучающем подмножестве, поскольку алгоритм обрабатывает наблюдения по одному, общая ошибка на отдельных шагах будет снижаться.
Под уровнем активации понимается взвешенная сумма входов элемента, суммируемая с пороговым значением. Следовательно, уровень активации представляет собой линейную комбинацию входов. Затем она преобразуется посредством сигмоидной функцией. При работе с пакетом SNN пользователю предоставляется среднеквадратичная ошибка (RMS).
Специфическим вопросом применения ИНС является проблема у количества наблюдений, которое необходимо использовать для процедуры обучения формируемой сети. Сформулирован набор эвристических рекомендаций, связывающих количество необходимых наблюдений с характеристиками сети. В частности, количество наблюдений должно на порядок превышать число связей в сети. С ростом числа переменных количество требуемых наблюдений нелинейно возрастает. Уже при 30...50 переменных может потребоваться колоссальное число наблюдений, известное под названием «проклятие размерности».
Процесс обучения нейронной сети основан на использовании наборов данных для ее требуемого поведения. В процессе «обучения» веса должны подстраиваться для минимизации задаваемого функционала, характеризующего отклонения, в качестве которого для ИНС с прямой передачей сигналов рекомендуется среднеквадратическое отклонение векторов выхода У0 и входа V. При обучении нейронной сети рассчитывается функционал Ф, характеризующий на каждом шаге процесса текущее качество обучения нейронной сети: 2я=іМ f (1.33) где Q - объем выборки; М- число слоев сети; q - номер выборки; s " -число нейронов выходного слоя; Ч" - вектор на входе сети; хУор - вектор целевых значений сигнала на выходе для выборки с номером q. На этапе использования обученной ИНС - для получении прогноза -она сможет использовать восстановленную зависимость для получения прогнозируемой величины, т.е. решать задачу экстраполяции.
Периодичность ВР урожайности характеризуется суперпозицией мультициклических процессов, априорные параметры которых заранее неизвестны, но, по мнению большинства экономистов-математиков, исследующих ВР урожайности, должна учитываться при моделировании и построении прогнозов. Численные характеристики внутренних закономерностей урожайности можно определять с помощью различных статистических показателей, но одной из проблем моделирования является их учет в исследуемых нелинейных методах прогнозирования.
Общая методика моделирования урожайности с использованием искусственных нейронных сетей
С целью обоснования архитектуры нейросетевых моделей урожайности сельскохозяйственных культур в острозасушливых условиях рискованного земледелия Волгоградской области, а также для увеличения точности прогноза, был выполнен автокорреляционный анализ ВР для различных зерновых культур. Данный вид анализа ВР урожайности зерновых культур позволяет выявить внутренние характеристики исследуемых ВР для последующего их учета при построении нейросетевых моделей.
Расчет АКФ базировался на следующих зависимостях. Рассмотривая в качестве первой переменной ВР у2, уз,...,уп а в качестве второй - ряд уь У2 --- Уп-ь то формула, приведенная в разделе 1 для коэффициента автокорреляции для т = 1, принимает вид
Значение (2.1) определяет коэффициент линейной автокорреляции уровней ВР, или, иначе говоря, первого порядка, поскольку характеризует взаимозависимость непосредственно между соседними уровнями ряда при единичном лаге. Аналогичный подход применяется для определения коэффициентов автокорреляции 2-го и более высоких порядков. Например, коэффициент автокорреляции2-го порядка, характеризующий степень взаимосвязи между уровнями yt и yt_2, определяют согласно зависимости п 2 = /=3 ІТіІУ -УзУ И&і-г-у )2 t=3 t-з (2.3) Л, у, Л У,-г Уг= ; y =J T где п 2 п 2 (2.4) Коэффициенты автокорреляции третьего и четвертого порядков можно оперативно рассчитывать в среде STATISTICA, Excel и других с помощью встроенной функции MS Excel «КОРРЕЛ», выбирая приведенные диапазоны переменных исследуемого ВР.
Анализ автокорреляционных функций урожайности таких важных продовольственных культур, как кукурузы на зерно и зерновых в целом выявил существенное различие циклических характеристик их ВР. В результате проведенного исследования были выявлены пики на графиках автокорреляционных функций при двух-, трех, четырех и двенадцатилетнем лагах. Следовательно, последующее моделирование динамики урожайностей анализируемых групп исследуемых зерновых культур должны учитывать выявленные различия.
Кроме подтверждения известной гипотезы «псевдодвухлетнего» цикла для пшеницы, выраженный «пик» для озимой пшеницы наблюдается при лагах в три и двенадцать лет. Возможным объяснением для последнего может быть суперпозиция двух- и трехлетних циклов.
В результате исследования ВР «Зерновые в целом» методом автокорреляционных функций были выявлены статистически значимые пики на графиках АКФ при одно-, двух-, трех-, четырех-, двенадцати- и пятнадцатилетнем лагах (табл. 2.7), при этом два последних практически на границах доверительного интервала (практически совпадают с красными линиями на диаграмме). Исследование ВР «Кукуруза на зерно» методом анализа автокорреляционных функций выявило статистически значимый (выше красных линий на диаграмме) первый пик на диаграме АКФ при однолетнем лаге (табл. 2.7), при этом второй пик - при пятилетнем лаге - практически на границе доверительного интервала.
В результате исследования ВР «Пшеница в целом» методом анализа автокорреляционных функций были выявлены статистически значимые (выше красных линий на диаграмме) пики на графиках АКФ при одно-, двух-, трех-, четырех- и двенадцатилетнем лаге (табл. 2.7), при этом только четырехлетний находится практически на границе доверительного интервала
В результате исследования ВР «Пшеница озимая» методом анализа автокорреляционных функций были выявлены статистически значимые пики на графиках ЧАКФ при одно-, двух-, трех-, четырех- и двенадцатилетнем лагах, кроме того, пятнадцатилетний соответствует на границах доверительного интервала
В результате исследования ВР «Пшеница яровая» методом анализа АКФ были выявлены статистически значимые, но практически на границах доверительного интервала, пики на графиках при одно- и тринадцатилетнем лагах (табл. 2.7), при этом оба они расположены на границах доверительного интервала.
В результате исследования ВР «Ячмень» методом АКФ были выявлены статистически значимые, но близкие к границам доверительного интервала, пики на графиках при трех- и тринадцатилетнем лагах, при этом последний расположен фактически на границе доверительного интервала.
Цикличность продукционных процессов для различных зерновых сельскохозяйственных культур, включая пшеницу в целом, кукурузы на зерно, тритикале) характеризуется противофазностью, что может использоваться для своего рода «хеджирования» сельскохозяйственного производства путем оптимизации структуры посевных площадей и выравнивания межгодовых колебаний валовых сборов.
Для уточненного анализа можно использовать частную автокорреляционную функцию (ЧАКФ), поскольку обычная АКФ может показывать смешанные эффекты взаимодействия уровней ВР при различных лагах. Задача аналогична постановки выявления числа независимых переменных, которые нужно удерживать при построении регрессии.
Информационная технология для прогнозирования урожайности сельскохозяйственных культур
После того, как сеть обучена, необходимо оценить качество ее использования для последующего выполнения прогнозирования. Чтобы оценить качество ИНС, полученной в пакете ST Neural Networks, выбирают окно Статистики регрессии (Regression Statistics) меню Statistics (рис. 3.8), и запускают процесс счета командой Run. %1 Щ Reqression Statistics e=p» j S кЬІ 1 Variable P Щ R ) Ш.М.Щ Tr. UROG 2 Data S.D. 5.037556 Error Mean -1.219Є-12 3.426312.671203 0.6734687 Error S.D. Abs E. Mean S.D. Ratio Correlation 0.7392157 "4 Рисунок 3.8 - Окно «Статистики регрессии», отображающее основные показатели какчества нейронной сети
Пакет позволяет пользователю получать значения среднеквадратичных ошибок (RMS), являющихся мерой погрешности, усредненной по всему обучающему множеству. Данная ошибка визуализируется в окне График ошибки обучения (Training Error Graphs однако он показывает весьма обобщенную оценку, представляющую достаточно грубую меру погрешности.
Более информативные характеристики отображаются в окне Статистики регрессии (Regression Statistics), доступ к которому возможен из меню Статистики (Statistics). Отметим, что аналогичное окно Статистики классификации (Classification Statistics) применяется при моделировании номинальных выходных переменных, например при задании уровней урожайности с помощью лингвистических переменных.
Весьма важной статистикой является «S.D. Ratio», вычисляемая как стандартное отклонение ошибки прогноза, деленное на стандартное отклонению исходных данных. Если величина S.D. Ratio значительно меньше единицы, то сеть достаточно эффективна. Величина, равная ц = 1 - S.D.Ratio, (3.3) характеризует долю объясненной дисперсии построенной нейросетевой ( модели. Остатки, получаемые как разность уровней исходного ВР и их оценок нейросетевой моделью, позволяют получить абсолютные индивидуальные погрешности модели для моментов времени t У =У -УГ (3-4) Теория моделирования принимает, что для признания модели удовлетворительной, если анализ её остатков показывает соответствие полученного ряда критерию стационарности с нулевым матожиданием. Для дополнительной проверки уровня адекватности получаемых моделей необходимо проведение анализа закономерностей их распределения.
Проверка соответствия распределения остатков нормальному закону проводилась с использованием графоаналитической методики на основе их гистограммы с наложением гауссовой кривой. Для аналитического выявления соответствия эмпирического распределения остатков нормальному закону рассчитывалось значение критерия %2. Проверка на гетероскедастичность проводилась с использованием метода Голдфелда-Квандта и критерия ранговой корреляции Спирмена. Для проверки отсутствия наличия автокорреляции остатков использовался тест Дарбина -Уотсона.
При проведении исследования качества функционирования построенных ИНС использовались также такие оценки, как величина А (3.7) средних относительных ошибок и значение остаточных дисперсий D (3.8), вычисленные по полученным прогнозным рядам А .± 10т. (з.5) где у,- фактические уровни временного ряда, у, - модельные значения 1 - 2 Л = —2 ,-jO ; (3.6) При практически равных средних относительных ошибках моделей (12,1%-15,4% в отдельных моделях, 11,2%-13,4% в ансамблях ИНС) остаточная дисперсия в ансамблях оказалась в 1,7 раза больше, чем в отдельных ИНС.
Анализ остатков построенных моделей ВР урожайности по приведенным выше эконометрическим критериям показал, что применение ансамблей ИНС позволяет получать более адекватные результаты. Остатки являются гомоскедастичными и статистически независимыми, распределение их близко к нормальному, а математическое ожидание ряда остатков построенных моделей и их ансамблей не превышает значений 0,02...0,03. распределению. Интересно, что результаты применения ансамблей ИНС позволяют получить меньшие остаточные дисперсии, чем отдельные, даже лучшие в автоматизированных сериях экспериментов, сети.