Содержание к диссертации
Введение
ГЛАВА I. Методы подготовки многовариантых прогнозов .. 13
1.1. Анализ современных методов прогнозирования 13
1.2. Состав комплекса моделей вероятностного прогнозирования. Трендовые экстраполяционные прогнозы 17
1.3. Преобразование доверительных областей и плотностей распределений в случае нелинейных прогнозных моделей 33
1.4. Многофакторный регрессионный анализ в вероятностных прогнозных расчета 42
1.5. Авторегрессия и скользящее среднее в комплексе моделей вероятностного прогнозирования 49
1.6. Вероятностное прогнозирование на основе экспертных оценок 57
ГЛАВА 2. Методы оценки вероятностей и достоверности прогнозов 67
2.1. Верификация прогнозов. Критерии оценок точности и достоверности прогнозов 67
2.2. Оценки ошибок экстраполяции 72
2.3. Влияние продолжительности временных рядов на достоверность прогнозов 79
2.4. Анализ влияния дисперсии исходных рядов на достоверность прогнозов 86
2.5. Статистическое моделирование в прогнозных расчетах 90
ГЛАВА 3. Определение вероятностных характеристик и достоверности прогнозов 100
3.1. Методика синтеза и оценки достоверности прогнозов 100
3.2. Практическая реализация комплекса моделей вероятностного прогнозирования 113
3.3. Результаты экспериментальных расчетов 120
Выводы 130
Литература
- Состав комплекса моделей вероятностного прогнозирования. Трендовые экстраполяционные прогнозы
- Многофакторный регрессионный анализ в вероятностных прогнозных расчета
- Влияние продолжительности временных рядов на достоверность прогнозов
- Практическая реализация комплекса моделей вероятностного прогнозирования
Состав комплекса моделей вероятностного прогнозирования. Трендовые экстраполяционные прогнозы
Многовариантность экономико-математических моделей прогнозирования является естественным следствием многогранности, многосторонности самих экономических явлений. Для построения достоверных моделей, адекватно описывающих прогнозируемый процесс, необходимо проанализировать многочисленные внутренние и внешние связи процесса, учесть взаимодействие разнообразных факторов, присущих процессу.
Большинство моделей прогнозирования отраслевых технико-экономических показателей используют в качестве базы ретроспективные временные ряды - наблюдения в течение некоторого периода предыстории. Для конкретного временного ряда можно предложить всегда несколько математических моделей, достаточно адекватно описывающих этот ряд в наблюдаемый отрезок времени, хотя прог 18
Выработка одного работающего по: а) специализированным видам работ, б) промышленным объединениям стройиндустрии Среднегодовая заработная плата одного работающего на СМР и в подсобных производствах Основные производственные фонды строительного назначения Активная часть основных производственных фондов строительного назначения Фондовооруженность одного работающего в строительстве Фондоотдача в строительстве Фондоотдача активной части основных производственных фондов строительного назначения Балансовая прибыль Себестоимость СМР Энерговооруженность одного работающего Численность работающих на СМР и в подсобных производствах Численность рабочих на СМР и в подсобных производствах Соотношение численности работающих и рабочих на СМР и в подсобных производствах Объем сборного железобетона на I млн.руб.СМР Объем бетона-раствора на I млн.руб. СМР Объем деревянных изделий на I млн.руб. СМР Объем металлоконструкций и металлоизделий на I млн.руб.СМР нозные значения, рассчитанные по различным моделям, будут различаться между собой, и отличия эти могут быть значительными. При построении моделей прогнозирования мы считали необходимым исходить из следующих, требований: 1) модели должны быть достаточно простыми для реализации, восприятия и осмысливания результатов; 2) тенденция развития явления, присущая наблюдаемому периоду, сохранится и в будущем; 3) предполагается возможность корректировки математических моделей в случае получения дополнительной информации о развитии процесса; 4) итоговая модель прогнозирования должна быть многовариантной, отдельные модели могут лишь случайно адекватно отразить возможное развитие процесса; 5) подразумевается возможность включения новых моделей в качестве составных в результирующую модель прогнозирования; 6) модели должны учитывать стохастический характер исходной информации; 7) достоверность прогнозов обусловливается степенью взаимной увязки прогнозных результатов, полученных для отдельных методов ; 8) более поздним наблюдаемым значениям ретроспективного ряда, несущим в себе новую, более ценную информацию, придается большая значимость; 9) с целью учета возможных скачкообразных изменений в развитии процесса, связанных с научно-техническим прогрессом, вводом новейшей технологии, изменением структуры производства, появлением новых целей развития, а также с целью использования профессионального опыта и интуиции ведущих специалистов отрасли, необходимо учитывать оценки и мнения квалифицированных экспертов. Хотя известно много практических примеров, подтвердивших по истечении многих лет почти полное совпадение расчетных и наблюдаемых значений [108, III], в момент составления прогнозов невозможно однозначно предугадать действительное развитие процесса, выбрать наилучшую модель прогнозирования. Но так как каждая из моделей отражает отдельные специфические стороны явления, то речь идет не об отбрасывании более "плохих" моделей, а о взаимоувязке отдельных прогнозов, о выявлении степени соответствия прогнозных значений, рассчитанных с использованием конкретных моделей. В зависимости от вида и характера исследуемого явления в комплекс прогнозирования можно включать различные конкретные модели. Возможное развитие экономических показателей отрасли, как показывают исследования [9], достаточно полно и всесторонне описывает вероятностный прогнозный комплекс математических методов, состоящий из трендовых экстраполяционных моделей (с анализом неполных временных рядов и оценками ошибок экстраполяции), многофакторных и авторегрессионных моделей, вероятностных методов обработки экспертных оценок, имитационных прогнозных моделей. В силу стохастичности исходной информации все модели прогноза, в том числе и модель синтеза, являются вероятностными, т.е. оценивают интервалы возможных изменений характеристик процесса и используют плотности соответствующих им распределений вероятностей.
Многофакторный регрессионный анализ в вероятностных прогнозных расчета
В реальных экономических процессах между отдельными харак теристиками существуют сложные зависимости, причем чаще не функциональные, а стохастические. Для учета влияния совокупности случайных переменных на исследуемый результирующий фактор применяются модели многофакторного регрессионного анализа (МРА). Такие модели позволяют учесть меру влияния каждого отдельного фактора Ху , а также результирующее воздействие всей совокупности независимых факторов Х1 , Х2,..., Хп на зависимую переменную У . Следовательно, зная тенденции развития каждой из величин Ху (используя, например, прогнозные значения Ху из построенных ранее трендовых экстраполяционных моделей), можно прогнозировать возможное развитие результирующего фактора У .
В задачах АСКП строительной отрасли мы исследовали, например, зависимость производительности труда - среднегодовой выработки одного работающего на СМР и в подсобном производстве ( У ) от фондовооруженности одного работающего (X/ ), энергевооружен-ности (Х2 ), соотношения численности работающих и рабочих на СМР и в подсобных производствах (Х3 ), фондоотдачи активной части основных производственных фондов строительного назначения ( Х ) и некоторых других факторов.
Обозначив через Xt: значение у -й независимой переменной для t -го наблюдения (годы), а через )/f - соответствующее значение зависимого фактора У , получим матрицу наблюдений Х=Х -и вектор У .
Если уравнение регрессии линейно относительно неизвестных коэффициентов (как и в рассмотренных ранее моделях экстраполя 43 ции), то эти коэффициенты можно отыскать, применяя метод наименьших квадратов. Будем использовать в моделях МРА уравнения связи, линейные относительно неизвестных коэффициентов: У = 6o + 6 f (Xf,) 2 ""Xn)+62f2(xf,x2,...,xn)+ (I.I2) + "т fm (X %2 , л/7), где функции //./г,-.-,///; зависят только от факторов Xf,X2,...,Xn и не включают в себя ни одного из коэффициентов 60i 5f,..., bm , что дает возможность применить МНК для нахождения неизвестных коэффициентов. Конкретные модели типа (I.I2) были реализованы в работе в следующих формах: 1) линейная y=60 + 6,Xt + 62X2 + ...+ 6nX„ ; (I.I3) 2) полином второй степени y-6e Z6/Xi+Z!Z6JtX/Xl; СІ.14) 0 у_/ J J J=f M J J 3) полином третьей степени о M j j H M jr j [ (1.15) n n n + H 21 21 6,-.. X,- Xp X. /-f e t s=f JC5 J ь Однако реальные показатели экономических процессов "не укладываются" в линейные модели (I.13-І.15), поэтому предусмотрены изменения масштабов по X следующих видов: р у ± \Г7 — ±— Р Р , СП Л , х УЛ \П( » РпУ с » с 44 причем для каждого фактора X; конкретный вид масштаба выбирается независимо от других.
Иногда используемая связь не является линейной относительно неизвестных коэффициентов, но путем элементарных преобразований эту связь можно сделать линейной. Например, степенная зависимость У — 00Af Х2 "... лк путем логарифмирования обеих частей приводится к линейной относительно логарифмов зависимости типа (I.I3): СпУ= n60 + 51tnX + 62CnX2+... + 6К in Хк.
В модель (I.I4) кроме членов Xj (при c=j ), учитывающих нелинейность второй степени, включены члены с произведением неизвестных Xj Хр (при iJ ), учитывающих взаимное, дополнительное к линейному, влияние пар Xj и Xg на фактор У
Модель (I.I4) применяется при небольшом числе п независимых переменных Xj , т.к. количество р неизвестных коэффициентов модели резко растет с увеличением п (р = Сп+2 , при п = 10, например, р = 66).
Обычно в (I.I4) значения независимых переменных сдвигают относительно их средних значений с целью исключения возможной коррелированности Xj и Xj , X, и Xj Х , т.к. из-за этого могли бы оказаться коррелированными оценки искомых коэффициентов 6/g { j,6 = 1,2,..., /7 ), даже если сами Xj и Хр были некоррелированы : У= 6в+ tbjXj + t t e/e(Xj-X)(Xe-X). (і.іб) n В первой сумме 5- Oj Xj тоже вместо Xj можно брать Х; Х , при этом, естественно, изменится лишь оценка коэффициента 00
Модели (вида I.I5) при прогнозировании экономических показателей используются редко, т.к. число неизвестных коэффициентов в (I.15) велико даже при небольшом количестве независимых факторов п ( р - Сп+3 ; при п = б, например, р - 84).
Из соображений, аналогичных изложенным для полиномов второй степени, в модели (I.I5) также используют обычно переменные, сдвинутые относительно средних величин.
МНК, используемый для нахождения неизвестных коэффициентов, приводит к системам уравнений, линейным относительно этих коэффициентов. Решив систему, можно подсчитать теоретические А значения У. результирующего фактора и оценить остаточное среднее квадратическое отклонение фактических значений от расчетных (оценку стандартной ошибки): Sg - \1т=Ш=Т%(Уг%) , СІЛ7) где m+f - число коэффициентов, подлежащих оцениванию. Как видно из (I.I7), количество Т наблюдаемых значений зависимого фактора должно быть больше числа коэффициентов модели, т.е. т+КТ. Но так как в экономических исследованиях статистические данные известны для незначительного количества лет (обычно Т = 10 -f 15), то полином второй степени и особенно третьей степени, содержащие достаточно большое число коэффициентов, могут быть применены при малом числе независимых факторов { п = 2 f 4).
Влияние продолжительности временных рядов на достоверность прогнозов
Среди различных факторов, влияющих на достоверность прогнозных оценок, большую роль играет продолжительность исходных временных рядов. Информация, скрытая в значениях ряда, в частности, и количество исходных членов, существенно влияет на вид конкретной прогнозной модели, а, следовательно, и на достоверность прогнозов. Как указывает Н.Н.Моисеев, "для того, чтобы закономерности, полученные статистическими методами, обладали необходимой степенью достоверности, необходимо, чтобы временные ряды были достаточно длинные"[75, с.12].
Чем продолжительнее ретроспективный период, чем больше известно значений исходного ряда, тем больше информации о развитии процесса получает прогнозист и тем лучшую, вообще говоря, прогнозную модель можно построить. Конечно, невозможен формальный подход к построению прогнозных моделей. Так, иногда, отбрасывание нескольких первых членов исходного ряда не ухудшает модель, а, наоборот, приводит к более точной модели, лучше описывающей развивающийся процесс. Это может произойти в случае, когда в развитии анализируемого процесса произошло некоторое качественное изменение (скачок), приведшее к изменению тенденций будущего развития. В этом случае первые члены ряда "не укладываются" в общий характер развития. Такие ситуации легко выявляются с помощью анализа неполных временных рядов и оценок ошибок экстра-поляционных расчетов.
Нет единого мнения относительно оптимальной продолжительности временных рядов, используемых при прогнозировании развития экономических процессов. Мы придерживаемся точки зрения авторов, считающих[63] , что очень длинные ряды динамики (20-30 лет), как, впрочем, и короткие (3-4 года) мало пригодны для прогнозирования: в первом случае исходные данные будут неоднородными, т.к. в столь продолжительный интервал времени обычно происходят качественные изменения экономических показателей; в случае очень коротких рядов невозможно проследить закономерность изменения процесса, отличить случайные изменения от устойчивых, в силу чего выводы о возможном развитии процесса будут необосноваными. Мы считаем, что в отраслевом среднесрочном и долгосрочном прогнозировании ряды с продолжительностью 10-20 лет несут в себе всю необходимую информацию о развитии прогнозируемых показателей.
Однако выбор конкретной длины периода предыстории, на базе которого будут осуществляться прогнозные расчеты, зависит от реальных статистических данных, от свойств, присущих изучаемому показателю, от используемой модели прогноза. Поэтому анализ зависимости достоверности прогнозов от длины наблюдаемого периода проведем с учетом согласованности временных рядов с выбранной моделью прогноза, что позволит в каждом конкретном случае выбирать наиболее рациональное количество членов исходного ряда, при котором достоверность прогнозных оценок будет максимальна.
В вероятностном прогнозировании понятия точности и достоверности прогнозов, как уже отмечалось, связаны с доверительными прогнозными интервалами, радиусы которых зависят от продолжительности наблюдаемого периода Т , оценки стандартной ошибки (среднего квадратического отклонения) % » табличных значений некоторых теоретических распределений вероятностей (например, tf-rtfo распределения Стьюдента), длины L периода упреждения.
Проанализируем, например, закономерность изменения радиу 81 сов Rf доверительных интервалов для линейных трендовых моделей. Из соотношений (1.5)-(1.6) для каждого прогнозного года t+1, ..., T+L имеем #, = -/,. - Wt, (2.3) где через W{ обозначено ty-W / J- +-—tl-j . (2.4)
Кроме Щ будем анализировать также величину Wt = tt-ым W(. Коэффициенты Wf и Wf явно зависят от длины наблюдаемого периода Г и неявно от длины периода упреждения L (в (2.4) t =7+/.). Поэтому можно проанализировать зависимости Wt(T, L) либо Wt(TtL). Значения f/_o/fe распределения Стьюдента изменяются незначительно, особенно при большом числе степеней свободы, в силу чего в ка-честве переменных для Wt включили только Т и L . Воспользо-вавшись таблицами значений Wf (Т, L) [108,с. 196-198], построим графики зависимостей VVj. от Т для некоторых фиксированных значений L (рис.2.2).
Сравнительный анализ графиков показывает, что для временных рядов с малой продолжительностью (Т 10) величины коэффициентов Wt , а вместе с ними и радиусы доверительных интервалов, значительно отличаются одни от других, увеличиваясь, как и следовало ожидать, с возрастанием значений прогнозных лет L (это подтверждает и анализ выражений (2.3), (2.4)). Для исходных рядов с большой продолжительностью (например, при Т = 20) различия в коэффициентах незначительны, радиусы доверительных прогнозных интервалов увеличиваются плавно, что в большей мере отражает реальное развитие экономических показателей.
Практическая реализация комплекса моделей вероятностного прогнозирования
Всякая теория, любые методы, рекомендации, методики и критерии могут быть признаны справедливыми и рекомендованы к применению, если они подтвердились практикой. Кроме того, составление планов развития на ближайшие пятилетки, а также на более отдаленную перспективу - до 2000 г. и до 2005 г. вынуждают постоянно делать новые расчеты, корректировать предварительные оценки, опираясь на дополнительные ретроспективные данные и экспертные оценки. Поэтому практическая необходимость требует автоматизировать процесс получения прогнозных оценок. Для осуществления реальных экономических прогнозов в составе АСКП Минстроя СССР, основанных на изложенной методике вероятностного прогнозирования, автором был разработан комплекс программ на языке ФОРТРАН для ЕС ЭВМ. Программы были многократно проверены на реальных статистических данных [9] и использованы при составлении конкретных прогнозов развития строительной отрасли на I98I-I985 годы и до 1990 г.
Несмотря на совершенное математическое обеспечение современных ЭВМ, обилие программ и систем, реализующих конкретные варианты и методы прогнозных оценок [18, 43, 51, 71, 84, 89],любые добавления и отклонения от заложенных в ЭВМ идей вынуждают раз работчиков переделывать созданное программное обеспечение. В случае, когда изменений много и нововведения существенно отличаются от реализованных ранее идей, когда логика внутренних взаимосвязей системы прогнозирования претерпевает принципиальные изменения, необходимо создавать новое математическое обеспечение, позволяющее на практике проверить разработанные идеи и лучше познать изучаемые объекты.
В нашем случае принципиальным "препятствием", не давшим возможность использовать имеющиеся программные разработки, явился вероятностный подход к построению прогнозных моделей, т.е. помимо привычных точечных оценок, для всех используемых методов рассчитывались доверительные интервалы возможных вариаций, строились функции плотности распределений для всех лет периода упреждения и оценивались вероятности изменения изучаемых параметров в прогнозных интервалах. К созданию комплекса программ для ЭВМ, реализующих методику вероятностного прогнозирования, нас привели следующие основные предпосылки: а) идея построения вероятностной модели синтеза, объединяю щей отдельные методы в единую прогнозную модель; б) расчеты критериев относительной достоверности прогнозов; в) вероятностный подход к обработке экспертных оценок; г) применение имитационного моделирования в трендовых экст раполяционных и многофакторных регрессионных расчетах; д) анализ неполных временных рядов с расчетом критериев однородности протекания процесса; е) оценки относительных ошибок экстраполяционных расчетов с использованием плотностей распределения ошибок в результирующей прогнозной модели синтеза; ж) преобразование границ доверительных интервалов и плот ностей распределения вероятностей при прогнозировании по нелинейным моделям; и) автоматизация выбора нескольких наиболее приемлемых для прогнозирования кривых по различным критериям соответствия расчетных и наблюдаемых значений.
По мере необходимости использовалось, естественно, и стандартное математическое обеспечение ЕС ЭВМ: вычисление значений интеграла вероятностей нормального распределения, решение систем линейных алгебраических уравнений, обращение матриц, получение наборов псевдослучайных чисел нормально распределенной случайной величины, вычисление значений обратной функции нормального распределения, расчет коэффициентов и параметров множественной регрессии и некоторые другие стандартные программы.
Для облегчения использования, все однотипные исходные данные, помещаемые на перфокартах, во всех программах и подпрограммах задавались в одном и том же формате, доверительные вероятности при расчетах интервалов прогнозов по любым методам были одинаковы (Р = 0,95), что дало основание сравнивать всю совокупность прогнозных оценок и на их основе конструировать результирующую модель синтеза; при этом постоянно использовались одина V2 вые столбцы таблиц распределения Стьюдента и д
Математическое обеспечение комплекса вероятностного прогнозирования создавалось автором в двух вариантах:
а) оперативном, без использования внешних носителей ЭВМ для записи промежуточной и результирующей информации, когда исходная информация обрабатывалась однократно, оперативно, в течение непродолжительного промежутка времени, а результаты расчетов либо не использовались в других прогнозных моделях, либо в случае необходимости переносились на перфокарты;