Содержание к диссертации
Введение
1 Автоматические метеорологические станции общего и специального назначения 11
1.1 Автоматическая информационно-измерительная система «Погода» 11
1.2 Автоматическая метеорологическая станция «НОВО».. 15
1.3 Аэродромные метеостанции (КРАМС) 18
1.4 Дорожная автоматическая информационно-измерительная система «МетеоТрасса» 24
1.5 Формирование архива данных 30
1.5.1 Формирование модельных временных рядов температуры воздуха 30
1.5.2 Формирование временных рядов по данным АМС РГГМУ 33
1.5.3 Формирование временных радов по данным АМС ИРАМ 38
2 Математические методы расчета статистических характеристик временных рядов 41
2.1 Статистические характеристики временных рядов и методы их расчета 41
2.2 Оценивание статистических характеристик временных рядов 48
2.3 Специальные методы исследования временных рядов
2.3.1 Оптимальная дискретность измерений 56
2.3.2 Контроль пропусков во временных рядах 61
2.3.3 Контроль выбросов и смены характера протекания процесса 63
2.3.4 Сглаживание временных рядов з
2.4 Выделение временного тренда и периодических составляющих временного ряда 69
3 Анализ статистических характеристик временных рядов приземной температуры воздуха 82
3.1 Сравнительный анализ временных рядов приземной температуры воздуха 82
3.2 Анализ статистических характеристик приземной температуры воздуха 89
3.3 Исследование временного тренда и значений периодических составляющих 101
4 Оценка возможностей использования аналитических методов для текущего прогнозирования приземной температуры воздуха 111
4.1 Технология текущего прогнозирования 111
4.2 Анализ результатов, полученных при использовании линейной экстраполяции 113
4.3 Анализ результатов, полученных при использовании полиномиальной экстраполяции 118
4.4 Анализ результатов, полученных при использовании сплайн экстраполяции 125
Заключение 133
Список использованных источников
- Автоматическая метеорологическая станция «НОВО»..
- Формирование модельных временных рядов температуры воздуха
- Контроль выбросов и смены характера протекания процесса
- Исследование временного тренда и значений периодических составляющих
Введение к работе
Актуальность и практическая значимость работы
Температура воздуха у поверхности земли является одной из важнейших метеорологических величин. Без знания фактического значения этой метеорологической величины, а также ее прогностического значения трудно себе представить жизнь и хозяйственную деятельность современного общества. В своей повседневной жизни мы интересуемся прогностическим ее значением вечером, планируя как свою одежду, так и свою работу, если она будет протекать на открытом воздухе. Утром мы выясняем фактическое значение этой температуры, тем самым уточняя ее прогностическое значение. В своей хозяйственной деятельности трудно себе представить тот случай, когда этот метеорологический параметр или его прогноз различной заблаговременности не учитывался бы в той или иной мере. Это коммунальные службы, авиация, дорожные службы, прогностические подразделения гидрометеослужбы, строительство, энергетика и многие другие виды хозяйственной деятельности.
Все выше сказанное определяет важность и актуальность исследования «поведения» этой метеорологической величины во времени и пространстве. Этим определяется актуальность и практическая значимость данной работы.
При исследовании приземной температуры атмосферного воздуха возможно как рассмотрение двухмерных полей этой метеорологической величины, так и временных рядов значений приземной температуры воздуха, измеренной в одном пункте. В данной работе рассматривались только временные ряды приземной температуры воздуха, измеренные с помощью современных автоматических метеорологических станций (АМС). Одной из особенностей данной работы является отказ от рассмотрения климатических характеристик приземной температуры воздуха, требующих наличия длинных временных рядов этой величины (при этом дискретность измерений может быть достаточно большой), а предлагается сосредоточиться на исследовании относительно небольших (по продолжительности общего времени измерения) временных рядов, но с малой дискретностью. Такая возможность появилась с внедрением в метеорологическую практику АМС, когда дискретность измерений может быть уменьшена вплоть до 10 с.
Цель работы состоит в получении и анализе статистических и других характеристик временных рядов значений приземной температуры воздуха, измеренных с помощью автоматических метеорологических станций, а также в исследовании возможностей применения аналитических методов к проведению текущего прогноза значений приземной температуры.
Основные задачи исследования:
– рассмотреть технические характеристики современных автоматических метеорологических станций общего и специального назначения;
– создать архив временных рядов приземной температуры воздуха, полученных с помощью АМС в Санкт-Петербурге и Ленинградской области;
– разработать и реализовать с помощью специально созданной для этой цели программы для ПЭВМ алгоритмы перевода текстовых значений данных с серверов, содержащих результаты измерений на АМС в Санкт-Петербурге и Воейково, в цифровую форму;
– разработать и реализовать с помощью специально созданной для этой цели программы для ПЭВМ алгоритмы контроля «качества» временных рядов и с их помощью исключить из архива данные, содержащие временные разрывы и выбросы;
– с использованием, как стандартных пакетов прикладных программ, так и специально созданных в процессе выполнения данной работы программ для ПЭВМ, произвести серию расчетов статистических характеристик временных рядов, соответствующих различным сезонам и пунктам измерения, и оценить доверительные интервалы для этих характеристик, а также произвести анализ полученных данных;
– разработать алгоритмы и подготовить соответствующую программу для ПЭВМ для расчета аддитивных составляющих временных рядов;
– на основе созданной программы и имеющегося архива данных исследовать поведение характеристик периодических составляющих временных рядов приземной температуры воздуха;
– исследовать, используя созданные для этой цели программы для ПЭВМ, точность текущего прогнозирования приземной температуры воздуха на основе аналитических методов проведения замкнутых численных экспериментов и дать практические рекомендации по их применению.
Исходные материалы и методика исследования:
– временные ряды приземной температуры воздуха, измеренные АМС в Санкт-Петербурге и поселке Воейково Ленинградской области;
– методики исследования статистических характеристик базировались на известных методах и подходах к их расчету с использованием как известных пакетов «Statistica» и «Excel», так и созданных в процессе выполнения данной работы специализированных программ для ПЭВМ;
– методика оценки точности текущего прогнозирования базировалась на проведении замкнутых численных экспериментов на ПЭВМ с использованием данных натурных измерений приземной температуры воздуха в Санкт-Петербурге и Ленинградской области.
Научная новизна работы заключается в следующем:
1. Скорректирована методика контроля «качества» временных рядов приземной температуры, адаптированная к работе с данными АМС РГГМУ и ИРАМ.
2. Разработана методика выделения аддитивных составляющих временных рядов с использованием специально созданной для этой цели программы для ПЭВМ.
3. Разработаны методики проведения замкнутых численных экспериментов для оценки точности текущего прогнозирования приземной температуры воздуха и для их реализации созданы соответствующие программы для ПЭВМ.
4. Определены статистические характеристики временных рядов приземной температуры воздуха и исследованы их вариации в зависимости от объема выборки, сезона и места проведения измерений.
5. Проведено сопоставление синхронных измерений приземной температуры воздуха в мегаполисе и за его пределами.
6. Для каждого сезона оценены параметры периодических составляющих временных рядов приземной температуры воздуха и исследована их изменчивость в зависимости от объема выборки и места проведения измерений.
7. Разработана методика использования аналитических методов прогнозирования приземной температуры воздуха, и определены оптимальные схемы его проведения на основе этих методов.
Положения, выносимые на защиту:
1. Методика выделения периодических составляющих временных рядов приземной температуры воздуха.
2. Методики использования аналитических методов для проведения текущего прогнозирования приземной температуры воздуха и результаты, полученные при определении оптимальной схемы такого прогнозирования.
Личный вклад. В процессе выполнения данной работы автором были
– созданы и обработаны архивы данных с АМС Санкт-Петербурга и Ленинградской области, необходимые для проведения исследования;
– освоены методики и на их основе проведены расчеты статистических характеристик временных рядов приземной температуры;
– разработаны алгоритмы и составлены программы для ПЭВМ, позволяющие реализовывать разработанные методики.
Апробация работы. Результаты исследований докладывались на научных семинарах кафедры экспериментальной физики атмосферы в 2012–2013 гг., на Итоговой сессии Ученого совета РГГМУ в 2012 г.
Основные результаты диссертации опубликованы в двух печатных работах и одном учебном пособии, в том числе две публикации – в издании, рекомендованном ВАК.
Структура и объем работы.
Автоматическая метеорологическая станция «НОВО»..
Вычислительный компонент КРАМС-4 представлен центральной системой, которая выполняет следующие функции /13, 14/: а) управляет работой датчиков; б) производит прием и архивацию измерительных сигналов; в) обеспечивает ручной ввод данных, необходимых для обеспечения аэронавигации; г) производит обработку измерительных сигналов (осреднение, выбор экстремальных значений, фильтрация и т. д.); д) производит вычисление (определение и оценку) метеорологических величин, необходимых для метеорологического обеспечения аэронавигации (дальность видимости на ВПП, параметры ветра, давление, приведенное к уровню порогов ВПП и уровню моря, температура точки росы и др.); е) формирует сообщения, передаваемые внутри аэродрома и распро страняемые за пределы аэродромов (в коде METAR/iSPECi); ж) производит архивацию всей выдаваемой метеоинформации с воз можностью распечатки на принтере; з) производит построение графиков изменения метеовеличин во време ни с возможностью распечатки на принтере; и) обеспечивает сигнализацию об отказах датчиков, первичных и промежуточных измерительных преобразователей, входящих в измерительный компонент, а также линий связи, соединяющих датчики метеовеличин и средства отображения метеоинформации; к) ведет календарь и текущий счет времени.
Выполнение перечисленных функций, обеспечивается специальной программой, разработанной Институтом радарной метеорологии (ИРАМ) /15/.
Одним из преимуществ и достоинств КРАМС-4 является возможность использования в измерительном компоненте любых сертифицированных датчиков, первичных и промежуточных измерительных преобразователей метеовеличин, подтвержденных Сертификатом типа метеооборудования аэродромов, выданным Межгосударственным авиационным комитетом. 1.4. Дорожная автоматическая информационно-измерительная система «МетеоТрасса»
Для специалистов по обслуживанию автодорог метеорологическая информация является одним из важных факторов принятия различных управленческих решений, связанных с обеспечением технологического процесса по их содержанию. Именно поэтому в последнее время на многих автодорогах устанавливают дорожные метеостанции. Так, например, во время проведения Олимпийских и Паралимпийских зимних игр в Сочи 2014 г. за состоянием поверхности на дорогах будут следить 10 автоматических дорожных метеорологических станций (АДМС). Собирая в реальном времени данные о погодных условиях и о состоянии дорожного полотна на трассе, эти станции незаменимы для обеспечения безопасности дорожного движения на автодорогах и в планировании и исполнении работ по их содержанию.
Рассмотрим структуру автоматической дорожной метеорологической станции на примере автоматической информационно-измерительной системы (АИИС) «МетеоТрасса» (рис. 1.9), предназначенной для обеспечения службы содержания автомобильных дорог своевременной специализированной метеорологической информацией.
« Рисунок 1.9. Схема АИИС «МетеоТрасса» Предоставляемая системой информация позволяет получать достоверные сведения о погодных условиях, их изменении и заранее подготовиться к опасным явлениям. АИИС «МетеоТрасса» предназначена для непрерывного круглосуточного, круглогодичного сбора, обработки, хранения и распределения между потребителями информации о погодных условиях, оказывающих влияние на эффективность и безопасность функционирования объектов дорожной сети и инфраструктуры. Для получения достоверных данных АИИС «МетеоТрасса» устанавливаются на каждом термически неоднородном участке, включая искусственные сооружения. Физико-температурные свойства путепроводов, мостов и других искусственных сооружений в основном имеют отличия от остальной части дороги. Так, например, металлический путепровод обладает много меньшей тепловой инерцией, чем асфальтобетон. Таким образом, при заходе Солнца мост остывает быстрее остальной дороги, что может привести к образованию скользкости раньше, чем прогнозировалось для всего дорожного полотна.
По состоянию на 1 июля 2012 г. АИИС «МетеоТрасса» установлена в 20 органах управления автодорог 11 субъектов Российской Федерации /16/. Основными задачами подсистемы метеорологического обеспечения являются: - мониторинг климатических условий вдоль автодороги; - сбор данных о метеоусловиях и состоянии дорожного полотна; - выявление критических метеоусловий (лед, снег, сильный дождь, туман, дым, сильные порывы ветра); - автоматического предупреждения об опасности; - незамедлительное информирование водителей посредством информационных табло, знаков ограничения скорости и других предупреждающих знаков. Система дорожного метеорологического обеспечения на участке автомобильной дороги Р-23 /17/ включает в себя следующее оборудование: — рабочая станция с программным обеспечением АИИС «МетеоТрасса» (фирма ИРАМ) в Центре управления; - сеть автоматических дорожных метеорологических станций (АДМС) Rosa фирмы Vaisala, выполняющих измерения метеорологических парамет ров и характеристик состояния поверхности автодороги (рис. 1.10). Рисунок 1.10. АДМС Rosa в комплекте с метеорологическими датчиками АИИС МетеоТрасса состоит из стационарных метеорологических датчиков (табл. 1.4), размещенных как вдоль автомобильного дорожного полотна, так и на самом дорожном полотне, преобразователей, центральной системы сбора и обработки информации, размещенной в помещении службы содержания автомобильных дорог.
АИИС «МетеоТрасса» выполняет следующие функции /18/: - измерение и выдача метеорологической информации и данных о состоянии поверхности автодороги; - прием и передача данных с использованием различных видов каналов связи в управляемом режиме; - контроль, обработка, архивация и отображение данных сети АДМС в удобном виде (карта, таблицы, графики) (рис. 1.11); - отображение на карте текущего состояния покрытия автодорог на всем их протяжении при наличии базы данных термокартирования;
Формирование модельных временных рядов температуры воздуха
Оценить взаимосвязь переменных во временных рядах можно путем расчета коэффициентов корреляции по формуле (2.15). В данной работе коэффициент корреляции был рассчитан с помощью программы «Stat». Результаты расчета автокорреляции для значений приземной температуры воздуха трех временных рядов (1, 7 и 14 дней) за май 2012 г. представлены в табл. 2.9.
Анализ полученных результатов автокорреляции говорит о том, что во всех трех рядах наблюдается достаточно сильная связь между соседними значениями /38/. Зависимость между соседними значениями приземной температуры воздуха будет прямой (все значения положительные). Более тесная связь будет наблюдаться в третьем временном ряду (14 дней), т.к. значения коэффициента автокорреляции здесь близки к единице, тогда как в первом временном ряду (1 день) связь между значениями не так сильна. Таблица 2.9 Значения коэффициента автокорреляции временных рядов приземной температуры воздуха
Значения коэффициентов межрядовой корреляции для значений «Г, f» (приземной температуры и относительной влажности воздуха) и для «Т, Р» (приземной температуры и атмосферного давления), рассчитанные для тех же временных рядов, представлены в табл. 2.10.
И в первом случае («Г,у»), и во втором случае («Г, Р») связь между переменными является не столь тесной по сравнению с автокорреляционной функцией для приземной температуры воздуха. При этом связь между температурой и относительной влажностью оказывается гораздо более тесной по сравнению со связью между температурой и атмосферным давлением. Для межрядовой корреляции «Г, Р» (приземной температуры и атмосферного давления) в третьем временном ряду (14 дней) связь между переменными практически отсутствует. Зависимость коэффициентов межрядовой корреляции «T,fi оказалась обратной, тогда как зависимость коэффициентов межрядовой корреляции «Т, Р» будет обратной только в первом случае (1 день), а во временных рядах за 7 и 14 дней зависимость между переменными будет прямой. Таблица 2.10 Значения коэффициента межрядовой корреляции «T,fo, «Т, Р»
После выполнения необходимых расчетов сравнивают значения критериев Стьюдента t и /кр (2.24). Если неравенство (2.24) выполняется, то значение коэффициента корреляции носит неслучайный характер, и его величина — значима. Для иллюстрации проверки значимости коэффициента корреляции {гух) были выбраны следующие значения гух из табл. 2.10: - коэффициент межрядовой корреляции (ryx) «Т, f» за 1 день №4; - коэффициент межрядовой корреляции {гух) «Г, Р» за 14 дней №4. Результаты расчета необходимых для оценки значимости коэффициента корреляции (гух) характеристик, рассчитанных по формулам (2.22) и (2.23), приведены в табл. 2.11. Значение критерия Стьюдента /кр было взято из табл.
Анализируя полученные результаты надо отметить, что в первом случае (межрядовая корреляция (ryx) «T,f» за 1 день) неравенство (2.24) соблюдается, следовательно, величина гух — значима (носит неслучайный характер). Во втором случае (межрядовая корреляция (гух) «Т, Р» за 14 дней) неравенство (2.24) не соблюдается, что говорит о том, что отклонение от нуля значения коэффициента корреляции (гух)-случайно, и, следовательно, незначимо. Таблица 2.11 Значения характеристик, необходимых для оценки значимости коэффициента корреляции (гух)
Проблема контроля данных гидрометеорологических наблюдений является одной из главных задач при подготовке их для дальнейшего использования при анализе и прогнозе погоды и связанных с ней явлений. Такой контроль весьма актуален для автоматических метеорологических станций, поскольку, работая в автоматическом режиме, они передают огромное количество информации для дальнейшего распространения без участия оператора, который при «ручном» снятии данных всегда может осуществить контроль их качества.
Для данных приземных метеорологических величин, измеряемых с помощью автоматических метеорологических станций, контроль обычно осуществляется с использованием статистических процедур: на основе выборочных значений средних и дисперсий, и для заданного уровня статистической значимости, определяющего вероятность ошибки, производится расчёт доверительного интервала, используемого в контроле каждого значения из проверяемого временного ряда данных. Такой контроль позволяет выявить наличие грубых ошибок (выбросов) в результатах наблюдений. Кроме того, по известной дискретности наблюдений выявляются пропуски во временных рядах результатов измерений. Для исключения систематических ошибок периодически осуществляется метрологический контроль датчиков станции.
Анализ существующих подходов к вопросу контроля качества данных от автоматических метеорологических станций был рассмотрен в работах /21, 55/. С учетом проведенных ранее численных экспериментов было решено остановиться на использовании логического подхода к контролю качества данных. При таком подходе должна быть установлена логическая связь для измеряемой метеорологической величины. Например, такая связь может быть записана в виде следующего условия: Tj=Tf, если а ТІ Ь ; где а и Ь- заданные граничные условия; ТІ является ошибочным, если неравенство не выполняется.
Для данных приземных метеорологических величин, измеряемых с помощью автоматических метеорологических станций, контроль позволяет выявить наличие грубых ошибок (выбросов) в результатах наблюдений. Оценка граничных значений а и Ъ обычно осуществляется с использованием статисти 58 ческих процедур: на основе выборочных значений средних и дисперсий, и для заданного уровня статистической значимости, определяющего вероятность ошибки, производится расчёт доверительного интервала, используемого в контроле каждого значения из проверяемого временного ряда данных. Такую проверку целесообразно осуществлять в процессе функционирования автоматической станции в таком порядке: по заданному отрезку временного ряда оценивать значения величин а и 6, а затем применять указанное выше условие к вновь измеренному значению метеорологической величины или серии измеренных величин. При контроле уже имеющегося временного ряда, например, перед записью его в архивный файл, значения величин а и Ъ целесообразно определить, анализируя область, в которую попадает контролируемое значение временного ряда.
По известной дискретности наблюдений выявляются пропуски во временных рядах результатов измерений.
Для исключения систематических ошибок периодически осуществляется метрологический контроль датчиков станции.
Переходя к рассмотрению практических вопросов реализации контроля качества данных, остановимся сначала на таком важном вопросе, как задание оптимальной величины дискретности временного ряда А. Современные автоматические метеостанции позволяют чрезвычайно детально описать поведение временных рядов регистрируемых ими метеорологических величин за счет высокой дискретности А проведения измерений. Данные могут быть получены с дискретностью 10 секунд. Однако при такой высокой частоте измерений появляется большое количество избыточных данных, что усложняет их использование. Поэтому была проведена оценка оптимальной величины дискретности измерений А. Определение оптимальной величины дискретности весьма важно, поскольку может существенно сократить объем как обрабатываемой, так и хранимой информации. Для решения этой проблемы были рассмотрены временные ряды приземной температуры воздуха, поскольку они не так изменчивы, как параметры ветра, и не так консервативны, как атмосферное давление /3, 25 -27/.
Контроль выбросов и смены характера протекания процесса
Анализ рис. 3.14, где представлены значения среднеквадратичного отклонения температуры воздуха от ее среднего значения в Санкт-Петербурге в 2011 и 2012 гг., показывает, что величина СКО за все четыре месяца 2011 г. была практически на ҐС меньше, чем в 2012 г. Это говорит о том, что приземная температура воздуха в 2011 г. изменялась не в таких больших пределах, как в 2012 г. - была менее изменчива.
Проанализируем теперь поведение средних значений приземной температуры воздуха, вычисленное по трем фрагментам одного и того же временного ряда. Анализ данных табл. 3.1-3.4 показывает, что доверительные интервалы для этой статистической характеристики в большинстве рассмотренных случаев не перекрываются, что позволяет сделать вывод о не стационарности временных рядов приземной температуры воздуха по этому параметру. Наглядно это демонстрируют данные, приведенные на рис. 3.15 (а). Среднее значение температуры, вычисленное за первые 7 суток, составляет С при 95% доверительном интервале от 11.5С до 12.9С, а за последующие 7 суток среднее значение температуры составляет 14.6С при 95% доверительном интервале от 13.9С до 15.2С. Для такой статистической характеристики как среднеквадратическое отклонение ситуация обратная - доверительные интервалы, вычисленные по первым 7 и последующим 7 суткам, обычно перекрываются. Подобное пове дение этой статистической характеристики иллюстрирует рис. 3.15 (б).
Средние значения (а) и среднеквадратичные отклонения (б) температуры с 95% доверительными интервалами в Санкт-Петербурге за сентябрь 2012 г., вычисленные по фрагментам временного ряда, содержащим 14 суток, 7 суток (1), 7 суток (2) Остановимся теперь на рассмотрении таких статистических характеристик как асимметричность (As) и эксцесс (Ех).
Как видно из табл. 3.1-3.4, в мае и июле 2011-2012 гг. (как для временного ряда за 14 дней, так и для двух фрагментов по 7 дней) основная масса значений температуры воздуха меньше среднего значения (As 0). В декабре 2012 г. подобное наблюдается только во фрагментах за 14 дней и за вторые 7 дней (с 8 по 14 декабря). В период первой семидневки (с 1 по 8 декабря) 2012 г. и второй семидневки за декабрь 2011 г. (с 8 по 14 декабря) характер поведения ряда меняется. Основная масса наблюдений уже больше среднего значения (As 0). В сентябре 2012 г. (табл. 3.2) за вторые 7 дней (с 10 по 17 сентября) значение As 1, что говорит о наличии в ряду «выбросов», которые могут быть ошибками наблюдения.
Значение эксцесса за май и июль 2011-2012 гг. оказалось меньше нуля (Ех 0) (см. табл. 3.1, 3.3), следовательно, ЭФР этих временных рядов является плоско вершинной и распределение стремится к случайному. Если Ех 0 (декабрь 2012 г., сентябрь 2011 г.), то ЭФР является островершинной и, как правило, у нее наблюдается два равнозначных хвоста. В сентябре 2012 г. (табл. 3.2) за период второй семидневки значение эксцесса говорит о наличии выброса (Ех = 2.72), соответственно выброс заметен и во временном ряду за 14 дней того же месяца.
Результаты расчета основных статистических характеристик временных рядов за май и август 2012 г. по данным АМС в поселке Воейково Ленинградской области представлены в табл. 3.5.
Для анализа особенностей изменения средних значений приземной температуры воздуха, вычисленных по различным фрагментам одного и того же временного ряда, обратимся к рассмотрению рис. 3.16.
Приведенные данные показывают, что рассчитанные при 95% уровне значимости доверительные интервалы для этой статистической характеристики не перекрываются. Так например, по данным рис. 3.16 (а) среднее значение температуры, вычисленное за первые 7 суток августа 2012 г, составляет 18.0С при 95% доверительном интервале от 17.0оС до 19.0С, аза последующие 7 суток среднее значение температуры составляет 12.8С при 95% доверительном интервале от 12.0С до 13.7С. Аналогичный характер поведения средних значений температуры в Воейково наблюдается и в мае (рис. 3.16(6)). Такой характер изменения среднего значения для двух фраг 95 ментов одного и того же ряда позволяет сделать вывод о не стационарности временных рядов приземной температуры воздуха по этому параметру и в Ленинградской области.
Для такой статистической характеристики как среднеквадратическое отклонение ситуация обратная - доверительные интервалы, вычисленные по первым 7 и последующими 7 сутками, обычно перекрываются. Подобное поведение этой статистической характеристики иллюстрирует рис. 3.17 для мая и августа 2012 г.
Значения стандартного отклонения (СКО) температуры в Воейково (Ленинградская область) за август (а) и май (б) 2012 г., вычисленные по фрагментам временного ряда, содержащим 14 суток, 7 - (1) и 7 суток (2) Определенный интерес представляет сравнение данные о временных рядах приземной температуры воздуха, синхронно измеренных в мегаполисе и в не урбанизированном районе. Для проведения такого сравнения обратимся к табл. 3.6. Здесь приводятся статистические характеристики временных рядов приземной температуры воздуха за один и тот же временной период (14 дней мая 2012 г.), полученные по данным измерений АМС в Санкт-Петербурге (РГГМУ) и Ленинградской области (ИРАМ).
Исследование временного тренда и значений периодических составляющих
Подводя итог анализу рассмотренных данных, можно констатировать, что полиномиальная аппроксимация при использовании в качестве предикторов непосредственно результатов измерения приземной температуры дает положительные результаты только при использовании полиномов первой степени при небольшом сглаживании за счет увеличения числа узлов до 4—5. При этом точность прогноза оказывается существенно ниже по сравнению с использованием первой методики.
Таким образом, подводя итог этого этапа исследования, можно сделать вывод о том, что для проведения текущего прогнозирования приземной температуры воздуха можно использовать метод полиномиальной аппроксимации, но при выполнении следующих условий: - осуществление предварительной обработки обучающего отрезка временного ряда путем удаления временного тренда и периодических составляющих;
Перейдем теперь к рассмотрению результатов численных экспериментов, полученных при использовании сплайн экстраполяции. В этом случае при расчете коэффициентов прогностической функции используется не аппроксимация, а многоинтервальная интерполяция элементов обучающей выборки, обладающая дополнительными (по сравнению с обычной интерполяцией) свойствами. А именно, сплайн интерполирующий полином обеспечивает не только равенство его значения в интерполяционных узлах, но и непрерывность заданного числа производных на границах узлов. В этом случае сочетаются достоинства аппроксимации (можно учитывать большое число узлов) и при этом исключаются осцилляционные эффекты, присущие классическим интерполяционным полиномам больших степеней /84, 85./.
Исследуя возможности применения сплайн экстраполяции для текущего прогнозирования приземной температуры воздуха, мы ограничились рассмотрением кубических сплайнов, используя алгоритм расчетов, приведенный в работе /20/.
Для проведения численных экспериментов по этому алгоритму была составлена программа «Tspl». С использованием этой программы проводились численные эксперименты, в которых варьировались как параметры временных рядов (сезон, продолжительность и т.д.), так и схемы расчета коэффициентов сплайна.
Типичные результаты, полученные при проведении численных экспериментов, иллюстрируют данные табл. 4.6 и 4.7 и кривые на рис. 4.4-4.8. Как и ранее, эти данные соответствуют использованию непосредственно результатов измерений, так и случаю, когда в процессе предварительной обра 126 ботки из обучающей выборки исключались временной тренд и периодические составляющие.
Численные эксперименты проводились при варьировании числа узлов в обучающей выборке h в диапазоне значений 4-12. Кроме того, при проведении численных экспериментов исследовалось влияние сглаживания данных в обучающей выборке. Характер сглаживания обучающей выборки кодировался параметром s:
Полученные в этом случае значения среднеквадратических отклонений прогностических и измеренных значений приемной температуры (СКО) представлены в табл. 4.6. Однако, анализировать все эти данные удобнее, обратившись к рис. 4.4, где представлены кривые, построенные по данным этой таблицы.
Кривые на рис. 4.4 иллюстрируют изменение СКО текущего прогноза в зависимости от заблаговременности прогноза и схемы эксперимента. Это те же данные, что и в табл. 4.6. Анализ поведения этих кривых показывает, что во всех случаях погрешность прогноза увеличивается с ростом заблаговременное. Это общая тенденция, она проявляется практически во всех случаях. Однако, что очень существенно, характер роста ошибок зависит от использованной схемы расчета параметров сплайна. Причем эти отличия могут превосходить 100%.
Оптимальной схемой расчета параметров сплайна экстраполяции оказалось использование 16 узлов в обучающей выборке ( h -16 ) и проведение предварительного сглаживания обучающего ряда по 5 точкам (s -5).
Рисунок 4.4. Зависимость среднеквадратических отклонений прогностических значений приземной температуры воздуха от измеренных в зависимости от заблаговременности прогнозов по сплайн экстраполяции Построен по данным табл. 4.6
Из анализа расположения кривых на рис. 4.4 следует наличие двух резко различающихся групп кривых: верхние, с номерами схемы эксперимента 1, 5 и 7 и нижние, с номерами схемы эксперимента 2, 3, 4, 6, 8, 9 и 10. Схемы эксперимента из первой группы абсолютно не подходят для проведения текущего прогнозирования приземной температуры воздуха. Схемы эксперимента из второй группы дают неплохие и близкие результаты, причем здесь есть и возможность оптимизации - наилучшей оказывается схема под номером 10.
Нетрудно видеть, что такое разделение на две группы связано с проведением или не проведением предварительного сглаживания данных измерений. При отсутствии предварительного сглаживания метод сплайн экстраполяции оказывается крайне не эффективным. Наличие сглаживания, осуществляемого как непосредственно с использованием соотношений (2.25-2.27), так и за счет увеличения количества узлов, по которым производится расчет коэффициентов сплайна, существенно уменьшает ошибки текущего прогнозирования.
Такое разделение схем прогнозов на два класса наблюдается и для других временных рядов приземной температуры воздуха. В подтверждение этого (рис.4.5) приводятся значение СКО прогноза для трех временных рядов при различных схемах использования метода сплайн экстраполяции. На этих рисунках погрешность сплайн экстраполяции откладывается по вертикальной оси. Зависимость погрешности текущего прогнозирования от номера схемы эксперимента откладывается по горизонтальной оси. Во всех трех случая хотя и меняются абсолютные значения СКО прогноза, но отчетливо прослеживается разделение на два класса: пики - не оптимальные схемы, ложбины - оптимальные. На всех трех фрагментах этого рисунка отчетливо проявляются три пика, соответствующие следующим номерам схемы эксперимента: 1, 5 и 7 .
На рис. 4.6 зависимость среднеквадратичной погрешности от заблаговременное прогноза для оптимальной схемы под номером 10 представлена нижней кривой, а для одной из неоптимальных - под номером 1 - верхняя кривая.