Содержание к диссертации
Введение
1. Сравнительный анализ современных систем спутникового мониторинга и баз данных для изучения ледового покрова арктики
1.1 Сравнительный анализ систем мониторинга ледового покрова Арктики на базе спутниковых активных и пассивных сенсоров 9
1.2 Анализ современных методов обработки спутниковых данных для определения геофизических параметров ледового покрова 21
1.3. Анализ геофизических баз данных Арктики, созданных на основе спутниковых измерений, сети буев, данных подводных лодок и метеорологических станций 31
1.4. Определение основных направлений исследований, связанных с информационным обеспечением проблем изучения климата 33
Выводы и предложения 35
2. Исследование и разработка алгоритмов обработки спутниковых измерений для создания многолетних баз данных геофизических параметров ледового покрова арктики .
2.1. Анализ алгоритмов оценивания типов морского льда по активным и пассивным микроволновым данным на базе моделей линейных смесей 36
2.2. Искусственные нейронные сети: основные понятия и определения 40
2.3. Разработка алгоритма обучения МСП нейронной сети на основе обратного распространения ошибки и эмуляции отжига 47
2.4. Исследование вопросов генерализации результатов обучения при построении МСП нейронной сети 53
2.5. Оценка параметров ледового покрова по данным многоканальных микроволновых радиометров с использованием искусственных нейронных сетей и данных спутников серий Океан-01 и ERS 57
2.6. Разработка алгоритмов оценивания начала, окончания и длительности периода таяния снежного и ледового покрова Арктики 61
2.7. Разработка консистентных баз данных для изучения сезонной и многолетней динамики ледового покрова и процессов таяния 64
Выводы и предложения 84
3. Исследование вариабельности, многолетней динамики ледового покрова и продолжительности сезонов таяния и корреляции этих процессов с арктическими осцилляциями .
3.1. Североатлантические и арктические осцилляции и проблема глобального климата 86
3.2. Исследование многолетней динамики ледового покрова Арктики и связи с арктическими осцилляциями 91
3.3. Исследование сезонной и многолетней динамики сезона таяния и его связи с арктическими осцилляциями 98
3.4. Сравнительный анализ оценок концентраций многолетнего морского льда, полученных с помощью алгоритма NASA TEAM и нейронных сетей, обученных на данных SSM/I-Океан и SSM/I-ERS 103
Выводы и предложения 105
Заключение 107
- Анализ геофизических баз данных Арктики, созданных на основе спутниковых измерений, сети буев, данных подводных лодок и метеорологических станций
- Искусственные нейронные сети: основные понятия и определения
- Разработка алгоритмов оценивания начала, окончания и длительности периода таяния снежного и ледового покрова Арктики
- Исследование сезонной и многолетней динамики сезона таяния и его связи с арктическими осцилляциями
Введение к работе
Изучение Арктики имеет большое значение для решения различных научных и практических задач.
Одной из актуальных современных научных проблем является проблема глобального изменения климата, выявление тенденций, поиск индикаторов такого изменения и прогнозирование климата в будущем. Последствия изменения климата могут привести к ряду негативных процессов, в частности, к ухудшению экологической ситуации в ряде регионов, изменению основных параметров, среды обитания животных и т.д. [3, 13, 15, 35, 51, 60, 86, 91, 115].
Арктический морской лед представляет собой важную компоненту климатической системы, поскольку он модулирует климат вследствие изменения коротковолнового альбедо земной поверхности, температуры воздуха, влажности и обмена кинетической энергией между атмосферой и океаном [3, 6, 14, 16,22, 38, 57, 67, 74,91,93,96, 125, 126, 144,149].
Данные о дрейфе льда, его пространственном распределении, возрасте, типах, концентрации, наличии айсбергов и торосов весьма важны для навигации, рыбного промысла, добычи нефти и газа в полярных районах и др. [14, 22, 31, 50, 52 - 56, 61, 91, 118,127].
Из-за сложных климатических условий в полярных регионах, высокой стоимости и опасности наземных и воздушных наблюдений в последние десятилетия широкое использование приобрело дистанционное зондирование с использованием спутниковых систем и с многоканальными активными и пассивными сенсорами [1-19, 23, 27-33, 36, 37, 75-80, 83, 147-149].
Современные спутниковые системы наблюдения работают в оптическом, инфракрасном и микроволновом диапазонах электромагнитного излучения. Однако, применение инфракрасных и оптических сенсоров в Арктике ограничено из-за продолжительной полярной ночи и облачности, поэтому наиболее эффективными являются микроволновые активные и пассивные сенсоры, так как их функционирование практически не зависит от освещенности поверхности и состояния атмосферы [1-19, 28-37, 51-69, 127].
Дистанционное зондирование Арктики началось в 1970-х годах на базе метеорологических спутников серий Landsat и Nimbus, оснащенных пассивными сенсорами, измеряющими интенсивность собственного излучения Земли и атмосферы
[45, 56, 66, 67, 69, 71, 93-97, 137]. Среди спутниковых систем мониторинга Арктики, функционирующих настоящее время в операционном режиме, следует выделить серии спутников ОКЕЛН-01 (Россия), DMSP (США), Radarsat (Канада), ERS (Европейское Космическое агентство) и JERS (Япония) [3, 4, 6-29, 30, 52, 54-56, 60, 62-69, 75, 127].
На российских спутниках серии ОКЕАН-01 установлены оптические сенсоры типа МСУ, радары с реальной апертурой и пассивные микроволновые радиометры типа РМ-08 [17, 29, 30, 36]. Это позволяет получать синхронные активные и пассивные микроволновые измерения при любых погодных условиях и освещенности, а достаточно большая полоса обзора (450 км), среднее разрешение (1.2 км) и высокая частота повторного наблюдения заданной территории (3 дня) обеспечивает систематический мониторинг Арктики [3, 6]. Спутники серии ОКЕАН-0 оснащены восьмиканальным радиометром Дельта-2Д [36].
Многоканальные микроволновые радиометры SSM/I спутников серий 5D-2 и DMSP (F8, F11 и F13) (США) обеспечивают получение микроволновых данных об основных типах морского льда, их концентрации и возрасте [11, 45, 53, 62-69, 71-73, 75, 78, 83, 84, 88, 92-97, 103-105, 114, 120, 122, 134-138]. Однако эти данные имеют низкое разрешение (25 км), что ограничивает их использование для детального анализа ледового покрова.
Радары с синтезированной апертурой (на спутниках ERS, JERS, RADARSAT) имеют высокое пространственное разрешение (от 7 до 150 м), но обладают маленькой полосой обзора [11, 53, 56, 58, 60, 86, 87, 111-113, 118, 122, 127, 130]. Поэтому они эффективны для более детального анализа ледового покрова. Учитывая ограниченный период функционирования соответствующих спутников, их данные не могут быть применены для многолетних глобальных исследований климата.
В настоящее время вопросам обработки и классификации микроволновых спутниковых данных уделяется большое внимание. Для проверки и валидации данных одних сенсоров используются имеющееся ограниченное количество результатов наземных наблюдений и данные других сенсоров [1-19, 27, 47, 87-103, 104, 110, 112, 129, 130, 136, 137].
В работах российских ученых [1, 4, 6, 7, 8, 11, 13, 14, 15, 16, 18, 19, 33, 51, 53, 54, 55, 56, 58, 62] исследованы различные вопросы обработки активных и пассивных микроволновых данных спутников серии ОКЕАН-01 и КОСМОС-1500 с использованием алгоритмов линейной смеси. Сравнительный анализ различных методов оценки параметров арктического морского льда с использованием пассивных
и активных микроволновых спутниковых данных (ОКЕАН-01, RADARSAT, SSM/I) представлен в [4, 6, 11, 51, 53, 57, 58, 60, 62, 87].
Два операционных алгоритма (NASA Team и Bootstrap) оценивания типов и концентрации морского льда на базе моделей линейной смеси по данным микроволнового радиометра SSM/I рассмотрены и проанализированы в работах [6, 11, 53, 63, 72, 88]. Эти алгоритмы используются в операционном режиме в Ледовом центре университета Колорадо. По данным SSM/I и его предшественника SMMR создаются среднесуточные карты типов и концентраций морского льда (с 1978 года по настоящее время). Этот набор данных в настоящее время является основным источником информации для глобальных моделей и исследований полярных регионов [11, 45, 47, 49, 51, 53, 57, 60, 62, 64, 66-104, 105, 114, 115, 120, 134-138]. Однако алгоритм NASA Team дает заниженную оценку суммарной концентрации морского льда по сравнению с алгоритмами обработки радарных данных, таких как ERS SAR и RADARSAT SAR [53, 76, 87, 111, 112]. В алгоритме NASA Team используются набор из 9 глобальных опорных значений и предполагается, что вода, многолетний и однолетний лед имеют стабильные отражательные характеристики [63, 72, 88]. Этот алгоритм чувствителен к содержанию водяного пара в атмосфере, поэтому дает заниженную концентрацию многолетнего льда летом.
В статье [139] предложен метод классификации данных RADARSAT (ScanSAR) на лед и воду, проведена оценка скорости таяния льда и скорости перемещения границы льда в районе побережья острова Ньюфаундленд. Метод классификации льда и воды, представленный в этой работе, достаточно прост и эффективен, позволяет исключать грубые выбросы в значениях данных, что исключает ошибочную классификацию. Однако этот метод применялся для уточнения границ и формы отдельных льдин, а для их определения на изображениях использовался визуальный анализ, что делает невозможным применение этого метода для обработки в операционном режиме больших массивов данных. Валидация данных RADARSAT по результатам визуальных наблюдений проведена в [130]. В этой работе проанализированы особенности восприятия радаром различных форм льда (ледяное сало, нилас, однолетний лед, айсберги). В работе отмечено соответствие между данными RADARSAT и измерениями других сенсоров (SSM/1, AVHRR). Основная проблема классификации льда по радарным данным заключается в разделении открытой воды и молодых форм льда. Показано, что нилас обладает такими же отражательными характеристиками, как и открытая вода, но окружен другими типами
льда, поэтому нилас можно выделить на данных RADARSAT. В работе [76] представлен метод оценки типов и концентраций морского льда с одновременным использованием данных ERS и RADARSAT. Оценки концентрации льда по результатам визуальных наблюдений с борта научно исследовательского судна были на 1% меньше оценок, полученных по радарным данным, а результаты вычислений по алгоритму NASA Team оказались ниже на 15-25%. В работе [87] проведена оценка результатов работы операционного алгоритма классификации льда по данным ERS, используемого в центре приема и обработки данных при Геофизическом университете шт. Аляска, США. Отличия от результатов классификации с обучением составили 6% для многолетнего льда.
Вопросы изучения динамики ледового покрова Арктики по данным спутниковых систем наблюдения представлены в работах [3, 10, 11, 45, 53, 55, 69, 93, 95,97,120].
В работе [120] были выявлены отрицательные тренды площади морского льда за 18.2-летний период (1978-1996) по всему северному полушарию и по отдельным его регионам. Значения площади и протяженности вычислялись по среднесуточным концентрациям морского льда, полученным по данным микроволновых радиометров SMMR и SSM/I. В этой работе не исследована вариабельность различных типов льда, т.к. данные сенсора SMMR позволяют вычислять только суммарную концентрацию морского льда. В [55] были получены 28-летние тренды протяженности ледового покрова в Баренцевом-Карском морях по результатам комплексной обработки активных и пассивных данных со спутников серии КОСМОС, ОКЕАН, Алмаз (1984-1993) и опубликованным в литературе результатам наблюдений за ледовым покровом за период 1966-1988 гг. В работах [45, 97] также изучены тренды площади и протяженности ледового покрова в северном полушарии и отдельных регионах, проведен анализ их пространственного распределения, выявлены отрицательные тренды площади морского льда. Наибольшие по величине отрицательные тренды выявлены в Чукотском, Японском, Охотском и Лаптевых морях.
Точное оценивание параметров морского льда требует решения ряда проблем, общих для всех микроволновых сенсоров, так как отражательные и излучательные характеристики льда нелинейно зависят от множества факторов (диэлектрические свойства, плотность, однородность, шероховатость поверхности, частота и поляризация, на которые настроен сенсор, его угол наблюдения и т.п.) [90]. Более того, в условиях таяния мокрый снег и талая вода на поверхности льда скрывают более
стабильные объекты [71, 109, ПО], и определение тонкого молодого льда проблематично [63, 73]. Следовательно, для максимально полного использования различных способностей различных сенсоров необходима разработка новых методов классификации, использующих данные с разных спутников.
Использование искусственных нейронных сетей (ИНС) для обработки спутниковых данных весьма перспективно, так как ИНС обладают способностью аппроксимировать различные функции после соответствующего обучения без априорного знания законов их распределения [12, 31, 82, 131].
В работе [4] представлен сравнительный анализ алгоритмов классификации морского льда по двухканальным микроволновым данным спутников серии ОКЕАН-01: с использованием многослойного перцептрона с различными алгоритмами обучения и на базе моделей линейной смеси и эталонных таблиц радиофизических параметров основных типов морского льда. Рассматривались динамические алгоритмы обучения нейронных сетей на основе Калмановской фильтрации и двуступенчатой оптимизации и комбинированный алгоритм обучения обратным распространением ошибки и эмуляцией отжига. Результаты классификации изображений с помощью искусственной нейронной сети и моделей линейной смеси совпадали на 90-93%, существенное расхождение имелось на границе однолетнего и многолетнего льда. При обучении нейронных сетей классификации данных ОКЕАН-01 динамический алгоритм требовал меньшего времени обучения. В этой работе показано, что нейронные сети с динамическим обучением были более эффективны по сравнению с МСП с обучением методом обратного распространения ошибки и эмуляции отжига при аппроксимации полиномов с идеальными обучающими данными. Оценка концентрации многолетнего льда по радиояркостным температурам SSM/I и соответствующим наборам обучающих данных Океан-01 показала, что динамические алгоритмы приводят к переобучению по сравнению с методом обратного распространения ошибки и эмуляции отжига.
Температура воздуха вблизи поверхности льда является важным климатическим параметром. Однако создание глобальной базы данных температуры воздуха полярных регионов сопряжено с рядом трудностей. В [125] представлена база данных значений температуры воздуха, осредненных за 12-часовые периоды за 1979-1997 гг. Температура дана в виде сетки с расстоянием между узлами ЮОкм. Значения в узлах были получены при помощи интерполяции данных наблюдений из следующих источников: дрейфующие буи международной программы International Arctic Buoy Programme (IABP), российские дрейфующие станции и метеорологические данные с
материковых станций. Созданный набор данных называется International Arctic Buoy Program/Polar Exchange at the Sea Surface (IABP/POLES).
По этой базе данных проведены оценки средней даты начала и окончания сезона таяния и средней длительности сезона таяния. За период 1978-2000 гг. выявлен положительный тренд длительности сезона таяния величиной 0.5 дней за 10 лет.
Процессы таяния ледового покрова тесно связаны с изменениями коротковолнового альбедо поверхности. Для определения момента начала таяния и замерзания в настоящее время используются как активные, так и пассивные спутниковые данные: RADARSAT [111, 127], ERS [147], Океан [16, 57, 60], SSM/I [57, 122] и др.
В [16, 60] предложен алгоритм определения концентрации талых озер и отражающей способности поверхности по данным синхронных микроволновых измерений SSM/I и «Океан-01», проведена валидация алгоритма по данным оптического сенсора AVHRR. Оценки концентрации талых озер по данным AVHRR превышали оценки по микроволновым данным на 2-5%, оценки альбедо по данным канала 1 AVHRR превышали оценки альбедо по микроволновым данным не более чем на 0.04.
В работах [49, 77-79] предложен алгоритм определения даты начала таяния по среднесуточным радиояркостным температурам с пассивных микроволновых сенсоров SMMR/SSM/I. В работе [57] для улучшения точности определения дат начала таяния и замерзания совместно с этим алгоритмом были использованы температуры IABP/POLES. В этих работах были выявлены положительные тренды средней даты начала сезона таяния и средней длительности сезона таяния.
Целью данной диссертационной работы являлось исследование и разработка более эффективных методов, алгоритмов и программного обеспечения для оценки геофизических параметров ледового покрова Арктики, создания многолетней консистентной базы спутниковых данных, исследование многолетней динамики и вариабельности параметров ледового покрова и сезонов таяния Арктики.
В главе 1 представлен сравнительный анализ современных систем спутникового мониторинга ледового покрова Арктики на базе активных и пассивных сенсоров. Рассматриваются спутники серий Океан-01, ERS, JERS, RADARSAT, система мониторинга на базе метеорологических спутников Nimbus-7, DMSP. Показано, что микроволновые сенсоры имеют ряд преимуществ перед оптическими в задачах дистанционного зондирования Арктики (данные практически не зависят от облачности
и освещенности поверхности). Проведен сравнительный анализ различных алгоритмов оценивания типов морского льда по микроволновым измерениям сенсоров типа SMMR и SSM/I и данным радаров с синтезированной апертурой типа ERS-1 и RADARS А Г. Проанализированы также алгоритмы обработки многоканальных и гиперспектральных данных. Рассмотрены современные геофизические базы данных Арктики, созданные на основе измерений спутниковых сенсоров, сети буев, подводных лодок и метеорологических станций.
В главе 2 проведен анализ алгоритмов оценивания типов морского льда по активным и пассивным микроволновым данным спутников серии Океан-01 на основе модели линейной смеси. Проведена разработка аппроксиматоров на основе искусственных нейронных сетей (ИНС) для оценок геофизических параметров морского льда по многоканальным пассивным микроволновым спутниковым данным. Для оценки концентрации многолетнего льда использовались многослойные перцептроны. Проведен также анализ и разработка алгоритмов оценивания начала, окончания и длительности периода таяния ледового покрова Арктики. В данной главе проведено исследование и разработаны алгоритмы построения консистентных баз данных для изучения сезонной и многолетней динамики ледового покрова и процессов таяния. Наряду с разработкой алгоритмов в главе исследованы вопросы создания вычислительной системы обработки, хранения и интерпретации спутниковых данных.
В главе 3 проведено исследование многолетней динамики ледового покрова Арктики и связей с арктическими осцилляциями (АО). Выявлены отрицательные тренды площади многолетнего морского льда в Северном Ледовитом океане, выявлены положительные тренды длительности сезона таяния в северном полярном регионе и отдельных его частях. Наблюдалась существенная корреляция между средней площадью многолетнего льда и среднезимним индексом АО и между средней длительностью сезона и среднезимним индексом АО.
В заключении перечислены основные результаты работы по исследованию и разработке методов обработки многоканальных спутниковых данных для изучения сезонной и многолетней динамики ледового покрова Арктики. Кроме того, отмечается, что максимальная эффективность мониторинга Арктики может быть достигнута при совместной обработке данных разных сенсоров с использованием современных перспективных нейросетевых алгоритмов, и дальнейшее повышение эффективности мониторинга Арктики связано с применением современных гиперспектральных
сенсоров, разработкой новых методов обработки данных и разработкой методов ускорения работы существующих алгоритмов.
Автор выражает особую благодарность научному руководителю, Бельчанскому Геннадию Ильичу, за большую помощь в период подготовки и написания данной диссертации, а также своим коллегам И.Н. Мордвинцеву, Н.Г.Платонову, И.В. Алпацкому.
Основные материалы диссертации представлены в [5, 11, 17, 28, 60, 62].
Анализ геофизических баз данных Арктики, созданных на основе спутниковых измерений, сети буев, данных подводных лодок и метеорологических станций
В настоящее время одной из крупнейших геофизических баз данных является база данных Ледового центра при университете шт. Колорадо (NS1DC). Она содержит данные для исследований морского льда, снегового и ледового покрова суши, вечной мерзлоты, атмосферы, гидросферы, биосферы и т.п. В Ледовом центре производятся и распространяются цифровые среднесуточные карты радиояркостных температур Арктики и Антарктиды, полученных с микроволновых радиометров SMMR и SSM/I. Радиояркостные температуры предоставляются в полярной стереографической проекции с размером пикселя 25 км х 25 км для всех каналов радиометров, кроме 85.5 ГГц, и с размером пикселя 12.5 км х 12.5 км для каналов 85.5 ГГц. Данные SMMR предоставляются на каждый второй день, за период с 25 октября 1978 года по 20 августа, данные SSM/I предоставляются на каждый день с 9 июля 1987 г по настоящее время. Всего имеется более 3500 изображений за период с 25 октября 1978г по 31 декабря 2002 г. Значения радиояркостной температуры в файлах хранятся в виде целых чисел длиной 2 байта. Данные со спутников F11 и F13 предоставляются в формате HDF (Hierarchical Data Format) [75, 100]. Концентрации морского льда вычисляются из радиояркостных температур по алгоритмам Bootstrap и NASA Team. Алгоритм Bootstrap позволяет вычислить суммарные концентрации морского льда и используется для данных SMMR и SSM/I. По алгоритму NASA Team можно определить концентрацию многолетнего морского льда и суммарную концентрацию морского льда. Этот алгоритм используется для обработки данных SSM/I, так как в нем для маскирования ложных концентраций многолетнего льда применяются данные канала 22ГГц, V, отсутствующие у SMMR.
Данные подводных лодок включают в себя измерения параметров нижней поверхности морского льда, произведенные сонаром, и результаты их обработки. Данные получены с субмарин американского и британского флотов за 1976, 1986-1994, 1996-1998 годы. Файлы состоят из заголовка, содержащего геолокационную информацию, и последовательного списка значений осадки нижней поверхности льда с интервалом в 1.0 м. Длина профиля нижней поверхности льда может составлять до 50.0 км, но может быть и короче, если разрывы в данных составляют больше 0.25км или если изменения курса судна приводят к отклонению от прямой линии. Статистическая информация включает описание характеристик нижней поверхности льда, трещин, степени деформированности льда, и дается для всех профилей длиннее 10.0 км [129]. База данных постоянно обновляется и корректируется. В работе [129] представлены результаты анализа и моделирования толщины льда. Выявлено уменьшение модельных значений толщины льда на 0.6-0.9 м за период с 1987-1996гг. Две упомянутые базы данных дополняют друг друга. В одной содержатся данные, позволяющие оценить площадь ледового покрова на длительном промежутке времени, а в другой - толщина ледового покрова. Таким образом, при совместном анализе этих данных возможно исследование динамики объема ледового покрова. База данных международной программы метеорологических буев (International Arctic Buoy Programme, IABP) находится в лаборатории прикладной физики университета штата Вашингтон [125]. В базе содержится метеорологическая и океанографическая информация с сети плавучих буев в Арктике. В каждый момент времени работают в среднем 25 буев, поставляя данные об атмосферном давлении, температуре и др. Путем интерполяции этих данных, а также данных метеорологических станций, создаются сетки значений атмосферного давления, температуры воздуха, скорости льда с 1979 г по настоящее время.
База данных характеристик морского льда по данным радаров с синтезированной апертурой со спутников ERS и RADARSAT находится в центре приема и обработки спутниковых данных при Аляскинском университете (Alaska SAR Facility, ASF). Результаты обработки данных ERS-1 системой EGPS (ERS Geophysical Processing System) и данных RADARSAT системой RGPS (RADARSAT Geophysical Processing System) включают данные о возрасте льда, коэффициенте обратного рассеяния, толщине льда, доле многолетнего льда, скорости движения льда и т.п. [110-112]. Система обработки данных RGPS, предназначенная для обработки данных RADARSAT, является новой версией системы EGPS, с помощью которой обрабатывались данные радаров с синтезированной апертурой на спутниках ERS-1, 2 и JERS-1. Эта система разработана лабораторией изучения реактивного движения (Jet Propulsion Laboratory, JPL) и установлена и функционирует в ASF. Результаты обработки данных ERS-1 имеются для периода с 1991 по 1993 годы, результаты обработки данных RADARSAT - за период с 1996 по 1999 годы. База данных Национального Ледового центра штата Вашингтон (National Ice center) содержит архивные и прогнозные данные о ледовой обстановке глобатьного и регионального масштаба: карты толщины, сплоченности и возраста льда, распределения айсбергов в северном полярном регионе, 1.4.Определение основных направлений исследований, связанных с информационным обеспечением проблем изучения климата
Анатаз результатов современных исследований показывает, что для понимания природы и. прогнозирования глобальных изменений климата необходимы оценки сезонной и регионапьной вариабельности арктического многолетнего морского льда, процессов таяния льда и снежного покрова и изучение взаимосвязи между климатическими процессами и ледовым покровом Арктики. Для повышения точности оценок геофизических параметров подстилающей поверхности необходима разработка более сложных моделей, учитывающих большее количество параметров и сложный характер зависимости между ними. Этого можно добиться при совместной обработке данных различных спутников, поэтому наиболее перспективны спутниковые системы, оснащенные несколькими пассивными и активными микроволновыми сенсорами, позволяющие получать синхронные изображения в различных диапазонах. Одним из направлений дальнейшего совершенствования алгоритмов обработки данных многоаспектного мониторинга Арктики является использование искусственных нейронных сетей (ИНС), обладающих способностью аппроксимировать широкий класс функций без априорных допущений о законах их распределения и на основе обучения строить решающие поверхности любой конфигурации [4, 6, 12, 31, 82]. В настоящее время разработан ряд алгоритмов такого типа для классификации морского льда по спутниковым радарным данным [4, 6, 10, 27, 51, 53, 143]. При использовании ИНС возникают различные проблемы, связанные с выбором топологии, обеспечивающей пр_иемлемую_адекватность аппроксимирующей функции в областях, где не существует обучающих, тестовых или валидационных данных (генерализация и переобучение), поиском глобального экстремума функционала ошибки, высокие временные затраты на обучение и др. Универсальных рецептов выбора оптимального J алгоритма обучения сети при решении конкретной прикладной задачи не существует, \ поэтому усилия исследователей концентрируются, в основном, на поиске различных подходов (рецептов), обеспечивающих приемлемую точность решения задачи аппроксимации при обработке заданных априорных и апостериорных спутниковых данных [4, 6, 108, 131].
Искусственные нейронные сети: основные понятия и определения
0Искусственная нейронная сеть (ИНС) образуется из множества искусственных нейронов, соединенных между собой. Выходные значения одних нейронов подаются на вход другим. Существуют также нейроны, на вход которых подаются внешние данные, и нейроны, выходное значение которых является выходным значением нейронной сети. Как правило, параметрами ИНС являются весовые коэффициенты нейронов и смещения. Процесс обучения нейронной сети состоит в их подборе таким образом, чтобы получить наилучшую аппроксимацию моделируемой функции. Моделируемая функция задается векторами входных и выходных значений. Качество аппроксимации определяется значением функционала ошибки. Задача обучения сети сводится к нахождению множества значений ее параметров, минимизирующих значение функционала ошибки. Таким образом, задача обучения сети представляет собой задачу оптимизации. Топологией нейронной сети называется схема соединения ее нейронов. Можно выделить три основных типа топологии сети: полносвязные сети; многослойные сети; слабосвязные сети [26]. В полносвязных сетях каждый нейрон передает свой выходной сигнал всем остальным нейронам и себе, все входные сигналы подаются на вход всем нейронам, выходными сигналами могут быть все или некоторые выходные сигналы нейронов после нескольких циклов работы сети.
В многослойных сетях все нейроны разделены на непересекающиеся подмножества, называемые слоями. Нейроны одного слоя соединены с нейронами других слоев и не соединяются между собой. Один из слоев является входным, на него сети подаются извне входные данные, а с одного из слоев снимаются выходные значения. Количество нейронов в одном слое может быть любым и заранее никак не связано с количеством нейронов в других слоях. В общем случае сеть имеет т слоев, слои нумеруются слева направо, входной слой, как правило, имеет номер 0 или 1. Если сеть имеет обратные связи, т.е. выходные значения некоторых нейронов подаются на вход нейронам слоя с меньшим номером, она называется нейронной сетью встречного распространения. Если нейроны связаны только с нейронами слоя с большим номером, то такая сеть называется нейронной сетью прямого распространения. В слабосвязных сетях между собой связаны преимущественно близлежащие нейроны. 2.2.2. Многослойные перцептроны. Многослойный перцептрон (МСП) является одним из видов многослойных искусственных нейронных сетей прямого распространения. Пример топологии многослойного перцептрона с одним входным слоем (« искусственных нейронов), р скрытыми (и, узлов в /-м слое) и с одним выходным (m узлов) слоем представлен на рис. 5. Топология многослойного перцептрона обозначается последовательностью чисел вида п-п\-пг--.--пр-т. Здесь he вектор размерности п, х 1 параметров активации; Wr матрица размерности пі х /7,-./ весовых коэффициентов; S(hi)- вектор размерности и, х 1 уровня активации; Ф, - вектор размерности и, х 1 входных смещений.
Функция активации представляет собой нелинейную компоненту нейронной сети и необходима для улучшения ее способности аппроксимировать поверхности. Наиболее часто используется сигмоидальная функция активации (9) [131]. ад=—1— (9) 1 + е Эта функция непрерывна, ограничена, дифференцируема, и выражение для ее производной (10) является рекуррентным выражением исходной функции, что используется в ряде методов обучения нейронной сети. Sr(x)=S(x)[l-S(x)]. (10) При конструировании нейросети для решения конкретной прикладной задачи возникает проблема выбора функции активации для скрытых и выходных нейронов. Выбор функции активации для выходных нейронов основывается на анализе априорных данных характера распределения выходных значений. Для бинарных величин (0/1) наилучшим образом подходит сигмоидальная функция (9) [106]; Для задач классификации вида 1-из-С лучше всего подходит функция активации softmax (11) [131]; Для решения задач классификации число выходов нейронной сети соответствует числу категорий, каждый выход соответствует определенной категории. При отнесении входного сигнала к какой-либо категории, выходной сигнал сети, соответствующий ей, принимает максимальное значение. Для оценки апостериорных вероятностей требуется, чтобы все выходные значения лежали в пределах от 0 до 1, и их сумма была равна 1. Функция softmax предназначена для реализации этого ограничения. Здесь .Y, (/=1, ..., С) - входной сигнал нейрона выходного слоя, С - количество категорий. Если известно, что аппроксимируемая функция непрерывна и ограничена, можно использовать сигмоиду (9) или гиперболический тангенс при условии линейных преобразований либо выходных значений сети, либо известных значений аппроксимируемой функции; Если известно, что аппроксимируемая функция имеет положительные значения, но может быть не ограниченной сверху, можно использовать экспоненциальную функцию активации. Однако, при реализации вычислительных операций существует опасность переполнения; Если известно, что аппроксимируемая функция непрерывна, но не известен интервал ее возможных значений, можно использовать функцию активации вида S{h)=h. Проанализируем влияние начальных условий обучения на способности многослойного перцептрона к аппроксимации функций [131]. Рассмотрим многослойный перцептрон и какой-либо скрытый или выходной его нейрон. Значения, подаваемые на N входов нейрона, будем считать координатами точки в N-мерном пространстве. Тогда веса входов можно считать коэффициентами уравнения гиперплоскости в этом пространстве. Например, в случае двух входов х\ и хг весовые коэффициенты vvi и wi и смещение р определяют уравнение прямой (12) в двумерном пространстве x\w\ + X2W2 + (р= О (12) ГО, h О Если функция активации нейрона имеет вид S(h) = , тогда эта [\, h 0 гиперплоскость разделяет пространство на две области, в одной из которых выходной сигнал нейрона имеет значение 1, в другой 0. В случае сигмоидальной функции (9) выходные сигналы нейрона будут асимптотически приближаться к 0 или 1 при удалении от этой гиперплоскости. Все нейроны одного слоя определяют гиперплоскости в одном и том же N-мерном пространстве, и если смещение (р равно 0, они все будут проходить через начало координат. Процесс обучения нейронной сети начинается, как правило, со случайного задания весов, и такое начальное расположение гиперплоскостей ограничивает возможности нахождения глобального экстремума функционала ошибки. Это в свою очередь ограничивает способности многослойного перцептрона к аппроксимации [131]. В случае большого количества скрытых слоев в процессе обучения один или несколько скрытых нейронов могут попасть в состояние насыщения, характеризующееся большими абсолютными значениями весов, и, соответственно, большими абсолютными значениями аргумента функции активации. В этом случае при использовании сигмоидальной функции активации ее значение, то есть выходной сигнал соответствующего нейрона, практически не меняется от итерации к итерации, так как изменения весов малы. На рис. 6 представлен вид графика сигмоидальной функции активации. Из рисунка видно, что при изменении аргумента от 10 до 10.5 изменение значения функции значительно меньше, чем при изменении аргумента от 0.5 до 1.
Разработка алгоритмов оценивания начала, окончания и длительности периода таяния снежного и ледового покрова Арктики
В ходе работы был исследован новый алгоритм оценки даты начала и окончания таяния [57], основывающийся на методе, предложенном в [78]. С использованием этого алгоритма была построена база данных дат начала и окончания сезона таяния и длительности сезона таяния за 1979-2001 гг. Оценивание дат начала таяния и замерзания проводилось на основе анализа азности радиояркостных температур ЛТЬ каналов 18/19h и 37h как функции даты. Дата начала таяния оценивается по результатам анализа величины [(тах2 ЛТЬ - min2 ЛТЬ) - (maxl ЛТЬ - mini ЛТЬ)]. Значения maxl и mini определяются по данным 10 дней, предшествующих рассматриваемой дате, а значения тах2 и min2 -по данным рассматриваемой даты и 9 дней после нее. При наступлении момента таяния разность радиояркостных температур ЛТЬ меняет знак с положительного на отрицательный, или ее значение уменьшается почти до нуля. Это происходит потому, что канал 18/19h более чувствителен к процессам таяния, чем канал 37h [49, 119]. В соответствии с алгоритмом [57] для каждого дня проводятся следующие проверки: 1) если ЛТЬ -10К, то дата начала таяния; 2) если -10К ЛТЬ 4К и [(тах2 ЛТЬ - min2 ЛТЬ) - (maxl ЛТЬ - mini Л72 )] 7.5К, то дата начала таяния; 3) если ЛТЬ 4К, то зимние условия, и таяния нет.
Для избежания ошибочных оценок даты начала таяния рассматриваемый период был ограничен датами, имеющими подходящий для условий таяния температурный режим. Для этого использовалась база данных температуры воздуха IABP/POLES. Для каждого пикселя определялась первая дата после 1 апреля, для которой температура воздуха превышала -5С, и анализ разности радиояркостных температур проводился, начиная с этой даты. Моментом начала таяния считалась первая дата, отвечающая критериям таяния. Для оценки даты начала замерзания описанный алгоритм применялся в обратном хронологическом порядке от 31 декабря с другими пороговыми значениями для температуры воздуха (-2С) и разности ЛТЬ: 1) если ЛТЬ -ЗК, то дата начала замерзания; 2) если -ЗК. ЛТЬ 5К и [(тах2 ЛТЬ - min2 ЛТЬ) - (maxl ЛТЬ - mini ЛТЬ)] 7.5К, то дата начала замерзания; 3) если ЛТЬ 5К, то зимние условия, и таяния нет. Изменения температуры воздуха, ЛТЬ и величины [(тах2 ЛТЬ - тіп2 ЛТЬ) -(maxl ЛТЬ - mini ЛТЬ)) для произвольно выбранного пикселя в Баренцевом море (79.70N, 37.87Е) в 1989 г. проиллюстрированы на рис. 10. В данном случае дата начала таяния, определенная на основе анализа радиояркостных температур, 12 апреля, но в соответствии с алгоритмом она пропускается, так как температура воздуха ниже -5С. Следующая дата с сигнатурой начала таяния (4 мая) отвечает критерию температуры воздуха и считается датой начала таяния. Из всех дат, отвечающих критериям, выбирается самая ранняя. При рассмотрении последовательности ЛТЬ в обратном хронологическом порядке выделяется несколько потенциальных дат начала замерзания, но при использовании порога температуры воздуха-2С, отбрасываются все даты после 26 сентября.
Пороговое значение температуры воздуха -5С было выбрано на основании результатов сравнения данных пикселей с аномально ранними оценками даты начала таяния по алгоритму [78] с изменениями температуры воздуха по данным IABP/POLES. Это пороговое значение является достаточно высоким, чтобы отбросить большинство ошибочных оценок даты начала таяния на основании анализа ЛТЬ и достаточно низким для точного определения даты начала таяния. Пороговые значения радиояркостной температуры и температуры воздуха для определения даты начала замерзания были выбраны на основе анализа синхронных данных радара спутников серии Океан-01, IABP/POLES и SSM/1 за 1995-1998 г. Изменения удельной эффективной площади рассеяния по данным Океан-01, связанные с процессами замерзания [53], использовались для исследования характера изменений радиояркостной температуры и температуры воздуха в условиях замерзания. Пороговые значения были выбраны так, чтобы достичь максимальной согласованности между сигнатурами замерзания по данным Океан и датами начала замерзания, представленными в [135]. 2.7. Разработка консистентных баз данных для изучения сезонной и многолетней динамики ледового покрова и процессов таяния.
Для изучения динамики геофизических параметров ледового покрова Арктики и Антарктики используются различные спутниковые измерительные системы и создаются базы спутниковых данных. В такие базы данных включаются исходные спутниковые изображения, результаты их первичной обработки и оценки геофизических параметров: типы и концентрации льда, физическая температура поверхности, карты дат начала таяния и т.п. Для получения корректного результата исследований данные в базе должны быть приведены к какому-либо единому стандарту, иначе неоднородности могут существенно повлиять, например, на величину трендов. Такие базы данных в диссертации определяются как консистентные. Основной причиной возникновения неоднородностей в данных с различных спутниковых систем являются различия в орбитальных параметрах спутников и параметрах сенсоров. Рассмотрим набор изображений среднесуточной радиояркостной температуры поверхности по измерениям микроволновых радиометров SMMR и SSM/I со спутников серий Nimbus-7 и DMSP (F8, F11, F13).
Например, значительно отличаются друг от друга радиояр костные температуры SMMR и SSM/I F8 на частотах 18.0 и 19.35 ГГц. Основная причина -близость частоты 19.35 ГГц к частоте излучения водяного пара, содержащегося в атмосфере (22 ГГц). Углы наблюдения также различаются (у SSM/I он 53, а у SMMR 50), хотя и близки к углу Брюстера для морской воды [69, 103]. Самое существенное влияние эта разница оказывает на каналы 18/19v, где оба фактора увеличивают радиояркостную температуру SSM/I F8 по отношению к SMMR. Больший угол наблюдения SSM/I F8 приводит к небольшому уменьшению разницы радиояркостных температур каналов 18/19h по сравнению с 18/19v [69]. Объединенный набор среднесуточных данных радиояркостной температуры подстилающей поверхности по измерениям микроволновых радиометров SMMR, SSM/I был создан при помощи различных процедур, включающих удаление сбойных данных, коррекцию дрейфа параметров сенсоров, интеркалибровку данных различных сенсоров, основанную на периодах пересечения, уменьшение влияния суши, заполнение пустот модельными значениями [69, 120]. Коррекция дрейфа параметров сенсора проводится в NSIDC, обрабатываются антенные температуры, принимаемые непосредственно с сенсоров. Отбрасывались пиксели, для которых отсутствовали данные хотя бы одного канала. Такой недостаток присущ в основном отдельным данным SMMR. Полоса захвата каналов с частотой 18 ГГц на этих изображениях на 1-2 пикселя шире полосы захвата каналов с частотой 37 ГГц. Данные 05 и 07 декабря 1986г., были сбойные, и тоже были удалены из набора данных (SMMR). Интеркалибровка данных разных сенсоров выполнялась с использованием регрессионного метода.
Исследование сезонной и многолетней динамики сезона таяния и его связи с арктическими осцилляциями
Исследования динамики сезона таяния проводились в регионе, представленном на на рис. 6. Границы морей определены в [25]. Исследование многолетней динамики сезона таяния и его связи с арктическими осцилляциями проводилось в регионе, изображенном на рис. 2. Анализ алгоритма определения даты начала таяния, даты начала замерзания и длительности сезона таяния представлен в главе 2. В таблице 6 представлены средние значения и среднеквадратические отклонения дат начала и окончания сезона таяния и длительности периода таяния в различных регионах. На рис. 7 показано распределение начала, окончания и длительности сезона таяния в Арктике в фазы низких (1979-1988) и высоких (1989-2001) значений индекса АО. В диссертации выявлена сильная корреляция между индексом АО и средними датами начала и окончания таяния и длительностью сезона таяния (табл. 7). Следующие за зимами высоких значений индекса АО весеннее таяние было более ранним, а осеннее замерзание более поздним, что приводило к более длинным сезонам таяния. Корреляция с АО была наибольшей для региона однолетнего льда в Северном ледовитом океане, особенно в Восточно-Сибирском море. Даты начала замерзания также коррелировали с индексом АО за летний период (июль -сентябрь) в Восточно-Сибирском и Лаптевых морях, где погодные условия, соответствующие высоким значениям индекса АО, были связаны с задержкой начала периода замерзания. Корреляция между АО и процессами таяния в регионе многолетнего льда не являлись статистически значимыми (табл. 7).
поверхности и усилению летнего таяния через механизм положительной обратной связи [125, 149]. Длительность периода таяния в регионах многолетнего и однолетнего льда была менее вариабельной в период низких значений индекса АО (1979-1988), когда преобладание антициклонических условий способствует более холодным и более однородным климатическим условиям в Арктике. После того, как стабильное атмосферное давление сменилось циклонической активностью в 1989, длительность периода таяния увеличилась для обоих типов льда, но существенная корреляция с зимним индексом АО наблюдалась только для однолетнего льда (табл. 7). Несмотря на общую схожесть характера динамики средней длительности периода таяния и зимнего индекса АО, корреляция между этими величинами низкая из-за большого расхождения в 1998. Аномально длинный сезон таяния в 1998 в регионе многолетнего льда не сопровождался высокими значениями индексов АО. 3.4. Сравнительный анализ оценок концентраций многолетнего морского льда, полученных с помощью алгоритма NASA TEAM и нейронных сетей, обученных на данных SSM/I-Океан и SSM/I-ERS. В таблице 8 представлены результаты сравнительного анализа карт концентраций многолетнего льда, сгенерированных из среднесуточных радиояркостных температур SSM/1 при помощи алгоритма NASA Team и искусственных нейронных сетей с обучающими данными Океан и ERS. В данной главе представлен анализ сезонной и региональной динамики многолетнего морского льда и динамики сезонов таяния в Арктике. Оценки концентрации многолетнего морского льда были получены различными способами: при помощи алгоритмов, использующих линейные соотношения и при помощи нелинейных аппроксиматоров на основе искусственных нейронных сетей.
В зимний период, когда излучательные характеристики льда отличаются наибольшей стабильностью, с использованием пассивных микроволновых данных можно оценить только часть многолетнего морского льда. Для интерпретации данных может оказаться необходимым знание (1) доли однолетнего льда, составляющего летний минимум площади ледового покрова, (2) части арктического ледового покрова, выносимого из Арктики, (3) доли многолетнего ледового покрова, исчезающего из-за процессов таяния и торошения и (4) пространственной вариабельности излучательных характеристик многолетнего и однолетнего льда. Выявлена корреляция между динамикой ледового покрова и процессов таяния и индексом несезонных циклических колебаний атмосферного давления в северном полушарии (арктических осцилляции). Проведен сравнительный анализ оценок концентрации многолетнего морского льда по пассивным микроволновым данным, выполненных различными способами: с использованием ИНС, алгоритма NASA Team и по минимуму площади ледового покрова летом предшествующего года. Результаты анализа показывают высокую корреляцию между различными оценками площади многолетнего льда. Существенная разница между среднеянварскими оценками площади многолетнего морского льда и минимумом площади ледового покрова предшествующим летом может быть объяснена тем, что часть многолетнего морского льда имеет излучательные характеристики, свойственные однолетнему морскому льду. Это может быть вызвано наличием снега и морской воды на поверхности льда.