Электронная библиотека диссертаций и авторефератов России
dslib.net
Библиотека диссертаций
Навигация
Каталог диссертаций России
Англоязычные диссертации
Диссертации бесплатно
Предстоящие защиты
Рецензии на автореферат
Отчисления авторам
Мой кабинет
Заказы: забрать, оплатить
Мой личный счет
Мой профиль
Мой авторский профиль
Подписки на рассылки



расширенный поиск

Диагноз океанологических условий методами многомерного статистического анализа Андрианов Геннадий Николаевич

Диагноз океанологических условий методами многомерного статистического анализа
<
Диагноз океанологических условий методами многомерного статистического анализа Диагноз океанологических условий методами многомерного статистического анализа Диагноз океанологических условий методами многомерного статистического анализа Диагноз океанологических условий методами многомерного статистического анализа Диагноз океанологических условий методами многомерного статистического анализа Диагноз океанологических условий методами многомерного статистического анализа Диагноз океанологических условий методами многомерного статистического анализа Диагноз океанологических условий методами многомерного статистического анализа Диагноз океанологических условий методами многомерного статистического анализа
>

Диссертация - 480 руб., доставка 10 минут, круглосуточно, без выходных и праздников

Автореферат - бесплатно, доставка 10 минут, круглосуточно, без выходных и праздников

Андрианов Геннадий Николаевич. Диагноз океанологических условий методами многомерного статистического анализа : 25.00.28 Андрианов, Геннадий Николаевич Диагноз океанологических условий методами многомерного статистического анализа (На примере Центрально-Восточной, Юго-Восточной Атлантики и Юго-Восточной части Тихого океана) : Дис. ... канд. геогр. наук : 25.00.28 Калининград, 2005 145 с. РГБ ОД, 61:05-11/168

Содержание к диссертации

Введение

Глава 1. Физико-географическое описание исследуемых районов 9

1.1 Центрально-Восточная Атлантика 9

1.2 Юго-Восточная Атлантика 17

1.3 Юго-Восточная часть Тихого океана 24

Глава 2. Методы многомерного статистического анализа, применяемые в работе 29

2.1 Определение и сущность задач классификации 29

2.2 Расстояния между отдельными объектами и меры близости объектов друг к другу .30

2.3 Классификация методов кластерного анализа 32

2.4 Оценка качества полученной классификации 33

2.5 Алгоритмы автоматической классификации, используемые в данной работе 34

2.6 Метод главных компонент 38

2.7 Экстремальные свойства главных компонент 40

2.8 Применение методов кластерного анализа и главных компонент в гидрометеорологических исследованиях 41

Глава 3. Используемые данные и их свойства 44

3.1 Источники и типы данных 44

3.2 Статистические свойства используемых данных 46

3.3 Первичные статистики исходных данных 52

3.4 Аномалии исходных данных и их статистические свойства 54

Глава 4. Результаты разложений полей атмосферного давления, температуры поверхности океана, соответствующих аномалий и аномалий уровня океана на главные компоненты ..60

4.1 Центрально-Восточная Атлантика. Атмосферное давление 60

4.2 Центрально-Восточная Атлантика. Температура поверхности океана 65

4.3 Юго-Восточная Атлантика. Атмосферное давление 70

4.4 Юго-Восточная Атлантика. Температура поверхности океана 74

4.5 Юго-Восточная часть Тихого океана. Атмосферное давление 78

4.6 Юго-Восточная часть Тихого океана. Температура поверхности океана 83

4.7 Разложение аномалий уровня океана на главные компоненты 87

4.8 Анализ устойчивости разложений исходных данных на главные компоненты 94

4.9 Основные результаты разложения гидрометеорологических полей на главные компоненты 98

Глава 5. Результаты кластеризации исследуемых акваторий по изменчивости аномалий уровня океана 104

5.1 Центрально-Восточная Атлантика 104

5.2 Юго-Восточная Атлантика 110

5.3 Юго-Восточная часть Тихого океана 115

5.4 Основные результаты классификации районов исследований по изменчивости аномалий уровня океана 119

Заключение 122

Библиографический список использованной литературы 125

Приложение 135

Введение к работе

Одними из наиболее продуктивных районов Мирового океана являются районы проявления прибрежного апвеллинга, которые обеспечивают более 50% мировой добычи рыбы. Важнейшими для российского промысла являются три района прибрежного океанического апвеллинга: Канарский (Центрально-Восточная Атлантика), Бенгельский (Юго-Восточная Атлантика) и Перуано-Чилийский (Юго-Восточная часть Тихого океана). Промыслово-океанологические исследования последних десятилетий показали, что численность и биомасса массовых пелагических рыб в районах апвеллинга не зависят от величины нерестового запаса и определяются уровнем пополнения, которых формируется под влиянием условий среды обитания во время нереста, а также структуры и динамики вод в период, соответствующий ранним стадиям развития организмов (Промыслово-океанологические исследования ..., 2002).

В последнее время созданы международные базы данных о состоянии поверхности Земли и, в частности, поверхности океана. Появление спутниковых систем мониторинга океана позволяет существенно улучшить качество информационного обеспечения океанологических исследований. В первую очередь это улучшение базируется на оперативности получения данных, которые охватывают весь регион исследования практически в режиме «реального времени». Кроме оперативных данных о состоянии поверхности океана доступными являются и данные, полученные по различным численным моделям циркуляции системы океан-атмосфера на базе спутниковых и контактных измерений, например NCEP/NCAR Reanalysis (Kalnay et al., 1996). Временное разрешение как оперативных, так и модельных данных колеблется в достаточно широких пределах от нескольких часов до нескольких месяцев. Вся вышеупомянутая информация может быть использована при решении различных задач по изучению океана: от исследования мезомасштабных процессов до изучения глобальной динамики.

Спутниковые и модельные данные можно представить как набор пространственных полей распределений гидрометеорологических характеристик в исследуемом районе. Чем выше пространственное и временное разрешение данных, тем больше элементов в каждом поле и тем больше полей присутствует в каждом наборе. Одним из эффективных способов анализа данной информации является применение методов многомерного статистического анализа (МСА) к исходным данным. Методы МСА позволяют существенно сжимать исходную информацию и выявлять в ней скрытые (латентные) закономерности. Эти свойства методов МСА позволяют провести комплексный диагноз гидрометеорологических процессов на исследуемых акваториях. Исходя из этих предпосылок, данная работа является весьма актуальной.

5 Цель представляемой работы - с помощью методов многомерного статистического анализа описать пространственно-временную изменчивость гидрометеорологических и океанологических процессов в Центрально-Восточной Атлантике (ЦВА), Юго-Восточной Атлантике (ЮВА) и Юго-Восточной части Тихого океана (ЮВТО). Поставленная цель определила следующие задачи исследований:

  1. Исследовать сезонную и межгодовую изменчивость гидрометеорологических условий в районах ЦВА, ЮВА и ЮВТО. Определить факторы, которые являются основными в изменчивости условий окружающей среды в районах исследования.

  2. Описать сезонные и межгодовые изменения динамики вод по данным спутниковой альтиметрии.

  3. Провести районирование акваторий ЦВА, ЮВА и ЮВТО по характеру сезонной и межгодовой изменчивости аномалий уровня океана.

  4. Оценить зависимость результатов районирования от выбранного метода классификации.

В работе были использованы данные двух массивов гидрометеорологической информации, включающие в себя поля давления и температуры поверхности океана из массива NCEP/NCAR Reanalysis и спутниковые наблюдения за уровнем океана (программа Topex/Poseidon).

Анализ полей метеорологических и океанологических характеристик проводился с помощью методов главных компонент (разложения на естественные ортогональные составляющие) и кластерного анализа. Для выделения преобладающих периодичностей применялся спектральный анализ. Научная новизна работы состоит в следующем:

  1. Впервые для диагноза океанологических условий применены итеративные методы кластерного анализа Форель и взаимных поглощений (Айвазян и др., 1989). Данные методы на выходе сами получают конечное число классов, основываясь на внутренних закономерностях исходных данных. Для их использования был создан специализированный пакет прикладных программ.

  2. Получена физическая интерпретация нескольких первых главных компонент разложений полей давления, температуры поверхности океана, соответствующих аномалий и аномалий уровня океана. Эта интерпретация основывается на анализе пространственного распределения нагрузок самих компонент.

  1. Исследована зависимость физической интерпретации нескольких первых главных компонент разложений полей аномалий давления и аномалий температуры поверхности океана от периода разложения.

  2. Для выбора окончательного числа классов применены критерии качества классификации, которые помогают выбрать наиболее оптимальное разбиение на кластеры.

Практическая ценность работы состоит в создании методики диагноза поверхностных океанологических условий с использованием методов многомерного статистического анализа. Данная методика позволяет проводить широкомасштабные исследования изменчивости условий среды с использованием различных видов данных с различным пространственно-временным разрешением. При этом анализ не требует больших вычислительных затрат.

Результаты проведенного исследования уровня океана по данным спутниковой альтиметрии могут быть использованы как методическая основа для мониторинга динамических процессов, происходящих в исследуемых районах.

Для проведения классификаций многомерных данных с помощью методов Форель и взаимных поглощений с использованием различных видов расстояния между объектами классификации был разработан пакет прикладных программ (ППП), в возможности которого входит и расчет нескольких критериев качества для выбора оптимального количества классов, оставляемых для дальнейшего анализа.

В теоретическом плане результаты работы могут быть использованы при разработке математических моделей взаимодействия океана и атмосферы.

Отдельные части работы, а также диссертация в целом докладывались и обсуждались на коллоквиумах лаборатории промысловой океанологии и отчетных сессиях АтлантНИРО, а также на Всероссийской конференции молодых ученых и специалистов, посвященной 140-летию со дня рождения Н.М. Книповича (Мурманск, 2002 г.); XII-й международной конференции «Потоки и структуры в жидкостях » (Санкт-Петербург, 2003 г.); VIII -й международной научно-технической конференции «Современные методы и средства океанологических исследований» (Москва, 2003 г.); IV -й Всероссийской научной конференции «Физические проблемы экологии (Экологическая физика)» (Москва, 2004 г).

По теме диссертации опубликовано 8 научных работ.

Диссертация состоит из введения, 5-ти глав, заключения, библиографического списка используемой литературы и приложения.

В первой главе на основе литературных данных представлена гидрометеорологическая характеристика районов Центрально-Восточной Атлантики, Юго-Восточной Атлантики и Юго-Восточной части Тихого океана. Рассмотрены климатические пояса, в которых находятся районы исследования, преобладающая атмосферная циркуляция, основные поверхностные течения и районы проявления прибрежного апвеллинга.

Вторая глава посвящена краткому теоретическому описанию методов кластерного анализа и главных компонент. В ней также по литературным данным приведены основные способы анализа гидрометеорологической информации с использованием этих методов МСА.

В третьей главе приводится статистическое описание используемых для анализа данных. Исследуемые районы были заключены в следующих пространственных границах: ЦВА - 5-45 з.д., 0-45 с.ш.; ЮВА - 30 з.д.-20 в.д., 5-40 ю.ш., ЮВТО - 70-105 з.д., 5-50 ю.ш. В работе были использованы следующие данные: I) среднемесячные значения температуры поверхности океана (ТПО) с пространственным разрешением 1.875 по долготе и широте с 1971 по 2002 г., полученные из массива NCEP/NCAR; 2) среднемесячные поля приземного атмосферного давления на уровне моря с пространственным разрешением 2.5х2.5 за тот же самый временной период, полученные из того же самого массива; 3) среднемесячные аномалии уровня океана (АУО) в узлах одноградусной сетки с мая 1992 по декабрь 2002 г., полученные из массива NASA GSFC. Для каждого вида данных были проведены оценки таких первичных статистик как среднее значение, стандартное отклонение, медиана, мода, асимметрия, эксцесс. Для пространственных средних оценена значимость линейного тренда по /-критерию Стыодента.

В четвертой главе рассмотрены результаты разложения полей ТПО, давления, соответствующих аномалий и АУО на главные компоненты, а также рассмотрена устойчивость этих разложений аномалий давления и аномалий ТПО. Для всех разложений приведены пространственное распределение нагрузок и графики значений первых четырех компонент, а также проведена физическая интерпретация этих компонент, исходя из анализируемых данных. С помощью спектрального анализа выявлены преобладающие периодичности в значениях компонент. Для значений первых компонент была оценена значимость линейного тренда. С помощью «скользящих разложений» исследована зависимость результатов разложения полей аномалий давления и аномалий ТПО от временных пределов анализируемых данных.

Пятая глава посвящена рассмотрению результатов районирования акваторий исследования по изменчивости аномалий уровня океана.

В заключении сформулированы основные результаты и выводы работы.

В приложении приводятся карты распределения среднеклассовых нагрузок первых четырех главных компонент скользящих разложений полей аномалий давления и аномалий ТПО на акваториях исследования.

Текст работы изложен на 145 страницах, содержит 10 таблиц и 69 рисунков. В списке литературы 128 названий, из которых 70 на иностранных языках.

Автор выражает искреннюю признательность и благодарность за помощь и постоянное внимание к работе своим научным руководителям докт. физ.-мат. наук, профессору В.А. Гриценко, канд. геогр. наук, доценту П.П. Чернышкову; докт. геогр. наук, профессору В.Н. Яковлеву, канд. геогр. наук A.M. Сироте, заведующему лабораторией промысловой океанологии АтлаитНИРО И.А. Полищуку и сотрудникам этой лаборатории. Работа выполнена при поддержке гранта РФФИ №03-05-65136 и программы ИНТАС, проект 01/460.

Юго-Восточная часть Тихого океана

От экватора до 20 ю.ш. он находится в тропическом поясе. У берега Перу и северного Чили практически всегда дует пассат средней силы, штили и штормы крайне редки. Все природные процессы тесно взаимосвязаны: ветер и течение вызывают подъем холодных (14—18С) вод, охлаждение (от воды) приповерхностного слоя воздуха, образование слоистой облачности и тумана, ослабление солнечной радиации на поверхности и соответственно уменьшение прогрева воды, устойчивую стратификацию воздуха и практическое отсутствие осадков. На акватории западнее Перуано-Чилийского района преобладает юго-восточный пассат. Главные процессы в акватории — прогрев вод, передача энергии атмосферы (ветер) океану, интенсивное испарение и осолонение вод при малом количестве осадков, образование относительно большой биопродукции. Еще западнее увеличивается количество осадков, повышаются температура и соленость воды, уменьшается общая (фоновая) биопродуктивность.

От 20 до 35 ю.ш. прибрежный район находится в субтропическом поясе. В океанической части границы пояса находятся между 30 и 40 ю.ш., что связано с циркуляцией поверхностных вод и атмосферы. Основными процессами здесь являются: опускание воздушных масс, формирование высокого давления и морского тропического воздуха.

От 35 до 60 ю.ш. район находится в умеренном поясе. Здесь господствуют западные, северо и юго-западные ветра. Высока здесь повторяемость штормов, велика облачность, преобладает перенос поверхностных вод на восток. У берегов Чили преобладает умеренный климат с частыми дождями.

Атмосферная циркуляция. Главными факторами, влияющими на атмосферную циркуляцию в ЮВТО, являются стационарные центры действия атмосферы над самым океаном и прилегающей к нему Южной Америкой. Сезонная смена температуры воздуха над материком создает в западной части океана муссонную изменчивость давления и направлений ветра. Большая часть района находится под влиянием стационарного субтропического антициклона южного полушария. Он существует весь год, летом усиливается, и его центр сдвигается в субтропические широты с увеличением площади действия. Зимой среднемесячное давление в центральной части антициклона уменьшается на 3-5 мб. (рис. 1.11).

В умеренных и приполярных широтах южного полушария находится зона пониженного атмосферного давления где весь год сохраняется полоса низкого давления. Район квазистационарного центра циклонической циркуляции находится над морем Росса, где давление зимой падает до 980 мб, а летом не превышает 990— 995 мб. В экваториальном поясе наблюдается понижение атмосферного давления, которое держится весь год. Величины давления в этой полосе составляют 1006—1012 мб.

Стационарный субтропический антициклон сдвинут к востоку, к берегам и Южной Америки. Поэтому поле давления и связанная с ним циркуляция в центральной и восточной части океана более стабильны. В течение всего года сохраняются ветры, направленные от тропиков к экватору с западной составляющей. С востока на запад, приблизительно до 150 з. д., уклонение ветра от меридионального направления к западу возрастает. Пассатные ветры в Тихом океане наиболее стабильны как по скорости, так и по направлению. В середине пояса между субтропическим максимумом давления и экваториальной барической ложбиной повторяемость преобладающего направления ветра со скоростью 8—12 м/с более 90%. (Тихий океан, 1982) Скорости и устойчивость ветров меняются над океаном в широких пределах. Наибольшая повторяемость во все сезоны года отмечается в восточном тропическом районе обоих полушарий.

В умеренных широтах обоих полушарий устойчивость ветров по направлению значительно ниже. В 40—50 ю. ш. преобладают направления от южных и юго-западных до северных и северо-западных. Название «ревущие сороковые» эти широты получили в связи с тем, что здесь наибольшая во всем океане повторяемость штормовых ветров со скоростью более 16 м/с. Зимой в южном полушарии их вероятность достигает 20 %, а к западу от м. Горн — до 25 % с максимальными скоростями до 45 м/с (Тихий океан, 1982). Южное экваториальное течение является важнейшим из течений с западным направлением потока в ЮВТО. Это ветровое течение быстро реагирует на изменение ветрового режима и имеет четкую сезонную зависимость. Максимальной силы оно достигает зимой южного полушария (в Августе до 0.6 м/с) при максимальной силе пассатов (Tomczak, Godfrey, 2001).

Наиболее выраженным из течений с восточным направлением потока является Течение Кромвелла. Оно представляет собой поток длиной около 17000 км., толщиной 100-250 и шириной около 400 м. Течение идет вдоль экватора под водами Южного экваториального течения на глубинах более 50 м и несет воду со скоростью 0.5 м/с. Восточная часть течения наиболее устойчивая, скорость доходит до 1.5 м/с. Стрежень в восточном направлении поднимается со 150 до 50 м. Структура течения сложная, местами наблюдаются два максимума скорости - верхний и нижний (Бурков, 1980). В средней части океана оно разделяется на две струи, правую и левую со слабым противотечением между ними. Течение образует меандры, питают его в основном воды, нагоняемые пассатами в западную часть океана. У берегов Америки течение дает начало Перуано-Чилийскому подповерхностному течению на юг (Богданов, 1985). Принадлежит течение Кромвелла южной циркуляционной системе (Tomczak, Godfrey, 2001).

В открытой части океана субтропического пояса расположена зона субтропической конвергенции, где сходятся воды Южного пассатного и северной струи Антарктического Циркумполярного течения. Положение зоны конвергенции неустойчивое, оно зависит от сезона и изменяется от года к году.

Расстояния между отдельными объектами и меры близости объектов друг к другу

них задан соответствующим столбцом матрицы исходных данных X либо геометрическая структура их попарных расстояний (близостей) задана матрицей р. Аналогично можно говорить и о классификации совокупности признаков учитывая, что каждый из признаков задается соответствующей строкой матрицы X. В дальнейшем, если это не оговаривается отдельно, изложение этой проблемы не будет разделяться отдельно на объекты и признаки. В общей (нестрогой) постановке проблема классификации объектов заключается в том, чтобы всю анализируемую совокупность объектов Х={Х/} (і = 1,2, .... п) статистически представленную в виде матриц X или р, разбить на сравнительно небольшое число (заранее известное или нет) однородных, в определенном смысле, групп или классов (Айвазян и др., 1989). Полученные в результате разбиения классы часто называют кластерами (родственные понятия, используемые в литературе, - таксон, образ, сгущение). Название кластер-анализ для совокупности методов решения задач такого типа было впервые введено, по-видимому, Трайоном (Тгуоп, 1939). Однако, берясь за решение задачи классификации, исследователь с самого начала должен четко представлять, какую именно задачу из двух он решает. Первая задача состоит в разбиении статистически обследованного (р - мерного) диапазона изменений значений анализируемых признаков на интервалы группирования. В результате исследуемая совокупность объектов разбивается на некоторое число групп так, что объекты одной группы находятся на сравнительно небольшом расстоянии друг от друга. Вторая задача состоит в определении естественных расслоений исходных наблюдений на четко выраженные кластеры, лежащие друг от друга на некотором расстоянии. Если первая задача - задача построения областей группирования - всегда имеет решение, то вторая задача может его не иметь, то есть множество исходных наблюдений не обнаруживает естественного расслоения на классы (например, образует один общий кластер). 2.2 Расстояния между отдельными объектами и меры близости объектов друг к другу.

Одним из ключевых моментов в задачах классификации является определение однородности объектов. В общем случае понятие однородности объектов определяется заданием правила вычисления величины Ру, характеризующей либо расстояние d(Xj, Xj) между объектами, либо степень близости (сходства) r(Xit Xj) тех же объектов. Неотрицательная вещественная функция d(Xit Xj) называется функцией расстояния (метрикой), если: расстояния построить соответствующие меры сходства. Например, можно положить r(Xj, Xj)=l/(1+ d(Xj, Xj)) (Дюран и др., 1977). Легко проверить, что все свойства для меры сходства г выполняются. Выбор метрики или меры близости является ключевым моментом исследования, от которого решающим образом зависит окончательный вариант разбиения объектов на классы при заданном алгоритме разбиения. В каждой конкретной задаче этот выбор должен производится по-своему. Ниже приведены метрики и меры близости наиболее часто встречающиеся в задачах классификации. Метрика Махаланобиса (общий вид). Здесь - ковариационная матрица генеральной совокупности, из которой извлекаются объекты Xj, а Л - некоторая симметричная неотрицательно-определенная матрица весовых коэффициентов, которая чаще всего выбирается диагональной (Bolshev, 1969). Данная метрика будет естественной мерой отдаленности объектов, если известно, что они извлекаются из нормальных генеральных совокупностей с одной и той же матрицей ковариаций (Айвазян и др., Здесь р — размерность пространства объектов. Данное расстояние наиболее часто используется при классификациях, так как это кратчайшее расстояние между двумя точками в Евклидовом пространстве. Вариантом этой метрики является взвешенное Евклидово расстояние: где шк - некоторый неотрицательный вес. Удобно полагать при этом О тк 1. Недостатком обычного Евклидова расстояния является возможная неравноправность осей пространства в котором расположены анализируемые объекты (Елисеева и др., 1977). Этот недостаток в ряде случаев можно устранить подбором весов хпк, что не всегда является легко разрешимой задачей. В случае невозможности подборки весовых коэффициентов, проблема неравноправности осей может быть решена путем нормализации исходных данных. где R(XnXj) - коэффициент корреляции между векторами Xt и Xj. Коэффициент корреляции используется очень часто в статистике, однако использовать его в качестве меры расстояния между объектами следует с осторожностью. Необходимо всегда помнить, что расстояние Пирсона вычисляет близость объектов как степень их линейной связи. В некоторых случаях использование данного расстояния полностью оправдано, например, при классификации точек сетки по временной изменчивости температуры поверхности океана. Во многих задачах классификации используются некоторые специально устроенные функции от двух векторных переменных Xt и Yj, а чаще всего просто от расстояния d(Xj, XJ между этими переменными. Эти функции называются потенциальными. В качестве потенциальных функций можно привести следующие (Яковлев и др., 1985): К настоящему времени известно уже несколько сотен алгоритмов классификации, среди которых встречаются и достаточно «экзотические». В таких условиях провести сколь либо четкую классификацию алгоритмов весьма затруднительно. Однако, все методы кластерного анализа можно разделить на три большие группы (Айвазян и др., 1989): вероятностные, эвристические, иерархические.

Для решения гидрометеорологических задач наиболее приемлемыми считаются алгоритмы двух последних групп (Малинин и др., 2002). Эвристические алгоритмы непосредственно опираются на постановку задачи выделения в многомерном пространстве компактных групп точек. В прикладных задачах кластерного анализа они стали применяться одними из первых и до сих пор сохраняют большое значение в разведочном анализе данных благодаря наглядности интерпретации полученных результатов. Эвристические алгоритмы в свою очередь делятся на параллельные процедуры и последовательные. В параллельных процедурах вся выборка сразу поступает на классификацию, а в последовательных элементы выборки поступают на классификацию по одному или малыми порциями. Иерархические алгоритмы делятся на агломеративные (объединяющие) и дивизимные (разделяющие). Агломеративные алгоритмы на первом шаге рассматривают каждый объект выборки как отдельный кластер. На втором шаге на сновании матрицы взаимных расстояний или мер сходства объединяются ближайшие друг к другу объекты. И далее классификация идет последовательно, пока все объекты не объединятся в один класс. Если матрица расстояний имеет размерность тхт, то полностью процесс кластеризации завершается за т-1 шагов. Дивизимные алгоритмы на первом шаге все объекты выборки рассматриваются как один кластер, а далее на каждом шаге происходит отделение объектов от начального кластера. Результаты классификации иерархическими алгоритмами зачастую наглядно представляются с помощью дендрограммы (Дюран и др., 1977, Айвазян и др., 1989). С помощью дендрограммы можно оценить оптимальное количество классов для дальнейшего анализа, однако, для оценки числа оставляемых классов весьма полезно применять и критерии качества классификации. Приведенная классификация не является полностью исчерпывающей и затрагивает только те группы, алгоритмы из которых будут применяться в данной работе.

Аномалии исходных данных и их статистические свойства

При построении графиков исходных данных сразу бросается в глаза доминирование годового хода во всех видах данных. Поэтому было принято решение работать не с исходными данными, а с их аномалиями, где внутригодовой ход отсутствует. Для расчета аномалий сначала вычислялись многолетние среднемесячные нормы по исходным данным. После этого эти нормы были вычтены из исходных данных и были получены среднемесячные аномалии. При этом ни временные, ни пространственные пределы аномалий не изменились по сравнению с исходными данными. После расчета аномалий для их пространственных средних были вычислены те же описательные статистики, что и в предыдущем параграфе. Расчет статистик проводился только для пространственных средних, так как при вышеописанном способе расчета аномалий средняя аномалия по времени равна нулю. Отметим, что в АУО также присутствует годовой ход, что выражается на графиках спектральной плотности АУО. Поэтому для исключения годового хода было принято решение рассчитать аномалии для АУО, как это было сделано для данных по атмосферному давлению и ТПО. В дальнейшем данные аномалии уровня океана с исключенным годовым ходом будем называть аномалиями АУО. В таблицах 3.4-3.6 приведены описательные статистики для аномалий исследуемых характеристик, осредненных по пространству.

Обозначения аналогичны обозначениям для таблиц 3.1 — 3.3 (SSHAA - аномалии АУО). В данном случае распределения всех исходных данных получились мультимодальными, как и в случае с абсолютными значениями анализируемых параметров. Различие между средним значением и медианой также не превосходит единицы шкалы измерения по абсолютной величине. Вычисление статистики Шапиро-Уилка показало, что в пяти случаях ЗРИД достаточно хорошо совпадает с нормальным законом распределения: для аномалий ТПО в ЦВА (W = 0.99248, р = 0.05045), аномалий АУО в ЦВА (W = 0.99292, /7 = 0.77056), аномалий давления в ЮВА (W = 0.99789, р = 0.91644), аномалий АУО в ЮВА (W = 0.99120,/? = 0.59901) и для аномалий давления в ЮВТО (W = 0.99468,/? = 0.20686). На рис. 3.7 — 3.9 приведено изменение во времени пространственных средних исследуемых характеристик во всех трех районах. Из графиков видно, что в некоторых данных присутствует достаточно сильный линейный тренд. Поэтому нами была проведена оценка значимости линейной зависимости по /-критерию Стьюдента и для данных со значимым линейным трендом были построены модели линейной регрессии. В таблице 3.7 приведены оценки коэффициентов построенной линейной модели у=а+Ьх, где х-время, R2 построенной модели, значение /-критерия Стьюдента с количеством степеней свободы для проверки гипотезы о равенстве нулю коэффициента регрессии Ь, и уровень значимости критерия Стьюдента (p-level). Спектральный анализ пространственных средних показал, что во всех исходных значениях исследуемых данных присутствует годовой ход, который совершенно четко выражается на графиках спектральной плотности. Кроме годовой периодичности в некоторых данных присутствует и полугодовая, менее выраженная, цикличность, однако, для давления в ЦВА полугодовая изменчивость доминирует над годовой. Это связано с характером внутригодовой изменчивости положения и интенсивности Азорского антициклона.

В аномалиях исходных данных, осредненных по пространству, спектральный анализ показал отсутствие годовой и полугодовой периодичности. Кроме этого, на графиках спектральной плотности видно отсутствие каких-либо других ярко выраженных периодических составляющих в аномалиях исходных данных.

Юго-Восточная часть Тихого океана. Температура поверхности океана

Важным вопросом при разложении данных на главные компоненты является их устойчивость. В данном случае под устойчивостью понимается сохранение пространственного распределения нагрузок ГК, от которого зависит их физическая интерпретация. Учитывая, что в исходных данных преобладает годовая изменчивость, которая сохраняется в значениях первых ГК разложений, можно предположить, что от изменения временного интервала исследуемых данных пространственное распределение нагрузок ГК не будет претерпевать значительные изменения. Поэтому для оценки устойчивости, на наш взгляд, эффективнее работать с аномалиями исходных данных.

Чтобы оценить устойчивость разложений, для аномалий исходных данных были проведены «скользящие разложения». Исходя из того, что в значениях аномалий для разных районов преобладают различные периодичности, было принято в качестве периода скользящего разложения взять один общий и достаточно длинный временной интервал. В качестве такого периода был взят интервал в 132 месяца (общеизвестный 11 летний цикл солнечной активности). Скользящее разложение проводилось итеративным способом. На первой итерации проводилось разложение соответствующих аномалий за 11 лет (с января 1971 по декабрь 1981) на ГК. На каждой последующей итерации начало и конец временного интервала сдвигались относительно предыдущей на один месяц вперед. Таким образом, для каждого типа аномалий было проведено по 253 разложения. Для каждого из них сохранялись нагрузки и значения нескольких первых ГК, а также их собственные числа, процент описываемой ими дисперсии и суммарная дисперсия, описываемая этими компонентами. При этом учитывался тот факт, что компонента вносит свой вклад в значение исследуемой величины только будучи умноженной на свою нагрузку (формула 2.13). Поэтому для каждой компоненты в качестве эталонных нагрузок выбирались ее нагрузки на первой итерации. На каждой последующей итерации нагрузки вновь полученной компоненты сравнивались с эталонными, и если различие в знаках было больше 50%, то нагрузки и значения вновь полученной компоненты умножались на -1.

После проведения всех итеративных разложений нагрузки каждой из первых четырех компонент подвергались классификации. В качестве метода классификации был выбран метод Уорда с Евклидовым расстоянием в качестве меры близости между объектами. Количество получаемых классов оценивалось с помощью дендрограммы. На рис. 4.31 приведена дендрограмма для классификации нагрузок первой ГК разложения аномалий давления в ЮВА. Для этой классификации было принято решение оставить два класса. На рис. 4.32 приведена преемственность классов при скользящих разложениях аномалий давления и аномалий ТПО в трех районах исследования. Количество классов для каждой компоненты получилось разное, но общие черты в преемственности классов существуют. Во-первых, хочется отметить отсутствие периодичностей в изменении номеров классов. Во-вторых, смена номеров классов очень часто происходит в годы возникновения и развития Эль-Ниньо в Тихом океане, причем эта смена происходит во всех трех районах исследования. Однозначной связи в смене номеров классов, однако, не наблюдается, что согласуется с утверждением о непохожести одного ЭН на другое (Бышев, 2003).

Анализ распределения среднеклассовых нагрузок первых четырех компонент разложения полей аномалий давления и аномалий ТПО показал, что характер распределения нагрузок для аномалий давления не изменяется с течением времени. Также мало изменяются и величины самих нагрузок. Для разложений аномалий ТПО получается иная картина. Характер распределения нагрузок компонент может изменяться достаточно сильно, как и величины самих нагрузок. Это означает, что для компонент разложения полей аномалий ТПО их физический смысл изменяется с течением времени. В приложении приведены пространственные распределения среднеклассовых нагрузок первых четырех компонент скользящих разложений полей аномалий давления и аномалий ТПО в районах исследования.

Подобное исследование устойчивости уже проводилось в (Мещерская и др., 1970) для полей геопотенциала на шести стандартных изобарических поверхностях. Было показано, что ГК обладают устойчивостью во времени. В данной работе рассматривался очень малый временной интервал (всего несколько суток) и исследовались абсолютные значения, а не аномалии. В (Hsuing, Newell, 1983) сравнивались разложения аномалий ТПО с 1949 по 1964 и с 1965 по 1979 годы, и было показано, что распределения нагрузок не сильно отличались друг от друга в эти временные периоды.

Похожие диссертации на Диагноз океанологических условий методами многомерного статистического анализа