Электронная библиотека диссертаций и авторефератов России
dslib.net
Библиотека диссертаций
Навигация
Каталог диссертаций России
Англоязычные диссертации
Диссертации бесплатно
Предстоящие защиты
Рецензии на автореферат
Отчисления авторам
Мой кабинет
Заказы: забрать, оплатить
Мой личный счет
Мой профиль
Мой авторский профиль
Подписки на рассылки



расширенный поиск

Исследование солнечно-земных связей с помощью оптимизационных алгоритмов Ожередов Вадим Андреевич

Исследование солнечно-земных связей с помощью оптимизационных алгоритмов
<
Исследование солнечно-земных связей с помощью оптимизационных алгоритмов Исследование солнечно-земных связей с помощью оптимизационных алгоритмов Исследование солнечно-земных связей с помощью оптимизационных алгоритмов Исследование солнечно-земных связей с помощью оптимизационных алгоритмов Исследование солнечно-земных связей с помощью оптимизационных алгоритмов Исследование солнечно-земных связей с помощью оптимизационных алгоритмов Исследование солнечно-земных связей с помощью оптимизационных алгоритмов Исследование солнечно-земных связей с помощью оптимизационных алгоритмов Исследование солнечно-земных связей с помощью оптимизационных алгоритмов Исследование солнечно-земных связей с помощью оптимизационных алгоритмов Исследование солнечно-земных связей с помощью оптимизационных алгоритмов Исследование солнечно-земных связей с помощью оптимизационных алгоритмов
>

Диссертация - 480 руб., доставка 10 минут, круглосуточно, без выходных и праздников

Автореферат - бесплатно, доставка 10 минут, круглосуточно, без выходных и праздников

Ожередов Вадим Андреевич. Исследование солнечно-земных связей с помощью оптимизационных алгоритмов : диссертация ... кандидата физико-математических наук : 01.03.03 / Ожередов Вадим Андреевич; [Место защиты: Ин-т земного магнетизма, ионосферы и распространения радиоволн].- Москва, 2010.- 159 с.: ил. РГБ ОД, 61 10-1/622

Содержание к диссертации

Введение

Раздел 1. Поиск аналогов спектральных компонент временных рядов гелиогеофизической активности и биологических показателей с помощью сингулярного спектрального анализа 23

1.0. Постановка задачи... 23

1.1. Собственные базисы временных рядов: концепция линейной оболочки 25

1.1.1. Простейший пример введения концепции линейной оболочки 26

1.1.2.Строгое изложение концепции линейной оболочки 28

1.2. Выделение сигнала 34

1.3. Коррекция нестационарных выбросов методом итеративного вращения собственного базиса 37

1.4. Прогнозируемость сигнала внутри линейной оболочки 43

1.5. Теория спектрального оценивания в рамках концепции линейной оболочки 50

1.6. Поиск аналогов спектральных компонент параметров гелиогеомагнитной активности в медикобиологических рядах смертности от инфаркта миокарда в Миннесоте 56

1.7. Синхронизация ритмов Кр-индеска и смертности от инфаркта миокарда в Миннесоте 61

1.8. Выводы Раздела 1 64

Раздел 2. Прямое восстановление нелинейных зависимостей биомедицинских показателей от параметров солнечно-земной физики 67

2.0. Постановка задачи отыскания функциональных взаимосвязей в гелиобиологии. Интерпретируемость, простота программной реализации и ограниченность линейного подхода. Введение в методику прямого восстановления нелинейных зависимостей (DDR) 67

2.1. Конъюнкциональный подход к восстановлению гладких функций. Радиус нелинейности функциональной зависимости 68

2.1.1. Вывод соотношения между радиусом нелинейности и размерами конъюнкции 68

2.1.2 Вывод квазилинейной коиъюнкциональной оценки исходно нелинейной зависимости 72

2.1.3. Анализ зависимости ошибки квазилинейной аппроксимации от корреляционных свойств предикторов и адапторов во внутренней конъюнкции множества прецедентов 73

2.2. Модуль управления параметрами оконечного каскада алгоритма восстановления. Кроссвалидационная петля 75

2.2.1 Ориентация и масштабирования конъюнкции исходя из компромисса надежности результатов и скорости счета на ЭВМ. 76

2.2.2 Разбиение экспериментальной выборки на обучающую и экзаменационную. Модуль сравнения экзаменационных результатов. Кроссвалидационная петля, оптимизирующая масштабный параметр конъюнкции в итерационном режиме 76

2.2.3 Доказательство существования оптимального значения масштабного параметра конъюнкции между нулем и единицей 77

2.3. Кроссвалидационное сканирование как способ определения шума и нелинейности многофакторных нелинейных связей 82

2.3.1 Определение понятия локальной невязки взаимодействия как характеристики возможности восстановления зависимости в масштабе конъюнкции и априорного качества результата применения алгоритма DDR 82

2.3.2 Сканирование зависимости локальной невязки от масштабного параметра конъюнкции 85

2.3.3 Применение результата кроссвалидационного сканирования для выяснения параметров зашумленности и нелинейности восстанавливаемой зависимости 86

2.3.4 Практический пример восстановления зависимости и извлечения информации из результатов кроссвалидационного сканирования 88

2.4. Применение алгоритма DDR к задачам обнаружения взаимосвязи между заболеваемостью инфарктом миокарда гелиогеофизическими параметрами 90

2.5. Выводы Раздела 2 95

Раздел 3. Обнаружение биотропных областей изменения характеристик обычной и космической погоды , 98

3.1. Разделение пространства признаков обычной и космической погоды в случае перекрывающихся выпуклых оболочек прецедентов в рамках линейного приближения 100

3.2. Нелинейный подход к разделению пространства признаков на основе конъюнкциональных оценок локального правдоподобия 108

3.3. Ассоциативное сканирование глобального правдоподобия. Кроссвалидационная петля 114

3.4. Влияние земной погоды на больных гипертонической болезнью (ГБ) 118

3.5. Связь объема статистики экспериментальных результатов и разрешающей способности алгоритмов решения обратных задач 120

3.6. Вариант алгоритма нелинейного распознавания образов, функционирующего на основе оптимизации целевой функции... 126

3.7. Влияние волн изменений температуры и атмосферного давления на заболеваемость инфарктом миокарда 133

3.8. Выводы Раздела 3 136

Заключение 138

Основные результаты работы 140

На защиту выносится 144

Благодарности 147

Литература 148

Введение к работе

Состояние исследований солнечно-земных воздействий и постановка задачи в диссертации

В последние десятилетия стало очевидно, что жизнь на Земле от биологических ее аспектов до функционирования мощных технологических систем зависит от постоянно изменяющихся свойств околоземного пространства. Солнце является главным источником энергии и возмущений, распространяющихся через межпланетную среду к Земле. Гелиосфера, сформированная истекающими из

Солнца потоками плазмы с вмороженным в них межпланетным магнитным полем - солнечным ветром, и околоземное пространство, заполненное собственным магнитным полем Земли, постоянно взаимодействуют друг с другом и представляют собой высоко - изменчивую систему солнечно-земных связей. Плазма солнечного ветра является основным агентом, с помощью которого активные процессы на

Солнце оказывают влияние на состояние околоземного космического пространства и магнитосферы Земли.

Мы живем внутри этой системы и изменчивость процессов, происходящих в ней, воздействует на нас непосредственно. Исследования солнечно-земных связей и определяемых функционированием этой системы процессов, являются фундаментальными задачами солнечно-земной физики. Важной в ряду этих фундаментальных задач является проблема прогноза и предотвращения негативных воздействий возмущений солнечной активности и генерированной ею геомагнитной активности на земные объекты

Таким образом, изучение динамики гелио и магнитосферы необходимо для решения как научных, так и практических задач в области космонавтики, радиосвязи, метеорологии и климатологии и тех видов деятельности, которые существенно от них зависят, в частности, биологии и медицины

Исследование воздействия гелиогеомагнитной активности на живые объекты представляет собой одну из довольно молодых и противоречивых областей этой проблемы. Её основы были заложены трудами выдающегося отечественного ученого Александра Леонидовича Чижевского в первой половине и в середине прошлого столетия [1, 2]. В 1939 году он был избран почетным Президентом 1-го Международного Конгресса Биофизиков в Нью-Йорке и позднее номинирован на

Нобелевскую премию за свои открытия. Чижевский сопоставил многолетние данные по эпидемиям и внезапной кардиологической смерти с числами Вольфа, характеризующими солнечную активность (СА) и продемонстрировал их корреляцию. Он также первым применил весьма популярный до настоящего времени метод наложенных эпох при анализе упомянутых данных. В эпоху до-космических исследований, однако, выявленные корреляции не могли позволить судить о том, какой именно фактор солнечной активности (СА) ответственен за производимые ею медико-биологические (МБЭ) эффекты, что и привело к появлению некоторых наивных представлений о воздействующих факторах.

С развитием космических исследований во второй половине XX века были сделаны открытия «солнечного ветра» - сверхзвуковых потоков замагниченной солнечной плазмы, заполняющей межпланетное пространство и обтекающей Землю, изучены ее свойства и взаимодействие с собственным магнитным полем Земли (магнитосферой), Благодаря значительному прогрессу в области геофизических исследований (реализации международных программ глобального мониторинга в рамках Международного геофизического года (1957-1958), Года спокойного Солнца (1965), Международных Исследований Магнитосферы (МИМ) (1976-1979)) и в сочетании с космическими исследованиями прояснились механизмы развития явлений в магнитосфере, приводящих к возникновению электромагнитных полей (ЭМП). Именно эти очень слабые поля по сравнению с известными ЭМП антропогенного происхождения и выдвинулись на первое место в качестве биотропных факторов в воздействиях солнечно-земных связей на биосферу..

Результаты многочисленных исследований по поиску связи различных проявлений СА с функциональными и морфологическими характеристиками биологических систем, относящиеся к этой эпохе изучения солнечно-земных связей, подробно описаны в обзорных работах [3-12]. Исследователями в основном проводились сопоставления биологических показателей с индексами СА, характеризующими ее проявление как в электромагнитном излучении (в качестве индекса брался поток радиоизлучения на волне 10,7 см — F 10,7), так и в корпускулярном излучении (с вариациями геомагнитного поля — Кр, К, Ар, А, С-индексами), а также с интегральными характеристиками СА (числами Вольфа) и вспышечной активностью.

Методология исследований основывалась на установлении корреляционных статистических связей между гелиогеофизическими и биологическими или медицинскими параметрами. Доказательством наличия непосредственных связей считалось обнаружение в рядах медико-биологических данных характерных совпадающих (или близких) временных изменений, а также установление для биологического явления такого же пространственного географического распределения, которое наблюдается для гелиофизического параметра.

Однако в 80-х же годах возник значительный скептицизм по отношению к гелиобиофизике, связанный с неоднозначностью и во многих случаях подозрительно низкой достоверностью результатов статистических исследований,

Наиболее же существенной причиной скептицизма, который привел к тому, что с точки зрения физики существование МБЭ стало полностью отрицаться, явилось то обстоятельство, что гелиобиофизика имела дело с парадоксальным явлением -нетепловым воздействием чрезвычайно слабых электромагнитных сигналов с амплитудами 10"10-10'6 Тл, энергия которых намного порядков меньше, чем энергия собственных тепловых шумов биологических объектов «кТ» .[13, 14]

Однако существенную поддержку солнечно-земной физике, нацеленной на биологические объекты, в целом в это время оказали новые дисциплины, получившие интенсивное развитие после 60-х годов прошлого века, а именно, теория индуцированных шумом переходов и ее приложение к биологии [15, 16,17] и хронобиология (хрономедицина), а также магнитобиология [18]. Последние дисциплины занимаются временной структурой биологических объектов и ее реакциями на ритмические колебания параметров среды обитания. Теория переходов индуцированных шумом и магнитобиология исследуют поведение открытых сложных нелинейных биологических систем при воздействии на них слабых, в основном, электромагнитных, сигналов уровня шума. Для таких систем эффекты влияния слабого внешнего шума являются, в противоположность интуитивным представлениям, фундаментальными. Внешний шум может играть активную роль в процессах самоорганизации этих систем.

Эти две упомянутые выше области лежат в основе понимания механизмов воздействия слабых ЭМП на биологические объекты. Магнитобиология получила стремительное развитие в последние 20-30 лет (например, в 2003 году в мире ежегодно публиковалось несколько тысяч статей по электромагнитобиологии (см. обзор [19]) в связи тем, что, с одной стороны, было .накоплено множество экспериментальных результатов, свидетельствующих не только о реальности МБЭ сверхнизких слабых ЭМП и излучений, но и зачастую о скрытом характере их действия, и потенциальной опасности для здоровья людей в современном мире, в котором окружающая среда загрязнена отходами производственной и бытовой деятельности. Естественные ЭМП, порожденные СА, представлялись не менее существенным фактором, влияющим на здоровье человеческой популяции, чем ПОЛЯ искусственного происхождения того же уровня или климатические факторы атмосферной температуры, давления и влажности.

Начиная с 90-х годов, начали разрабатываться стандарты электромагнитной безопасности различными национальными и международными организациями, и стали появляться академические обзоры экспериментальных и теоретических работ по магнитобиологии [20-23]. Исторический обзор российских экспериментальных работ содержится в работе Жадина М.Н. [24].

В цикле работ Бинги В.Н. [18,19, 23, 25,26] впервые дается не только обстоятельный анализ, но и критический обзор существующих в настоящее время основных теоретических концепций и механизмов воздействия ЭМП в магнитобиологии. Обсуждается парадоксальность действия слабых ЭМП и сделан вывод, что чрезвычайно низкая энергия этих полей заставляет заключить, что они могут играть роль лишь управляющего сигнала, а не энергетического фактора, подобного кТ. Поскольку обмен веществ в биологических системах представляет собой совокупность в основном неравновесных процессов, то, если время формирования и распада биологических структур в системе меньше времени их термализации, понятие температуры к ним вообще говоря неприменимо, и сравнение изменений их энергии под воздействием ЭМП с «кТ» не имеет смысла. В этих работах показано также, что целесообразно рассматривать только те механизмы, в которых ЭМП управляет не процессами, а вероятностями их развития в том или ином направлении, и что неравновесность или метастабильность биологической мишени и вероятностный характер преобразования сигнала слабого ЭМП в биохимический ответ свидетельствуют о молекулярном механизме магниторецепции

Следует отметить, что воздействие солнечно-земных факторов на биологические объекты в отличие от магнитобиологии, имеет дело с проявлениями МБЭ на организменном и популяционном уровне, тогда как механизмы, его реализующие, как следует из магнитобиологии, работают на клеточном и атомно-молекулярном уровнях. Промежуточные этапы этого воздействия, биохимические реакции, биофизические процессы остаются «за скобками» исследований. По- существу, поставить эксперименты, в которых бы исследовались соответствующие биохимические реакции или биофизические процессы взаимодействия, вообще чрезвычайно трудно, а с естественными слабыми ЭМП - это практически невозможно. Кроме того, предметом исследований являются как гелиогеофизические, так и медико-биологические явления, и эта область представляет собой междисциплинарную науку, в которой должны находить язык взаимопонимания биологи, медики, геофизики, физики, биохимики, математики. Как и в других областях знаний, имеющих дело с популяционным и организменным уровнем исследований, значительную роль играют современные методы статистического анализа. В силу вышесказанного возникает особая ответственность за адекватность используемых методов и достоверность и воспроизводимость полученных результатов..

Накопленный в прошлом столетии биоритмологами опыт убедительно свидетельствовал, что многие биоритмы в значительной степени синхронизируются гелиогеофизическими колебательными процессами соответствующих периодов. Длительное время хронобиологические исследования были направлены в основном на эти циркадианные ритмы, считавшиеся ведущими и определяющими всю динамику биологических показателей. Естественным времядатчиком, сформировавшим в процессе эволюции эндогенную циркадианную ритмику, считается ритм солнечной освещенности (чередование дня и ночи), и, соответственно, ритмы температуры, определяемые собственным вращением Земли (см. например, [27, 28, 29]). Однако в остальных случаях, даже в простейших из них, далеко не всегда удавалось выявить внешний синхронизатор, а в случае успеха он мог иметь и не гелиогеофизическое происхождение (например, социальное).

Важной особенностью как геофизических, так и биологических процессов, в последнем случае порожденной, по-видимому, процессом адаптивной эволюции, является феномен «блуждания фазы» и феномен изменчивости периода. Однако причины изменчивости этих характеристик у биосистемы, как правило, неизвестны и не описываются заранее заданными модельными представлениями, столь типичными для физических и технических наук. В то же время, в исследованиях проблемы поиска связей гелиогеофизических и биологических процессов широко практиковалось простое перенесение методологических приемов, заимствованных из технических и физических областей. Это приводило к тому, что математические модели зачастую оказывались неадекватными исследуемым процессам и не могли достаточно полно описать известные биологические явления. Например, в биоритмологии, как правило, использовались математические модели, описывающие биоритмы элементарными математическими функциями (синусоидой, произведением синусоид ит. д [30, 31, 32]. Однако такое удобство моделей этих типов, как малопараметричность, нередко оборачивалось плохим качеством прогноза биоритмов, так как они не учитывали возможности адаптационных механизмов живых систем (а именно, изменения фазы ритмов под влиянием адаптации к изменению фазы синхронизатора). Подробный анализ применявшихся в солнечно-земной физике методов и их ограничений был проведен в ряде работ (см., например, [33 -37]).

Кроме того, имелась еще одна серьезная трудность при разработке математического подхода, связанная с различными возможностями сбора медико-биологической и гелиогеофизической информации. Эквидистантность и длина рядов измерений в гелиогеофизических исследованиях позволяла при их обработке использовать могучий математический аппарат современного статистического анализа, в то время как в хронобиологии использовались в большей степени методы регрессионного анализа. Все эти обстоятельства поставили на ведущее место необходимость тщательного анализа и разработки адекватных математических подходов и методов исследований и проверки с их помощью некоторых ранее полученных результатов и сделанных заключений.

1. Основные новые концепции солнечно-земных связей, относящиеся к биологическим объектам

В начале 90-х годов была предложена новая концепция воздействия СА на биосистемы [38, 39], согласно которой ритмы гелиогеофизических факторов «завели» еще на ранних стадиях эволюции «биологические» часы, т. е. являются одним из внешних синхронизаторов ритмов биологических систем. Имеется аналогия с происхождением суточных (циркадианных) биологических ритмов, которые возникли под воздействием ритмов другого фактора солнечной активности, а именно волнового излучения Солнца (т.е. освещенности и, соответственно, температуры), связанных с суточным вращением Земли. Сформировавшиеся под влиянием гелиогеофизического датчика времени эндогенные ритмы должны быть устойчивыми, так как адаптационная система поддерживает организм в устойчивом состоянии. Однако вследствие резких апериодических изменений, т. е. сбоев ритмов этого внешнего времядатчика (например, геомагнитных возмущений), должна происходить десинхронизация внутренних биологических ритмов, как одно из проявлений общего адаптационного синдрома. Подобный адаптационный стресс наблюдается, например, при десинхронизации фаз суточных ритмов во время трансконтинентальных перелетов. Необратимая реакция живых организмов на «сбои ритмов» времядатчика, однако, должна возникать в основном тогда, когда биологическая система находится в состоянии неустойчивости, то есть, имеется патология адаптационной системы (заболевание), или адаптационная система перенапряжена вследствие воздействия другого стрессового фактора.

Инфрадианные биологические ритмы (с периодами больше 28 часов и меньше 28 дней) и, в частности, с периодом около недели, [40] до недавнего времени не привлекали к себе пристального внимания биологов. Физиологическая неделя была известна еще с античных времен по ритмам обострений различных заболеваний, однако популярным и распространенным было мнение, что эти ритмы имеют социальное происхождение. Гелиогеофизические ритмы с периодами, соответствующими периоду собственного вращения Солнца, также стали известны еще с начала космических исследований. Однако детальной структурой и происхождением более короткопериодических, чем 28 дней гелиогеофизических ритмов и, в частности, околонедельных периодов, а также их динамикой в цикле солнечной активности в 80-х гг., когда гелиобиология испытала свой кризис, никто всерьез не занимался. Поскольку близость периодов биологических и гелиогеофизических ритмов в этой короткопериодической области давала некоторое обоснование для упомянутой выше концепции о ключевой роли гелиогеомагнитных ритмов в формировании эндогенной временной структуры биологических объектов, в 90-х годах группой отечественных специалистов, руководимой Т.К.Бреус, и сотрудничавшей с ней группой американских специалистов, возглавляемой проф. Ф.Халбергом, начались интенсивные исследования по проверке этой гипотезы. Вскоре к проводившимся исследованиям подключился обширный коллектив различного рода специалистов из международного сообщества «International Womb to Tomb Chronome Initiative Group», из США, Японии, Германии, Италии, Чехии, Болгарии, Швеции, Мексики и др стран, которые по инициативе Ф. Халберга и Т.К.Бреус и под влиянием результатов проводимых их группами работ стал разрабатывать действующую в настоящее время международную программу БИОКОС (Биосфера и Космос) [ 41-43].

В настоящее время более 100 специалистов из международного сообщества публикует работы по проблемам солнечно-земных связей, относящихся к биофизике. Основные направления предыдущих исследований следующие: поиски прямых линейных корреляций длинных рядов медико-биологических и гелиогеофизических данных; построение стационарных и динамических спектров этих рядов; поиски аналогий в периодах ритмов гелиогеофизических и медикобиологических показателей в стационарных спектрах; поиски синхронных вариаций полученных в динамических спектрах периодов ритмов гелиогеофизических и медикобиологических показателей в циклах солнечной активности.

Следует подчеркнуть, что полученные во время поисков корреляции гелиогеомагнитных и медикобиологических рядов коэффициенты получались весьма неустойчивыми по величине и изменялись от значений, близких к нулю до очень высоких цифр. Особенно значительный негативный эффект произвели исследования Американских ученых массивов данных ежесуточных наблюдений за 4 года смертности в Америке от коронарной недостаточности и инсультов головного мозга (275 млн.. показателей [13]). В этих исследованиях статистически значимые связи медико-биологических и гелиогеофизических параметров не обнаруживались. В некоторых отечественных исследованиях репрезентативных данных по показателям Скорой помощи, например, в Москве (80 000 вызовов по поводу инфаркта миокарда (ИМ)) [44, 45] и в Миннесоте (более 10 000 дней с с вызовами скорой помощи по поводу внезапной смерти от ИМ) [44, 46, 47, 49] коэффициенты корреляции с большой достоверностью оказывались меньше 0,01. Однако в других исследованиях и в России (см., например, [50-52], получались коэффициенты корреляции геомагнитной активности с острыми сердечно-сосудистыми патологиями вплоть до 80%.

Таким образом, возникла проблема правомерности существования МБЭ на популяционном уровне, адекватности используемых методов математического анализа и достоверности результатов, полученных регрессионными методами.

Естественно, что критики гелиобиофизических исследований ссылались на практически не учитываемую многофакторную зависимость биологических эффектов от показателей внешней среды (одновременное воздействие гелиогеомагнитных, метеорологических, социальных и других факторов). Вызывало недоумение, что несмотря на то, что мощные современные методы математического анализа, такие как вейвелет-анализ, нейронные сети, метод распознавания образов, ряд из которых успешно применялся к многофакторному анализу данных гелиогеофизических рядов [53-76], солнечно-земные воздействия на биосферу по-прежнему игнорировали, а довольствовались многократно раскритикованным корреляционным анализом, и опирались, в лучшем случае, на косинор-анализ и метод быстрого преобразования Фурье.

2. Цель работы

Таким образом целью работы являлось достоверное выявление особенностей солнечно-земных связей в условиях многофакторного характера отклика объектов в системе Солнце-Земля на внешние воздействия путем использования современных математических методов ситуационного анализа.

2. Основные задачи диссертации и методические подходы

Данный подраздел не будет посвящен критическому обзору методов, традиционно использующихся в гелиофизике или в исследованиях солнечно-земных воздействий на биологические объекты, а обсуждает некоторые широко известные в практике обработки геофизических данных подходы, с точки зрения возможного применения их в задачах солнечно-земных связей наравне с распространенными в них традиционными методами. В результате возникает задача перед данной диссертацией использовать подходящие подходы или разработать новые, и оценить, позволяют ли они получить преимущества и расширить круг решаемых задач, как в области фундаментальных, так и прикладных проблем солнечно-земных связей.

При критическом описании методик анализа данных мы будем придерживаться того порядка, который используется в методических подходах воздействия солнечной активности на биологические объекты и, в частности, в данной диссертации при решении поставленных перед ней задач:

1. выявления сходства и различий ритмов гелиогеофизических и медико-биологических показателей, а именно, спектральному анализу. поиску зависимостей медикобиологических показателей от вариаций гелиогеомагнитных - т.е поиску функциональных зависимостей и, наконец, обнаружению биотропных областей характеристик обычной и космической погоды, а именно, распознаванию образов.

Поэтому мы рассмотрим следующие актуальные на настоящий момент методики анализа, сгруппированные согласно этим перечисленным выше подходам:

К подходам, относящимся к спектральному анализу, принадлежат: вейвлет-анализ [74], сингулярный спектральный анализ (Singular Spectral Analysis, SSA) [71-73] и методика рандомизированной оптимизации параметров аппроксимирующего сигнала [76].

К подходам, относящимся к поиску функциональных зависимостей, принадлежат: метод локальной аппроксимации (Local Approximation, LA) и модификация LA [77] с фильтрацией близких траекторий [78].

К подходам, относящимся к распознаванию образов, принадлежат: метод потенциальных функций, алгоритмы выращивания кластеров [79], искусственные нейронные сети [80]

В итоге проведенного ниже анализа оказалось, что подходящие базовые идеи некоторых из перечисленных выше методик (а именно, SSA, LA и метод перебора конъюнкций) можно положить в основу разработанных в диссертации алгоритмов обработки данных.

Вейвлет-анализ

У этой методики обработки временных рядов, вообще говоря, есть множество преимуществ (таких как частотное самоподобие формы компонентов базиса и вытекающая из данного обстоятельства возможность кратномасштабного анализа сигналов), которые, возможно, играют решающую роль в теории артефактных динамических систем, но именно эти преимущества, однако, абсолютно бесполезны для гелиобиологии по причине невозможности присутствия в ней кратномасштабных структур. Единственное, на первый взгляд, полезное для этой дисциплины свойство вейвлет-преобразования - это форма его базисных функций, которые, в отличие от стационарных «нигде не начинающихся и нигде не кончающихся» синусов Фурье, локализованы во времени и их структура, быть может, немного лучше соответствует нестационарным структурам рассматриваемых в гелиобиологии сигналов [74]. Во всяком случае, большинство разумных сторонников вейвлет-преобразования именно это обстоятельство ставят на первое место, заявляя, что там, где Фурье-анализ дает лишь беспорядочную густую гребенку по всему спектру, вейвлет-преобразование демонстрирует набор весьма ограниченного количества резких спектральных пиков, что было бы полезным для гелиобиологии. Не нуждается в особых доказательствах утверждение о том, что такой спектр говорит о наличии оптимального базиса линейного1 пространства достаточно малой размерности, целиком содержащего изучаемый сигнал - это утверждение прямо следует из определения спектра. Таким образом, применение вейвлетов в гелиобиологии предполагает, что а) у реально наблюдаемого в гелиобиологических экспериментах сигнала есть оптимальный базис и б) совокупность компонентов этого базиса совпадает с одним из наборов стандартных вейвлетов.

Как показывает практика, упомянутый выше пункт «а» срабатывает, а пункт «б» - нет. В разделе 1 диссертации будет доказано, что гелиобиологические сигналы действительно обладают малоразмерными оптимальными базисами. Однако в соответствии с главной концепцией солнечно-земныйх воздействий на биообъекты, согласно которой периодические изменения параметров внешней среды явились синхронизаторами биоритмов на ранних этапах эволюции биосистем, релаксационные процессы, связанные с влиянием синхронизации, давно прошли, а раз так - биоритм должен обладать выраженной периодичностью. Поэтому оптимальным для гелиобиологических сигналов будет некоторый суббазис синусоид с, быть может, блуждающими характеристиками. Таким образом, спектры должны характеризоваться набором периодов, а не коэффициентов при существенно апериодических компонентах вейвлет-базиса, поэтому интерпретация вейвлет-спектров даже для геофизических данных затруднена (например, из частного замечания В.Н. Обридко).

Основной проблемой спектрального анализа в гелиобиологии является поиск малоразмерного оптимального базиса, т.е. подпространства, целиком содержащего сигнал. Спектр сигнала в этом базисе будет содержать ограниченное число резких 1 Понятно, что временной, частотный и масштабно-параметрический интегралы в прямом и обратном вейвлет-преобразовании суть линейные конструкции, поэтому прямое и обратное вейвлет-преобразования — линейные операторы, действующие из одного линейного пространства в другое. пиков, т.е. как раз и будет являться репрезентативным. При этом главной задачей становится идентификация углов разворота оптимального базиса относительно естественного, решить которую вейвлет-анализ, очевидно, неспособен. Поэтому мы переходим к рассмотрению следующей методики, которая создана для решения задачи идентификации углов разворота оптимального базиса по определению.

Сингулярный спектральный анализ (Singular Spectral Analysis, SSA)

Данная методика как раз разработана для идентификации подпространства, содержащего сигнал, иными словами, для нахождения оптимального базиса и углов его разворота относительно естественного. Однако в базовом варианте этот метод воспринимает сигнал как стационарный, т.е. у него нет возможности отличать выбросы от регулярных точек траектории реализаций сигнала. Будучи напрямую примененным к нестационарному гелиобиологическому временному ряду, SSA неправильно вычисляет параметры ориентации оптимального базиса. Это обстоятельство способно существенно исказить спектр гелиобиологического ритма [75, 81].

Рандомизированная оптимизация параметров аппроксимирующего сигнала

Эта своеобразная методика спектрального анализа состоит в нахождении параметров (периодов) отдельных синусоид в сумме, в среднеквадратичной норме наилучшим образом приближающей исходный сигнал. В данной задаче упомянутая среднеквадратичная норма разности (невязка) между реальным и аппроксимирующим сигналом становится функцией периодов, так что последняя как бы имеет рельеф в пространстве своих переменных. Далее утверждается, что наиглубочайшая точка рельефа (в которой, очевидно, невязка достигает своего минимума) соответствует набору периодов в как бы «идеальном» спектре. Поскольку так построенный рельеф изобилует неглубокими локальными минимумами и градиентные методы спуска в этих условиях не работают, в [76] предлагается использовать рандомизированную стратегию поиска глобального минимума.

Начнем с того, что аппроксимация сигнала набором линейно-независимых синусоид является (в среднеквадратичной норме) ничуть не лучше, чем аппроксимация компонентами ортогонального суббазиса линейной оболочки2, натянутой на эти синусоиды. Действительно, пусть 4у обозначает указанный суббазис, S - матрица, столбцы которой представляют собой синусоиды заданных периодов, а х - исходный сигнал. Тогда задача Чаплынского ставится как minjLft* - х\\ (*) а " " а задача аппроксимации компонентами ортогонального суббазиса линейной оболочки, натянутой на S— как тіп^с-хЦ (**)

Докажем от противного, что минимум (**) не больше (*). В самом деле, допустим, что это не так. Поскольку W - (суб)базис линейной оболочки S, то каждый вектор-столбец из S может быть представлен в виде S = 4*R, где матрица R состоит из столбцов коэффициентов разложения синусоид из S по базисным компонентам Ч*. Подставляя такое разложение в (*), получим: minll&z - jell = minllY/ta - xll = ІІЧ'с - x\\, с = Ra a " "a " " " " т.е. существует такое с, равное Ra, для которого норма разности |^Рс - jc| в точности равна минимуму (*), что противоречит исходному предположению о том, что минимум (**) всегда больше (*), что и требовалось доказать.

Отсюда необходимо сделать вывод, что для наилучшей аппроксимации временного ряда, по предположению содержащего периодичности (в работе Чаплынского автор доказывает оптимальность набора синусоид заданных периодов, тем самым, в частности, пытаясь доказать, что в сигнале содержатся окологодовые (transyear) ритмы, а годовые ритмы отсутствуют), нужны не оптимальные соотношения периодов гармоник — нужна информация о топологии некоторого ортогонального суббазиса в пространстве размерности длины временного ряда. Тем 2 Линейной оболочкой набора векторов называется минимальное по включению множество, содержащее вектора из набора и обладающее свойствами линейного пространства. более, что одна и та же линейная оболочка может быть порождена совершенно разными векторами, а, учитывая рандомизацию стратегии поиска минимума (*), Чаплынскии отнюдь не гарантирует, что при других соотношениях периодов не будет достигнуто лучшее качество аппроксимации.

Концепции на основе SSA (в частности, одна из них рассматривается в разделе 1 настоящей диссертации) ориентированы на прямую оптимизацию топологии пространств наименьшей размерности, в которые целиком укладывается сигнал, аппроксимирующий заданный временной ряд. Такой подход к задаче аппроксимации более корректен, т.к. 1) задача в этом случае имеет единственное решение и не требует алгоритма рандомизированного перебора, который, вообще говоря, результата не гарантирует, и 2) это решение гарантированно наилучшее среди всех аппроксимаций набором любых гармонических или иных функций, имеющим ранг не выше заданного.

Метод локальной аппроксимации (LA)

Идеи этого подхода, описанного в [77], лежат в основе используемого нами в разделе 2 диссертации алгоритма поиска функциональных зависимостей DDR. Метод производит квазилинейную аппроксимацию функции, информация о которой задана в виде набора измеренных пар независимых и зависимых переменных. При этом размеры «ячеек», внутри каждой из которых функциональную зависимость можно считать линейной, в традиционной модификации LA выбираются произвольно, поскольку у этого алгоритма нет аппарата извлечения дополнительной информации о топологических свойствах соответствующей функции гиперповерхности. В то же время, DDR, являясь, вообще говоря, «двухкаскадным» методом локальной аппроксимации, способен оценивать такие параметры функциональной зависимости, как устойчивость, степень нелинейности и соотношение «шум/сигнал», что позволяет не только вести корректную оптимизацию параметров вышеупомянутой «ячейки», но и указывать степень достоверности полученной зависимости.

Модификация LA с фильтрацией близких траекторий

В работе [78] описывается недостаток метода LA, связанный с явлением т.н. мулътиколлинеарности. Имеется в виду неустойчивость решения задачи квазилинейной аппроксимации при некорректности обращения ковариационной матрицы независимых переменных внутри «ячейки». McNames связывает это явление с дублированием информации о корреляциях между отдельными компонентами независимой переменной в случае, когда близкие по времени измерения экспериментальные точки почти накладываются друг на друга, и предлагает «прореживать» измеряемые ряды, используя в качестве основного критерия достаточную «разнесенность» измерений по времени. Здесь разумно заметить, что такой метод фильтрации применим исключительно к зависимостям с низким уровнем шума, где накопление достаточной статистики не играет особой роли и мультиколлинеарность «страшнее» статистической несостоятельности (McNames применял свою модификацию LA к задачам прогнозирования временных рядов, порождаемых артефактными системами нелинейных уравнений) и не подходит для задач гелиобиологии, где уровень шума едва ли не превышает уровень сигнала. В реализации алгоритма DDR существуют другой способ борьбы с мультиколлинеарностью, функционирующий на основе оптимизации соотношений между размерами «ячейки».

Метод потенциальных функций

Эта методика распознавания образов [82] основана на построении некоторого функционала признаков изучаемого объекта, работающего по аналогии с распределением потенциала силы притяжения - попадая в этот потенциал, вектор признаков как бы «притягивается» определенным классом, к которому и относят вследствие этого объект. Функционал признаков ищется в виде линейной комбинации базисных потенциальных функций, чему метод обязан своим названием.

У данного метода имеется очевидный недостаток - это предположение о том, что точки пространства признаков из одного класса расположены компактно, причем центры «скопления» точек из каждого класса разнесены на значительное расстояние друг от друга. Как будет показано в разделе 3 настоящей диссертации, 1) области, в которые вероятнее всего попадают точки пространства признаков из конкретного класса, являются многосвязными, и 2) из-за того, что факторы космической и обычной погоды играют второстепенную роль в изменениях характеристик состояния организма, расстояние между центрами вышеназванных «скоплений» обычно много меньше размеров самих скоплений. Поэтому метод потенциальных функций имеет весьма ограниченную применимость к задачам гелиобиологии.

Алгоритмы выращивания кластеров [79]

Данная методика относится к процессам «обучения без учителя», т.е. система распознавания образов пытается разделить пространство признаков, обучаясь на объектах, принадлежность которых к конкретному классу заранее неизвестно. При этом вся информация о механизме взаимосвязи «объект - признак», закладываемая в любую систему «обучения с учителем», в данном случае недоступна. В определенном классе задач, к которым гелиобиология, к сожалению, не относится по названным выше причинам, алгоритм кластеризации может получить ее косвенным путем, выясняя топологию расположения отдельных «скоплений» точек в пространстве признаков. В гелиобиологических задачах ярко выраженные скопления либо отсутствуют, либо они многосвязны, так что два сильно удаленных друг от друга «кластера» могут вполне оказаться из одинаковых іслассов, тогда как два близких или даже перекрывающихся - из разных.

Искусственные нейронные сети [80]

Этот широко известный аппарат принятия решений обладает двумя недостатками - 1)он непрозрачен и 2) он многопараметрический. Первое очевидно -известно, что нейронная сеть имеет множество элементов, характеристики каждого из которых отслеживать просто нереально. Второе же означает, что за настройку нейронной сети отвечает очень большая группа параметров, которые к тому же не имеют ни малейшего отношения к параметрам модели взаимосвязи между объектами и их признаками. А раз так, следовательно, невозможно построить адекватную систему критериев, позволяющих определить «достоверность» множества настроек сети, т.е. определить, позволяет ли экспериментальная выборка алгоритму обучаться, или же только следовать за нестационарно меняющимися ситуациями.

Постановка задач в диссертации

Из приведенного здесь краткого обзора состояния проблемы, ее основных концепций, результатов исследований, применяемых и потенциально возможных к применению методов анализа временных рядов следует следующая постановка задач в диссертации.

А. В процессе многолетних исследований выработалась основная концепция солнечно-земных связей, относящихся к их воздействию на биологические объекты - включение в эндогенную биологическую ритмику периодов ритмов естественных электромагнитных полей, порожденных солнечной и геомагнитной активностью, и, соответственно, синхронизация гелиогеомагнитных и медикобиологических ритмов. Эта концепция будет проверяться поисками аналогий спектральных компонентов в стационарных ритмах обоих показателей, а также возможного синхронного изменения гелиогеомагнитных и медикобиологических ритмов в циклах солнечной активности, т.е. поисками аналогических вариаций в динамических спектрах обоих показателей.

В предыдущих исследованиях этих задач имелся целый ряд проблем, связанных с ограничениями применяемых методов спектрального анализа, которые не позволяли достаточно убедительно продемонстрировать искомые аналогии.

Как уже отмечалось выше имеется целый ряд более современных методов, базовые идеи некоторых из которых (в частности, Singular Spectral Analysis, SSA), будут использоваться в данной диссертации при разработке адекватного метода решения поставленной задачи.

В свете сказанного выше в Разделе 1, прежде всего, рассматривается метод изучения топологии реализаций сигнала в многомерном пространстве (подразделы 1.1.; 1.2) . Затем разрабатываются методы устранения искажения информации об означенной топологии, которые обусловлены наличием нестационарных выбросов (подраздел 1.3). Далее вводится понятие линейной оболочки - фильтра, функционирующего на основе топологических характеристик реализаций сигнала, и доказывается прогнозируемость порождаемого ею временного ряда (подразделы 1.4). Затем будет доказано, что линейная оболочка порождает сигнал с ограниченным количеством спектральных пиков, и проводится спектральный анализ этого сигнала (1.5). Все эти этапы исследований позволяют произвести спектральный анализ гелиогеофизических и биологических рядов и сравнить между собой их репрезентативные спектры (подраздел 1.6).

Б. Второй задачей предлагаемой работы является прямое восстановление нелинейных зависимостей биомедицинских показателей от параметров космической и земной погоды.

Линейно-регрессионные методики получили широкое распространение в гелиобиологии, однако линейная регрессия не способна учесть то обстоятельство, что сами физиологические показатели изменяются в зависимости от условий - их скорость роста или падения не является постоянной. Отсюда возникает необходимость использования нелинейной регрессии, требующей в качестве управляющего параметра т.н. характерный радиус нелинейности. Обычно последний заранее неизвестен, поэтому алгоритму восстановления нелинейных зависимостей требуется как минимум два каскада - оконечный представляет собой собственно метод нелинейной регрессии, а предшествующий ему каскад оптимизирует управляющие параметры последнего. В диссертации разработан этот двухкаскадный алгоритм, названный аббревиатурой DDR (от Direct Dependence Recovery), и именно он в дальнейшем используется для выявления функциональной взаимосвязи между биомедицинскими показателями и характеристиками факторов окружающей среды.( Раздел 2)

В. Обнаружение биотропных областей изменения характеристик обычной и космической погоды с помочью метода распознавания образов представляет собой третью основную задачу данной диссертации (Раздел 3). Практически интересным в гелиобиологии является получение ответа, имеющего достаточную конфиденциальность, на вопрос о том, какие именно соотношения параметров окружающей среды в многомерном пространстве вызывают заданный биологический отклик. Такая постановка задачи позволяет варьировать не только «биотропную» область в параметрическом пространстве, но и определение самого отклика до тех пор, пока утверждение о том, что «такое-то воздействие вызывает тот или иной отклик» не станет достаточно конфиденциальным. Такие задачи называются обратными, потому что, как рассматриваемые в первых двух главах диссертации, так и традиционно решаемые в гелиобиологии задачи представляют собой прямые: а именно, нахождение отклика биологической системы на заранее заданный класс возмущений (магнитные бури, перепады атмосферного давления) или же просто на ритмические (Раздел 1 настоящей диссертации) или неритмические (Раздел 2 ее же) изменения какой-либо характеристики окружающей среды. Обратные задачи рассматриваются с точки зрения теории распознавания образов, поэтому в диссертации впервые будет использован этот новый подход к задачам гелиобиологии.

Методики обработки, предложенные в диссертации протестированы по данным на био-медицинских показателей, но рассмотрены на высоком уровне абстракции и могут быть применимы в других областях исследований солнечно-земных связей.

Коррекция нестационарных выбросов методом итеративного вращения собственного базиса

Поскольку какие-либо априорные предположения о модели мешающей, шумовой компоненты изначально отсутствуют, то вполне разумно допущение, что расположение N -мерных реализаций по отношению к линейной оболочке сигнала может меняться нестационарно (из-за шума). В самом деле, скажем, для чисел Вольфа, то есть Wn-индекса, характеризующего солнечную активность, отклонения годовых реализаций от линейной оболочки имеют явно периодический характер (Рис.4). Локализованные на достаточно длинном временном сегменте значительные «скопления» точек - концов векторов реализаций на сравнительно больших расстояниях от линейной оболочки, задаваемой (обычной) матрицей ковариации, определенной формулой (1), т.е. нестационарные выбросы, способны отдалить фильтруемую «сигнальную» компоненту от графика исходного временного ряда. Отсюда следует, что факт возможного наличия нестационарных выбросов следует учитывать при вычислении топологии линейной оболочки.

Постановка прямой оптимизационной задачи, на наш взгляд, здесь не имеет смысла, даже если бы был задан в явном виде некоторый функционал качества, связывающий параметры расположения линейной оболочки в TV -мерном пространстве реализаций и «корректность картинки», получаемой при наложении фильтруемого сигнала на исходный временной ряд. Действительно, топология линейной оболочки задается вектором смещения (b), который имеет размерность N, и суббазисом Ф, матричная форма которого имеет размерность NxQ. Таким образом, при такой (гипотетической) постановке задачи мы имели бы необходимость варьирования N(Q + 1) переменных, что в случае, например, изображенной на Рис.4 ситуации составляет 54 параметра. Понятно, что современное состояние развития вычислительной техники не позволило бы -нам выработать устойчивый алгоритм (достаточно быстро реализуемой на PC) минимизации функции пятидесяти четырех переменных, имеющей, к тому же, весьма замысловатый вид. В связи с вышеизложенным, мы предлагаем процедуру поиска линейной оболочки, сопряженную с нахождением собственного базиса т.н. самосогласованной ковариационной матрицы, позволяющей учитывать выбросы и как бы приписывать им малые веса в формировании топологических характеристик линейной оболочки. Ковариацш может быть определена как мера (линейного) сходства между М -мерными последовательностями [92]. Аналогично, взвешенная ковариацш может быть определена как мера линейного сходства во взвешенной норме, т.е. если мы имеем два ряда ) ]U и у? } , то covw{ ,j]} определяет Вычислениями, аналогичными тем, которые были произведены в подразделе 1.1 (см. равенства (1-4)), несложно показать, что преобразование взвешенной ковариационной матрицы aw при разворотах базиса происходит по формулам, аналогичным (4). При этом диагональные элементы взвешенной ковариационной матрицы (взвешенные дисперсии) определяют среднеквадратичный разброс проекции реализаций на базисные направления с учетом весов, приданных отдельным реализациям. Рассмотрим, например, двумерную схему расположения реализаций (N = 2), изображенную на Рис.5. Здесь отчетливо видны группы точек - концов векторов вдоль прямой линии.

Представляемые этими точками реализации мы условимся считать регулярными, а сами точки - образующими кластер I. Кластер красных точек - кластер II (реализации-выбросы) - образует как бы «вырост» из первого кластера. Визуальный анализ Рис.7 показывает, что базисным направлением линейной оболочки, в которую укладывается траектория регулярных реализаций, является длинная синяя линия, обозначенная как q \w\ в то время как вычисление собственных векторов тривиальной ковариационной матрицы дает направление, помеченное как р{ (без верхнего индекса). Причина наличия достаточно большого угла между направлениями очевидна - кластер выбросов, обладая значительными размерами, как бы «оттягивает» на себя базис ковариационной матрицы. Допустим теперь, что последняя вычислена по формуле (19), где роль весов играют невозрастающие функции расстояния до линейной оболочки, порождаемой базисом этой же матрицы. Такую ковариационную матрицу, так же как и порождаемую ею линейную оболочку сигнала, будем называть самосогласованной. Для простоты представим себе ступенчатый характер зависимости весов от расстояний до линейной оболочки - вес равен единице для расстояний, меньших либо равных длине светло-зеленого отрезка на Рис.7 (соединяет наиболее дальнюю от направления p\W) точку с линией этого направления). Легко видеть, что в этой ситуации все выбросы находятся за тонкой зеленой линией и их веса равны нулю, так что взвешенной ковариационной матрицей, отвечающей описанному распределению весов, соответствует (обыкновенная) ковариационная матрица регулярных реализаций.

Таким образом, фильтруемый при помощи порождаемой самосогласованной линейной оболочки сигнал хорошо описывает поведение регулярных реализаций, не принимая во внимание выбросы. Если собственные направления требуется некоторая автоматическая процедура поиска этих направлений. Предлагаемый нами итеративный алгоритм формально записывается как т.е. на каждой последующей итерации вычисляется взвешенная ковариационная матрица, отвечающая весам как функциям расстояния до линейной оболочки, порождаемой предыдущей матрицей. При этом исходно веса всех реализаций равны единице, т.е. в стартовой точке алгоритма ковариационная матрица тривиальна. При удачном подборе зависимости веса от расстояния до линейной оболочки сигнала (Рис.6) и, разумеется, наличии кластера регулярных реализаций данная процедура сходится, и предел последовательности является самосогласованной ковариационной матрицей, поскольку порождаемая ею весовая последовательность в соответствии с формулой (20) формирует саму эту матрицу. В качестве примера полезно рассмотреть поиск собственных направлений изображенного на том же Рис.5 кластера регулярных реализаций в присутствии выбросов, но уже полностью в автоматическом режиме. Исходная весовая последовательность

Модуль управления параметрами оконечного каскада алгоритма восстановления. Кроссвалидационная петля

Как мы только что убедились, при заданных форме и ориентации конъюнкции вокруг точки х, зависимость в которой требуется восстановить, задача восстановления (зависимости F(x)) имеет однозначное решение. Таким образом, при передаче исчерпывающих данных о параметрах конъюнкций вокруг всех интересующих нас значений предикторов в оконечный каскад DDR, который, собственно, выдает оценку адаптора y = F(x), теоретически возможно получить достаточно подробную картину расположения гиперповерхности y = F(x) в (Q + І)-мерном пространстве, зависящую от числа прецедентов. Разумеется, вопрос об оптимальных параметрах конъюнкции в подразделе 2.1 оставался открытым, и здесь мы попытаемся его разрешить. Исходя из компромисса достоверности получаемых зависимостей в тестовых примерах (см. ниже) и скорости счета на ЭВМ, мы пришли к выводу, что конъюнкцию вполне допустимо сориентировать так, чтобы ее ребра были параллельны осям естественного базиса (см. Рис.1 и пояснения к нему), а в качестве параметра, отвечающего за линейные размеры конъюнкции, разумно взять один масштабный параметр р, так что ребро конъюнкции, располагающееся вдоль оси тах{ХА}-т1п{Х } - полный размер облака прецедентов в направлении А:-той координаты предиктора, а коэффициент 2 соответствует ситуации, в которой при р = 1 в конъюнкцию вокруг произвольной точки попадают все прецеденты. Таким образом, в оконечный каскад DDR передается единственный параметр масштаба конъюнкции, и для подбора его оптимального значения потребуется дополнительный каскад, который бы искал наиболее подходящее значение р, исходя из оптимизации качества восстановления. При этом естественно предполагать, что для чистоты эксперимента значения адаптора, с которыми сравниваются оценки в процессе вычисления качества восстановления, не должны передаваться в оконечный каскад.

Это означает, что база данных, участвующая в настройке всего комплекса модулей DDR, должна состоять из двух частей, одна из которых (обучающая, обозначаемая далее индексом «Т» от слова Teaching) полностью передается оконечному каскаду, а из второй части (экзаменационной, обозначаемой далее индексом «Е» от слова Examining) передаются лишь значения предикторов для вычисления оценок адапторов с помощью оконечного каскада, использующего обучающую часть базы данных, с целью сравнения результатов вычислений со значениями адапторов из экзаменационной части базы данных. Этим занимается т.н. модуль сравнения, функция которого заключается в сканировании графика зависимости ошибки восстановления А от масштабного параметра конъюнкции р. Этот дополнительный каскад алгоритма DDR также занимается нахождением оптимального значения р, при котором А минимальна. Таким образом, модуль сравнения передает оконечному каскаду некоторое значение р. Затем оконечный каскад возвращает модулю сравнения значение Л(р), после чего тот корректирует значение р и снова передает его оконечному каскаду. Такое циклическое движение информации между каскадами алгоритма мы называем петлей кроссвалидации. Оценим зависимость эффективности кроссвалидационного подхода к поиску А нелинейных зависимостей от масштабного параметра р. Пусть (J 1а - разбиение области произвольного плотного скопления прецедентов, такое, что С1а Г\0.р =0, а /3, и для всех предикторов х внутри каждого отдельно взятого Qa оптимальным является линейное приближение ха + с, причем коэффициенты а не- одни и те же для всех хєС1а (формулы (3-5) из предыдущего подраздела формально доказывают, что такое разбиение теоретически существует).

Пусть также АЕа обозначает минимально возможное значение среднеквадратичной ошибки линейного приближения экзаменационных адапторов, предикторы которых находятся в пределах Qa (она достигается при условии, что алгоритм линейной оптимизации получил в распоряжение всю экзаменационную базу данных), а Д -среднеквадратичная ошибка того же приближения в «штатном режиме» работы оконечного каскада DDR, т.е. при условии, что адапторная часть ему не известна. Тогда благодаря свойству аддитивности квадрата нормы вектора7 «глобальная» ошибка восстановления АЕ, вычисленная по всем адапторам экзаменационной базы данных, соотносится с АЕа,а = \,2,...,А следующим образом: где Na - число экзаменационных прецедентов, попадающих внутрь Q.a, а N общее число таких прецедентов. Соотношение между ошибкой восстановления Ат, вычисленной по тем же адапторам в «штатном режиме» работы оконечного каскада, вычисляется по той же схеме (12): Назовем глобальной, эффективностью Eff кроссвалидационного алгоритма соотношение между приращением квадрата ошибки восстановления по всем доступным экзаменационным прецедентам в «штатном режиме» работы, когда их адаптеры неизвестны, и абсолютным минимумом ошибки восстановления, достигающимся в «тестовом режиме» при известных экзаменационных адапторах: Аналогично, локальная эффективность Effa определяется как 7 Имеется ввиду следующее: пусть вектор С состоит из элементов векторов а и Ь; тогда И2 ЧИ!2+1Н2

Сканирование зависимости локальной невязки от масштабного параметра конъюнкции

Понятно, что для практических задач гелиобиологии, связанных с выявлением взаимосвязей между биомедицинскими параметрами и обычной и космической погодой, понятие зависимости существенно локально. Например в работах [118, 119] выявлен, так сказать, «оконный» характер зависимости скорости роста планарии от частоты воздействующего на нее нанотеслового -2 -Ї Рис.4 Результат восстановления смоделированной поверхности. Верхний ряд: слева - исходная магнитного поля, т.е. данная зависимость идеальная поверхность, по центру - проявляется при частотах внутри наложен шум на все три координаты, определенных «окон» и теряется при восстановленной зависимости. Нижний ряд: слева - исходная идеальная поверхность, по центру -удалены 96% измеренных точек, справа - графическое представление выходе частоты из такого «окна». Так что все рассуждения касательно наличия или отсутствия взаимосвязи между предикторами и адаптерами применимы только в пределах некоторой области справа - графическое представление (конъюнкции), содержащей в себе восстановленной зависимости [36, заданную точку х- Тогда мы говорим, 117,120]. что вблизи значений предикторов х зависимость существует. Локальное измерение є{х- Р) как функции масштабного параметра р мы будем называть кроссвалидационным сканированием.

Последнее производится модулем сравнения алгоритма DDR, который при помощи рандомизации разбивает базу данных прецедентов на обучающую и экзаменационную части, примерно равные друг другу и, задавая оконечному каскаду последовательные значения р и матрицу экзаменационных предикторов, сравнивает полученные оконечным каскадом оценки экзаменационных адаптеров в пределах конъюнкции, содержащей j, с их реальными значениями, сканируя таким образом кривую є(х,р). Понятно, что конкретное значение є{х,р) зависит от характера разбиения, поэтому кривая є{%,р) сканируется несколько раз и в качестве окончательного результата используется усредненная зависимость. Рассмотрим вначале более подробно типичный результат кроссвалидационного сканирования (Рис.5). При чрезвычайно малых значениях масштабного параметра р в конъюнкцию попадает слишком мало прецедентов, чтобы задача линейного восстановления в пределах конъюнкции была корректной. Поэтому в качестве оценки у в этой ситуации используется наилучшее константное приближение, т.е. среднее значение у по всем адапторам. Таким образом, є{х,0) = 0. Затем по мере возрастания параметра р число прецедентов внутри конъюнкции возрастает, но из-за наличия шума в зависимости y = F(x) невязка є некоторое время растет, поскольку неустойчивость любой степенной зависимости к действию шума растет со степенью этой зависимости, линейное приближение внутри конъюнкции при наличии шума оказывается хуже приближения нулевого порядка. Затем выборка становится состоятельной для корректной фильтрации шума, и є падает до тех пор, пока размеры конъюнкции не станут сравнимы с радиусами нелинейности зависимости F{x) вблизи #, и тогда невязка снова начинает расти. Соотношение между величиной «горба» и размером углубления («Шумом» и «Сигналом» на Рис.5) позволяет ввести условную характеристику эффективности работы алгоритма DDR10, называемую соотношением «Шум / Сигнал». Эта характеристика широко известна в радиофизике и других областях научной деятельности, работающих в классе линейных оценок. Данная работа показывает, что подобное соотношение вполне имеет право на существование в гелиобиологии, где подавляющая часть зависимостей существенно нелинейна. Кстати, нелинейность зависимости, как видно из того же Рис.5, так же поддается оцениванию. В самом деле, возрастание невязки є{%,р) по отношению к ее минимальному значению происходит не бесконечно -когда размер конъюнкции становится достаточно большим, все адаптеры приближаются одной и той же гиперплоскостью. Естественно, ошибка такого Равенство в соотношении (24) достигается, если зависимость у = F(x) является линейной. Поэтому высота подъема кривой є(%,р) после прохождения ею минимального значения локальной невязки взаимодействия е\Х,рор1) отражает степень нелинейности F(x) (РИС.4). Таким образом, помимо прямой задачи определения оптимального значения масштабного параметра конъюнкции р, кроссвалидационное сканирование отвечает на ряд существенных для гелиобиологических исследований дополнительных вопросов, а именно: 1. Насколько сильно зависит адаптор от заданной конфигурации предикторов? 2. Какова степень зашумленности взаимосвязи? 3.

Насколько некорректным является допущение о линейности зависимости? Для лучшего понимания особенностей процедуры локального кроссвалидационного сканирования рассмотрим один практический пример явной одномерной зависимости, которая имеет место уже хотя бы из контекстных соображений, а именно - взаимосвязь курса евро по отношению к доллару с ценами на нефть основной торгуемой марки Ice Brent. На Рис.6 вверху изображены scatter-диаграмма исходных прецедентов (облако зеленых точек) и график восстановленной зависимости (красный) - по горизонтальной оси отложена цена за баррель нефти (X), по вертикальной - стоимость одного евро в долларах (У). Снизу того же рисунка показаны две кроссвалидационные диаграммы, построенные для двух точек на красном графике вверху, соответствующих ситуациям, когда нефть стоила 44.44 и 64.42 доллара за баррель, а евро (исходя из оценок DDR) должен был стоить 1.283 и 1.397 доллара соответственно. Как уже было сказано, результат сканирования графика локальной невязки е{х,р) зависит от разбиения исходной базы прецедентов на обучающую и экзаменационную части, которое происходит рандомизированно11. Поэтому представление о достоверности процедуры кроссвалидации можно получить только исходя из анализа пучка кривых зависимости є{х,р), полученных при разных актах разбиения. Таким образом, каждая зависимость є(%,р) получается в результате цепочки процедур разбиения и последующего сканирования, и поскольку эти процессы чрезвычайно ресурсоемки, то за разумное время вычислений возможно получить лишь весьма ограниченное количество кривых є{х р) В пучке.

На настоящий момент модуль сравнения в алгоритме DDR сканирует десять кривых в пучке. Они изображены на Рис.6 внизу. В соответствии со схемой на Рис.5 и выкладками подраздела 2.2 (см. формулу (22)), при небольших значениях масштабного параметра конъюнкции р процедура кроссвалидации не дает достоверных результатов, поэтому кривые є{%,р) в пучке сильно отличаются друг от друга. Более того, зашумленность анализируемой зависимости столь велика, что верхняя часть кроссвалидационных кривых на Рис.6 не видна. По мере роста р кривые E{Z,P) идут вниз и собираются вместе. Это означает, что результат процедуры кроссвалидации при данном р (в нашем случае для обеих точек % это значение /? = 0.08) практически перестал зависеть от характера разбиения, т.е. линейное приближение зависимости в масштабах конъюнкции вблизи выбранных точек х адекватно описывает реальность. Дальнейшее повышение масштабного параметра р приводит к тому, что размеры конъюнкции становятся сравнимы с радиусами нелинейности зависимости — кроссвалидационные кривые идут вверх и расходятся, что свидетельствует о несостоятельности линейного приближения внутри конъюнкции. Важную информацию о степени связанности предикторов и адаптора несут значения минимумов локальной невязки взаимодействия — они равны -0.7 и -0.9 соответственно. Отсюда следует, что в точке х = 44.44, исходя из формулы (23), принятие гипотезы о зависимости адаптора от предиктора понижает

Ассоциативное сканирование глобального правдоподобия. Кроссвалидационная петля

Оконечный каскад модуля распознавания получает на вход вектор размеров конъюнкции d и значение константы с (см. формулу (14)), после чего строит удовлетворяющее априорным условиям критическое множество G. При этом у него нет возможности проверить оптимальность переданной ему пары [d,c]. Однако, аналогично ситуации, изложенной нами ранее в Разделе 2, именно от последней зависит успех применения конъюнкционального алгоритма. Действительно, при больших размерах d нарушается условие линейного приближения (3), а при малых - условие достаточности статистики п(х)»1. Точно так же, большие значения константы с приводят к экстремальному сокращению критической области, а малые - к ее неоправданному расширению. Для решения проблем оптимизации {d, с} мы поступим так же, как и в Разделе 2: а именно, разобьем выборки прецедентов из класса 1 (X) и из класса 2 (У) на две равные части: обучающую, обозначенную индексом "Т", и экзаменационную, обозначенную индексом "Е". Таким образом, мы будем иметь четыре группы прецедентов - Хт, ХЕ, YT и YE. Две обучающие выборки Хт и YT прецедентов из обоих классов служат для определения принадлежности точки, в которой находится вектор признаков прецедентов из экзаменационной выборки ХЕ или YE, к критической области G - при заданном значении константы с в каждой такой точке вычисляется локальное отношение правдоподобия (14) и сравнивается со значением с, после чего на основе вычисления т.н. индикаторной функции /(/), где индекс і обозначает номер прецедента в экзаменационной базе данных, а / - значение локального отношения правдоподобия, принимается решение - принадлежит данный прецедент критической области G или же нет.

Сумму индикаторных функций /,(/) по всем индексам /, принадлежащим Говорят, что в этом случае вектор признаков четко ассоциируется с критической областью. Однако такой выбор индикаторной функции является частным случаем нечеткой ассоциации [130], когда индикаторная функция выглядит как сигмовидная кривая на Рис.9, параметром релаксации по с у которой является величина S. Т.е. если вектор признаков находится вблизи (S как раз и отвечает за понятие близости) границы критической области, значение /](/), которое трактуется как степень ассоциации точки с критической областью, примерно равно 0.5. С удалением точки вглубь критической области /.(/) принимает значения, близкие к единице - точка начинает четко ассоциироваться с критической областью; с удалением точки от границ критической области значения /(/) становятся близки к Рис.9 Индикаторная функция, построенная нулю - точка вовсе перестает на принципе нечетких ассоциаций ассоциироваться с критической областью. Такой выбор обобщенной индикаторной функции позволяет эффективно управлять визуализацией зависимостей глобального правдоподобия от параметров [d, с} при рандомизированном варьировании разбиения базы данных прецедентов на обучающую и экзаменационную часть - зависимости Good (d, с) и Bad (d, с) с ростом S начинают как бы идти ближе друг к другу, что позволяет выявлять общие закономерности поведения этих зависимостей, не связанное с особенностями конкретного разбиения. Итак, характеристика Good показывает, сколько прецедентов из класса 1 ассоциируется с критической областью. Понятно, что чем больше значение этой величины, тем лучше - этому обстоятельству она обязана своим названием5. Характеристика Bad показывает, сколько прецедентов из класса 2 ассоциируется с критической областью, и большое значение этой величины отрицательно сказывается на алгоритме распознавания (растет ошибка второго рода). Поиск оптимальных размеров конъюнкции осуществляется при помощи кроссвалидационпой петли, организованной аналогично описанной в разделе 2, но с одной незначительной особенностью - при заданных размерах d приходится оптимизировать еще и значение константы с. К счастью, последняя задача решается достаточно просто - достаточно заметить, что зависимость характеристик глобального правдоподобия от с при фиксированном наборе параметров d монотонно не возрастает (Рис.10 вверху)).

В самом деле, критические области Gf(c) при возрастании с обладают монотонной вложенностью друг в друга, а потому точки, ассоциированные с областью G(ci), при с1 с2 будут не в меньшей степени ассоциироваться с областью Gf(c2). Ели обозначить за NiXE общее количество прецедентов класса 1 в экзаменационной базе данных, то оптимальным будет наибольшее значение с, при котором еще выполняется неравенство /-кг П - при этих условиях отвечающая за вероятность ошибки / 1У ХЕ второго рода характеристика Bad минимальна. На принципиальной схеме изображена работа алгоритма. В начале делается экспертная оценка принадлежности прецедентов к классам исходя из их откликов. Затем рандомизированно выбирается масштабы конъюнкции и порог локального правдоподобия, и экспертно выбирается верхняя граница параметра Bad. Затем значения изначально выбранных параметров корректируются при помощи кроссвалидационной "Good" по-английски означает «хорошо», a "Bad" - «плохо» (примечание для полиглотов).

Похожие диссертации на Исследование солнечно-земных связей с помощью оптимизационных алгоритмов