Содержание к диссертации
Введение
I. Этапы систематизации и передачи радиометеорологической информации
1.1. Общие принципы пространственного сопоставления радиометеорологической информации 12
1.2. База данных, как метод упорядочивания разнородной информации 14
1.3. Передача радиолокационной и метеорологической информации по существующим каналам связи 18
1.4. Выводы 26
II. Использование таксономического подхода и базы данных для сопоставления радиолокационной и другой информации
2.1. Метод сопоставления радиолокационной и другой информации 27
2.2. База радиолокационных данных. Принципы и алгоритмы архивации и систематизации радиолокационных параметров 34
2.3. Метод распознавания изображения и ввода картографической информации в базу данных 49
2.4. Методика приема и архивирования спутниковой информации 56
2.5. Выводы 65
III. Исследование и систематизация градовых процессов, с использованием принципов таксономии
3.1. Условия возникновения и места зарождения града 67
3.2. Определение локальных максимумов для мест зарождения града 75
3.3. Кластерный анализ районов зарождения градовых процессов 79
3.4. Корреляция направлений перемещения градового облака и ведущего потока 88
3.5. Выводы 97
IV. Использование таксономических принципов в разработке информационных систем метеорологического назначения
4.1. Информационно-поисковая метеорологическая система 99
4.2. Метод прогноза зарождения и перемещения градовых процессов 103
4.3. Оперативный прогноз паводков на водосборе р. Нальчик, на основе таксономического подхода 108
4.4. Выводы 114
Заключение 116
Литература 118
- База данных, как метод упорядочивания разнородной информации
- База радиолокационных данных. Принципы и алгоритмы архивации и систематизации радиолокационных параметров
- Определение локальных максимумов для мест зарождения града
- Метод прогноза зарождения и перемещения градовых процессов
Введение к работе
Грозы, град, ливни, паводки, сели и другие опасные метеорологические явления наносят огромный урон народному хозяйству страны. С незапамятных времен человечество стремилось найти пути преодоления этих негативных явлений погоды. Научные основы их прогнозирования еще далеки от совершенства. Это связано с необычайной сложностью атмосферных процессов. Их формирование и развитие зависит от множества факторов, учесть и определить количественный вклад которых очень сложно.
Моделировать эти процессы, а так же воспроизводить их в лабораторных условиях, учитывая все многообразие и взаимообусловленность, весьма затруднительно. Сложность проблемы для нашего региона заключается еще и в том, что опасные явления локальны, наблюдаются, как правило, в горных и предгорных районах, имеющих малую аэрологическую и метеорологическую освещенность.
Для успешного прогноза развития облачности, в том числе опасных явлений погоды, необходима обработка разнородных данных, отличающихся по форме и содержанию. Данные могут быть получены в результате оперативных инструментальных "точечных" или "площадных" измерений облаков и атмосферы в целом (радиолокационных, наземных, синоптических, спутниковых и т. д.) и предварительного сбора информации о состоянии рельефа и подстилающей поверхности из различных источников: карт местности, кадастров, справочной литературы и т.д. Существенен также вопрос наглядного представления на мониторе или других носителях разнородной информации для прогноза дальнейшего развития облачности или анализа ситуации и оперативного реагирования на опасные явления.
Эти вопросы могут быть решены за счет применения ЭВМ и современных средств обработки и выбора удобного способа пространственной привязки всех данных, обеспечивающих полноту, наглядность и оперативность их представления. Реально данные наблюдений и измерений могут быть привязаны к узлам регулярной сетки. В результате формируются равномерно распределенные в пространстве поля данных, которые на заданной территории могут быть представлены своими осредненными (или максимальными, минимальными и т.д.) значениями. Благодаря этому к элементарной пространственной ячейке - таксону [89] могут быть отнесены данные различных средств наблюдения одного или нескольких источников, как однотипных, так и различных. То есть таксон может служить средством пространственного согласования данных различных средств наблюдения.
Согласование следует рассматривать как начальный этап комплексного анализа, поскольку в последующем к упорядоченной по территориальным элементам информации могут быть применимы различные методы математической обработки данных.
Очевидно, что широкое внедрение вычислительных средств математики и ЭВМ, в частности методов сбора и анализа разнородных данных, в практику геофизического мониторинга и прогноза опасных явлений погоды возможно лишь тогда, когда их действенность будет продемонстрирована при изучении фактического материала. Применение специальных программных и технических средств позволит собирать и обрабатывать необходимые данные.
Для достижения такой цели необходимо разработать новое программное обеспечение или доработать уже имеющееся до конечной реализации.
Объектом исследования являются опасные гидрометеорологические явления, связанные с развитием мощной конвективной облачности.
Предметом исследования являются автоматизированный анализ и прогноз опасных явлений погоды, основанные на комплексном использовании разнородной информации.
Целью настоящей работы являются исследования мощных конвективных облаков, основанные на таксономическом сопряжении разнородной метеорологической информации, для анализа и прогноза опасных явлений погоды.
Для достижения поставленной цели в работе решены следующие задачи:
• разработан таксономический метод сопряжения радиолокационной, метеорологической и другой информации, включающий в себя метеорологическую базу данных, в которую входят радиолокационные параметры облаков, прогнозы погоды на день, водосборы рек, ландшафты, географические объекты, высоты местности, спутниковые карты погоды, наземные данные и с/х культуры для КБР и прилегающих территорий;
• разработан алгоритм распознавания и автоматизированного ввода картографической информации и спутниковых карт в базу данных;
• разработан метод передачи радиометеорологической информации по GPRS каналу в условиях горной местности на центральный компьютер;
• разработан алгоритм накопления радиолокационной информации в базе данных;
• исследованы градовые процессы по местам зарождения и траекториям перемещения на территории КБР, в результате чего выявлены три области зарождения «А», «В» и «С»;
• проведен сравнительный анализ и установлены соответствующие корреляционные связи между направлением и скоростью перемещения градовых облаков с направлением и скоростью воздушных потоков для каждой области;
• разработан метод прогноза зарождения и перемещения градовых процессов на основе таксономического сопряжения радиолокационной, аэросиноптической информации и прогностических соотношений по каждой области;
• разработана автоматизированная методика выявления градовых процессов-«близнецов»;
• на основе радиолокационной и других видов информации (метеорологической, аэросиноптической, спутниковой) разработаны алгоритмы и принципы работы информационно-поисковой метеорологической системы.
• разработана технология оперативного прогноза дождевых паводков на водосборах горных рек на основе таксономического метода сопряжения радиолокационной и другой информации.
Научная новизна полученных результатов:
• впервые проведена объективная территориальная классификация мощных градовых процессов, зарождающихся на территории КБР и прилегающих районов;
• впервые по результатам кластерного анализа всех случаев зарождения градовых процессов на исследуемой территории выявлены три неравномерных области разной активности «А», «В» и «С», различающиеся и по синоптико-географическому положению;
• впервые получены прогностические соотношения, отражающие связь между направлением и скоростью перемещения градовых облаков с направлением и скоростью перемещения ведущего потока по каждой области;
• разработан метод прогноза зарождения и перемещения градовых процессов на основе таксономического сопряжения радиолокационной и аэросиноптической информации, с привлечением полученных прогностических соотношений;
• разработана методика выявления градовых процессов-«близнецов», основанная на автоматизированном поиске по местам их зарождения и траекториям перемещения. Проведена апробация предлагаемой методики;
• предложен метод прогноза мощных градовых процессов за счет автоматизированного поиска дней-аналогов;
• предложена технология оперативного прогноза дождевых паводков на водосборах горных рек на основе таксономического метода сопряжения радиолокационной и другой информации.
Научная и практическая значимость результатов:
• результаты исследований траекторий перемещения и мест зарождения градовых процессов могут быть использованы в научной практике для комплексного прогноза опасных природных метеорологических явлений (града);
• технология оперативного прогноза дождевых паводков на водосборах горных рек, может быть использована в службах оповещения населения о наводнении/паводке для предотвращения ущерба;
• метод прогноза зарождения и перемещения градовых процессов на основе таксономического сопряжения радиолокационной и аэросиноптической информации, может быть использован в совокупности с другими методами прогноза для их уточнения различными метеослужбами и смежными организациями (МЧС, Гидрометцентр, Минприроды);
• алгоритмы и принципы работы информационно-поисковой метеорологической системы, могут быть использованы в структурных подразделениях Росгидромета, занимающихся прогнозом и изучением опасных природных явлений (град, наводнение, паводки и др.); Основные положения, выносимые на защиту:
• таксономический метод сопряжения радиолокационной и другой информации;
• области зарождения градовых процессов на территории КБР и прилегающих районов;
• прогностические соотношения, отражающие связь между направлением и скоростью перемещения градовых облаков с направлением и скоростью перемещения ведущего потока;
• метод прогноза зарождения и перемещения градовых процессов на основе таксономического сопряжения радиолокационной и аэросиноптической информации;
• методика выявления градовых процессов-«близнецов», основанная на автоматизированном поиске по местам их зарождения и траекториям перемещения; Личный вклад автора: Автором диссертации выполнены исследования мощных градовых процессов на основе архивных и оперативных радиолокационных данных по местам зарождения и траекториям перемещения градовых процессов.
Выявлены 3 области зарождения градовых облаков, получены прогностические соотношения траектории перемещения и скорости градовых облаков по каждой области, разработан метод прогноза зарождения и траектории перемещения градовых облаков и проведена апробация на основе полученных соотношений.
Совместно с сотрудниками ОАВ ГУ «ВГИ» были выполнены: разработка программных средств; усовершенствование и дополнение автоматизированной радиолокационной системы АСУ «Антиград» алгоритмами накопления радиолокационных и других параметров в базу данных.
Материалы по радиолокационным данным, используемых в диссертационной работе, были получены автором при выполнении НИР на научно-исследовательском полигоне ВГИ в 2004-2008 гг. и из архивов.
Метеорологические данные взяты из Интернета по материалам спутниковых наблюдений и «Атласа природных опасностей и стихийных бедствий КБР».
Апробация работы: Основные результаты диссертации докладывались на:
• V конференции молодых ученых аспирантов и студентов (г. Нальчик, КБНЦРАН,2004г.);
• Всероссийской научной конференции по физике облаков и активным воздействиям (г. Нальчик, ГУ «ВГИ», 2006 г.);
• Всероссийской научной конференции по селям и паводкам (г. Нальчик, ГУ «ВГИ» 2005 г.);
• VII конференции молодых ученых аспирантов и студентов (г. Нальчик, КБНЦ РАН, 2006 г.);
• II конференции молодых ученых национальных гидрометслужб государств-участников СНГ «Новые методы и технологии в гидрометеорологии» (г. Москва, Росгидромет, 2006 г.);
• Научно-практической конференции, посвященной 40-летию начала производственных работ по защите сельхозкультур от градобитий (г.
Нальчик, ГУ «ВГИ», 2007 г.).
• в Известиях ВУЗов Северо-Кавказского региона, 2007 г.
Публикации. По материалам диссертации опубликовано 11 научных работ, в том числе в рецензируемых изданиях из перечня ВАК. Объем и структура диссертации: Работа состоит из введения, четырёх глав, заключения и списка литературы.
В первой главе рассматриваются общие принципы сопоставления радиолокационной и метеорологической информации, пространственной привязки радиолокационной информации к регулярной сетке и база данных (БД) как метод упорядочивания различной информации, а также применена технология GPRS для передачи радиометеорологической информации в горных условиях.
Во второй главе рассматриваются принципы представления и согласования радиолокационной и другой информации, показан принцип работы таксономического подхода для сопоставления разнородной информации. Представлены технология приема и обработки радиолокационной информации программно-аппаратным комплексом, алгоритмы архивации и систематизации радиолокационных параметров. Вся собираемая информация находится в единой базе данных, приводится ее структура, взаимосвязь первичных и внешних ключей таблиц. Показана технология получения и распознавания картографической информации на основе существующей программы MagicMap. Предложены алгоритмы распознавания карт с последующим вводом их в базу данных и алгоритм разбиения географического пространства на таксоны. Представлена технология сбора и накопления спутниковой метеорологической информации с использованием сети Интернет и программы Teleport Pro, которая скачивает метеорологические и прогностические карты.
Третья глава посвящена исследованиям и систематизации градовых процессов. Рассмотрены условия возникновения и места зарождения града.
Показан алгоритм поиска локальных максимумов для мест зарождения града.
Алгоритм работает с данными грозо-градовых процессов, собранными с 60-х по
90-е гг., а также с данными, полученными по радиолокационным измерениям.
Выделены 3 области (кластеры) мест зарождения града, полученные с помощью кластерного анализа. Показана корреляция направлений перемещения градового облака и ведущего потока. Приведены уравнения регрессии и графики зависимости направления движения и скорости облаков от направления и скорости ведущего потока. Разработана блок-схема прогноза по данным о перемещении, скорости и времени «жизни» градовой ячейки.
Получены результаты прогноза по разработанному алгоритму и прогностическим формулам.
В четвертой главе показаны принципы работы информационных систем различного назначения с использованием радиолокационных и других данных.
Разработана информационно-поисковая метеорологическая система, общая схема ее работы и взаимодействия со сторонними пользователями, входные данные и примеры результатов программных запросов к БД. Разработана автоматизированная методика выявления градовых«близнецов». Данная методика апробирована и выявила 9 процессов«близнецов» по динамическим характеристикам. Предложен метод прогноза мощных градовых процессов за счет автоматизированного поиска дней аналогов.
Предложена технология оперативного прогноза дождевых паводков на водосборах горных рек на основе таксономического подхода. Преимущество данной технологии обусловлено разбиением территории водосбора на соответствующие таксоны. Это позволяет отслеживать накопление осадков на каждом таксоне водосбора.
В заключении приводятся основные выводы и результаты работы, полученные в диссертации.
I. ЭТАПЫ СИСТЕМАТИЗАЦИИ И ПЕРЕДАЧИ РАДИОМЕТЕОРОЛОГИЧЕСКОЙ ИНФОРМАЦИИ
База данных, как метод упорядочивания разнородной информации
Для оптимальной системной упорядоченности различной информации используют базы данных. Рассмотрим их более детально. База данных (БД) - это совокупность набора связанных данных, организованных по определенным правилам, предусматривающим общие принципы описания, хранения и манипулирования, и независимых от прикладных программ. БД является информационной моделью предметной области [71-73]. Обращение к БД осуществляется с помощью системы управления базами данных (СУБД). СУБД обеспечивает создание БД, централизованного управления и организации доступа к ним различных пользователей. На уровне физической модели электронная БД представляет собой файл или набор файлов либо в формате TXT, CSV, XLS, DBF, XML, либо в специализированном формате конкретной СУБД. Также в СУБД понятие физической модели включает специализированные виртуальные понятия, такие как таблица.
Несмотря на существование различных типов БД [49], большинство данных хранится именно в реляционных БД. Реляционная БД представляет собой совокупность специальным образом организованных данных. Кроме того, элементы этих данных могут быть связаны с элементами данных других логических групп, что называется отношениями (relations).
Основой реляционной БД является таблица. Таблица используется для логической группировки данных. Каждая таблица предназначена для хранения данных определенного типа. Каждая таблица имеет строки (записи) и столбцы (колонки). Каждая строка таблицы имеет одинаковую структуру и состоит из полей. Строкам таблицы соответствуют кортежи, а столбцам - атрибуты отношений. Любая реляционная БД содержит индексы, индексные поля. Индекс это объект БД, создаваемый с целью повышения производительности выполнения запросов [20, 95]. Таблицы в базе данных могут иметь большое количество строк, которые хранятся в произвольном порядке, и их поиск по заданному значению путем последовательного просмотра таблицы строка за строкой может занимать много времени.. Индекс формируется из значений одного или нескольких столбцов таблицы и указателей на соответствующие строки таблицы и, таким образом, позволяет находить нужную строку по заданному значению. Ускорение работы с использованием индексов достигается в первую очередь за счёт того, что индекс имеет структуру, оптимизированную под поиск, - например, сбалансированного дерева. Кроме того, индексы могут быть объявлены как уникальные и неуникальные. Уникальный индекс реализует ограничение целостности на таблице, исключая возможность вставки повторяющихся значений. В таблице может быть несколько индексов, но один из них всегда является первичным, остальные будут внешними. Первичный ключ обозначает поле (столбец), значение которого используется в качестве уникального идентификатора записи (строки) этой таблицы. Обычно первичные поля - это ID (Identification) поля. В каждой таблице имеется свое ID поле (автоинкрементное), оно всегда одно, и, как правило, индексируется именно это поле.
Первичный ключ в таблице является базовым уникальным идентификатором для записей. Значение первичного ключа используется везде, где нужно указать на конкретную запись. На использовании первичных ключей основана организация связей между таблицами реляционной БД. Чтобы организовать между двумя таблицами связь типа «один к одному» или «один ко многим», в одну из связываемых таблиц добавляют поле, содержащее значение первичного ключа записи в связанной таблице (такое поле называют внешним ключом). Для организации связи типа «многие ко многим» создают отдельную таблицу (так называемую «таблицу связи» или «таблицу ассоциации»), каждая запись которой содержит первичные ключи двух связанных записей в разных таблицах. Внешним ключом называется поле таблицы, предназначенное для хранения значения первичного ключа другой таблицы с целью организации связи между этими таблицами.
Другое необходимое условие любой реляционной БД - это ссылочная целостность, заключающаяся в отсутствии в любой её таблице внешних ключей, ссылающихся на несуществующие записи в этой или других таблицах.
Основным свойством любой реляционной базы данных является наличие связей между её таблицами. Связи в реляционной БД устанавливаются с помощью использования внешних ключей, т.е. для установления связи между записью в таблице А с определённой записью в таблице В. В одно из полей таблицы А записывается первичный ключ связанной с нею записи таблицы В. Таким образом, всегда имеется возможность выполнить две операции: определить, с какой записью в таблице В связана определённая запись таблицы А; найти все записи таблицы А, имеющие связи с определённой записью таблицы В.
Благодаря наличию связей в реляционной БД можно хранить данные об объектах в нормализованном виде, т.е. недопустимо наличие в базе избыточных функциональных зависимостей между атрибутами (полями таблиц). Другими словами, не допускается хранение внешних ключей в таблице В, тогда как в таблице А соответствующий ей первичный ключ отсутствует. Данные об одном объекте хранятся в нескольких таблицах, связанных ссылками. Но выделить все записи, относящиеся к нужному объекту, можно только тогда, когда соблюдается ссылочная целостность.
Для управления реляционной БД предпочтительней всего использовать язык структурированных запросов SQL [72, 86]. С помощью SOL программист или пользователь может просматривать, изменять и удалять данные, что является основой самого понятия СУБД. Наличие стандартов и набора тестов для выявления совместимости и соответствия конкретной реализации SOL общепринятому стандарту только способствует «стабилизации» языка. Несмотря на наличие диалектов и различий в синтаксисе, в большинстве своём тексты SOL запросов могут быть достаточно легко перенесены из одной СУБД в другую. Существуют системы, разработки которых изначально закладывались на применение, по меньшей мере, нескольких СУБД. Несмотря на наличие международного стандарта ANSI SOL-92, многие компании, занимающиеся разработкой СУБД (например, Oracle, Microsoft, MySQL, MySQL AB, Borland), вносят изменения в язык SOL, применяемый в разрабатываемой СУБД, тем самым, отступая от стандарта. Таким образом, появляются специфичные для каждой конкретной СУБД диалекты языка SQL.
База радиолокационных данных. Принципы и алгоритмы архивации и систематизации радиолокационных параметров
При проектировании базы радиолокационных данных необходимо было принять решение: БД какого типа следует разрабатывать. Из приведенных примеров и типов, описанных в предыдущей главе, а также обоснованности их выбора, было принято решение разработать БД реляционного типа распределенных данных. То есть, БД будет работать на сервере БД, а именно в MS SOL Server. Клиентской частью будет программно-аппаратный комплекс, назовем его АСУ «РЛС», запрограммированный на языке C++ при помощи среды разработки Microsoft Visual C++. В данном АСУ заложены алгоритмы первичной и вторичной обработки радиолокационной информации. То есть, оно управляет работой МРЛ-5, принимает и отдает команды посредством АДПЛДАП на уровне драйверов и через дружественный интерфейс работает с оператором. Используемые классы библиотеки MFC позволяют удачно применять механизмы передачи данных из SQL Server в среду нашей разработки и наоборот. В иерархии MFC есть класс базы данных {CDatabase) и класс наборов записей (CRecordSet). При помощи удобных мастеров, входящих в состав MS SQL Server были разработаны все таблицы и установлены связи; они также позволяют создавать запросы и отчеты.
Кратко опишем классы, использованные при разработке. Класс CDatabase предоставляет абстракцию соединения с базой данных ODBC. Прежде чем можно будет воспользоваться большинством других классов и методов базы данных, потребуется открыть объект CDatabase при помощи функции ОрепЕх. По завершению работы с соединением метод Close освобождает ресурсы. Класс CRecordSet инкапсулирует группу подобных записей, обычно записей таблицы базы данных или записей, возвращаемых в результате выполнения запроса. Этот класс позволяет изолировать свою программную логику от реального SQL, необходимого для выборки, вставки, удаления или обновления строк в базе данных. При определении аппаратной платформы обработки данных нужно исходить из реальных возможностей конкретного пункта наблюдения. При этом могут быть применены две схемы реализации системы управления данными. На рис. 2.3 представлена схема организации информационной системы, работающая на одном компьютере. Такая система называется локальной или однопользовательской. Ее еще называют файл - серверная архитектура. Физически система организована следующим образом: на компьютере, входящем в состав автоматизированного радиолокационного комплекса, устанавливается база данных. Рис 2.3. Схема организации базы данных на одном компьютере (локально). Обработанная радиолокационная информация, получаемая с радиолокатора, пополняется соответствующими данными таблицы БД. На рис. 2.4 представлена более перспективная архитектура клиент - сервер. Эта структура предполагает наличие компьютерной сети и распределенной базы данных. При этом информация хранится и обрабатывается на отдельном мощном компьютере - сервере БД, а клиенты посредством локальной сети и установленной клиентской части на своем ПК обмениваются с БД SQL-запросами. На уровне команд БД клиентская часть может добавлять, удалять или изменять информацию. Сервер БД Рис. 2.4. Схема организации удаленной БД (клиент-серверная архитектура). Достоинством организации информационной системы по архитектуре клиент - сервер является удачное сочетание централизованного хранения, обслуживания и коллективного доступа к общей корпоративной информации с индивидуальной работой потребителей над персональной информацией.
Разработанная БД может работать в файл-серверной и клиент-серверной архитектурах [12, 13]. Поскольку на сегодняшний день нет необходимости и потребности в подключении нескольких пользователей к базе, то в данный момент она работает как однопользовательская БД для сбора радиолокационных параметров в оперативном или архивном режимах. На рис. 2.5 показан принцип работы БД; радиолокационные данные и графические образы метеообъектов поступают в БД при выделении их курсором [16]. Сама БД расположена на SQL-сервере. Оператор-прогнозист обращается к БД при помощи запросов, БД в свою очередь выдает результат запроса в виде таблицы, удовлетворяющей этому запросу. Также этими данными может воспользоваться и некий потребитель. Помимо радиолокационных параметров, в БД содержаться картографические данные (административные районы, растительность, с/х культуры, ландшафты, селевые очаги) и данные с метеорологических геостационарных спутников. Подробные механизмы получения данных и пополнения БД описаны в следующих параграфах данной главы. Рис. 2.5. Схема взаимодействия пользователей, АСУ «РЛС» и SQL - сервера с БД. Структура метеорологической БД представлена на рис. 2.6. Спутников " карты Дата Время Номер ич Zmax2 Hzmaxl H2inai2 Z55 245 Тип осадков Поток энерт Тип панд шаф та Дата Время Карты Назем, данные Время Давление Влажность Напр вед. поі Скор оед пот Напр ветра Скор Ветра Нас пункт Граница Дорога Высота макс Высота мин. Высота сред. Рис. 2.6. Мифологическая модель метеорологической БД. Как видно из рисунка, БД состоит из 10 таблиц, которые имеют общие логические связи через внешние индексы. Каждая таблица, как указывалось выше, имеет свое ключевое поле, в данном случае это поле ID. Это -автоинкрементное поле, то есть, при добавлении очередной записи в таблицу это поле автоматически создается с приращением на единицу. Таким образом, каждая запись таблицы имеет уникальный номер и ни при каких обстоятельствах не повторяется.
Определение локальных максимумов для мест зарождения града
Поиск локального максимума заключается в отыскании мест наиболее частого зарождения градовых процессов. Необходимо выяснить, в какой таксон больше всего попало градовых облаков. Поиск максимума проводится среди 8-ми соседних таксонов и по каждому из них. Рассмотрим работу алгоритма (рис. 3.5.). В цикле (3) происходит проверка на конец массива. Элементами массива являются значения таксонов, то есть количество зародившихся градовых облаков. Затем на 4-м шаге выбираем я# таксон. Сравниваем его с соседними 8-ю таксонами, а именно: %./ -/, ад./, щ+іьі, Щ-іь %+ifc %-/ +/, Щк и %+/ +/ Поскольку сравнение всех 8-ми таксонов довольно объемное, то в блоке условия (5) показана основная цель сравнения, т.е. выявление максимума среди 8-ми. Далее в (6), если условие выполнилось, то счетчику s присваиваем 1. И следующим шагом (7) запоминаем координаты максимума ms = j и ns = к. Затем в блоке условия (8) проверяем, не вышли ли индексы массива за пределы последнего столбца, если «да», то проверяем и индекс по строкам. Переменная L равна количеству строк /столбцов по горизонтали или вертикали. И может быть равна 52, 26 или 13, в зависимости от выбора размера таксона п (5x5, 10x10 или 20x20 км). Если условия (8) и (9) выполняются, то это значит, все элементы массива перебраны и результат выводим на экран: количество максимумов и их координаты. Если же условие не выполняется, то в соответствующих ветках условия (8) и (9) наращиваем шаг цикла на 1, т.е. переходим на следующий таксон для очередного сравнения.
Таким образом, получаем набор количества зародившихся градовых процессов с локальными максимумами. В процессе исследования количества зарождений и работы алгоритма поиска максимума зарождений в таксонах 10x10 было выяснено, что большая часть градовых процессов сконцентрирована в междуречье верховий Кубани и Малки: таксоны (5,13), (5,14), (6,13), (6,14) и (7,15), (7,16), (8,15), (8,16). В остальных таксонах зарегистрировано небольшое количество зарождений. В связи с этим при поиске локальных максимумов получаются ложные, они появляются при сравнении с «пустыми» (нулевыми) таксонами, с теми, в которых вообще не было зарождений. Поэтому следует увеличить площадь таксона до 20x20 км или 30x30 км.
При переходе таксона размерности с 10x10 км на 20x20 км следует номер столбца j и строки к делить на 2, причем если у или к нечетное, то округляем результат до целого старшего, например, таксон (5,14) будет иметь координаты (3,7) для сетки 20x20 км.
Принцип перехода с 10x10 км на 30x30 км аналогичен, как и при 20x20 км, с той разницей, что j и. к делятся на 3. При выборе площади 30x30 км получается один большой максимум, который притягивает соседние таксоны, а при выборе таксона 20x20 км количество «пустых» таксонов резко сокращается, ложных максимумов практически не наблюдается, поэтому поиск локальных максимумов целесообразней проводить именно на этой площади. При переходе от размерности 10x10 км к размерности 20x20 км количество зарождений суммируется при объединении одних таксонов в другие.
Места зарождения градовых облаков на фоне карты КБР. Здесь четко выделяются три локальных максимума. Это таксон (4,8) -14,3%, таксоны (7,9) - 8,2% и (8,10) - 4,3%. Цветами обозначены количества зарождений и их места в процентном соотношении. На данной карте очень наглядно представлены очаги зарождений. При получении таких результатов возникает необходимость проведения кластерного анализа [53, 62, 74], который позволит выявить центры кластеров, их характеристики и свойства. Кластерный анализ предназначен для разбиения совокупности объектов на однородные группы (кластеры или классы). По сути, это задача многомерной классификации данных. Говоря более точно, кластерный метод представляет собой многомерную статистическую процедуру, выполняющую сбор данных, содержащих информацию о выборке объектов, и упорядочивающую объекты в сравнительно однородные группы.
При анализе и прогнозировании градовых явлений исследователь довольно часто сталкивается с многомерностью их описания [21, 77]. Это происходит при сравнении разных по типу и характеру развития градовых облачных систем, по достаточно большому числу показателей, при прогнозировании перемещения отдельных градовых ячеек и решении многих других проблем.
На полученной графически карте-схеме рис. 3.7, легко просматриваются территориальные области зарождений в нескольких таксонах. Это позволяет провести кластерный анализ, который позволит группировать процессы в кластеры для их статистического учета, регистрации, удобства работы с конвективными ячейками. Такое территориальное распределение необходимо для краткосрочного прогноза зарождения и траекторий перемещения градовых процессов.
Главное назначение кластерного анализа — разбиение множества исследуемых объектов и признаков на однородные в соответствующем понимании группы или кластеры. Это означает, что решается задача классификации данных и выявления соответствующей структуры в ней. Методы кластерного анализа можно применять в самых различных случаях, даже когда речь идет о простой группировке, в которой все сводится к образованию групп по количественному сходству. В нашем случае кластером будет считаться область из нескольких таксонов. Форма кластеров может быть различной. Они не должны пересекаться между собой.
Большое достоинство кластерного анализа в том, что он позволяет производить разбиение объектов не по одному параметру, а по целому набору признаков. Кроме того, кластерный анализ в отличие от большинства математико-статистических методов не накладывает никаких ограничений на вид рассматриваемых объектов и позволяет рассматривать множество исходных данных практически произвольного происхождения, исследовать достаточно большой объем информации и резко сокращать, сжимать большие массивы статистической информации, делая их компактными и наглядными. Кластерный анализ можно использовать циклически. В этом случае исследование производится до тех пор, пока не будут достигнуты необходимые результаты. При этом каждый цикл здесь может давать информацию, которая способна сильно изменить направленность и подходы дальнейшего применения кластерного анализа. Этот процесс можно представить системой с обратной связью.
Как и любой другой метод, кластерный анализ имеет определенные недостатки и ограничения: в частности, состав и количество кластеров зависит от выбираемых критериев разбиения. При сведении исходного массива данных к более компактному виду могут возникать определенные искажения, а также могут теряться индивидуальные черты отдельных объектов за счет замены их характеристиками обобщенных значений параметров кластера. При проведении классификации объектов игнорируется очень часто возможность отсутствия в рассматриваемой совокупности каких-либо значений кластеров [52, 62, 80].
Задача кластерного анализа заключается в том, чтобы на основании данных, содержащихся во множестве X таксонов, разбить множество объектов G на т (т - целое) кластеров (подмножеств) так, чтобы каждый объект Gj принадлежал одному и только одному подмножеству разбиения и чтобы объекты, принадлежащие одному и тому же кластеру, были сходными, в то время как объекты, принадлежащие разным кластерам, были разнородными.
Например, пусть G включает п кластеров, любой из которых характеризуется местом зарождения (Fj) и направлением перемещения (F2). Тогда Xi (вектор измерений) представляет собой набор указанных характеристик для первого кластера, обозначенного «кластер «А», Х2 - для второго — «В», Х3 - для «С». Задача заключается в том, чтобы разбить территорию градобития на кластеры, в которых зарождаются преимущественно все процессы.
Метод прогноза зарождения и перемещения градовых процессов
Использование метеорологической БД и проведенных исследований локальных мест зарождений и направлений перемещения дает хорошую основу для составления прогнозов зарождения и перемещения градовых процессов. За счет накапливаемой разнородной информации и разработанных программных средств составление прогноза не вызывает больших трудовых затрат. Метод заключается в решении двух задач: а) Поиск процессов «близнецов» 104 б) Поиск аналогичных дней с градом в БД по радиолокационным, метеорологическим, аэросиноптическим и спутниковым данным. Поскольку вторая задача требует наличия большой базы набора разнородных метеорологических данных, а в настоящий момент соответствующих данных не достаточно, поэтому метод работает по поиску процессов-«близнецов». Решение первой задачи состоит в поиске и отборе процессов с одинаковыми или близкими траекториями перемещения по таксонам на основе литературных источников [24, 40], архивных материалов и накопленных процессов по автоматизированным радиолокационным данным. Отбираем все процессы, зародившиеся в области «А». Затем отбираем (сортируем) процессы по трем направлениям - СЗ, 3, ЮЗ. Далее выбираем процессы северо-западного направления и отслеживаем перемещение по каждому таксону. Если есть процессы, у которых имеются общие таксоны от начала развития и до их диссипации, то устанавливаем, что коэффициент подобия равен 1 и оба этих процесса являются «близнецами». Степень подобия лежит в интервале [0,1]. Если же коэффициент не равен единице, то очевидно, что рассматриваемые процессы несколько трудно подпадают под термин «близнецы», за исключением тех, которые довольно длительны по жизни и расходятся на 1 или 2 таксона, такие процессы также можно отнести к «близнецам». Те же действия необходимо проделать для остальных направлений и областей («В» и «С»).
В результате проведенных исследований мощных градовых процессов и вычислений по архивным данным 1940-1950, 1960-2000 гг. и радиолокационным данным 2001-2007 гг. на предмет подобия, таковых было выявлено 9. По результатам вычисления была получена таблица 4.1, в которой подробно отражены идеальные процессы-«близнецы», таких выявлено 5, они в некоторой степени схожи по направлению перемещения.
Как показало исследование, наибольшее количество градовых процессов-«близнецов» зарождается на юго-западе КБР, которые, как правило, перемещаются в том же направлении без особенных отклонений. Этому свидетельствует рис. 4.5. На нем показаны основные трассы перемещения градовых процессов-«близнецов», зародившихся в областях «А» и «С».
Таким образом, табл. 4.1 и рис. 4.5 являются основным результатом первой задачи метода прогноза зарождения и перемещения градовых процессов.
Вторая задача заключается в отыскании аналогичных дней с радиолокационной, метеорологической, аэросиноптической и спутниковой обстановкой. Поиск будет осуществлен по данным автоматизированных радиолокационных измерений, спутниковым картам и радиозондам. Такая задача наиболее сложна и требует тщательного и обдуманного подхода в ее решении. Для этого требуется рассматриваемые метеорологические и другие характеристики привести к единому виду. Например, синоптические карты необходимо некоторым образом представить в табличной форме, т.е. те данные, которые графически представлены перевести в текстовый вид.
После этого обращаемся к БД для поиска аналогичных дней / процессов. Далее, если такие процессы найдены, то выводим таковые дни. И, наконец, последним шагом является непосредственно сам прогноз, находим дни и сравниваем, насколько они схожи с текущими. Выводятся соответствующие коэффициенты сходства (по месту зарождения, траектории перемещения и /или высоте верхней границы, высота максимальной отражаемости и т.д.).
За счет одновременного использования нескольких прогностических схем, можно получить определенное улучшение качества метеорологического обслуживания. Подобная процедура получила название комплексирования прогнозов [32, 91 ], причем в своей традиционной постановке эта задача предполагает изыскание путей повышения успешности предсказаний.
Для использования в гидрологических расчетах и прогнозах радиолокационных данных о поле осадков необходимо их пространственно сопоставлять с характеристиками водосбора реки. Такое сопоставление возможно при разбиении площади водосбора на таксоны, совпадающие с таксонами радиолокационного разбиения пространства [10, 11].
Протяженность р. Нальчик от истока до верхней окраины с. Хасанья (место впадения р. Нарития в р. Нальчик) составляет 26,5 км, площадь водосбора около 270 км". Правых притоков - три. Это реки: Белая, Нешбурка и Нарития. Левых притоков - пять. Это реки: Хара, Элекансу, Казансу и два безымянных притока. Водораздельная линия проходит по возвышенностям высотой от 2848 м (с. Сурх) до 520 м над уровнем моря. Средняя облесенность водосбора составляет 81 %, и она распределена неравномерно. В верховьях облесенность составляет 28 %, в среднем течении облесенность - 95 %, в нижнем — 40 %.