Содержание к диссертации
Введение
1. Радиолокационные характеристики кучеводовдевых облаков и методика их определения
1.1. Радиолокационные и аэрологические параметры, характеризующие кучево-дождевые облака 9
1.2. Применяемая радиолокационная аппаратура, методика сбора и обработки экспериментальных данных и точность определения радиолокационных параметров 24
1.3. Исследование информативности радиолокационных параметров 33
2. Применение методов математической статистики для решения задачи распознавания ливневых и градовых облаков по данным радиолокационных и аэрологических наблюдений
2.1. Существующие способы радиолокационного определения градоопасности кучево-дождевых облаков 38
2.2. Использование метода многомерной линейной регрессии для разделения ливневых и градовых облаков 46
2.3. Алгоритмы обучения распознаванию ливневых и градовых облаков 57
2.3.1. Алгоритм обучения распознаванию ливневых и градовых облаков, реализующий формулу Байеса 60
2.3.2. Алгоритм обучения распознаванию ливневых и градовых облаков, реализующий метод обобщенного портрета 74
3. Применение алгоритмов распознавания градоопас-ности облаков в практических работах по защите сельскохозяйственных культур от градобитий
3.1. Определение градоносности кучево-дождевых облаков с использованием уравнений многомер ной регрессии и решающих правил, полученных по формуле Байеса и методом обобщенного портрета 33
3.2. Выбор оптимального значения разделяющих функций с учетом минимума риска при проведении активных воздействий на градовые процессы 94
3.3. Распознавание градовых и ливневых облаков по совокупности решений нескольких алгоритмов одновременно 102
Заключение 105
- Применяемая радиолокационная аппаратура, методика сбора и обработки экспериментальных данных и точность определения радиолокационных параметров
- Использование метода многомерной линейной регрессии для разделения ливневых и градовых облаков
- Алгоритм обучения распознаванию ливневых и градовых облаков, реализующий метод обобщенного портрета
- Выбор оптимального значения разделяющих функций с учетом минимума риска при проведении активных воздействий на градовые процессы
Введение к работе
В 40-х годах нашего столетия многочисленными экспериментальными и теоретическими исследованиями было показано, что в таких атмосферных образованиях, как облака и осадки, происходит рассеивание и поглощение электромагнитных волн» Дальнейшие исследования показали, что отражения радиоволн определяются размерами, формой, фазовым состоянием и движением частиц осадков и облаков. В связи с этим радиолокационный метод стал мощным орудием для изучения облаков на разных стадиях их развития. С помощью радиолокационных станций стали измерять параметры, которые характеризуют формирование, развитие и выпадение осадков. Поэтому для метеорологических исследований были разработаны и сконструированы специальные радиолокационные системы. В результате образовалась и получила интенсивное развитие радиолокационная метеорология, с помощью которой успешно решаются многие вопросы физики атмосферы.
В связи с развитием работ по активному воздействию на облака с целью искусственного вызывания осадков, подавления грозовых и градовых явлений и др., стало необходимым выявление и определение таких параметров, которые характеризуют микрофизические процессы, происходящие при формировании и развитии вышеперечисленных явлений. Такие параметры можно измерить с помощью метеорологических радиолокаторов и на основе анализа полученных данных разработать методы дистанционного распознавания градоопасности облаков и вида осадков, выпадающих из них.
Решение этой задачи имеет важное научное и практическое значение. Эффективность защиты сельскохозяйственных культур от
градобитий во многом зависит от оперативности обнаружения и надежного определения градоопасности кучево-дождевых облаков, без чего невозможно обоснованно осуществить операцию искусственного воздействия,
В настоящее время разработаны методы борьбы с градом в Высокогорном геофизическом институте, в Институте геофизики АН ГССР, в Центральной аэрологической обсерватории, в Закавказском научно-исследовательском гидрометеорологическом институте, которые основываются на обнаружении градовых очагов радиолокационной станцией и измерении их характеристик. Эти методы успешно используются как в СССР, так и в зарубежных странах (НРБ, ВНР).
Как известно, образование и выпадение града обусловливается многими факторами. Учет и измерение их практически не представляется возможным, а отдельные параметры не дают возможности во всех случаях однозначно определить градоносность и потенциальную градоопасность конвективных облаков. Поэтому более рациональным представляется физико-статистический анализ совокупности данных некоторого комплекса характеристик, который позволит более полно реализовать диагноз состояния конвективной ячейки.
Целью настоящей диссертации является разработка оперативного метода распознавания градоопасности облаков, обладающего высокой степенью надежности на основе физико-статистического анализа данных многолетних радиолокационных и аэрологических измерений»
Для достижения поставленной цели необходимо было решить
следующие задачи:
критически проанализировать существующие методы оценки градоопасности облаков;
выявить и подобрать высокоинформативные параметры, характеризующие кучево-дождевые облака на различных этапах жизни их естественного развития;
отобрать оптимальный комплекс параметров для физико--статистического анализа;
разработать алгоритмы распознавания градоопасности облаков по совокупности значений комплекса параметров;
определить критериальные значения разделяющих функций градовых и ливневых облаков с учетом минимизации риска;
оценить степень надежности разработанных алгоритмов распознавания и выполнить их оптимизацию с учетом надежности и оперативности;
разработать способ применения полученных алгоритмов распознавания градоопасных облаков в практических работах по борьбе с градом.
Для решения поставленных задач физико-статистическому анализу с применением ЭВМ и современных методов математической статистики - подверглись многолетние данные полевых экспериментальных исследований, выполняемых Институтом геофизики АН Грузинской ССР в Алазанской долине с 1962 года в течении более чем 20 лет при непосредственном участии автора диссертации.
Отобранные для анализа материалы включают в себя измерения комплекса радиолокационных параметров 1650 отдельных ячеек кучево-дождевых облаков, данные трехразового температурно--ветрового зондирования атмосферы, производимого в Алазанской
долине на центральной экспериментальной базе в селе руиспири Телавского района Грузинской ССР, данные специальной учащенной градо-дождемерной сети, охватывающей территорию экспериментального полигона, данные метеосети и местных органов о градовых явлениях.
Диссертация состоит из трех глав,
В первой главе диссертации дается определение параметров, которые могут быть использованы для радиолокационной характеристики конвективных облаков, кратко описывается использованная в исследовании радиолокационная аппаратура, приводятся оценки систематических и случайных погрешностей измерений, рассмотрен вопрос методики сбора и обработки экспериментальных данных полевых работ, исследована информативность выбранных радиолокационных параметров.
Во второй главе рассмотрены способы определения градоопасности конвективных облаков, ранее разработанных как специалистами Института геофизики АН ГССР, так и другими исследователями.
На основе анализа данных радиолокационных и аэрологических измерений методом многомерной линейной регрессии получены диагностические уравнения определения вида ожидаемых осадков для семи и четырех предикторов.
С использованием формулы Байеса и метода обобщенного портрета разработаны решающие правила для определения градоопасности и градоносности конвективных облаков,
В этой же главе приводится с использованием экзаменационных выборок оценка надежности разработанных алгоритмов.
В третьей главе описываются способы практического применения разработанных алгоритмов распознавания градоопасности обла-
ков, определены критериальные значения разделяющих функций, при которых следует приступить к воздействию на облака с обеспечением возможного минимального экономического риска при проведении операций по борьбе с градом. Описывается предлагаемый способ для принятия решения о принадлежности облака к категории градовых или неградовых по совокупности решений всех алгоритмов распознавания одновременно на основе принципа мажоритарного выбора и производятся сравнения надежности отдельных алгоритмов классификации конвективных облаков.
Применяемая радиолокационная аппаратура, методика сбора и обработки экспериментальных данных и точность определения радиолокационных параметров
Целью настоящей работы, как указывалось выше, является разработать методику надежного распознавания градоопасности конвективных облаков на основе радиолокационных характеристик. Естественно, радиолокационная станция (РЛС), используемая для этих исследований, должна обладать достаточно высоким энергетическим потенциалом, способным обнаружить даже слабую крупнокапельную фракцию. Кроме этого, станция должна обладать высокими техническими показателями, чтобы обеспечить за кратчайшее время точное и оперативное измерение нескольких характеристик облаков. Требуется также подобрать подходящую рабочую длину волны радиолокационной станции. По исследованиям В.Д.Степаненко LJ59J » ДДЯ обнаружения надежностью 85-90% ближней и дальней границы осадков, интенсивность и ширина которых соответственно составляют 50 мм/ч и 10 км на удалении до 150-200 км, оптимальной длиной волны является 2-3 см. Длина волны при постоянном значении размера антенны определяет ширину диаграммы направленности, а с диаграммой направленности связана разрешающая способность РЛС по высоте и дальности, от которых зависит точность измерения высоты и координат радиоэхо. При выборе рабочей длины волны должна учитываться разрешающая способность РЛС, которая, согласно теории радио-локационных объемных целей, обратно пропорциональна Я . Необходимо учитывать также поглощение электромагнитных волн в облаках и осадках. Коэффициент поглощения обратно пропорционален длине волны и поэтому необходимо выбирать такую рабочую длину волны, поглощением которой можно пренебречь на пути распространения луча до цели и обратно. Следует также учитывать, что вероятность наличия интенсивных осадков на пути распространения луча до изучаемого облака при небольших удалениях не превышает 10-15% 59]. Исходя из вышеизложенного, радиолокационная аппаратура для обеспечения работ по активным воздействиям на градовые процессы должна удовлетворять следующим требованиям: а) наличие высокого энергетического потенциала; б) высокая разрешающая способность; в) узкая диаграмма направленности с одинаковым значением угла раскрыва луча в вертикальной и горизонтальной плоскос тях; г) высокая оперативность в работе, чтобы обеспечить за ко роткое время определение координат радиоэхо.
В начале экспериментальных работ по предотвращению градобитий в Алазанской долине не существовала станция заводского производства, удовлетворяющая вышеперечисленным требованиям. Поэтому в наших работах использовалась специально смонтированная метеорологическая радиолокационная станция, С помощью фоторегистраторов осуществлялось автоматическое фотографирование отдельно вынесенных совмещенных индикаторов ИКО и ВДВ. Одновременно на пленке фиксировались номер кадра, дата, время, величина затухания в децибелах, азимут и угол места. Использованная нами РЛС имеет следующие основные технические данные: 1. Дальность обнаружения зон ливневых осадков - 100 кіл. 2. Разрешающая способность по дальности - не более 200 м. 3. Рабочая длина волны - 3,2 см. 4. Длительность импульса - 0,28 мкс. 5. Частота следования импульсов передатчика, плавно регулируемая - 1,0 - 2,0 кгц. 6. Реальная чувствительность приемного тракта Ртіп не хуже 3,76 W IZ вт. 7. Тип антенны - параболическая с диаметром Д = 3,0 м. 8. Ширина диаграммы направленности по половинному спаду мощности S =14,0 мрад. 9. Угловая разрешающая способность - не хуже 7,0 мрад. 10. Мощность в импульсе p. - 270 квт. 11. Скорость вращения антенны регулируемая - 6-Ю об/мин. 12. Скорость вертикального сканирования антенны - б/С. 13. Управление антенной: а) по углу места - ручное; б) по азимуту - автоматическое, ручное. 14. Аттенюация - плавная от 0 до 74 дб. 15. Масштаб развертки - 20, 50, 100 км. Примерно такими характеристиками обладает радиолокационная станция МРЛ-2. Как уже указывалось, экспериментальные данные, лежащие в основе настоящей диссертационной работы, были собраны главным образом в Алазанской долине Грузинской ССР. Физико-географические условия в этой долине исключительно благоприятны для развития конвективных процессов. С северо-востока эта долина ограничена Большим Кавказским, а с запада,юго-запада и юга - Кахетинским и Гомборским хребтами. Ширина долины в среднем составляет 20-30, а длина около 100 км. Высокие хребты, ограничивающие долину, расположены почти перпендикулярно господствующему направлению переноса воздушных масс и холодных вторжений, создают динамический подпор, способствуют развитию конвекции и значительному обострению атмосферных процессов. По исследованиям проф. В.М.Гигинеишвили, Кахетинский регион характеризуется аномально высокой частотой и интенсивностью градовых процессов. Сезон градобитий здесь длится с апреля по октябрь месяц и максимума по частоте и интенсивности достигает в мае-июне месяцах. Основной сельскохозяйственной культурой этого региона является виноград, весь вегетационный период которого охватывается сезоном градобитий. Алазанская долина, будучи регионом интенсивного развития сельскохозяйственного производства, является родиной прославлен- ных кахетинских вин и других ценных культур. Виноградники на каждом этапе вегетации очень чувствительны к механическим повреждениям, в связи с чем даже слабые градобития наносят им значительный ущерб.
Вышеперечисленные факторы обусловили большой практический интерес и вместе с тем весьма благоприятные условия изучения градовых явлений и разработки методов активного воздействия на них. Именно этим и следует объяснить, что упомянутые исследования в нашей стране начались именно в Алазанской долине и первая служба борьбы с градом в Советском Союзе в 1961 году была создана в этом регионе. В настоящее время работы по защите сельскохозяйственных культур в этом регионе осуществляются четырьмя военизированными частями на территории 670 тыс.га. Каждая часть оснащена радиолокационной станцией и данные измерений, проведенных с их помощью, использованы в настоящей работе. Радиозондирование атмосферы проводится систематически три раза в сутки в селении І испири, где,кроме того осуществляется прием синоптических материалов. Для получения информации о выпадении твердых осадков использовались данные учащенной градо-дождемерной сети Института геофизики АН Груз.ССР, данные метеорологических станций и постов, данные органов государственного страхования и специальных обследований территории, где имелась опасность выпадения твердых осадков. За период с 1962 по 1981 год набран очень большой материал, насчитывающий десятки тысяч наблюдений за кучево-дождевыми облаками» В настоящей работе использована лишь сравнительно небольшая часть накопленного материала - данные наблюдений за 1650 кучево-дождевыми облаками, из которых 500 были градовыми. При отборе материала руководствовались полнотой и надежностью полученных данных. Рассматривались только те случаи, когда имелись многократные измерения всех радиолокационных параметров в течении не менее 30 минут, данные температурно-ветрово-го зондирования и надежные сведения об осадках, выпавших из данной ячейки, при условии, что она воздействию не подвергалась. К градовым облака относились в тех случаях, когда из них на поверхность земли выпадали твердые осадки с ледяными зернами со средним диаметром, превышающим 0,5 см, а сумма твердых осадков была не менее 0,1 мм. При отборе материала выполнялось требование, чтобы изучаемый объект не был удален от радиолокационной станции более чем на 50 км и не был экранирован интенсивными осадками. Используя для задачи распознавания перечисленные выше радиолокационные параметры, необходимо оценить погрешности их измерения. Такая оценка приведена в работе [во]. Оцениваются как случайные, так и систематические ошибки, которые допускаются при измерении параметров облаков с помощью радиолокатора.
Использование метода многомерной линейной регрессии для разделения ливневых и градовых облаков
В настоящей работе мы пытались получить более простое, но надежное правило классификации облаков путем применения множественного регрессионного анализа. В рассматриваемом случае задача сводится к тому, чтобы по совокупности значений выбранного нами комплекса семи предикторов определить значение некоторой функции , которая наилучшим образом разделит градовые и ливневые облака друг от друга. В качестве предикторов использовались вышеприведенные 7 параметров CCY - Нт , эсг tH , С целью решения поставленной задачи из архива материалов радиолокационных наблюдений и радиозондирования, путем случайной выборки были отобраны данные для 150 градовых и 150 неградовых кучево-дождевых облаков, которые составили обучающую выборку. Для избранной выборки была составлена система уравнений При этом принимается, что дихотомическая переменная "Чі при градовых случаях принимает значение I, а при неградовых - 0. Задача сводится к отысканию коэффициентов & системы уравнений (2.2). По условию метода наименьших квадратов требуется, чтобы значение величины тг гч: - д scc:j оыло минимальным, (f = / t = i Неизвестные коэффициенты были определены из системы уравнений: Индекс 0 соответствует переменной . В таблице 2.1 представлена матрица величин /7г х системы (2.3). В результате решения системы (2.3), реализованного на ЭВМ М-220, найдены значения коэффициентов CL , которые представлены в таблице 2.2, а значения осй и ч приведены в таблице 2.3. градовые, В интервале значений Ч от 0,35 до 0,75 наблюдались осадки обоих видов (51 градовое и 31 неградовое облако). Таким образом, 73$ всех случаев обучающей выборки разделены однозначно, а 7П% выборки оказались в диапазоне неоднозначности. Если в качестве разделяющего значения брать Н Р = 0,35, то для 96,7$ градовых случаев - ур , т.е. только 3,3% градовых зон окажутся ошибочно опознаны и причисленными к неградовым. Соот-ветственно для 95,3$ случаев ливневых осадков Ч Нр и, следовательно, всего лишь 4,7$ ливневых облаков будут ошибочно сочтены градовыми.
Таким образом, вправо от разделяющего значені ния Ч р оправдываемость диапазона составляет 95,4%, а влево -97,3$, Общая оправдываемость распознавания ливней и града составляет 96,3$. Проверка диагностического уравнения (2.4), произведенная на большой экзаменационной выборке, состоящей из 1200 случаев, в том числе 340 градовых и 860 ливневых облаков, показала, что надежность распознавания достаточно высока и составляет 92,5$. С целью повышения оперативности и эффективности радиолокационного обеспечения противоградовых работ число предикторов желательно сократить с условием, что надежность распознавания существенно не будет ухудшена, к чему мы и стремились в наших работах. Методика физико-статистической обработки данных, примененная в работах ll,12] , затрудняла решение вопроса рационального сокращения числа предикторов. На основе метода множественного регрессионного анализа с применением электронно-вычислительных машин эту задачу можно решить проще. Следующей нашей целью является подобрать такое минимальное число предикторов, которое вместе с тем обеспечит несущественное ухудшение достоверности распознавания градовых и ливневых облаков по сравнению с диагностическим уравнением (2.4). В частности, мы поставили целью подобрать такой комплекс предикторов, который позволит распознавать вид конвективных осадков с относительной ошибкой не более 5$ при условии, что в области однозначности разделения окажутся не менее 70$ всех рассматриваемых случаев. Для этого на одном и том же архивном материале можно было для всевозможных сочетаний из семи предикторов составить уравнение, аналогичное (2.4), и путем сопоставления результатов разделения подобрать искомый минимальный комплекс предикторов, обеспечивающий выполнение вышеприведенных требований.
Очевидно, что для этого в рассматриваемом случае пришлось бы составить и сравнить друг с другом лг = J С = / 27 уравнений. Более экономно эту задачу можно решить и без рассмотрения всех сочетаний, если из первоначально выбранного комплекса последовательно исключать один, два, три и более предиктора, каждый раз сохраняя в комплексе те из них, которые обладают наибольшей информативностью или имеют наилучшие корреляционные связи с предиктантом.На основе использованной выборки были вычислены коэффициенты корреляции каждого предиктора с явлением града. Результаты этих расчетов приведены в таблице 2.4. Из системы 2.1 последовательно вычеркивались элементы, соответствующие предикторам сс3 , 0Сц , sc sc OC Отдельно были сгруппированы температурные и геометрические параметры облаков Для кавдой совокупности была решена аналогичная задача, т.е. были найдены коэффициенты и составлены диагностические уравнения, Результаты по распознаванию градовых и ливневых облаков были проверены на обучающей выборке. Анализ результатов показал, что наилучшим образом выдвинутым требованиям отвечает совокупность следующих четырех предикторов: cci, сс3 , рс4 , ос П8Ґ]. Задача решалась на ЭВМ М-222. Имея рассчитанные значения коэффициентов О. с для комплекса (1,3,4,6), было составлено диагностическое уравнение, которое имеет следующий вид: Это уравнение позволяет определить то значение функции у. , которое наилучшим образом разделит градовые и неградовые облака, т.е. с определенной точностью позволит установить диагноз вида осадков. На рис. 2.2 приведены графики частот распределения значе- ний функций для градовых и ливневых кучево-дождевых облаков. Анализ этих графиков показывает, что если в качестве критерия разделения принять значение М, - 0,5, то правее точки с такой абсциссой окажется 96$ градовых и всего лишь 4,7$ неградовых облаков. Соответственно левее абсциссы 0,5 расположатся 95,3$ ливневых и 4$ градовых облаков.
Алгоритм обучения распознаванию ливневых и градовых облаков, реализующий метод обобщенного портрета
Предположим, что расстояния между выпуклыми оболочками двух множеств X и X р О » а диаметр О) этих множеств (т.е. наибольшее расстояние между элементами X и X ) меньше некоторой величины Г( Ю (р) . Тогда эти два множества разделимы гиперплоскостью, т.к. достаточно построить от-резок, определяющий расстояние между выпуклыми оболочками,и провести гиперплоскость, ортогональную к этому отрезку и проходящую через его середину. При этом разделяющая гиперплоскость может быть построена многими способами. Необходимость построения разделяющей гиперплоскости по выборке фиксированной длины привела к созданию конечно-оптимальных алгоритмов обучения распознаванию образов [_7Ij, в отличие от асимптотических алгоритмов, которые гарантируют построение оптимальных разделяющих гиперплоскостей лишь при неограниченном увеличении выборки обучения (оптимальная разделяющая гиперплоскость определена как гиперплоскость, обладающая минимальной вероятностью ошибок). В фиксированном пространстве признаков выбор оптимальной гиперплоскости при выборках конечного объема осуществляется методом минимизации эмпирического риска. Однако, для выбора оптимальной разделяющей гиперплоскости в конечно-мерных пространствах найден более эффективный метод минимизации риска, чем метод эмпирического риска, и он связан с выбором подпространства признаков. Этот метод позволяет среди решающих правил, минимизирующих эмпирический риск в различных подпространствах, выбирать решающее правило в том пространстве, которому соответствует минимальная вероятность ошибок. Таким образом, необходимо решить две задачи. Первая задача состоит в умении построить в фиксированном пространстве признаков решающее правило, минимизирующее эмпирический риск. Эмпирический риск равен нулю, если обучающая последовательность разделена безошибочно. Решающему правилу наилучшего качества в этом пространстве признаков соответствует гипер- плоскость, названная минимаксной. Однако, чтобы минимаксная гиперплоскость обладала гарантированной малой вероятностью ошибок (а не просто обращала в нуль эмпирический риск), необходима достаточно большая выборка.
Требуемую длину обучающей последовательности можно значительно сократить, если воспользоваться некоторыми свойствами подпространства признаков. Пусть в исходном пространстве признаков Е п выделены подпространства Err, (JTL ri) . Тогда в каждом подпространстве может существовать своя минимаксная гиперплоскость, которая обращает в нуль эмпирический риск, и с этой точки зрения все они равноправны. На самом деле в различных подпространствах им соответствуют различные вероятности ошибочных классификаций. Вторая задача как раз и состоит в выборке такого подпространства признаков, минимаксная гиперплоскость которого обладает гарантированной минимальной вероятностью ошибок. Это подпространство названо экстремальным. И для его выбора было введено понятие качества решающего правила, которое позволяет сравнивать различные подпространства между собой и выделять подпространство с экстремальными свойствами. Для отыскания подпространства признаков минимаксное решающее правило, которое обладает гарантированной минимальной вероятностью ошибок, необходим полный перебор по подпространствам. В связи с нереальностью осуществления этой процедуры предлагается использовать эвристический прием замены его частичным перебором. При этом нет гарантий, что будет найден глобальный минимум функции риска. Тем не менее, даже найденный локальный минимум позволяет иногда существенно повысить точность решающего правила при использовании минимизированной совокупности признаков. Минимаксная разделяющая гиперплоскость для градовых и ливневых облаков нами построена методом обобщенного портрета Ц7ІІ Использованный в настоящей работе алгоритм обобщенного портрета относится к числу конечно-оптимальных методов, то есть гарантированная оценка результатов производится с учетом фиксированной выборки наблюдений и при этом никаких ограничений на вид распределения исходных данных не налагается; не требуется также выполнения условия независимости признаков. Предположим, что для рассматриваемых множеств X и X (массивы векторов обучающей последовательности первого и второго классов - соответственно градовых и ливневых облаков) существует гиперплоскость, которая безошибочно делит векторы обучающей последовательности. Это означает, что расстояние р между выпуклыми оболочками множеств X и X больше нуля о) . Для построения разделяющей минимаксной гиперплоскости рассмотрим множество Q , образованное всевозможными разностями векторов ее; и сс . Элементами множества Q являются векторы Такие векторы Q называются крайними и образуются информативными парами векторов ос с } ос. к (1 - «/, ...; &) , к.- (j}... 7 &) Обычно, если множества X и X разделимы гиперплоскостью, тогда число крайних векторов невелико. (Геометрически крайние векторы множества X - это те векторы, которых первым коснется разделяющая гиперплоскость при параллельном переносе в направлении множества X , аналогично определяются крайние векторы множества X ). Поэтому вектор f можно представить как линейную комбинацию небольшого числа векторов oz и оск. Метод обобщенного портрета заключается в выявлении крайних векторов и нахождении коэффициентов разложения вектора У . По значениям коэффициентов о и по крайним векторам легко строится обобщенный портрет.
Если обучающая последовательность является случайной выборкой X U X множеств с длиной X , а количество крайних векторов равно т , тогда величина [і - —) характеризует вероятность того, что любой вектор, взятый из совокупности X и X , удовлетворяет одному из неравенств: (ос } ty) С0 - вектор принадлежит к I классу; (СС ф) Со вектор принадлежит ко П классу, т.е. чем меньше величина т/L , тем выше вероятность правильной классификации векторов. Коэффициенты разложения оС- вектора по векторам Qi находятся как координаты точки покоя системы уравнений: (4 {ь, ) » если Ч или ( (Qi? )) 0 Заметим, что каждому вектору из обучающей последовательности соответствует свое уравнение в этой системе и целиком эта система состоит из большого числа уравнений. Поэтому решать ее следует не целиком, а по частям. Сначала решается система для нескольких векторов Qі (например, для К ), которые составляют начальную группу обучения. Затем система сокращается; из нее исключаются неинформативные векторы, т.е. те векторы, которые входят в разложение вектора у с нулевыми весами. Далее определяется вектор Q , для которого d - пгьіп (Q і г yj. Если & 4 сС t то вектор ( считается построенным. ( 96 допустимое отклонение от оптимальной гиперплоскости). Для построения гиперплоскости остается только определить: Если же d /- as , то вектор Q добавляется к информативным и вновь решается система (2.7). Процесс повторяется до тех пор, пока не окажется, что СІ І . Система (2.7) считается решенной, если По информативным векторам первой группы строится вектор Y І потом к этим векторам добавляются крайние векторы из вто- ,рой группы и снова решается система и т.д. Одновременно с вычислением вектора у проверяется существование разделяющей гиперплоскости. Для этого на каждом шаге траектории движения к устойчивой точке вычисляется значение величины W( ) Поиск устойчивой точки системы (2.7) эквивалентен нахождению максимума квадратической формы: Если в какой-то момент окажется, что W ( ) W0 = то поиск гиперплоскости прекращается, поскольку это неравенство означает, что не существует гиперплоскости, разделяющей множества X и X и отстоящей от ближайшего из них на расстоянии, большем ро . Если существует максимум функции W ( ) , тогда существует и вектор у и устойчивая точка системы. Если же максимум формы не существует, т.е. функция Vs/(oc) в положительном квадранте может быть сколь угодно велика, то вектор У построить нельзя. Поиск устойчивой точки осуществляется методом сопряженных градиентов СтД» (р Таким образом, здесь рассмотрен метод построения разделяющей гиперплоскости, если расстояние между выпуклыми оболочками множества больше нуля (Р о).
Выбор оптимального значения разделяющих функций с учетом минимума риска при проведении активных воздействий на градовые процессы
При проведении активных воздействий на градовые процессы возникает проблема определения оптимальных значений разделяющих функций градовых и ливневых облаков, при которых следует приступить к воздействию. Это очень важно потому, что ошибочная обработка неградовых облаков, как и пропуск градовых, приводит к значительным экономическим убыткам. Рациональная методика воздействия должна исходить из того, чтобы обеспечить минимум экономических убытков. С этой целью нами вычислены оптимальные значения разделяющих функций для всех полученных нами алгоритмов распознавания облаков, с учетом ущерба от пропущенных градобитий и ошибочно обработанных ливневых облаков. Допустим, что с учетом успешности воздействия отношение средней суммы затрат на ошибочную обработку одной зоны л к среднему ущербу, вызванному одним пропущенным градобитием Qn , составляет rA/cLr =0.2. Если Pj ( ) и Рр[Ц) представляют собой функции распределения плотности вероятностей ливневых и градовых облаков, то легко показать, что значение 14 р , при котором необходимо приступить к проведению операции воздействия для обеспечения минимальных экономических убытков, может быть найдено из условия минимума функционала: С помощью распределений значений "Ч градовых и ливневых облаков, которые представлены на рис. 2.1 и 2.2 для семи и четырех параметров соответственно, вычислены значения функционала J l j » полагая в относительных единицах, что Qfi = I, а # в 5. Соответствующие графики представлены на рис. 3.1 и Анализ рис. 3.1 показывает, что минимум ,/ (?) достига-ется при ti = 0,35 и остается неизменным почти до 0,5. При -и 0,5 значение функционала J1 ($) быстро возрастает. Следовательно для обеспечения минимального риска воздействию должны подвергаться все облака, для которых V 0, 5. При этом окажется, по данным обучающей выборки, что ошибочно будет подвергнуто воздействию не более 12$ облаков. Из рис. 3.2 видно, что при четырех предикторах минимальное значение функционала J ( %) тоже лежит в пределах 0,4-0,5, поэтому целесообразно считать критериальным значени-ем Ч = 0,45. Следовательно, воздействию должны подвергнуться все облака, для которых значение Ч 0,45. При этом по обучающей выборке ошибочно будут подвергнуты воздействию около 13$ облаков и пропущены будут 4% градовых облаков.
Аналогично были вычислены значения функционала риска для алгоритмов распознавания, составленных по формуле Байеса,и методом обобщенного портрета, т.е. для функций Р(эс) , (оа} %) и (ас } У ) по распределениям, представленным на рис. 2.10,2.11 и 2.12. Как видно из рис. 3.3, значение функционала риска J l Pfa1)) достигает минимального значения при F (ж) =-5, что и следует считать критериальным значением. Это значение обеспечивает минимальное количество ошибочно обработанных 8$ неградовых и 3$ пропущенных градовых облаков. Анализ рис. 3.4 показывает, что минимум функционала J ((& , Щ \соответствует значению абсциссы 850 и критериальным следует считать именно это значение. При этом окажется, что ошибочно будут подвергнуты воздействию всего 1% неградовых облаков, а пропущенными окажутся только 1,3$ градовых случаев. По рис. 3.5 минимум J ((ж, Щ)) лежит в интервале от 750 до 850. В качестве критериального можно взять foe, V4) -= 800. По обучающей выборке правее критериального значения оказывается 12% неградовых облаков, а левее - 1% градовых облаков. Значения функционала риска для всех алгоритмов были рассчитаны и при других соотношениях Q/ / ty п .В частности, когда: Ял/Цг = 1» fy/Яг = 5 и /?" = 1 Оказалось» что диапазон минимальных значений функционала существенно не меняется, поэтому можно принять, что вышеприведенные критериальные значения разделяющих функций являются достаточно надежными. 3.3. Распознавание градовых и ливневых облаков по совокупности решений нескольких алгоритмов одновременно Анализируя полученные результаты распознавания градовых и ливневых облаков по различным алгоритмам, можно сделать вывод, что из рассмотренных пяти алгоритмов каждый обеспечивает достаточно высокую надежность оправдываемости, хотя вероятность правильного распознавания по различным алгоритмам немного отличаются друг от друга. Оценка надежности всех алгоритмов на одной и той же экзаменационной выборке, состоящей из 1200 случаев, показала, что поставленная задача наилучшим образом решается с применением метода обобщенного портрета. Как видно из рисунков 2.1., 2.2., 2.10., 2.П., 2.12., по всем пяти алгоритмам рассмотренную обучающую выборку можно разделить на три части: зону однозначного распознавания неградовых облаков, зону однозначного распознавания градовых облаков и зону неоднозначности, где с разной частотой встречаются как градовые, так и неградовые облака. Именно в интервале неоднозначности затруднено принять решение о проведении активных воздействий на облака, когда одни алгоритмы указывают на градоопасность, а по другим облако считается неградоопасным. В целях уменьшения числа таких случаев, более полного использования полезной информации, получаемой при помощи какого алгоритма, и на этой основе повышения надежности диагноза, использован критерий мажоритарного выбора [88], который позволяет классифицировать облака по совокупности решений, принятых одновременно по нескольким алгоритмам. Применение ЭВМ для анализа данных позволяет реализовать несколько алгоритмов распознавания одновременно, чтобы принять окончательное решение о принадлежности облака к градовым или ливневым. Как отмечено в работах [_89,9(F), применение принципа мажоритарного выбора обеспечивает увеличение общей вероятности правильного распознавания объектов разных классов. где "4-І - значения разделяющих функций по различным алгоритмам распознавания в конкретном случае; "Чіо критериальные значения разделяющих функций, рассчитанных нами выше с учетом минимизации риска.
Считается, что Практическое применение принципа мажоритарного выбора при проведении воздействий можно осуществить следующим образом: по каждому алгоритму вычисляется значение разделяющей функции, оно сравнивается с соответствующим критериальным значением. Если окажется, что значение разделяющей функции больше или равно критериальному значению, принимается решение +1, в противном случае —I. Затем вычисляется их сумма $ по формуле (3,2). Когда у = +J. , облако относится к градовым, а если значение = - i, , облако считается неградовым. С применением этого принципа была произведена классификация облаков упомянутой экзаменационной выборки. Общая вероятность правильного распознавания составила 98,1%, что в среднем на 5% повышает надежность распознавания по сравнению с отдельными алгоритмами. Эти результаты позволяют делать вывод, что принцип принятия решения по нескольким алгоритмам одновременно существенно повышает вероятность однозначной идентификации градовых и ливневых облаков. 1. По данным многолетних полевых экспериментальных ис следований, проведенных в Алазанской долине Грузинской ССР, были отобраны радиолокационные и аэрологические параметры, которые на основе анализа физических предпосылок должны были характеризовать стадии развития кучево-дождевых облаков. Расчеты показали, что семь нижеследующих параметров: находятся в тесной корреляционной связи с явлениями выпадения ливневых осадков и града. 2. На основе применения модифицированного метода Шеннона и вычисления расстояния Махалонобиса установлено, что вышеупо мянутые параметры характеризуются высокой информативностью и могут быть успешно использованы в качестве признаков для раз работки методов распознавания градовых и ливневых облаков. Наиболее информативными оказались параметры Н , А& и Z, Используя представительную выборку значений семи отобранных признаков, разработаны алгоритмы распознавания ливневых и градовых облаков с применением методов многомерной линейной регрессии, обобщенного портрета и формулы Байеса. Построенные решающие правила классификацию конвективных облаков по характеру выпадающих осадков (ливни, град) позволили осуществить с высокой достоверностью. Наилучшим образом задача решается методом обобщенного портрета. 4. Распознавание градовых и ливневых облаков с помощью алгоритмов, разработанных с использованием четырех параметров ,( Htn » h /A+ » H ! , лрі ),осуществляется с небольшим ухудшением надежности.