Электронная библиотека диссертаций и авторефератов России
dslib.net
Библиотека диссертаций
Навигация
Каталог диссертаций России
Англоязычные диссертации
Диссертации бесплатно
Предстоящие защиты
Рецензии на автореферат
Отчисления авторам
Мой кабинет
Заказы: забрать, оплатить
Мой личный счет
Мой профиль
Мой авторский профиль
Подписки на рассылки



расширенный поиск

Алгоритмы обработки данных радиоволнового дистанционного зондирования поверхности Земли на основе искусственных нейронных сетей Мансуров Александр Валерьевич

Алгоритмы обработки данных радиоволнового дистанционного зондирования поверхности Земли на основе искусственных нейронных сетей
<
Алгоритмы обработки данных радиоволнового дистанционного зондирования поверхности Земли на основе искусственных нейронных сетей Алгоритмы обработки данных радиоволнового дистанционного зондирования поверхности Земли на основе искусственных нейронных сетей Алгоритмы обработки данных радиоволнового дистанционного зондирования поверхности Земли на основе искусственных нейронных сетей Алгоритмы обработки данных радиоволнового дистанционного зондирования поверхности Земли на основе искусственных нейронных сетей Алгоритмы обработки данных радиоволнового дистанционного зондирования поверхности Земли на основе искусственных нейронных сетей Алгоритмы обработки данных радиоволнового дистанционного зондирования поверхности Земли на основе искусственных нейронных сетей Алгоритмы обработки данных радиоволнового дистанционного зондирования поверхности Земли на основе искусственных нейронных сетей Алгоритмы обработки данных радиоволнового дистанционного зондирования поверхности Земли на основе искусственных нейронных сетей Алгоритмы обработки данных радиоволнового дистанционного зондирования поверхности Земли на основе искусственных нейронных сетей
>

Диссертация - 480 руб., доставка 10 минут, круглосуточно, без выходных и праздников

Автореферат - бесплатно, доставка 10 минут, круглосуточно, без выходных и праздников

Мансуров Александр Валерьевич. Алгоритмы обработки данных радиоволнового дистанционного зондирования поверхности Земли на основе искусственных нейронных сетей : Дис. ... канд. техн. наук : 05.13.18 Барнаул, 2006 125 с. РГБ ОД, 61:06-5/3423

Содержание к диссертации

Введение

Глава 1. Современные методы обработки радиолокационных и радиометрических данных дистанционного зондирования 10

1.1. Принципы и задачи дистанционного зондирования поверхности Земли в радиодиапазоне 10

1.1.1. Методы решения задач классификации ..15

1.1.2. Методы решения задач инверсии 21

1.2. Методы решения задач обработки данных дистанционного зондирования на основе нейронных сетей 27

1.2.1. Задачи обработки данных дистанционного зондирования как слабо формализованные задачи 27

1.2.2. Определение и принципы функционирования ИНС 30

1.2.3. Нейросетевое решение задач обработки данных дистанционного зондирования 38

1.3. Выводы 41

Глава 2. Восстановление параметров почвенного покрова по данным радиометрического зондирования ., 44

2.1. Общая концепция формирования алгоритма обработки данных ДЗ на основе ИНС 44

2.2. Модель радиоизлучательных и диэлектрических характеристик почвенного покрова 48

2.3. Нейросетевое решение поставленной задачи 53

2.4. Исследование свойств полученных нейросетевых решений 60

2.5. Выводы 71

Глава 3. Мониторинг сети оврагов с помощью нейронной сети по радиолокационным изображениям 74

3.1. Овражная сеть как объект мониторинга 74

3.2. Общая концепция решения задачи 77

3.3. Нейросетевой мониторинг овражной сети 86

3.4. Выводы 100

Заключение , 102

Библиографический список

Введение к работе

Актуальность темы исследования. Необходимость усиления контроля за глобальными процессами изменения климата, ростом негативного антропогенного воздействия на биосферу, а также потребности в прогнозировании природных и техногенных катастроф, в ведении хозяйственной деятельности выдвигают в качестве приоритетной задачи дистанционное зондирование природной среды. Ученые и специалисты многих стран активно разрабатывают методики изучения Земли с использованием дистанционных измерений, совершенствуется и техническая база мониторинга, и методы интерпретации данных. Ключевая роль в этом процессе отводится системам обработки данных дистанционного зондирования (ДЗ) с применением многоканальных оптических, а также микроволновым измерительным системам и радиолокаторам с синтезированной апертурой (РСА).

Радиоволновые (радиолокационные и радиометрические) методы исследования земной поверхности являются перспективными, поскольку не зависят от естественной освещенности местности и состояния атмосферы. Наблюдения в радиоволновом диапазоне чувствительны к влажностным, геометрическим и диэлектрическим характеристикам объектов. Это делает возможным ведение мониторинга объектов и определение характеристик объектов, которые недоступны для оптических систем наблюдения. Один из последних выведенных на орбиту спутников – ALOS – помимо сенсоров видимого и ИК-диапазона оборудован РСА PALSAR с разрешением от 10 до 100 м (L-диапазон). В 2007 году готовится к запуску спутник SMOS, имеющий на борту усовершенствованный радиометр L-диапазона для изучения влажности почв и солености океанов. Однако обработка результатов радиолокационных и радиометрических исследований является более сложной по сравнению с оптическими системами мониторинга и требует нетривиальных методик, адаптированных к физическим и техническим особенностям формирования данных. Также для повышения оперативности при мониторинге природных ресурсов необходимы новые методы экспресс-анализа и быстрой обработки данных ДЗ в режиме реального времени.

Одним из направлений дальнейшего совершенствования методов изучения природных ресурсов является использование искусственных нейронных сетей (ИНС), обладающих способностью реализовать широкий класс функций без априорных допущений о законах их распределения. Повышенный интерес к применению ИНС в подобного рода задачах объясняется простотой и эффективностью, с которой нейронные сети выполняют функциональные преобразования при обработке сигналов – зачастую при отсутствии определенного закона или модели, а также в условиях работы с зашумленными данными. На основе их обучения может быть обеспечено более точное и оперативное получение искомых параметров в реальном масштабе времени. Разработка эффективных алгоритмов, основывающихся на искусственных нейронных сетях, для выполнения задач подобного класса представляет собой актуальную проблему данного исследования.

Цель исследования – разработка алгоритмов восстановления температуры и влажности почвенного покрова, мониторинга овражной сети по данным дистанционного зондирования почвенного покрова в радиоволновом диапазоне с применением искусственных нейронных сетей.

Основные задачи исследования:

  1. анализ методик применения нейросетевых компонент в составе алгоритмов обработки данных дистанционного зондирования;

  2. разработка методики применения нейросетевых алгоритмов для обработки данных дистанционного зондирования земных покровов с целью получения оптимального решения;

  3. разработка и апробация основанного на искусственной нейронной сети алгоритма определения влажности и температуры почвенного покрова по данным радиометрического дистанционного зондирования;

  4. разработка и апробация алгоритма определения овражной сети по радиолокационному изображению при помощи искусственной нейронной сети.

Объект исследования. Алгоритмы и методы обработки данных дистанционного зондирования, использующие в основе своей работы искусственные нейронные сети.

Предмет исследования. Разработка и исследование алгоритмов обработки радиометрических и радиолокационных данных дистанционного зондирования поверхности Земли с применением нейронных сетей.

Методы исследования. Для реализации цели и задач работы используются: методы нейроинформатики, методы математического моделирования и оптимизации, математического моделирования взаимодействия электромагнитных волн с почвенным покровом, имеющим геометрические и диэлектрические неоднородности, методы вейвлет-анализа.

Научная новизна работы:

  1. Предложены основывающиеся на ИНС алгоритмы обработки данных радиометрического дистанционного зондирования и радиолокационных изображений, сформированы схемы анализа работы предложенных алгоритмов и адаптации их к конкретной задаче;

  2. Продемонстрирован нейросетевой способ определения неоднородности распределения влаги в приповерхностном слое почвы по данным многоканальных измерений в СВЧ-диапазоне;

  3. Впервые предложен базирующийся на ИНС и вейвлет-анализе метод выделения овражной сети на радиолокационном изображении;

  4. Экспериментально показано преимущество РЛИ SIR-C (L-диапазон) с поляризацией HV над РЛИ JERS-1 (L-диапазон) с поляризацией HH при нейросетевом определении овражной сети на радиолокационных изображениях.

Практическая значимость работы. Разработанные алгоритмы обработки данных дистанционного зондирования земных покровов в радиодиапазоне могут быть использованы в сельском хозяйстве, для оперативной обработки данных зондирования и контроля земельных ресурсов, для наполнения баз данных ГИС при интеграции результатов в геоинформационные системы, а также при решении различных задач обработки данных дистанционного зондирования Земли.

На защиту выносятся следующие положения:

  1. Базирующийся на искусственной нейронной сети алгоритм определения влажности и температуры почвенного покрова по данным радиометрического дистанционного зондирования в режиме реального времени;

  2. Предложенный алгоритм определения влажности и температуры почвенного покрова дает возможность находить неоднородность распределения влаги в приповерхностном 5-сантиметровом слое почвы при многоканальных измерениях в микроволновом диапазоне (4 и более каналов) на разных частотах и двух поляризациях;

  3. Алгоритм выделения овражной сети по радиолокационным изображениям, полученным с помощью радаров с синтезированной апертурой с использованием искусственной нейронной сети и методов вейвлет-анализа;

  4. Разработанный алгоритм выделения овражной сети выполняет классификацию наиболее точно при использовании радиолокационных изображений в диапазоне L и поляризации HV для аппарата SIR-C.

Апробация работы. Результаты диссертационного исследования докладывались, обсуждались и изложены на следующих конференциях: международной конференции молодых ученых и студентов «Актуальные проблемы современной науки» (Самара, 2000); международной конференции студентов, аспирантов и молодых ученых по фундаментальным наукам «Ломоносов-2003» (Москва, 2003); всероссийской конференции «Дистанционное зондирование поверхности Земли и атмосферы» (Иркутск, 2003); 4-й международной конференции молодых учёных и студентов «Актуальные проблемы современной науки» (Самара, 2003); международной научной конференции «Татищевские чтения: актуальные проблемы науки и практики» (Тольятти, 2004) и на XII Всероссийском семинаре «Нейроинформатика и ее приложения» (Красноярск, 2004).

Публикации. По теме диссертации опубликовано 11 работ, в том числе 5 – в научных журналах и сборниках научных трудов.

Объем и структура диссертации. Диссертация состоит из введения, главы с обзором литературы и описанием существующих методов и технологий исследования и обработки данных ДЗ, двух глав с описанием собственных исследований, заключения и списка литературы. Общий объем диссертации составляет 127 страниц, работа содержит 25 рисунков и 9 таблиц. Список литературы содержит 137 цитируемых источников отечественных и зарубежных авторов.

Методы решения задач обработки данных дистанционного зондирования на основе нейронных сетей

Основываясь на опыте классического подхода к решению задач ДЗ, можно отметить следующие особенности, характерные для задач обработки данных ДЗ в радиоволновом диапазоне [15]:

1. Заявленные и разрабатываемые алгоритмы достаточно сложны и не столь просто реализуемы.

2. Точность работы сложных алгоритмов недостаточна и пока проигрывает обработке данных непосредственно человеком.

3. Эффективные методы классификации, базирующиеся лишь на данных радиоволнового зондирования, существуют только для ограниченных случаев. Остается открытым вопрос о совместном использовании информации, полученной в радиоволновом диапазоне, с информацией, полученной из других источников. Также актуален вопрос доступности данных - некоторые методики обработки могут предъявлять к данным ДЗ невыполнимые на сегодняшний момент требования (например, невозможность в данный момент получить информацию в нужном диапазоне, с нужной поляризацией и т.п.).

4. Используемые модели работают, исходя из определенного рода приближений и допущений. Алгоритмы используют вероятностные модели, которые только пытаются соответствовать реальному поведению данных, либо же только для таких вероятностных моделей возможно обосновать и реализовать рабочий алгоритм,

5. Модели требуют для своей работы учета большого числа параметров, которые невозможно получить непосредственно по данным радиоволнового зондирования.

Исходя из изложенного материала, можно утверждать, что обратные задачи ДЗ являются слабо формализованными (плохо структурированными, плохо определенными) задачами [59]. Подобные задачи являются преобладающими в области человеческой деятельности. В соответствии с [8,59] слабо формализованные задачи обладают следующими свойствами:

1. Ошибочностью, неоднозначностью, неполнотой и противоречивостью знаний о предметной области и о решаемой задаче. Для этих задач трудно, строить формальные "теории и применять классические математические методы, поскольку в ситуациях, в которых они возникают, имеет место один гз двух случаев: а) уровень формализации соответствующей предметной области и (или) доступная информация таковы, что они не могут составить основу для синтеза математической модели, отвечающей классическим математическим или математико-физическим канонам и допускающей изучение классическими аналитическими или численными методами; б) математическая модель в принципе может быть построена, однако ее синтез или изучение связаны с такими затратами (сбор необходимой информации, вычислительные ресурсы, время), что они существенно превышают выигрыш, приносимый решением, либо выходят за пределы существующих технических возможностей, либо делают решение задачи бессмысленным.

2. Ошибочностью, неоднозначностью, неполнотой и противоречивостью исходных данных. В этих задачах «по определению» существует «плохая» исходная информация, характеризующая сложную в семантическом и структурном отношении ситуацию, - это ограниченная, неполная (с пропусками), разнородная, косвенная (характеристики внешних проявлений процесса, причем не всегда относящиеся к принципиальным особенностям лежащего в его основе механизма), нечеткая, неоднозначная, вероятностная. В этих задачах известно слишком мало для того, чтобы можно было пользоваться классическими методами решения (моделями), но все-таки известно достаточно, чтобы решение было возможно. Также для слабо формализованных задач в некоторых предметных областях могут быть свойственны большая размерность пространства решения и высокая динамика предметной области. Один из эффективных подходов к решению слабо формализованных задач, а также созданию систем, способных самостоятельно анализировать природные объекты по предоставляемой информации и формировать экспертное заключение состоит в использовании информационных моделей на основе искусственных нейронных сетей (ИНС). Основной принцип такого подхода состоит в моделировании внешнего функционирования системы с помощью «черного ящика» с чисто информационным описанием - на основе данных экспериментов или наблюдений. Обычно такие модели проигрывают формальным математическим по степени «прозрачности» и «объяснимости» получаемых результатов, однако важной особенностью таких моделей является отсутствие ограничений на сложность моделируемых систем, а также возможность функционировать в режиме реального времени, что является все более актуальным аспектом в области обработки данных мониторинга Земли.

Определение и принципы функционирования ИНС

Общую технологию поиска нейросетевых решений задач можно представить так [65,78]:

1. Постановка задачи. На этом этапе анализируется сама задача, выбираются входные и выходные параметры, проводится сбор априорной информации, выдвигаются гипотезы о характере данных.

2. Сбор и обработка исходных данных. Формирование обучающих и тестовых выборок, кодирование выходов и проверка данных на конфликтность.

3. Выбор структуры и параметров модели нейросети. Выбор конкретных моделей сети производится специалистом на основе эвристических соображений. То же относится и к вопросу сложности ИНС.

4. Настройка (обучение) нейросети.

5. Оценка полученной модели и применение модели. Для оценки работы обученной ИНС выполняется ее тестирование на специально подготовленной выборке. Особенно важна ошибка обобщения, получаемая на тестовых данных (не участвующих в обучении). Малая ошибка при обучении гарантирует адекватность модели в заранее известных точках, а малость ошибки обобщения свидетельствует о формировании понятий и навыков, распространяющих опыт обучения на новые условия. Если результаты оказались неудовлетворительными, то необходим возврат к одному из этапов. Специфичность информационных моделей связана не только с особенностями их синтеза, но и с характером ее приближений и ошибок [65]. Отличия функционирования информационной модели и реальной системы возникают вследствие свойств экспериментальных данных. Например, из-за каких-либо ограничений пространства входных и выходных переменных не могут содержать всех существенных для описания поведения системы данных, данные могут быть потеряны ИЛИ искажены шумами, иметь произвольное распределение в пространстве переменных. Все это ухудшает свойства информационной модели. Методы нейроинформатики позволяют оценить свойства нейросетевой информационной модели, проводить разностороннюю оценку функционирования модели и вносить необходимые коррективы на этапах 1-5 общей технологии поиска нейросетевых решений. С помощью алгоритмов прореживания и контрастирования, определения значимости входов, анализа работы ИНС и обучающего множества в структуру ИНС и процесс обучения, в процесс формирования обучающих выборок, а возможно, и в процесс постановки и первоначального анализа задачи вносятся необходимые коррективы. Это позволяет в последствии получить оптимально работающее нейросетевое решение поставленной задачи.

В процессе обучения ИНС формирует некоторое скрытое, неявное знание о способе решения поставленной задачи, которое заложено в виде значений весов ее адаптивных параметров. Если требуется лишь получение результата, удовлетворяющего требованиям поставленной задачи, сама ИНС и является конечным решением задачи. Для получения дополнительной информации, содержащейся в самом нейросетевом алгоритме (чтобы заглянуть в «черный ящик» данной информационной модели), применяют различные способы «извлечения знаний» (knowledge extraction) или «извлечения правил» (rule extraction) из ИНС. Основные цели процедур «извлечения знаний» заключаются в следующем [79-83]:

1. Обнаружение свойств и взаимосвязей между различными данными конкретной задачи, которые не являются очевидными, не были выявлены и определены ранее.

2. Объяснение механизма работы конкретного алгоритма, в частности, работы алгоритма в определенные моменты или определенные условия, понятие сути проблемы через внутреннюю логику системы.

3. Проверка правильности работы алгоритма и дальнейшее его совершенствование.

Выполнение данного этапа работы с ИНС является сложной задачей, что обусловлено рядом причин. Во-первых, в многослойных сетях присутствуют сотни или тысячи параметров;, которые определяют взаимосьязь между входным и выходным вектором. Во-вторых, скрытые нейроны образуют нелинейные и немонотонные зависимости между входом и выходом, а также устанавливают различные взаимосвязи между входами, передавая от слоя к слою в сети «производные от свойств входных параметров», соответствие которых привычным свойствам данных решаемой задачи часто является неочевидным. Кодируя таким образом от слоя :с слою входное пространство, каждый нейрон вносит свой вклад в общую работу ИНС.

Модель радиоизлучательных и диэлектрических характеристик почвенного покрова

При дистанционном зондировании важным является факт зависимости мощности принимаемого теплового излучения от температуры, влажности, шероховатости и минералогического состава почв. Физическая сущность теплового излучения почвы заключается в преобразовании внутренней тепловой энергии в энергию электромагнитного поля. Уровень теплового электромагнитного излучения обычно характеризуется спектральной плотностью излучения, для которой в радиодиапазоне выполняется закон Рэлея-Джинса: 1=1 оХ , (2.2) где / - спектральная плотность излучения, % - коэффициент излучения объекта, 10 - интенсивность излучения абсолютно черного тела, в приближении Рэлея-Джинса пропорциональна абсолютной термодинамической температуре.

Радиояркостная температура Тв является одной из основных радиоизлучательных характеристик объектов и связана с коэффициентом излучения х и абсолютной термодинамической температурой То следующим соотношением [37,38]: Тв =тоХ (2.3)

Коэффициент излучения может быть выражен через коэффициент отражения по мощности. Для реальных природных объектов можно записать следующее соотношение [16, 40]: Тв = (1- )Г + Гс(1-Г)(1 + гГ) (2.4) где Тс - температура растительного покрова, К; Ts - температура почвы, К; Rsur - коэффициент отражения от поверхности почвы; Г - коэффициент прохождения для растительности (отсутствие растительности предполагает Г=1).

Поправки на шероховатость поверхности вводятся следующим образом [16,40,47]: Rsur = Rsoi, ехр(-4 :2ЯСЯ cos2 0) (2.5) где RSOii - коэффициент отражения для почвы; 0 - угол падения волны на границу раздела, к - волновое число, RGH - параметр, задающий среднеквадратичное (эффективное) значение возвышенностей.

Вычисление коэффициента отражения Rsoil = \ RHy осуществляется численно методом инвариантного погружения [111] с учетом вертикальной неоднородности входящей в коэффициент отражения є - комплексной диэлектрической проницаемости (КДП). Для плоского диэлектрического слоя толщиной / (0 z l), коэффициент отражения вычисляется по следующим выражениям: /Q л r(O,y-l)r(/ )exp( Vg(;)-sin20Az) 1 - Я(0, j - \)R(j)exp[2ikJe(j) - sin2 0Az) r/0 y) = T(0,j - l)rQ-)exp(/ g(y) - sin2 0Az) (2 6) 1 - 91(0,j - \)R(j)exp{2ik-Js{j) - sin2 0Az) й(0,;) = Я(/) і O ( (Q 7-O p(2 Vg(y)-Sin20Az) 1 - 91(0, j - і)д(/)ехр(м 0") - sin2 0 Az) R(0j) = R(0j-\)+&i 1 - 9i(0,; - l)R(j)ex ik-{s(j) - sin2 0Az) где R - коэффициент отражения, т - коэффициент прохождения, Ж и Т -комплиментарные коэффициенты для Rvi r,j номер промежуточного слоя, на которые разбивается исходный слой толщиной /, Az - толщина слояу.

Неоднородность реализуется посредством введения профилей объемной влажности W = W(z). Вертикальное распределение влаги W = W(z) в почвенно-грунтовой толще задается выражением (2.7), которое описывает плоскослоистую модель, состоящую из однородного слоя с влажностью W толщиной dl, переходного слоя толщиной d2 и нижнего слоя с влажностью Wend:

При значительном увлажнении земной поверхности (W Wend) интенсивность излучения главным образом определяется значением влажности на поверхности и слабо зависит от особенностей вертикального распределения влаги [40]. В прочих случаях исследователи отмечают, что радиационно-влажностная зависимость определяется толщиной т.н. «эффективного» слоя, ответственного за формирование коэффициента излучения, длиной волны и градиентом влажности, а также отмечается влияние «переходного слоя», находящегося над более сухим верхним. Таким образом, вариацией параметров dl и d2 реализуются практически все возможные профили влажности почв, оказывающих влияние на интенсивность излучения. При W = Wend моделируется однородное увлажнение почвогрунтов. Для расчета КДП почвы (є) в работе используется рефракционная модель диэлектрических свойств смесей. Она представляет собой описание влажностной зависимости диэлектрической проницаемости почв. Модель является наиболее успешной при работе в диапазонах СВЧ, учитывает двойственность диэлектрических свойств почв, определяемых содержанием связанной и свободной воды [39, 46, 107, 112, 113]. Различие между свободной и связанной водой устанавливается при представлении влажностной зависимости для квадратного корня из комплексной диэлектрической проницаемости, поскольку экспериментально наблюдается точка излома влажностной зависимости при значениях объемной влажности W=Wt. Меньшие значения соответствуют влаге в грунте в связанном состоянии, большие - в свободном. Учитывая, что v = n + ik, рефракционная модель имеет вид:

Нейросетевой мониторинг овражной сети

В отличие от РЛИ с РСА JERS-1 изображения с радиолокатора SIR-C являются многоканальными. В исследовании рассматриваются фрагменты изображений в L-диапазоне с поляризацией НН и HV. Поскольку для РЛИ с поляризацией НН анализ уже был проведен, и как отмечалось ранее, при визуальном анализе снимков овражная сеть лучше различается на изображении с поляризацией HV, дальнейшее исследование выполняется по РЛИ SIR-C, поляризация HV.

Аналогично работе с предыдущими изображениями, за основу берётся модель ИНС из 2 слоев по 10 нейронов в, каждом слое, генерируется и обучается некоторое количество сетей. Результат работы на тестовой выборке трёх лучших из группы обученных ИНС приведён в таблице 3.2. В сравнении с результатами, полученными при обработке тестовых данных на 1 изображении JERS-1, поляризация НН (таблица 3.1), можно отметить более высокую точность классификации (на 7% -17% выше) для изображения SIR-С, поляризация HV.

На рис. 3.13 представлено результирующее изображение, полученное при обработке фрагмента РЛИ (рис. 3.12) с помощью ИНС № 1. На РЛИ правильно определяется овражная сеть, лесные насаждения (лесополосы) и прочие участки, попавшие в изображение—«маску». Участки, отмеченные указателем А и ошибочно отнесенные ИНС к оврагам, на самом деле являются лесополосами. Указателем В отмечены участки, классифицированные как насаждения, в то время как они очевидно являются продолжениями овражной сети. Этот факт можно объяснить тем, что растительный покров в этих участках имеет большую площадь и затеняет овражную структуру.

Графическое представление значимости входных сигналов для ИНС №1 и ИНС №3 приведено на рис. 3.14. В данном случае наиболее информативным для сети является вход W7, пропорциональный, в основном, интенсивности по рабочему окну, в котором выполнялось вейвлет-преобразование. Далее по значимости можно отметить группу входов W3, W5, W6 и W2, W4. Важность коэффициентов W3-W6 для проведения классификации по РЛИ SIR-C (L / HV) была определена ранее в разделе 3.2, данное наблюдение подтверждает этот факт.

Согласно представленным профилям спектральных коэффициентов на рис. 3.3 профили для коэффициентов W1 и W4, W2 и W5 очень похожи друг на друга, следовательно, в последующих схемах следовало ожидать взаимозаменяемость (по важности) указанных спектральных коэффициентов [132]. Этот факт продемонстрирован на рис. 3.14, где приведены значимости спектральных коэффициентов (входные сигналы) для двух ИНС, обрабатывающих одно и то же изображение.

Константа Липшица для обучающей и тестовой выборки имеет значение (Ls & 6.2) много меньшее, чем константа Липшица ИНС, вычисленная по формуле (1.16) для ИНС из 2 скрытых слоев по 10 нейронов в каждом слое. Исходя из предположения об избыточности начальной конфигурации ИНС, поиск оптимальной конфигурации начинается с минимума нейронов. Аналогично методике, изложенной в главе 2, за основу берется ИНС, состоящая из двух скрытых слоев. Увеличение числа нейронов в том или другом скрытом слое осуществляется на каждом шаге. В соответствии с проделанным анализом значимости входов, входной вектор для ИНС формируется из наиболее значимых элементов - W3, W5, W6, W7.

Согласно полученным данным, приемлемый результат обработки тестовой выборки достигается уже на первом этапе (ИНС №1). Существенных изменений в дальнейшем не происходит (ИНС №2 - ИНС №4), поэтому в качестве оптимальной выбирается ИНС №2, имеющая 2 нейрона в первом скрытом слое и 3 нейрона во втором. Используя алгоритм контрастирования ИНС [62], реализованный в нейроимитаторе NeuroPro, начальный вариант ИНС (2 скрытых слоя по 10 нейронов) упрощается до вида ИНС №1 (2 скрытых слоя, 1 и 2 нейрона в каждом слое соответственно). Однако ИНС №1 работает несколько жёстко, и ряд мест на РЛИ классифицируются неправильно (рис. 3.15 а)). Это компенсируется введением дополнительных нелинейностей (нейронов) в скрытые слои - ИНС №2 (рис. 3.15 б)).

Получив вербальное описание ИНС, можно попытаться проанализировать внутренний механизм работы сети, определить ключевые элементы. На рис. 3.16 приведено графическое представление выходов нейронов скрытых слоев сети №2 при работе с выборкой, в которой представлены все три определяемых ИНС класса. В соответствии с рис. 4.15 основными рабочими элементами скрытых слоев являются первый (1) нейрон первого скрытого слоя и нейроны 1 и 2 второго скрытого слоя, что повторяет конфигурацию ИНС №1. Оставшиеся нейроны обеспечивают дополнительную коррекцию работы нейросети.

Похожие диссертации на Алгоритмы обработки данных радиоволнового дистанционного зондирования поверхности Земли на основе искусственных нейронных сетей