Содержание к диссертации
Введение
Глава 1. Анализ проблемы использования нейросетевых методов при автоматизированном дешифрировании изображений топографических объектов 13
1.1.Состояние автоматизированного дешифрирования в современном картографическом производстве 13
1.2. Анализ нейросетей и методов их обучения 28
1.3. Анализ технических средств реализации нейросетевых методов, используемых при автоматизированном дешифрировании изображений топографических объектов 46
Выводы по главе 54
Глава 2. Теоретическое обоснование и разработка методики автоматизированного дешифрирования изображений топографических объектов с использованием нейросетевых методов 56
2.1. Характеристика исходных материалов и топографических объектов 56
2.2. Выбор нейросетевых методов для классификации, оконтуривания и распознавания изображений топографических объектов 62
2.3. Предварительная обработка изображений 67
2.4. Разработка метода автоматизированной классификации изображений топографических объектов с использованием нейросети 76
2.5. Оконтуривание изображений топографических объектов с использованием нейросети 85
2.6. Разработка методов распознавания изображений топографических объектов 89
2.6.1. Метод автоматизированного распознавания изображений топографических объектов с использованием элементов экспертной системы, построенной на основе нейросети 89
2.6.2. Метод автоматизированного распознавания изображений площадных объектов растительного покрова и грунтов с использованием нейросети 98
2.6.3. Способ организации классификатора дешифровочных признаков топографических объектов 104
2.7. Методика автоматизированного дешифрирования изображений топографических объектов с использованием нейросетевых методов 110
Выводы по главе 118
Глава 3. Экспериментальные исследования методики автоматизированного дешифрирования изображений топографических объектов с использованием нейросетевых методов 121
3.1. Методика проведения экспериментальных исследований 121
3.2. Исходные данные, вычислительные и программные средства экспериментальных исследований 125
3.3. Результаты экспериментальных исследований 128
Выводы по главе 133
Заключение 135
Список используемой литературы 138
Приложение 153
- Анализ технических средств реализации нейросетевых методов, используемых при автоматизированном дешифрировании изображений топографических объектов
- Выбор нейросетевых методов для классификации, оконтуривания и распознавания изображений топографических объектов
- Разработка метода автоматизированной классификации изображений топографических объектов с использованием нейросети
- Исходные данные, вычислительные и программные средства экспериментальных исследований
Введение к работе
Получение информации о топографических объектах по материалам космических съемок при создании и обновлении топографических цифровых и электронных карт выполняется на этапе дешифрирования снимков. Временные затраты на дешифрирование по традиционной технологии создания и обновления карт составляют от 20 до 40 % общих затрат. Это вызвано тем, что наиболее сложные и трудоемкие этапы дешифрирования (обнаружение объектов местности и их распознавание) выполняются визуальным или визуально-машинным способами. В связи с успешной автоматизацией других процессов входящих в технологическую схему составления и обновления карт, процент временных затрат на дешифрирование снимков растет и в ближайшей перспективе может составить 60-70%.
Начиная с 1970-х годов, вопросам разработки методов и средств автоматизированного дешифрирования уделялось существенное внимание, а в 90-е годы, в связи с возросшими потребностями в точной и современной картографической информации, эти вопросы приобрели приоритетное значение. Большой вклад в теорию и практику распознавания образов внесли М.М. Бонгард, М.К. Бочаров, В.И. Васильев, А.Г. Ивахненко, В.А. Ковалевский, Г.С. Поспелов, Д.А. Поспелов, Н.С. Подобедов, Ф. Розенблатт, Г.С. Себестиан, П. Уинстон, К. Фу, Р.И. Эльман, Д.А. Янутш и др. Теоретические основы и практические рекомендации в области автоматизации
дешифрирования изображений топографических объектов сформулированы в работах В.И. Аковецкого, А.Н. Живичина, И.Г. Журкина, А.В. Карпова, А.И. Мурынова, В.Н. Милича, B.C. Соколова, Г.А. Шабанова, В.В. Скрипнюка и др. Весомый вклад в решение вопросов получения цифровой информации о контурах местности в части разработки методологии ее классификации и кодирования, структур хранения и выдачи потребителям внесли Е.И. Халугин, А.И. Мартыненко, Е.А. Жалковский и др.
В настоящее время институтом математики и механики УрО РАН и сотрудниками 29 НИИ МО РФ разработана методика автоматизированного дешифрирования фотоснимков, включающая классификацию, оконтуривание и распознавание изображений топографических объектов. Эта методика максимально учитывает особенности технологии выполнения работ в частях ТС ВС, позволяет повысить полноту содержания топографических карт и ЦКИ, увеличить производительность труда и улучшить условия выполнения работ по сравнению с традиционными неавтоматизированными методиками. Однако существует ряд причин, сдерживающих дальнейшее повышение эффективности создания и обновления топографических, специальных, цифровых и электронных карт. Основными из них являются следующие:
наличие ряда интерактивных процессов (оконтуривание объектов, поиск эталонной информации, классификация изображений по их текстурным и яркостным признакам) существенно снижает производительность труда при дешифрировании топографических объектов;
слабая адаптация существующих методов автоматизированного дешифрирования к изменяющимся условиям съемки и обработки изображений; длительность процесса подготовки высокопрофессиональных операторов-дешифровщиков для выполнения работ на комплексах автоматизированного дешифрирования (5-7 лет).
Одной из перспективных возможностей изменения ситуации в области автоматизированного дешифрирования являются разработка и внедрение технических и программно-технологических средств, основанных на использовании нейросетевых методов. Эти методы обеспечивают:
выполнение операций над целыми образами (например, над фрагментами изображений);
ассоциативный поиск информации;
возможность самообучения в процессе функционирования нейрокомпьютера;
преимущественное использование логико-лингвистических моделей при формализации информации;
отсутствие необходимости внешнего программирования;
параллельный ввод и параллельную обработку информации.
В связи с изложенным, тема диссертации, посвященная автоматизации процессов дешифрирования изображений топографических объектов с использованием нейросетевых методов, является актуальной.
Цель диссертационной работы заключается в определении путей совершенствования методов и средств автоматизации дешифрирования материалов космических съемок для создания и обновления топографических цифровых и электронных карт.
Научная задача диссертации заключается в разработке и исследовании
методики автоматизированного дешифрирования изображений
топографических объектов с использованием нейросетевых методов.
Для выполнения научной задачи диссертации необходимо решить следующие частные задачи исследований:
выполнить анализ возможностей использования нейросетевых методов при автоматизированном дешифрировании изображений топогоафических объектов;
разработать метод автоматизированной классификации изображений топографических объектов с использованием нейросети;
разработать метод автоматизированного распознавания изображений топографических объектов с использованием элементов экспертной системы, построенной на основе нейросети;
разработать метод автоматизированного распознавания изображений площадных объектов растительного покрова и грунтов с использованием нейросети;
разработать способ организации классификатора дешифровочных признаков топографических объектов;
выполнить экспериментальные исследования основных положений предлагаемой методики.
На защиту выносятся:
Метод автоматизированной классификации изображений топографических объектов с использованием нейросети.
Метод автоматизированного распознавания изображений топографических объектов с использованием элементов экспертной системы, построенной на основе нейросети.
Метод автоматизированного распознавания изображений площадных объектов растительного покрова и грунтов с использованием нейросети.
Способ организации классификатора дешифровочных признаков топографических объектов.
Методика автоматизированного дешифрирования изображений топографических объектов с использованием нейросетевых методов.
Практическая ценность работы заключается в том, что совокупность разработанных методов, способа и методики, примененных в технологии автоматизированного дешифрирования снимков с целью создания топографических и цифровых карт, позволит существенно повысить эффективность дешифрирования и, следовательно, повысить эффективность создания топографических и цифровых карт в целом.
11 Структурно диссертация состоит из введения, трех глав, заключения,
списка использованной литературы и приложения.
В первой главе выполнен анализ проблемы использования нейросетевых методов при автоматизированном дешифрировании изображений топографических объектов. Обоснована научная задача диссертации. Намечены пути ее решения. Сформулированы предложения по использованию нейросетевых методов.
Во второй главе научно обоснованы технические и технологические решения, составляющие основу предлагаемой методики. Выполнена оценка дешифровочных свойств космических снимков в аналоговой и цифровой формах представления. Теоретически обоснован выбор нейросетевых методов для классификации, оконтуривания и распознавания изображений топографических объектов. Обоснован способ организации классификатора дешифровочных признаков топографических объектов. Дано детальное описание предлагаемой методики автоматизированного дешифрирования изображений топографических объектов с использованием нейросетевых методов.
В третьей главе описана методика выполнения экспериментальных исследований, сформулированы их результаты. Подтверждена эффективность защищаемых положений и предлагаемой методики в целом.
В заключении обобщены полученные научные и практические результаты диссертационной работы, сформулированы выводы и определены
направления дальнейших исследований.
По материалам диссертации опубликовано 6 работ, в том числе: доклад на научно-технической конференции ЦНИИГАиК, два доклада на VI Всероссийской конференции «Нейрокомпьютеры и их применение».
Результаты диссертационных исследований реализованы: 1. В учебном процессе Военно-инженерного университета; 2. В учебном процессе СПб Военного топографического института; 3. В учебном процессе Военно-космической академии им. А.Ф. Можайского.
Анализ технических средств реализации нейросетевых методов, используемых при автоматизированном дешифрировании изображений топографических объектов
При реализации нейросетевых методов используются следующие направления: программная реализация, т.е. эмуляция работы нейросетей на цифровых ЭВМ общего назначения; разработка нейроускорителей в виде сопроцессоров к ЭВМ; создание нейрокомпьютеров на базе нейрочипов.
Первое направление является наиболее простым и не требует значительных финансовых затрат. Оно используется в основном для предварительного моделирования или эмуляции работы нейросетевых алгоритмов. Программный комплекс, предназначенный для решения этих задач, называется тйропакетом. Под приведенное определение подходит достаточно широкий класс программных продуктов, начиная от запрограммированных пользователем нейросетевых алгоритмов и кончая мощными нейронными оболочками и трансляторами с языка описания нейросетей [48]. Фактически нейропакет является промежуточным звеном между традиционными компьютерами и компьютерами с нейросетевой логикой организации. Нейропакет может быть реализован в виде отдельной оболочки, в виде надстройки над электронными таблицами или в виде специализированного математического пакета для персональных компьютеров и рабочих станций. Краткая характеристика некоторых известных нейропакетов приведена в таблице 5 [15]. решения, обусловленная отсутствием всех преимуществ параллельной архитектуры нейрокомпьютера, а также трудности выбора оптимальной структуры нейросети и алгоритма обучения.
В настоящее время интенсивно развивается разработка нейроускорителей [21, 42]. Нейроускорителем называется специализированный вычислительный модуль, аппаратно поддерживающий архитектуру нейросетей, но вставляемый в качестве расширяющей платы в «обычный» компьютер. Нейроускоритель предназначен для быстрого выполнения вычислительных операций нейронного типа. Обучение и настройка связей в нейроускорителях осуществляется управляющей ЭВМ с одним или несколькими процессорами посредством системы команд, оптимизированной для операций нейронного типа. В таблице 6 [15] приведены примеры некоторых нейроускорителей, реализованных в виде сопроцессоров к ЭВМ общего назначения, и применяемых для решения задач автоматизации дешифрирования космических снимков [15].
Использование нейроускорителей позволяет повысить производительность ЭВМ при решении специализированных задач в 5-Ю раз [42]. В настоящее время большинство фирм выпускает именно компьютеры на базе различных нейроускорителей.
Под нейрокомпьютером [58] понимается специализированное вычислительное средство, реализующее архитектуру нейросети. Нейрокомпьютеры позволяют максимально приблизиться к проблеме создания технических устройств, моделирующих биологическую нейронную систему.
Создание нейрокомпьютеров на базе нейрочипов по мере развития электронной промышленности выделилось в самостоятельную отрасль производства. В 90-е г. интегральная технология электронных СБИС позволила реализовать несколько процессоров внутри одного кристалла. Благодаря этому, стали выпускаться нейрочипы с аппаратно реализованными фрагментами нейросетей. В таблице 7 иллюстрируются основные различия нейрокомпьютера с аппаратно-реализованной нейросетью от традиционных компьютеров с архитектурой фон Неймана.
Как следует из анализа таблицы 7, преимущество нейрокомпьютеров заключается в том, что они воплощают в себе основные достоинства первых двух направлений. Примеры нейрокомпьютеров на базе нейрочипов приведены в таблице 8 [15].
В настоящее время при оценке эффективности разрабатываемых нейрокомпьютеров основной характеристикой является их производительность. Ее оценка может быть выполнена следующими способами: путем измерения времени решения нейрокомпьютером стандартных задач и последующего сравнения его со временем выполнения аналогичных задач на других вычислительных системах; косвенным путем на основе анализа архитектурных и системотехнических характеристик.
Метод оценки производительности на стандартных задачах пока не имеет достаточного развития, так как требует разработки алгоритмов решения различных задач на нейрокомпьютерах. Поэтому в настоящее время производительность нейрокомпьютеров оценивают в основном косвенным путем. При такой оценке основными системотехническими характеристиками, определяющими производительность нейрокомпьютера, являются: быстродействие (переключение связей/секунда); число эмулируемых или физически реализуемых связей в нейронной сети (или весовых коэффициентов, что равнозначно); число эмулируемых или физически реализуемых нейронов.
Выбор нейросетевых методов для классификации, оконтуривания и распознавания изображений топографических объектов
При использовании нейросетевых методов для решения конкретной прикладной задачи необходимо определить наиболее эффективный подход к выбору нейросети. В настоящее время наиболее часто используют два основных подхода [25]. Первый предусматривает применение хорошо изученных и определенных заранее видов нейросетей. При этом после выбора вида нейросети она либо уже построена и требуется задать лишь некоторые параметры (число слоев, число нейронов в каждом слое, характер связей), либо, кроме этого, требуется произвести определение весовых коэффициентов сети, т.е. ее обучение.
При другом подходе нейросеть строится каждый раз заново. Как правило, применяется следующий порядок ее построения [25]: формулируются исходные данные и требуемый результат; определяются входные сигналы нейросети (исходные данные, начальное значение определяемых величин и пр.); определяются выходные сигналы нейросети (решение или некоторые его характеристики); определяется структура нейросети (число слоев, связи между слоями и весовыми коэффициентами); определяется функция ошибки нейросети, характеризующая отклонение желаемого выходного сигнала от реального; определяются критерии качества нейросети и функционал ее оптимизации, зависящий от функции ошибки; определяются значения весовых коэффициентов нейросети (аналитически с использованием численных методов, или с применением процедуры обучения). Для достижения необходимых результатов при работе с нейросетыо необходима ее оптимизация. Этот процесс требует выполнения дополнительных исследований для нахождения оптимального числа слоев нейронов, числа нейронов в слое и коэффициента скорости обучения.
При выборе обучающего алгоритма необходимо учитывать ряд специфических обстоятельств. Во-первых, обученная нейросеть должна с заданной точностью решать все тестовые задачи. Поэтому задача обучения нейросети становится многокритериальной задачей оптимизации, при решении которой необходимо найти точку общего минимума большого числа функций. Во-вторых, обученная нейросеть должна иметь возможность приобретения новых навыков без утраты старых или с их незначительной потерей. Это означает, что в достаточно большой окрестности найденной точки общего минимума оценок их значения должны незначительно отличаться от минимальных. Как правило, при реализации обучающего алгоритма возникает ограничение по памяти. Если п - число параметров, то желательно использовать алгоритм, требующий Кп затрат памяти, где K=const. В случае затрат памяти, равных п , необходим тщательный выбор минимального количества параметров сети. Для определения качества обучения выполняется тестирование нейросети. Как правило, сначала тестирование проводят на той выборке, на которой сеть обучалась. Если она обучилась полностью, то при тестировании той же самой обучающей выборки все примеры будут решаться правильно.
Если тестирование выполняется на выборке с заранее известными ответами, но с примерами, не участвовавшими в обучении, можно более объективно судить о качестве обучения. Неправильное определение классов некоторых примеров может быть вызвано следующими причинами: обучающая выборка имеет недостаточное количество примеров; обучающая выборка выбрана не объективно, т.е. примеры подбирались по принципу самого яркого представителя; для объективной работы нейросети необходимо выбирать реальные данные, независимо от их противоречивости; некоторые сетевые параметры при создании сети были выбраны не оптимально; задана неверная классификационная модель. Как показал анализ, выполненный в первой главе, для решения задачи автоматизированного дешифрирования возможно применение ряда нейрометодов, таких как сеть Кохонена, сеть Хопфилда, которые в основном использовались для оконтуривания и классификации объектов. Недостатки, которые связаны с использованием этих методов, заключаются в ограниченности количества запоминаемых классов и низкой точности классификации. Успешнее других для решения задач автоматизированного дешифрирования применялись многослойные нейросети с полными связями между нейронами. Это связано с тем, что, во-первых, многослойные нейросети можно настроить для решения большого круга задач, во-вторых, эти нейросети относительно легко моделировать на персональных компьютерах. Наибольшую сложность в применении многослойных нейросетей для автоматизированного дешифрирования топографических объектов заключается в проблемах с представлением исходных данных в нейросети и их интерпретации. Таким образом, с учетом сложности задачи автоматизированного дешифрирования, многообразия входных данных, наиболее приемлемым для выполнения автоматизированного дешифрирования изображений топографических объектов предлагается использовать различные модификации многослойных нейросетей с различным числом слоев нейронов. Использование некоторых видов таких нейросетей обусловлено различными характерами задач распознавания компактных, линейных и площадных объектов РП и Г но разным наборам признаков.
Разработка метода автоматизированной классификации изображений топографических объектов с использованием нейросети
Одной из важных задач автоматизированного дешифрирования является классификация изображений топографических объектов. Под классификацией, как предварительным этапом распознавания, понимается разделение изображений топографических объектов на группы, однородные по заранее заданным критериям. В результате классификации не выполняются распознавание и точное определение типов объектов. Однако правильно выполненная классификация изображений топографических объектов значительно упрощает последующий процесс их распознавания, повышает полноту и вероятность распознавания, а следовательно и эффективность дешифрирования в целом.
Для классификации объектов могут использоваться яркостные, текстурные и контекстные классификаторы. Яркостные и текстурные классификаторы подробно рассмотрены в работе [65]. Контекстные классификаторы стали применяться лишь недавно.
В настоящее время успешно применяются классификаторы, использующие локальный пространственный контекст [40]. Этот вид классификаторов основан на применении правила максимального правдоподобия, т.е. для каждого элемента назначается тот класс, для которого реализуется максимальное значение апостериорной вероятности при заданном значении признака. Известные модификации этого классификатора основаны на предположении, что характерные размеры объектов значительно превышают размеры элемента изображения. Считается также, что взаимосвязь между двумя произвольными элементами быстро уменьшается при увеличении расстояния между ними и, следовательно, основная часть контекстной информации сосредоточена в небольшой области (окне), окружающей данный элемент. Чаще всего для повышения эффективности контекстной классификации используют рекурсивные алгоритмы.
Применяются и другие способы классификации, когда классификации подвергается целая группа смежных элементов, называемая "объектом". В "объектных" классификаторах явно или неявно используется предполагаемая пространственная корреляция между элементами изображения, а само изображение обычно рассматривается как реализация случайного пространственного поля. Недостатком "объектных" классификаторов является смазывание истинных границ между классами.
Многочисленные исследования в области разработки и практического применения нейрометодов [8, 19, 20, 66] показывают, что в отличие от традиционных классификаторов, в которых последовательно проверяются конкурирующие гипотезы, нейросетевые классификаторы работают параллельно, обеспечивая высокую скорость вычислений. Дополнительными преимуществами также являются устойчивость к сбоям и возможность адаптации или обучения.
В последние годы были выполнены исследования в области применения нейрометодов для автоматизированного дешифрирования изображений топографических объектов [21, 48, 51, 55, 60, 92]. В качестве исходных материалов применялись в основном материалы многозональной и радиолокационной съемок местности, что существенно облегчает применение НС методов [109, 113, 119,122].
Однако, как было изложено в главе 1, основными видами исходных материалов, применяемых для дешифрирования в картографических целях, являются фотографические и оптико-электронные снимки в оптическом диапазоне спектра. Поэтому диссертационные исследования выполнялись в этом направлении.
Автором предложен новый метод автоматизированной классификации изображений топографических объектов с использованием неиросети. Новизна этого метода заключается в использовании неиросети большой размерности в качестве предварительного разделения изображения на несколько классов, которые на следующем этапе поступают на вход блока распознавания.
Разработанный метод включает следующие этапы: обучение НС по фрагментам эталонных изображений из базы ЭИ; подготовку данных для классификации исходного снимка; получение НС решения классификации; формирование результатов классификации.
Для выполнения классификации выбрана многослойная континуальная НС, показанная на рисунке 7, так как она позволяет обрабатывать большой объем данных с высокой скоростью. Архитектура НС (число промежуточных слоев, число нейронов в слоях, вид функции активации) определялась экспериментально.
Исходные данные, вычислительные и программные средства экспериментальных исследований
В качестве исходных данных для выполнения экспериментальных исследований использовались специально подготовленные эталонные наборы данных на следующие физико-географические районы умеренного и субтропического климатических поясов: холмистого лесостепной зоны; горного пустынно-степной зоны; равнинного пустынной зоны. Выбор наборов исходных данных был обусловлен тем, что их состав был специально оптимизирован по результатам исследований, выполненных с участием автора в НИР "Эталон-96". Сформированные наборы исходных данных использовались для проверки технологии автоматизированного дешифрирования в ходе Государственных испытаний программно-технологической системы "САДКО". В состав наборов были включены следующие материалы, объединенные в базе знаний, базе ЭИ, базе ГЛСМ: материалы космической съемки с изображениями топографических объектов, полученные панорамной, кадровой и щелевой съемочными камерами в масштабе от 1:70 000 до 1:200 000; эталоны камерального дешифрирования и их описания; топографические карты масштаба 1:50 000,1:100 000 и 1:200 000; литературно-справочная информация. В качестве вычислительных средств была использована графическая станция SiliconGraphics 320, предназначенная для обеспечения автоматизированного дешифрирования изображений топографических объектов и эффективного использования специализированных программных средств.
В качестве специализированных программных средств использовался универсальный нейросетевой пакет NeuroSolutions фирмы NeuroDimension Inc. и программа тематической интерпретации данных дистанционного зондирования ScanEx NeRis (Neural Raster Interpretation System). Нейропакет NeuroSolutions применялся для проектирования и моделирования нейросетевых структур, которые использовались при реализации предложенных автором методов классификации и распознавания изображений топографических объектов. Выбор этого нейропакета был обусловлен тем, что он включает мощный редактор визуального проектирования НС, позволяющий создавать практически любые собственные НС структуры и собственные алгоритмы их обучения. Нейропакет имеет достаточно мощные средства для организации работы со стандартными графическими изображениями в формате bmp. По оценке специалистов в области искусственного интеллекта [48], NeuroSolutions является одним из самых мощных нейроиакетов в мире для решения задач прогнозирования и моделирования классификаторов и распознающих систем. Программа ScanEx NeRis предназначена для обработки исходных данных дистанционного зондирования (визуализация, фильтрация, получение новых изображений расчетными методами). В ходе экспериментальной проверки методики программа использовалась на этапе формирования набора АДП распознаваемых изображений.