Введение к работе
нктуальность проблеми. В настоящее время существенно повысился интерес к решению разнообразных задач автоматизации научных исследований и технологических процессов. Многие из этих задач связаны с обнаружением заданных объектов или классов объектов на изображениях. В качестве примеров можно привести задачи анализа аэрофотоснимков, управления автономным роботом-манипулятором, снабженным средствами технического зрения, автоматизации медико-биологических исследований и т.д.
Одним из способов решения указанных задач является метод сравнения с эталоном. Он достаточно часто позволяет достичь желаемого результата в тех случаях, когда другие методы по различным причинам (невозможность явного выделения характерных признаков, сильная зашумленность или слабая структурированность изображения и т.д.) работают неудовлетворительно. Однако, методы сравнения с эталоном имеют и общий недостаток связанный с весьма низкой скоростью работы. Так как при решении многих задач распознавания выдвигаются достаточно жесткие ограничения на время принятия решения, этот недостаток становится весьма существенным.
Эффективным способом ускорения работы методов сравнения с эталоном является применение пирамидально-рекурсивных структур видеоданных, предложенное в ряде работ (Р.Янг, Е.Холл, С.Танимото, В.В.Александров и "Н.Д.Горский). Однако, рассматриваемая задача обладает рядом особенностей; требующих доработки существующего к настоящему времени теоретического аппарата. Во-первых, при прямой реализации пирамидально-рекурсивного подхода проявляется мешающее влияние фона, попадающего вместе с объектом в прямоугольное окно эталона: Во-вторых, допущение о произвольной ориентации объекта приводит к необходимости хранения не одного его прототипа, а достаточно большого их числа, отличающихся лишь своей ориентацией.
В случае решения задачи идентификации на изобрахении не одного, а нногих классов объектов, дополнительно встает вопрос о необходимости предварительного отсева неперспективних эталонов, так как в протиЕНС.ч случае время принятия ресения становится слишком большим. Данная проблема мохет быть решена с помощью привлечения дополнительных источников информации, в частности, атрибутивного и контекстного характера. Однахо, существующие в настоящее время подходы к совместному учету нескольких источников информации не всегда позволяют добиться хелаемого результата в такой специфической области, как обработка и анализ изобрахении.
Пель работы. Целью диссертационной работы является разработка методов и алгоритмов идентификации на изобрахениях объектов, задаваемых эталонной и контекстной информацией на основе использования пирамидально-рекурсивных струкур данных.
Для достихекия этой цели в работе решаются следующие основные задачи:
1; разработка метода быстрого поиска на изобрахении объекта произвольной формы и ориентации;
2) разработка методики совместного использования
различных методов при идентификации на изобрахении мнохества
объектов;
-
разработка способа оценки надехности работы созданных' алгоритмов идентификации объектов;
-
создание математического и программного обеспечения систем локализации и идентификации объектов иа полутоновых и бинарных изобрахениях.
Научная новизна. В процессе реиения поставленных задач получены следующие новые научные результаты, которые выносятся автором на защиту:
1) метод быстрого понсха на полутоновых изобрахениях
двумерного объекта слохнои формы і! произвольной ориентации;
2) методика комплексного использования эталонной,
жситехепняг и атрибутивной информации при идентификации на
изображении нескольких объектов, задаваемых множеством эталонов:
3) способ хранения информации о форме объектов при
применении пирамидально-рекурсивных структур видеоданных:
4) способ расчета вероятности необнаружения заданного
объекта при использовании пирамидально-рекурсивных структур
для поиска объектов на полутоновых изображениях.
Практическая ценность работы. Практическая ценность
полученных результатов заключается в следующем:
1) разработана подсистема поиска объектов на
изображении, являющаяся составной частью системы
автоматизированной обработки изображений "РЕКС и
позволяющая идентифицировать заданные в базе видеоданных
объекты-прототипы на исследуемом изображении;
2) разработана система распознавания текстов "INTEXT",
позволяющая распознавать текст на машинописных и
типографских документах, введенных в компьютер посредством
сканера или другого устройства ввода изображений;
3) разработана подсистема принятия решения о
распознаваемом объекте на основании информации, поступающей
от нескольких независимых источников;
4) разработана подсистема обучения программы
распознавания текстов при работе с новыми нрифтами.
Реализация и внедрение. Результаты диссертационной работы получены в процессе выполняемой в ЛИИАН темы "Создание и ввод в эксплуатацию специализированной автоматизированной системы обработки изображений на основе пирамидально-рекурсивных структур данных" (НТП 0.80.03., задание 07.05.) и конкурсного научно-технического проекта в рамках государственной научно-технической программы "Перспективные информационные технологии" - "Разработка интеллектуальных систем анализа и синтеза визуальной информации на основе пирамидально-рекурсивных структур." Программа распознавания объектов была использована при создании в ЛИИАН аппаратно-программной системы автоматизированной обработки изобрахений РЕКС. Программа
распознавания текстов INTEXT используется в следующих организациях Санкт-Петербурга: объединении Лентрансгаз, акционерном обществе "Ниеншанц", центральном телеграфе Санкт-Петербурга, обществе с ограниченной ответственностью "Руссикон", Государственном Оптическом Институте им. С.И.Вавилова. Результаты диссертационной работы внедрены в институте информатики и автоматизации РАН.
Апробация работы. Основные результаты диссертационной работы докладывались на:
XVIII Дальневосточной математической школе-семинаре, Находка, 1988 г.
IV Всесоюзной конференции "Методы математического распознавания образов", Рига, 1989 г.
III Всесоюзной конференции "Автоматизированные системы обработки изображений", Ленинград, 1989 г.
II Республиканском семинаре по проблемам создания систем обработки, анализа и распознавания изображений, Ташкент, 1990 г.
публикации, по теме диссертации опубликовано 7 научных работ.
Объели и структура работы. Диссертационная работа состоит из введения, 4 глав и заключения (120 страниц машинописною текста), приложения (10 страниц), списка литературы (55 наименований на 7 страницах).