Содержание к диссертации
Введение
1 Структурный синтез систем локализации объектов в потоках изображений динамических сцен 17
1.1 Формализация описания систем локализации изображений в последовательностях взаимосвязанных сцен 18
1.2 Анализ параметрических и корреляционно-экстремальных методов локализации изображений динамических объектов 21
1.3 Проблемный анализ признаковых методов локализации 28
1.4 Концепция построения систем локализации изменяющихся изображений объектов 34
1.5 Постановка задач исследований 42
2 Синтез многоуровневой системы функционально-геометрических признаков изображений объектов 46
2.1 Синтез линейных интегро-дифференциальных операторов отображения изображений 46
2.2 Исследования автокорреляционных фильтров Уолша и оператора формирования локальных признаков 53
2.3 Характеристики класса автокорреляционных фильтров в базисах ортогональных преобразований 61
2.4 Выбор оператора формирования признаков объектов и анализ его вероятностных характеристик 67
2.5 Инженерный расчёт вероятности ложной тревоги и методы её снижения 74
3 Разработка базовых методов локализации объектов в потоках изображений динамических сцен 79
3.1 Формальное описание базовых методов с системой функционально-геометрических признаков 79
3.2 Алгоритмические особенности метода локализации изображений объектов малой протяжённости 83
3.3 Алгоритмический синтез метода локализации для протяжённых изображений 85
3.4 Экспериментальные исследования устойчивости и сходимости алгоритмов базового метода 90
4 Исследование методов повышения допустимой сложности динамических сцен 97
4.1 Анизотропия операторов отображения как фактор ограничения сложности сцен 97
4.2 Исследование способов достижения изоморфизма пространств локальных признаков 103
4.3 Анализ пересечений множеств локальных признаков 107
4.4 Структурно алгоритмический синтез методов локализации объектов для изображений сложных сцен 112
5 Теоретические предпосылки обобщения линейных отображений изображений их вэйвлет преобразованием 118
5.1 Вэйвлет преобразование изображений как способ преодоления неопределённости выбора апертуры фильтров 118
5.2 Особенности построения дискретного вэйвлет преобразования 126
5.3 Представление автокорреляционных фильтров Уолша BZ-области 130
5.4 Разложение квадратичных сплайнов в конечные ряды автокорреляционных функций Уолша 134
5.5 Представление автокорреляционных функций Уолша степенными сплайнами 143
6 Синтез дискретных вэйвлет преобразований для формирования локальных признаков изображений 153
6.1 Z-образы дискретных последовательностей с произвольными степенями децимации 153
6.2 Исследования дискретного вэйвлет преобразования с квадратичными сплайнами 157
6.3 Синтез ДВП с повышенными степенями децимации 163
6.4 Структурно-алгоритмический синтез ДВП с автокорреляционными вэйвлетами Уолша 168
6.5 Структурный синтез линейных по смещениям операторов множественного отображения 176
6.6 Обобщённая структура метода локализации объектов в потоках изображений сложных сцен 180
7 Применение результатов исследований в решении прикладных задач 186
7.1 Проект телевизионного автоматического визира 186
7.2 Особенности проектирования АСДН с активным зондированием пространства 197
7.3 Локализация биоэлектрических сигналов в технике клинических исследований 201
Заключение и основные результаты работы 205
Список использованных источников 207
- Концепция построения систем локализации изменяющихся изображений объектов
- Выбор оператора формирования признаков объектов и анализ его вероятностных характеристик
- Экспериментальные исследования устойчивости и сходимости алгоритмов базового метода
- Структурно алгоритмический синтез методов локализации объектов для изображений сложных сцен
Введение к работе
Дистанционные исследования объектов и явлений по своей сути являются исследованиями излучаемых и/или отражённых ими физических полей, регистрируемых в удалённой точке наблюдения. Это электромагнитные поля в различных диапазонах длин волн, акустические, радиационные, магнитные и другие, а их выбор определяется целями исследований выбранных объектов и явлений. Регистрируемые интенсивности поля в виде массивов действительных чисел представляют собой первичные данные и содержат информацию об объекте, которую необходимо выделить в процессе их обработки.
Наибольшей информативностью и адекватностью представления данных об объекте исследований обладают системы, которые позволяют массивы первичных данных упорядочить на плоской решётке целочисленных координат. Такие массивы ограниченных размеров обобщённо называют плоскими изображениями той или иной физической природы. Изображения описывают многомерными векторами, матрицами, дискретными функциями двумерных аргументов, а для обозначения их элементов и значений используют обобщающий термин яркостей точек изображения.
Типичные изображения в своём большинстве представляют собой сцены, матрицы которых помимо областей элементов, принадлежащих объекту исследований, содержат области, принадлежащие другим объектам и/или фону. И если одна или несколько характеристик (положение, форма, размеры, распределение яркостей точек) одной или нескольких таких областей функционально зависимы от времени, то соответствующие таким матрицам сцены относят к динамическим. Для представления динамических сцен необходимо уже иметь множество массивов взаимосвязанных данных, упорядоченных по оси дискретного времени и формирующих потоки изображений сцен или, иначе, последовательности кадров изображений. Изучение объектов в потоках динамических изображений сцен позволяет не только снизить искажения результатов, но и получить недоступные в исследованиях по единичным сценам данные об объ-
екте наблюдения, его эволюциях, о структурных отношениях и динамических связях с другими объектами и наблюдателем. В силу этих возможностей такие исследования объектов вызывают широкий интерес, имеют большое научное и практическое значение.
С задачей дистанционного изучения объектов естественным образом сопряжена задача локализации на сценах их изображений, описываемых эталонами или моделями. Эта задача понимается как выделение изображения интересующего объекта на сцене и определение его координат. Её решение заключается в поиске такой области двумерной функции изображения предъявленной сцены, в которой эта функция соответствует аналогичной функции эталона (модели). При этом оценки координат объекта получают решением системы уравнений или неравенств, составленных из линейных или нелинейных функций от значений и аргументов найденной области функции сцены. Для полученной последовательности оценок выбирают закон сглаживания и экстраполяции координат и подбирают такие его параметры, которые минимизируют целевой функционал в виде функции невязки истинных координат и их оценок.
Решение с должным качеством задачи автоматической локализации изображений объектов на динамических сценах позволяет реализовать в системах дистанционного исследования объектов целый ряд важных функций.
Распознавание объектов. Обеспечивает непрерывную идентификацию объектов, выбранных для исследований, на множестве других объектов сцены.
Оценивание характеристик объектов. Как правило, интересуют площадь, интегральная и максимальная яркости, контраст, текстура, ориентация, относительный масштаб, динамика перемещения и трансформации и др.
Селекция объектов. Обеспечивает выделение других объектов сцены, оценку их характеристик, взаимного влияния, структурных отношений и динамических связей с объектами исследований и наблюдателем.
Автоматическое сопровождение объектов. Или автоматическое позиционирование изображения исследуемого объекта, как правило, в центре изображения динамической сцены. Реализуется автоматической подстройкой про-
странственного положения "поля зрения системы" замыканием координатных следящих контуров.
Автоматическое обнаружение объектов. Служит для упрощения функций наблюдателя, либо для замещения этих функций. Применяется для объектов с априорно известными характеристиками и/или с априорно заданными решающими правилами.
Стабилизация поля зрения системы. Обеспечивает дополнительную следящую стабилизацию пространственного положения поля зрения по координатам какого-либо статического объекта сцены.
Адаптация к объектам и условиям наблюдения. Одна из основных и проблемных функций. В общем случае реализуется структурными, алгоритмическими и параметрическими методами адаптации.
Важность и характер приведённых функций дают основания утверждать, что задача автоматической локализации изображений динамических объектов играет центральную роль в решениях объемлющей задачи их дистанционного исследования. Актуальность исследований по совершенствованию и созданию новых методов локализации, как основы повышения качества и функциональных возможностей технических систем дистанционного исследования объектов, дополнительно подчёркивается широтой их практических приложений.
Робототехника. Охватывает системы диспетчирования заготовок в цехах, сортировки деталей на конвейерных линиях, технического контроля готовой продукции, роботизированного автотранспорта, регистрации и поиска автомобилей в транспортных потоках, а также подсистемы ориентации космических аппаратов и другие системы.
Геодезия и картография. Включает системы автоматической регистрации деталей рельефа, точной топопривязки на местности, автоматического счисления пути.
Аэрокосмические исследования ресурсов. В сочетании со спектрозональ-ными методами анализа позволяют автоматизировать прогноз и оценки урожа-
10 ев, водных и лесных ресурсов, поиск полезных ископаемых, обнаружение природных явлений и аномалий и др.
Метеорология и метеонаблюдения. Включают наземные, воздушные и космические системы автоматического обнаружения метеоявлений, оценки облачных образований, метеорологической дальности видимости.
Военное дело. Включают автоматические и автоматизированные информационно-управляющие и информационно-советующие системы управления, наведения, разведки и обнаружения.
Траекторные измерения. Охватывают информационно-измерительные и информационно-советующие автоматические системы регистрации траекторий метеоракет, исследовательских зондов, глиссад взлёта и посадки самолётов, фигур высшего пилотажа.
Системы видеонаблюдения. Включают автоматические системы охраны территорий, объектов, системы управления движением, контроля аэродромного и автодорожного трафика.
Телевизионная журналистика. Используют автоматизированные системы стабилизации и кадрирования высокодинамичных изображений, изображений при съёмках длиннофокусными объективами или/и при съёмках с движущихся платформ.
Даже краткая характеристика приложений задачи автоматической локализации даёт представление о том, какие высокие требования к качеству и условиям решения задачи предъявляет практика применения технических систем. Реализация этих требований и требований ближайшей перспективы целиком и полностью определяется применяемыми методами и алгоритмами автоматической локализации изображений объектов в динамических сценах.
Ставшие классическими хорошо известные параметрические, корреляционно-экстремальные и признаковые методы позволяют получить удовлетворительные решения задачи локализации изображений для простых сцен, известных или неизменных моделей объекта (иконических, статистических, призна-
ковых). Существенный вклад в теоретическую базу и общую методологию исследований объектов на последовательностях динамических сцен внесли работы учёных А. Розенфельда, Л. Хармана, Л.П. Ярославского, Г.П. Шибанова, Д.К. Аггарвала, Л.С. Дейвиса, У.Н. Мартина, T.S. Huang, R.J. Shalkoff, Н.Н. Красильникова. Создание и развитие теории параметрических методов локализации принадлежит трудам Ф.И. Барсукова, А.И. Величкина, А.Д. Сухарева, К.В. Михалкова, G.M. Flash, P.G. Pens, R.S. Rogers. Корреляционно-экстремальные методы оформились как самостоятельное перспективное направление исследований благодаря работам учёных A.M. Бочкарёва, В.К. Бак-лицкого, А.И. Юрьева, Е.П. Путятина, У.К. Прэтта, Дж. Ту, Р. Гонсалеса, V.V. Vinod, Н. Murase. Теория признаковых методов локализации изображений пог лучила своё развитие в работах Р. Дуды, П. Харта, У. Гренандера, Э. Патрика, Дж. Ту, Р. Гонсалеса, К. Фукунаги, А.Л. Горелика, В.А. Скрипкина, В.Н. Вап-ника, А.Я. Червоненкиса, А.М Айзермана, Э.М. Бравермана, Л.И. Розоноэра, Е. Gose, R. Johnsonbaugh, S. Jost, J.L. Mundy, A. Zisserman, а наиболее перспективные её направления, названные синтаксическими, структурными или лингвистическими методами, разработаны Ю.И. Журавлёвым, К.С. Фу, И.Б. Гуревичем, У. Гренандером, Р. Хараликом.
В рамках этих методов, разработаны и применяются разнообразные методы обновления и нормализации моделей, которые позволяют компенсировать метрическую группу аффинных преобразований изображений объектов (изменения координат, масштабов, поворотов) и тем самым расширяют применимость классических методов. К этим методам относят также беспризнаковые методы распознавания, компенсирующие нелинейные изменения координатной решётки иконической модели объекта. Значительный вклад в совершенствование методов внесли Д. Кейсесент, Д. Псалтис, А.А. Васильев, А. Розенфельд, Л. Роберте, Р. Дуда, П. Харт, М.И. Либенсон, А.Я. Хесин, Б.А. Янсон, Л. Харман, А. Оппенгейм, В.В. Моттль, Р. Шафер, А.В. Ковалевский. Однако, как следует из приведенных выше характеристик приложений, этого недостаточно для решения многих практических задач в реальных условиях наблюдения. Вследствие недостатков методов локализации, приходится ограничивать классы подхо-
12 дящих объектов, вводить дополнительные ограничения на условия применения, что накладывает на них статус узкоспециализированных, проблемно ориентированных методов.
Анализ прикладных задач также показывает, что многие из них неразрывно связаны с локализацией объектов, структура изображений которых в реальной динамической сцене претерпевает существенные изменения на интервале наблюдения. Такие изменения вызваны естественными эволюциями объектов и/или ракурса их наблюдения. Можно утверждать, что естественные изменения изображений объектов в сцене, подлежащих выделению, являются скорее правилом, чем исключением, и часто используемые в известных методах предположения о квазипостоянстве изображений объектов наблюдения малореалистичны.
Изменения изображений искомых объектов есть следствие изначального противоречия между трёхмерными объектами и их плоскими проекциями с наложенными на них рельефами яркости того или иного физического поля. Первичные данные именно таких проекций, или изображения, а не данные самих объектов, подвергаются обработке для получения целевой информации. Противоречие порождает априорную неопределённость анализируемых изображений, нарушение адекватности сопоставления триады объект - модель - область сцены, что в конечном итоге приводит к аномальным погрешностям локализации и срыву автоматического процесса как такового. В таких условиях классические методы локализации изображений либо не дают удовлетворительных решений в принципе, либо поднимают крупные теоретические проблемы. Даже их частичное решение требует существенных компромиссов в классах объектов, их динамике, сложности сцен, мощности их потоков, степени автоматизации процессов, временном масштабе реализации.
Таким образом, проблема изменений изображений исследуемых объектов представляется основной проблемой в решении задач их автоматической локализации в потоках изображений динамических сцен. Проблема существует вне зависимости от применяемых методов локализации. В этом смысле, а также с
13 учётом центральной роли и широты практических приложений задач локализации, проблема характеризуется как крупная.
Настоящая работа посвящена углублению теории и разработке методологии локализации объектов в изображениях динамических сцен в реалистичных условиях изменений изображений этих объектов, наблюдаемых в автоматическом режиме.
В качестве общей теоретической основы решения этой проблемы в работе принята признаковая методология локализации объектов в рамках теории распознавания образов. Такой подход выбран на основании критического анализа других известных методов, который не выявил перспективы удовлетворительного решения основной проблемы в их рамках. Постановка задачи локализации изменяющихся изображений в рамках теории распознавания образов также далеко не стандартна. Она характеризуется двухальтернативным распознаванием, малой (единичной) обучающей выборкой, динамическим образом объекта, пересекающимися по совокупности сцен кластерами альтернативных образов, принятием решений о принадлежности образов по каждой сцене в реальном масштабе времени. Сформулированная таким образом задача выходит за рамки классических методов распознавания, требует пересмотра сложившихся подходов к синтезу признаков, признаковых пространств и решающих правил в силу возникающих проблем и противоречий с постановкой задачи.
В классической теории проблема формирования признаков молчаливо опускается. Ограничиваются лишь обобщёнными рекомендациями, проблему в целом считают «скорее искусством, чем наукой», а её решение практически всегда возлагают на эвристические подходы и интуицию исследователя. Применительно к изображениям, рекомендации сводятся к выявлению структурных различительных признаков, которые минимизируют внутриклассовые расстояния в признаковом пространстве. Противоречие выражается в том, что именно структурные признаки неинвариантны к типичным изменениям изображений объектов в потоках динамических сцен.
14 В классических методах решающее правило строится на представительной обучающей выборке центральных образов классов и остаётся неизменным в условиях последовательного предъявления образов. Используют, как правило, линейные разделяющие границы классов образов в едином признаковом пространстве и увеличивают его размерность для повышения мощности решающего правила. В рассматриваемой постановке задачи, каждая сцена из их потока одновременно содержит множество выборочных образов разных классов. Разделяющие границы требуется проводить между отдельными образами и изменять их от сцены к сцене. Очередная сцена играет роль, по сути, единственной обучающей совокупности, выдвигая на первый план проблему малой обучающей выборки при коррекции разделяющих границ для следующей сцены. Увеличение размерности признакового пространства, с одной стороны, ограничено проблемой выбора признаков, инвариантных к изменениям изображений объектов, ас другой стороны - опасностью переобучения в условиях малой обучающей совокупности.
Решение основной проблемы локализации изменяющихся изображений, а также проблем и противоречий, вытекающих из постановки задачи в рамках классической теории распознавания образов, привело к необходимости решения важных теоретических вопросов и проведения комплексных исследований. Существо и результаты исследований изложены в семи разделах.
В первом разделе рассматриваются вопросы структурного синтеза и формального описания систем автоматической локализации объектов в потоках изображений динамических сцен (САЛИ). Исходя из формального представления трёхмерных объектов наблюдения и основных функций компонентов систем, формируются обобщённые математические модели датчиков изображений и собственно САЛИ, вводятся целевые функционалы и критерии их выполнения. С позиций полученных моделей и целевых функционалов анализируются параметрические, корреляционно-экстремальные и признаковые методы локализации. Показаны их достоинства и недостатки, установлены методологические ограничения на возможности решения основной проблемы локализации
15 изменяющихся изображений. Предложены концепция построения САЛИ на базе признаковых методов распознавания образов и обобщённая структура системы, реализация которых позволяет разрешить выявленные проблемы. Сформулирована цель и конкретизированы задачи исследований.
Во втором разделе исследуются вопросы аналитического синтеза многоуровневой системы функционально-геометрических признаков (ФГП) изображений объектов. В основу синтеза положены неформальные требования к линейным операторам отображения изображений, предложенная концепция и соответствующая ей структура системы. Исследуются свойства операторов, локальных признаков, признаков объектов. Делаются обобщения полученных ин-тегро-дифференциальных операторов на класс автокорреляционных фильтров в базисах ортогональных преобразований. Рассчитываются вероятностные характеристики помехоустойчивости операторов отображений, проводится сопоставление рассчитанных данных с результатами математического и имитационного моделирования.
Третий раздел посвящен построению методов и алгоритмов локализации изображений объектов, основанных на системе ФГП. Рассматривается построение базовых методов локализации малоразмерных и протяжённых изображений объектов в несложных динамических сценах. Пошаговые процедуры формирования признаковых моделей объектов, локальных решающих функций и обработки изображений в целом, соответствующие предложенным методам, представлены в алгоритмической форме. Приводятся результаты экспериментальных исследований как характеристик признаков, так и устойчивости и сходимости алгоритмов методов в целом.
В четвёртом разделе исследуются возможности повышения допустимой сложности динамических сцен в методах автоматической локализации изображений. Исследуются основные причины, порождающие ограничения на допустимую сложность изображений сцен, предлагаются методологические и алгоритмические решения по ослаблению ограничений. Выявляется возможность и оценивается эффективность введения логических решающих правил при фор-
мировании локальных признаков объектов. По результатам исследований, уточняется алгоритмическое описание метода локализации объектов для сложных динамических сцен.
В пятом разделе развиваются теоретические предпосылки обобщения множества операторов линейных отображений, необходимых для повышения допустимой сложности динамических сцен в САЛИ, одномерными вэйвлет преобразованиями изображений. Представление сечений функций изображений одновременно в частотной и временной областях, или их вэйвлет преобразование, рассматривается как необходимое и достаточное средство преодоления априорной неопределённости выбора разрешающей способности автокорреляционных фильтров. Предлагаются и доказываются теоретические утверждения, необходимые для построения новых видов дискретных вэйвлет преобразований, которые были бы согласованы с разработанными методами локализации.
В шестом разделе решаются задачи синтеза алгоритмов и структур вэйвлет преобразований с автокорреляционными вэйвлетами Уолша для группового оператора отображения изображений. Построены и исследованы вэйвлет преобразования с произвольными степенями децимации, с квадратичными сплайнами, степенными сплайнами, пакетное вэйвлет преобразование и избыточное вэйвлет преобразование с автокорреляционными вэйвлетами Уолша. Показано, что интегро-дифференциальные операторы отображений, фильтрация изображений автокорреляционными фильтрами Уолша и соответствующее избыточное вэйвлет преобразование являются частными случаями единого оператора группового дискретного вэйвлет преобразования. Полученные результаты позволили существенно повысить допустимую сложность динамических сцен за счёт ослабления требований к размещению множества объектов на сцене.
В седьмом разделе рассматриваются вопросы применения результатов исследований в решении прикладных задач. Приведены практические примеры структурного проектирования телевизионных автоматических визиров, визира с активными зондирующими сигналами и новое решение задачи совершенствования медицинских информационных систем.
Концепция построения систем локализации изменяющихся изображений объектов
Концепция построения системы должна в обобщённом виде давать представление о методах обработки исходных данных в системе, основных принципах, условиях, ограничениях и допущениях их реализации, о проблемах и возможных мерах по их преодолению. Применительно к САЛИ, необходимо сформулировать, каким образом реализовать функционал (1.4), чтобы обеспечить достижение цели (1.5) в условиях объективного существования проблемы локализации изменяющихся изображений объектов [83].
Анализ методов локализации изображений показал, что в основу концепции следует положить признаковые методы распознавания образов с использованием преимущественно детерминистского подхода. При этом функционал (1.4) переходит в выражение (1.9), вводится вспомогательная цель адаптации (1.10), конкретизируются существенные условия реализации 1, ...,6 (см. подраздел 1.3), а платой за недостаток статистических характеристик будет неопределённость в степени оптимальности полученных решений.
Естественные изменения изображения объекта с переходом к признаковому описанию, которое имеет известные преимущества (сжатие, единообразие описаний, гибкость и др.), приводят к изменениям, что очень важно, лишь одного или нескольких компонентов, суть скаляров it- п его вектора П.- [84].
Появляется возможность плавно подстраивать эталонный вектор признаков ОИ П0 =Пу по полученным оценкам вектора Пу , то есть реализовать для изображений известную концепцию подстраиваемой модели объекта [82]:
Применим в САЛИ принцип подстраиваемой модели искомого объекта, позволяющий принципиально решить проблему распознавания и локализации изменяющихся изображений объектов. Корректировку модели будем производить по апостериорным оценкам вектора признаков ОИ в каждой сцене из их последовательности.
Решение проблемы локализации изменяющихся изображений объектов признаковыми методами неразрывно связано с проблемой выбора адекватных признаков, которая рассматривается как ключевая в теории распознавания образов. В нашем случае она полностью определяет выполнение условия 6 (подраздел 1.3), и в значительной мере влияет на другие.
Классическая теория распознавания образов подробно освещает лишь одну сторону проблемы выбора признаков - оптимизации их выбора из определённого множества. В статистических подходах для этого используют методы минимизации энтропии классов образов, максимизации межклассовой дивергенции, разложения функции классов по системам ортогональных функций, и др., а в детерминистских - непосредственные оценки вероятности правильного распознавания. Другой аспект проблемы - как определить исходное множество признаков, - теория относит на опыт исследователя и ограничивается общими рекомендациями выделения различительных признаков объектов, т.е. признаков, которые с высокой вероятностью выделяют объект исследований из всех других объектов. Поскольку такие признаки не всегда возможно выделить или измерить, то применяют существенные признаки, которые не несут достаточной различительной информации, дают множественные решения, расширяют размерность признакового пространства, но при достаточном их числе позволяют стабилизировать качество процедур классификации на приемлемом уровне. Применительно к изображениям, к таким признакам относят геометрические или структурные (прямые линии, углы, контуры, площади, размеры, координаты и др.), а также функциональные, или математические. В качестве последних применяют статистические средние областей изображений, локальные коэффициенты корреляции, спектральные коэффициенты Фурье, Меллина, Уолша, моментные функции и другие признаки, вычисляемые в каждой сцене [84, ..., 86]. В приложении Б приведён пример локализации изображений объектов с использованием системы моментных признаков вида (1.3).
Однако известные признаки не позволяют гарантировать соблюдение условия 6, поскольку не всегда сохраняют свои различительные свойства для классов и выборочных образов объектов на сложных фонах и неустойчивы к преобразованиям изображений. Последнее обстоятельство значительно осложняет основную проблему локализации объектов в потоках изображений динамических сцен.
Для решения проблемы выбора признаков примем гипотезу непрерывности изображений объектов в пространстве и времени. Гипотеза практически не ограничивает классы объектов исследований, позволяет ослабить влияние изображений природных объектов и явлений, рассматриваемых как помехи, не обременяет теоретические выводы противоречиями и представляется вполне реалистичной.
Используем достоинства алгебраических и синтаксических методов и тт( ) применим иерархическую систему признаков ГГ , пока неопределенных. Система признаков позволит использовать информацию о деталях изображений (локальные признаки), об объектах (признаки объектов) и о связях и отношениях в иерархии признаков. Варьирование количеством уровней признаков Я и их числом позволит изменять размерность обобщённого признакового пространства и, соответственно, мощность обобщённого решающего правила [87].
Предъявим к признакам требование привязки к геометрии изображения объекта, такое требование, чтобы проекции векторов признаков объектов П. на координатное поле соответствовали координатам объектов С , а проек ции векторов локальных признаков соответствовали координатам деталей объектов. При этом изображение объекта на координатном поле будет представлять собой геометрическое место точек проекций локальных признаков, которое в том или ином виде будет существовать при изменениях изображения в силу принятой гипотезы непрерывности. Усилим качественные требования к признакам требованием учёта "энергии" изображения объекта и его деталей (функция размеров и распределения интенсивности). Энергетические характеристики существуют, если существуют сами изображения, и в этом смысле позволяют сохранить устойчивость признаков к произвольным преобразованиям изображений объектов [88]. С другой стороны, использование только энергетических признаков с очевидностью приводит к отождествлению разных изображений, обладающих равными энергиями, что дополнительно подтверждает обоснованность совместного использования функциональных признаков с признаками другого рода, в частности с геометрическими.
Иерархическую систему локальных признаков и признаков объектов, включающую функциональные (энергетические) и геометрические признаки, учитывающую их взаимосвязи и отношения, будем называть системой функционально-геометрических признаков (ФГП).
Выбор оператора формирования признаков объектов и анализ его вероятностных характеристик
Оператор формирования глобальных признаков, или признаков объектов, (t) должен отображать векторы локальных признаков П. из пространства ло кальных признаков Qv , или области пространства, или подпространства, в векторы Щ пространства глобальных признаков Dr (см. рисунок 1.4):
Для п -ой сцены из их потока и г -го оператора Q из их множества исходное множество локальных признаков в (2.28) соответствует выражению гп=ПгпРг ггп где локальные признаки описываются формулами (2.18). Опустим индексы сцен и операторов и представим проекцию 9Я на поле координат пространства Qr матрицей ГГ (i, j] , в которой наличие признака будем обозначать единицей, а отсутствие - нулем (рисунок 2.9).
0 12 10 j Если изображение BliJJ пред ставляет собой аддитивную смесь изображения объекта и шума, то единицы в матрице будут группироваться в области, соответствующей объекту и на строках, пересекающих изображение объекта Рисунок 2.9. Пример формального (стр(ЖИ 2,...,5ш рисунке 2.9). Учитывая представления матрицы ло кальных признаков. принятую гипотезу непрерывности изо бражений объектов, будет справедливым говорить о пространственной связности [16, 33] локальных признаков. На дру гих строках матрицы координата j единиц будет являться случайной дискрет ной величиной с равномерным законом распределения, что следует из (2.20), (2.21) при подстановке БтЪ =0 . Следовательно, задачу локализации изображений объектов можно сформулировать как задачу нахождения связных множеств локальных признаков и их центров.
Связность признаков является эффективным оператором их композиции [74,100, 101] и часто используется в задачах непараметрической классификации образов. В нашем случае, без потери общности невозможно принять реалистичные допущения о двумерных плотностях, которые позволили бы классифицировать локальные признаки на принадлежность объектам и сформировать их признаки. Учитывая эти причины, применим оператор координатной связности локальных признаков в качестве оператора формирования глобальных (Я) признаков Q , который хорошо вписывается в систему ФГП.
При использовании оператора связности для объектов, представленных малым количеством единиц, возникает проблема их отождествления со связными цепочками, случайно сформированными из-за воздействия шума. Проблема порождает задачу нахождения минимального количества связных единиц, сформированных при воздействии шумового поля, вероятность появления которых не превышала бы заданного значения вероятности ложной тревоги (ВЛТ). Решим эту задачу для вертикальных двусвязных множеств единиц, под которыми будем понимать множество смежных по направлению «верх-низ» точек в координатном поле [33] (единицы на строках 4 и 5, рисунок 2.9).
Математически задачу сформулируем следующим образом. Задана выборка из I (число анализируемых строк) положительных целых чисел, имеющих равномерный закон распределения на интервале от 1 до X (число элементов в строке матрицы ГГ (i, j) ). Необходимо найти вероятность того, что в данной выборке найдется последовательность из / чисел, в которой рядом стоящие числа отличаются не более, чем на параметр связности Ах =0 .
Рассмотрим последовательность событий А , гДе событие Л-=1 состоит в совпадении координат і и і+l строк, а А- =0 -внесовпа 69 дении. Элементарная вероятность единичного исхода события Л р=1/Х ,а нулевого исхода-q=l-p . Обозначим Р вероятность того, что среди у=1-1 независимых испытаний найдется участок длинной I и более, на котором встречаются одни «1» . Тогда Qy =1-Р - вероятность того, что на любом участке длины I встретится хотя бы один «О» . Рассмотрим последовательность (1-1) независимых испытаний. Иллюстрация этого случая приведена на рисунке 2.10, на котором испытания занумерованы и выделен участок от номера и-1 до u .
Экспериментальные исследования устойчивости и сходимости алгоритмов базового метода
Экспериментальные исследования обобщённых алгоритмов составляют важную часть поставленных в подразделе 1.5 задач исследований. Они позволяют получить оценки практических результатов разработки базового метода локализации динамических изображений, обобщить результаты выполненных исследований свойств, статистических характеристик признаков и операторов отображений, которые представлены на рисунке 2.3 и в таблицах 2.3,..., 2.6.
Необходимость и обязательность экспериментальных исследований сходимости и устойчивости алгоритмов метода [37, 61] применительно к решаемой проблеме обусловлена следующими условиями: недоступностью прямого измерения состояний ОИ, непараметрической априорной неопределённостью аналитического описания изображений объектов сцен, использованием преимущественно детерминистского метода распознавания образов. В силу этих причин, вынужденный отказ от оптимальных критериев и переход к критериям диссипативности систем определил методы прямых оценок вероятностей локализации в качестве методологии экспериментальных исследований алгоритмов. Стохастический характер изображений учтён заменой целевого функционала (1.5) в алгоритмах метода на функционал сходимости траекторий системы по вероятности (частости) Рс в область єс вида [82]:
Исследования устойчивости и сходимости алгоритмов базового метода при изменениях изображений объектов и параметров алгоритмов выполнены методом имитационного моделирования. Динамические сцены представлялись последовательностями Вп в 1000 кадров. Изображения в областях сцен, размерами 64x64 э.д., представляли собой аддитивную смесь реализаций гауссов-ского шума и постоянной функции яркости объекта квадратной формы со стороной /, при известном отношением сигнал/шум д0 . Изображение ОИ с известными координатами перемещалось по эллиптической траектории с линейными скоростями до 8 э.д./кадр.. В алгоритмах локализации малоразмерных объектов использовались АКФУ gr (х) четвёртого порядка, R=H=16 .
Полученные результаты подтверждают устойчивость и сходимость алгоритмов базового метода локализации. Подтверждаются также избирательные свойства алгоритмов к размерам ОИ. При задании типового значения пороговой вероятности Рс =0,95 в (3.23), алгоритм сохраняет работоспособность при i0 3 , что свидетельствует о его высокой помехоустойчивости.
В следующей серии экспериментов оценивалась устойчивость алгоритмов к изменениям изображения объекта. В тех же условиях моделирования, дополнительно изменялись по гармоническому закону и асинхронно форма, масштаб и распределение яркости изображения ОИ, рисунок 3.3.
Полученные данные свидетельствуют об устойчивости алгоритма к существенным изменениям изображения объекта. В сравнении с предшествующими экспериментами, значения вероятностей несколько ниже, что ожидалось и объясняется существенным увеличением степеней свободы изображений.
Однако для применяемых на практике значений точности локализации sc 3 вероятность локализации изображений сохраняется на высоком уровне.
В экспериментах по оценке помехозащищённости алгоритма, в изображения динамических сцен вводились изображения фонов и других объектов с фиксированными координатами, различными формами, масштабами и яркостями. Параметры моделирования: r=l, \iQ 10, sc =3, Рс =0,95 . Объект исследований перемещался по области сцены D 64x64 э.д., включая ситуации выхода части его изображения за пределы области.
Структурно алгоритмический синтез методов локализации объектов для изображений сложных сцен
В процессе исследований основных методологических факторов, ограничивающих применимость базовых методов локализации с системой ФГП, были определены способы их ослабления. Расширение условий хорошего размещения объектов на сцене достигается выделением нескольких векторов признаков на каждой строке изображений, а также анализом матриц изображений по столбцам и диагоналям. Способ направленного анализа матриц решает также проблему анизотропии апертуры фильтров и повышения эквивалентной разрешающей способности методов локализации объектов. Доопределение матриц предъявляемых изображений обеспечивает изоморфизм иерархии координатных подпространств, исключение методических погрешностей в реализации целевого функционала системы. Формирование нескольких однотипных множеств векторов признаков и введение оператора пересечения их проекций эффективно снижает аномальные ошибки локализации объектов на сложных сценах, обусловленные, в том числе, вводимыми в базовый метод совершенствованиями. Рассмотрим подробнее их основные алгоритмические особенности.Как и в базовых методах, оператор Q формирует векторы признаков объектов (3.1) в соответствии с (2.50). Отличия состоят в том, что раздельно (з) (з) формируются два множества векторов Шп , Шп . Для объединения этих множеств и селекции вектора признаков ОИ необходим дополнительный, второй уровень признаков объектов и соответствующее пространство Q , отображение в которое выполним оператором Q . Множество вариаций методов локализации для потоков сложных сцен [97, 105, 106, 108] объединяет общность требований соответствия признаков и пространств системе ФГП при определённом произволе в их конкретизации, под раздел 3.1. В частности, в основу оператора QK может быть также положен принцип пересечения подмножеств, поскольку каждый вектор Пц п , П, формируется подмножествами связных признаков:
Введённые признаки не нарушают условий из (1.12) и сохраняют действенность гипотезы умножения мощностей локальных решающих правил. Оценим дихотомизационную мощность обобщённого решающего правила для структуры метода локализации по рисунку 4.4 с учётом представлений (4.25):
W=2(q1 +2)2(q2 +2)2(q3 +2)2(q4 +2)=16-7-6-841=59136
Отсюда следует, что усовершенствованный метод по мощности решающего правила более чем в 400 раз превосходит базовый и позволяет линейно разделить примерно 59000 объектов на сценах со сложным размещением.
Теоретические предпосылки обобщения линейных отображений изображений их вэйвлет преобразованием
Поиск существенных признаков нестационарных функций привёл к ин-тегро-дифференциальным операторам отображения изображений и их анализу во временной области, а теоретические обобщения операторов коэффициентами преобразования Уолша - Адамара, свёртками с автокорреляционными фильтрами Уолша и, наконец, свёртками с АКФ известных унитарных преобразований позволили сформировать локальные признаки объектов и построить систему ФГП в целом. Вместе с тем, решение проблемы поиска адекватных линейных отображений, как составляющей главной проблемы локализации изменяющихся изображений, нельзя считать завершенным. Причины такого вывода заключаются в необходимости продолжения исследований по преодолению априорной неопределённости масштабов изображений и связанной с ними неизбежностью перехода к анализу в частотной области. Очевидны также необходимость формирования признаков масштаба и их обобщения с существующими с единых теоретических позиций.