Введение к работе
Актуальность исследования. Современные информационно-
телекоммуникационные системы характеризуется тем, что объектом их обработки являются различного рода изображения, достаточно сложные по структуре и с неоднородными статистическими свойствами. Примером могут служить радиолокационные, навигационные, различные медицинские диагностические системы, системы наблюдения за земной и водной поверхностями, ближним космическим пространством. Одной из важных задач таких систем является распознавание изображений. В последние годы решение задачи распознавания осложнилась в связи с необходимостью обработки не только плоских, 2D изображений, но и пространственных, 3D изображений. Развитие технологий трехмерного моделирования на современном этапе актуально и перспективно для создания автономных систем различного назначения.
Среди формируемых изображений особое место по важности содержащейся в ней информации занимают изображения в виде групповых точечных объектов (группировка космических и других летательных аппаратов, изображения антропогенных объектов, в частности, боевой техники и пр.).
Существует несколько актуальных проблем, решение которых связано с необходимостью автоматизации обработки изображений групповых точечных объектов. Одна из них объясняется появлением радиолокационных станций с синтезированной апертурой, способных в высоком темпе осуществлять сбор данных об обстановке на больших участках подстилающей поверхности. Это вызывает, в свою очередь, необходимость получения в реальном масштабе времени результатов обработки таких данных. Особый интерес представляют две задачи: автоматическое обнаружение точечных целей и выделение групп среди обнаруженных такого вида объектов. Необходимость обработки групповых точечных объектов (ГТО) с получением результатов в реальном масштабе времени возникает в радиолокационных системах управления воздушным движением. Динамические изображения ГТО наблюдаются на экранах индикаторов соответствующих систем. Достаточно важной является также задача автоматизированного структурного анализа локализованного ГТО. На его основании делается вывод о характере ордера целей, например, колонна, скопление и т.п.
Основные проблемы распознавания трехмерных изображений ГТО обусловлены действием шумов и наличием неинформативных параметров, происхождение которых вызвано угловым и пространственным рассогласованием распознаваемого объекта с каждым эталонным объектом алфавита классов.
Поэтому проблема распознавания зашумленных и искаженных неинформативными параметрами трехмерных изображений и сигналов является актуальной и интенсивно разрабатывается специалистами в области радиолокации и систем технического зрения. Решение проблемы распознавания
трехмерных изображений и сигналов будет способствовать повышению эффективности радиолокационных и воздушно-космических систем наблюдения за окружающей средой, развитию интеллектуальных робототехнических и навигационных систем.
Работа выполнена в рамках гранта Министерства образования РФ - НИОКР по заданию министерства, per. номер 01-20-1255303 «Теоретическое и экспериментальное обоснование решения проблемы углового согласования изображений трехмерных объектов на основе итерационного подхода».
Степень разработанности проблемы. Важнейшие результаты в области анализа сцен и распознавания образов получены отечественными учеными в рамках НТС РАН по проблеме «Кибернетика» под руководством академика РАН Ю.И. Журавлева. Следует отметить Самарскую школу под руководством член корр. РАН В.А. Сойфера, Новосибирскую школу под руководством д.т.н., профессора B.C. Киричука, Нижегородскую школу под руководством д.ф.-м.н., профессора Ю.Г. Васина, Курскую школу под руководством B.C. Титова и другими учеными, входящими в Российскую общественную организацию «Ассоциация распознавания образов и анализа изображений». Решению проблемы анализа и распознавания изображений посвящены работы отечественных и зарубежных ученых, среди которых: Журавлев Ю. И., Василенко Г.И., Горелик А.А., Розенфельд А. , Павлидис Т., Барабані Ю.Л., Фомин Я.А., Ту Дж. , Гренандер У., Фукунага А., Фу, К., Прэтт У., Айзерман М.А., Дуда Р., Хорн Б. К. П., Бархатен К., Гонсалес Р. и др.
Среди информационных систем важным является класс систем с принятием решений. К ним относятся системы обнаружения, оценки параметров и распознавания сигналов. Еще с середины 70-х годов по мере развития элементной базы и создания алгоритмов обработки визуальной информации были начаты работы по интегральным роботам, представляющим собой замкнутые системы, действующие автономно в условиях, заранее четко не ограниченных. Большинство актуальных задач для систем распознавания не решены на сегодняшний момент по той причине, что не созданы алгоритмы для разработки программного обеспечения. Из-за необходимости обработки значительных объемов плохо структурированной и искаженной информации достаточно сложно в полной мере использовать наработки теории сигналов, особенно для трехмерных изображений. В общем случае затруднительно ввести понятие и количественно определить потенциальную помехоустойчивость правильного распознавания. Существенная статистическая неоднородность и вариабельность законов распределений реальных изображений снижают эффективность использования методов оптимальной обработки. В такой ситуации носителем потенциального качества становится человек, но ментальная компонента, которую он использует при обработке и распознавании изображений, далеко не раскрыта и поэтому не может быть использована при создании эффективных алгоритмов. Данные факторы привели на современном этапе к проблемной ситуации в рассматриваемой области из-за широкого применения эвристических подходов.
В настоящее время существуют следующие основные проблемные вопросы, связанные с обработкой изображений:
работа современных информационных систем характеризуется возможностью формирования в условиях большого отношения сигнал/шум детальных изображений, но основные трудности решения стоящих перед ней задач не устранены. Они вызваны необходимостью учета при математическом описании изображений ГТО случайных процессов вращения, изменения масштаба и других его параметров. В условиях априорной неопределенности параметров этих факторов принятие информационной системой правильного решения становится маловероятным событием;
- формирование трехмерных изображений для информационных систем, поскольку использование третьей координаты значительно увеличивает информативность изображения, усиливает степень ортогональности зашумленных изображений разных классов.
Особенно остро проблема правильного распознавания возникает в условиях априорной неопределенности параметров объектов. При наличии углового рассогласования между распознаваемым и эталонным объектами происходит изменение аналитического описания распознаваемого объекта, в результате которого происходит «разрушение» его образа и правильное распознавание резко падает.
Таким образом, в настоящее время существует проблемная ситуация между объективной необходимостью повышения достоверности распознавания трехмерных изображений групповых точечных объектов и возможностями существующих систем распознавания.
Указанная проблемная ситуация определяет постановку и решение актуальной научной проблемы - повышение достоверности распознавания изображений трехмерных групповых точечных объектов путем разработки автоматической системы распознавания, обеспечивающей угловое и пространственное согласование распознаваемого объекта с каждым эталонным объектом алфавита классов.
Научный аспект сформулированной проблемы заключается в развитии теоретических основ распознавания трехмерных изображений групповых точечных объектов на основе разработки математической модели трехмерного изображения, задаваемой векторными кватернионами, а также в разработке методов углового согласования и распознавания трехмерных изображений по их форме на основе математических моделей в виде полных кватернионов в условиях априорной неопределенности угловых параметров.
Практический аспект проблемы включает разработку структурно-
функциональной организации и инженерно-технических решений,
позволяющих реализовать помехоустойчивые системы распознавания и
идентификации расположенных в свободном пространстве или на
подстилающей поверхности со сложным рельефом местности с неизвестными
параметрами углового положения групповых точечных объектов, образованных
группировками воздушно-космических объектов, изображениями
антропогенных объектов и боевой техники.
Целью диссертационной работы является разработка теоретических и реализационных основ создания автоматической системы обработки трехмерных изображений групповых точечных объектов, обеспечивающей повышение достоверности распознавания на основе применения методов углового и пространственного согласования с использованием алгебры кватернионов.
В соответствии с поставленной целью в работе решаются следующие основные задачи:
-
Анализ состояния проблемы распознавания трехмерных изображений групповых точечных объектов в условиях априорной неопределенности угловых параметров.
-
Разработка системы математических моделей зашумленных трехмерных изображений групповых точечных объектов, обеспечивающих их распознавание в условиях априорной неопределенности угловых параметров.
-
Разработка метода углового согласования групповых точечных объектов по результатам решения обратной задачи их вращения.
-
Разработка итерационного метода углового согласования зашумленных групповых точечных объектов на основе кватернионной модели.
-
Создание системы алгоритмов и специализированного программного обеспечения для моделирования, анализа и решения задач: упорядочения точек изображения зашумленного группового точечного объекта; оценки параметров вращений трехмерных групповых точечных объектов; итерационного углового согласования групповых точечных объектов.
-
Разработка и экспериментальные исследования обобщенной структурно-функциональной организации оптимальной по критерию максимального правдоподобия автоматической системы распознавания зашумленных трехмерных изображений групповых точечных объектов с априорно неизвестными параметрами.
Объект исследования - система распознавания зашумленных трехмерных изображений объектов в условиях априорной неопределенности параметров.
Предмет исследования - математические модели, методы и алгоритмы распознавания трехмерных изображений групповых точечных объектов.
Методы исследования. Для решения поставленных в диссертационной работе задач были использованы методы теории распознавания образов, различения сигналов, кватернионного анализа, цифровой обработки сигналов и изображений, теории вероятностей и математической статистики, теории функции комплексного переменного, алгебры гиперкомплексных чисел, численные методы и методы математического моделирования.
Научная новизна. Научная новизна результатов, полученных в диссертации, и положения, выносимые на защиту, заключаются в следующем:
1. Концептуальное положение создания автоматической системы распознавания групповых точечных объектов, состоящее в устранении углового и пространственного рассогласования векторных описаний эталонного и распознаваемого объектов, что обеспечивает повышение достоверности распознавания.
2. Теоретические основы распознавания трехмерных изображений
групповых точечных объектов в условиях априорной неопределенности
параметров и большого уровня шумов, включающие:
математическую модель пространственно расположенного группового точечного объекта, использующую кватернионные сигналы и позволяющую получить большую информативность нормированного скалярного произведения (НСП) векторов ГТО в кватернионном пространстве по сравнению с НСП этих же векторов в действительном пространстве;
математическую модель ГТО в виде контура, содержащую при отсутствии шумов и заданном положении полюса полную информацию о положении в трехмерном пространстве каждой точки объекта, обладающую инвариантностью к преобразованию сдвига ГТО и обеспечивающую визуальное представление о форме объекта;
геометрическую модель ГТО, учитывающую результаты упорядочения всех его точек и позволяющую в дальнейшем применить для обработки ГТО стандартные методы обработки сигналов;
математическую модель зашумленного распознаваемого ГТО, учитывающую угол поворота ГТО относительно оси с направляющим вектором и сдвиг номера начальной компоненты вектора, позволяющую разработать структуру системы распознавания ГТО в условиях действия шумов и априорной неопределенности угловых параметров, а также сдвига векторного задания сигнала, обеспечивающую повышение достоверности распознавания.
-
Метод углового согласования групповых точечных объектов на основе решения обратной задачи их вращения, отличающийся возможностью поэтапного вычисления оценок угла поворота и направляющего вектора, и обеспечивающий по сравнению с матричными методами уменьшение вычислительной сложности.
-
Итерационный метод углового согласования групповых точечных объектов с априорно неизвестными угловыми параметрами, основанный на свойствах полного кватерниона задавать одновременно меру схожести сигнала и величину угла между ними, и обеспечивающий реализацию операций как корректного (в случае когда один ГТО получен вращением другого с неизвестными параметрами поворота), так и некорректного (в случае когда оба ГТО являются разными объектами) углового согласования групповых точечных объектов.
5. Метод пространственного согласования векторных описаний эталонного
и распознаваемого групповых точечных объектов, основанный на определении
по результатам работы согласованного кватернионного фильтра сдвига
векторных описаний групповых точечных объектов, обеспечивающий
последующий компенсирующий сдвиг компонент вектора одного из групповых
точечных объектов для последующего их распознавания.
6. Система алгоритмов функционирования автоматической системы
распознавания групповых точечных объектов, включающая:
алгоритм упорядочения точек изображения зашумленного группового точечного объекта, учитьшающий, что каждая точка объекта наделяется инвариантным к повороту информативным признаком, это позволяет провести упорядочение точек эталонного и повернутого пространственных групповых точечных объектов;
алгоритм оценки параметров вращений трехмерных групповых точечных объектов и исследования его помехоустойчивости на основе кватернионного анализа, позволяющий выяснить механизм влияния шума на точность определения параметров вращения и сформулировать рекомендации по выбору пар векторов, обеспечивающих минимальное влияние шума на результаты вычислений;
алгоритм итерационного углового согласования трехмерных групповых точечных объектов и исследования его помехоустойчивости, основанный на свойствах скалярного произведения дискретных кватернионных сигналов, задающих данные объекты, и обладающий устойчивостью как при решении задачи корректного углового согласования изображений групповых точечных объектов, так и при решении некорректной задачи.
7. Синтезирована структурно-функциональная организация
автоматической системы распознавания трехмерных изображений групповых точечных объектов, особенностью которой является введение следующих функциональных блоков: блока согласования векторных описаний групповых точечных объектов; блоков согласования по угловым параметрам эталонного и распознаваемого группового точечного объектов с соответствующими связями между ними, обеспечивающая повышение достоверности распознавания.
Теоретическая значимость работы заключается в развитии теории, методов и алгоритмов обработки зашумленных трехмерных изображений групповых точечных объектов с априорно неизвестными угловыми параметрами на основе разработки адекватной математической модели процесса и метода распознавания, учитывающих: пространственное рассогласование векторных описаний исходного и распознаваемого группового точечного объекта; угловое рассогласование групповых точечных объектов; наличие значительного уровня шумов, сопровождающих процесс распознавания.
Практическая значимость работы состоит в том, что ее результаты являются основой разработки широкого класса автоматических систем обработки трехмерных изображений объектов, которые позволяют:
решать задачи распознавания и идентификации трехмерных объектов в условиях априорной неопределенности их параметров;
обеспечить требуемые показатели распознавания;
- повысить оперативность и обоснованность принимаемых решений при
распознавании пространственно расположенных объектов;
Практическая ценность и новизна подтверждается тем, что на основе предложенных методов и алгоритмов разработаны прикладные пакеты программ, защищенные Свидетельствами об официальной регистрации программ для ЭВМ (№ 2009610894, № 2012617392, № 2012617393, №20136102227).
Реализация результатов исследования осуществлена в Научно-исследовательском центре (г. Курск) ФГУП «18 ЦНИИ» МО РФ, в учебном процессе Поволжского государственного технологического университета по специальностям 210601.65 «Радиоэлектронные системы и комплексы» и 220400.62 «Управление в технических системах», что подтверждено соответствующими документами.
Теоретические и практические результаты работы использованы в следующих НИР, выполняемых автором в качестве исполнителя по грантам (2009-201 Зг.):
-
Грант РФФИ № 07-01-0005 8-а. К решению проблемы визуализации и анализа 3D сцен, распознавания пространственных образов методами кватернионного исчисления.
-
Грант РФФИ № 08-01-00854-а. Решение проблемы распознавания и оценки параметров 2D и 3D изображений при неизвестной нумерации отсчетов их контуров на базе теории функции комплексного и гиперкомплексного переменного.
-
Грант РФФИ № 10-01-00445-а. Решение проблемы распознавания и оценки параметров многоградационных и цветных 3D изображений сложной формы при неизвестной нумерации их отсчетов на базе методов теории функции гиперкомплексного переменного.
-
Грант РФФИ № 11-07-00585-а. Разработка методов и создание информационной технологии для оценки параметров вращений пространственных групповых точечных объектов.
-
Грант Министерства образования РФ. НИОКР по заданию министерства, per. номер 01-20-1255303. Теоретическое и экспериментальное обоснование решения проблемы углового согласования изображений трехмерных объектов на основе итерационного подхода.
Соответствие диссертации паспорту научной специальности. Содержание диссертации соответствует паспорту специальности - 05.13.01 «Системный анализ, управление и обработка информации», а именно:
п.1. «Теоретические основы и методы системного анализа, оптимизации, управления, принятия решений и обработки информации», в части разработки математической модели зашумленных трехмерных изображений групповых точечных объектов;
п.4. «Разработка методов и алгоритмов решения задач системного анализа, оптимизации, управления, принятия решений и обработки информации», в части разработки методов и алгоритмов: углового согласования групповых точечных объектов по результатам решения обратной задачи их вращения, итерационного углового согласования зашумленных групповых точечных объектов на основе кватернионной модели, пространственного согласования векторных описаний эталонного и распознаваемого групповых точечных объектов.
п. 5. «Разработка специального математического и программного обеспечения систем анализа, оптимизации, управления, принятия решений и обработки информации», в части синтеза системы алгоритмов и
специализированного программного обеспечения для моделирования, анализа и решения задач: оценки параметров вращений трехмерных групповых точечных объектов; итерационного углового согласования групповых точечных объектов.
Апробация работы. Основные положения диссертационной работы докладывались и обсуждались на следующих 17 международных и всероссийских конференциях: XI международной научно-технической конференции «Оптико-электронные приборы и устройства в системах распознавания образов, обработки изображений и символьной информации. Распознавание 2013». - Курск, 2013; XVI международной научно-технической конференции «Me дико-экологические информационные технологии - 2013». -Курск, 2013; международной научно-практической конференции «Современные проблемы и пути их решения в науке, транспорте, производстве и образовании -2012». - Одесса, 2012; 8-ой международной научно-практической конференции «Бъдещето въпроси от света на науката - 2012». - София, 2012; научно-технической конференции «Техническое зрение в системах управления-2012». -Москва, 2012; X международной научно-технической конференции «Оптико-электронные приборы и устройства в системах распознавания образов, обработки изображений и символьной информации. Распознавание - 2012». -Курск, 2012; 8-th Open German-Russian Workshop «Pattern recognition and image understanding. OGRW-8-2011». - Nizhny Novgorod, 2011; 15-й Всероссийской конференции «Математические методы распознавания образов. ММРО-15». -Петрозаводск, 2011; V Всероссийской научно-технической конференции «Радиолокация и радиосвязь». ИРЭ им. В.А. Котельникова РАН. - Москва, 2011; XIV международной научно-технической конференции «Медико-экологические информационные технологии - 2011». - Курск, 2011; 10-th International Conference «Pattern Recognition and Image Analysis: New Information Technologies. PRIA-0-2010». - St.Petersburg, 2010; X международной научно-технической конференции «Оптико-электронные приборы и устройства в системах распознавания образов, обработки изображений и символьной информации. Распознавание - 2010». - Курск, 2010; 9-th International Conference «Pattern Recognition and Image Analysis: New Information Technologies. PRIA-0-2008». - Nizhni Novgorod, 2008; International Conference «Information and telecommunication technologies in intelligent systems». - Katania, Italy, 2006; 11-й всероссийской конференции «Математические методы распознавания образов. ММРО-11». - Москва, 2003; международной конференции «Телевидение: передача и обработка изображений». - Санкт-Петербург, 2002; 5-ой Всероссийской конференции «Методы и средства обработки сложной графической информации». - Нижний Новгород, 1998.
Публикации. По материалам диссертационного исследования опубликована 51 научная работа, из них 21 статья в рецензируемых научных журналах и изданиях, 3 монографии, 4 статьи в иных изданиях, 4 свидетельства о регистрации программы для ЭВМ, 19 публикаций материалов и тезисов докладов.
Личный вклад соискателя. Все выносимые на защиту научные положения разработаны соискателем лично. В научных работах по теме диссертации,
опубликованных в соавторстве, личный вклад соискателя состоит в следующем:
в [14-23, 28] - теоретические основы распознавания зашумленных изображений
объектов в условиях априорной неопределенности параметров; в [11-13] - метод
углового согласования групповых точечных объектов на основе решения
обратной задачи их вращения и алгоритм оценки параметров вращений
трехмерных групповых точечных объектов и исследования его
помехоустойчивости; в [2, 4, 24] - итерационный метод и алгоритм углового
согласования групповых точечных объектов с априорно неизвестными
угловыми параметрами и метод пространственного согласования векторных
описаний эталонного и распознаваемого групповых точечных объектов; в [1, 5-
10] - предложена структурно-функциональная организация
автоматизированной системы распознавания трехмерных изображений групповых точечных объектов и алгоритмы ее функционирования.
Структура и объем работы. Диссертация состоит из введения, шести разделов, заключения, списка литературы, включающего 172 наименования. Работа изложена на 246 страницах машинописного текста, содержит 85 рисунков и 12 таблиц.