Введение к работе
Актуальность темы. В настоящее время обработка изображений (двумерных и многомерных) широко применяется при решении многих научных и практических проблем, среди которых исследование космического пространства, мониторинг Земли, навигация, биология, медицина, робототехника и т.д.
Многие из этих исследований связаны с обработкой совокупностей изображений - их временных последовательностей или же единовременно зарегистрированных изображений, полученных с различных сенсоров, например, спектрозональных изображений. При обработке совокупностей изображений может потребоваться их совмещение, то есть установление соответствия между точками этих изображений, относящимися к одним и тем же элементам сцены. Это позволяет обнаруживать временные изменения в серии изображений. Совмещение изображений, полученных от различных сенсоров, даёт возможность извлечения более полной информации о наблюдаемом объекте, чем из отдельных изображений. Совмещение изображений применяется также при обнаружении и распознавании объектов.
Таким образом, совмещение является фундаментальной проблемой обработки изображений, поскольку возникает при решении множества задач. Этим обусловлен большой интерес отечественных и зарубежных исследователей к этой проблеме. Однако, несмотря на значительные усилия специалистов, эта проблема далека от полного решения и до сих пор остается актуальной.
Совмещение изображений обычно требуется выполнять в реальном времени, что ведёт к необходимости разработки алгоритмов с приемлемыми вычислительными затратами. Очень часто задача совмещения изображений может быть сведена к оцениванию параметров межкадровой геометрической трансформации (ГТ) этих изображений (сдвига, поворота, масштаба и т.д.). При этом в прикладных задачах значения этих параметров могут быть большими (например, в медицине и робототехнике).
В настоящее время существует множество методов и алгоритмов оценивания параметров ГТ, однако они требуют неприемлемых вычислительных затрат при больших значениях параметров ГТ. Например, в корреляционно-экстремальных алгоритмах для достижения высокой точности требуется производить пробные совмещения при большом количестве комбинаций значений параметров ГТ. Псевдоградиентные алгоритмы дают высокоточные оценки параметров при небольших вычислительных затратах, но их существенным недостатком является небольшая рабочая зона, то есть требуется иметь достаточно точные начальные приближения значений параметров ГТ, при которых эти алгоритмы работоспособны. Поэтому при возможных больших значениях параметров приходится применять эти алгоритмы многократно для множества возможных начальных приближений, что также ведёт к большим вычислительным затратам. Из сказанного следует, что было бы весьма полезно иметь алгоритмы, которые при небольших вычислительных затратах обладают большой рабочей зоной и дают оценки параметров ГТ, которые можно использовать в качестве начальных приближений для высокоточных алгоритмов.
Таким образом, разработка алгоритмов оценивания параметров ГТ изображений с большой рабочей зоной является актуальной.
Цель и задачи работы. Целью диссертации является повышение быстродействия систем извлечения полезной информации из совокупностей изображений за счёт применения новых алгоритмов оценивания больших значений параметров межкадровых ГТ.
Для достижения поставленной цели решаются следующие задачи.
Построение алгоритмов оценки параметров ГТ изображений на основе метода неподвижной точки оператора ГТ.
Исследование математических моделей ГТ изображений и нахождение их неподвижных точек.
Математическое моделирование траекторий неподвижных точек последовательности ГТ. Выбор вспомогательных ГТ, обеспечивающих траектории простого типа для облегчения их обнаружения.
Разработка численных процедур для вычисления параметров ГТ по параметрам траектории неподвижной точки оператора ГТ.
Исследование точности разработанных алгоритмов, а также формы и размера их рабочей зоны на реальных и имитированных изображениях.
Разработка комплекса программ, реализующего предложенные алгоритмы.
Методы исследования. При решении поставленных задач применялись методы теории вероятностей, математической статистики, функционального анализа, обработки изображений и сигналов, численные методы и математическое моделирование с применением ЭВМ.
Научная новизна положений, выносимых на защиту
Предложен новый способ оценки параметров ГТ изображений с использованием неподвижной точки оператора ГТ, который при небольших вычислительных затратах имеет рабочую зону, значительно большую по сравнению с известными алгоритмами.
Для ряда моделей ГТ определены виды вспомогательных преобразований, обеспечивающих прямолинейность траекторий неподвижной точки.
Разработаны алгоритмы обнаружения прямолинейных траекторий и численные процедуры оценивания параметров ГТ изображений по параметрам этих траекторий.
Разработан комплекс прикладных программ для совмещения изображений со значительными ГТ.
Практическая значимость. Предложенные алгоритмы оценки параметров ГТ имеют большую рабочую зону, требуя при этом вычислительных затрат, осуществимых в системах извлечения полезной информации из последовательностей изображений в реальном времени.
Реализация результатов работы. Результаты диссертационной работы использованы при выполнении госбюджетной НИР УлГТУ, гранта РФФИ а09-08-00725 и в учебном процессе УлГТУ в дисциплине «Основы теории обработки изображений», что подтверждено соответствующим актом.
Достоверность. Достоверность положений диссертации обеспечивается корректным использованием математических методов и подтверждается близостью теоретических расчётов и результатов статистического моделирования алгоритмов на реальных и имитированных изображениях.
Апробация работы. Основные результаты работы докладывались на VI и VII Всероссийских с участием стран СНГ научно-практических конференциях «Современные проблемы создания и эксплуатации радиотехнических систем» (Ульяновск, 2009 и 2011); LXIV и LXV научных сессиях Российского научно-технического общества радиотехники, электроники и связи им. А.С.Попова, посвященных Дню радио (Москва, 2009 и 2010); 10-й Международной научно-технической конференции PRIA-2010 «Распознавание образов и анализ изображений: новые информационные технологии» (Санкт-Петербург, 2010) и ежегодных конференциях профессорско-преподавательского состава Ульяновского государственного технического университета (2008-2011 гг.).
Публикации. По теме диссертации опубликовано 8 статей, из них 2 опубликованы в изданиях из перечня ВАК и 6 в трудах научных конференций.
Объем и структура диссертации. Диссертация состоит из введения, четырех глав, заключения, списка литературы из 101 наименований, и приложения, общий объем 102 страницы.