Содержание к диссертации
Введение
3. Спектральная и морфологическая классификация изображений структур на основе методов проверки статистических гипотез. общий случай и частные реализации 35
3.1. Классификация на основе отношения правдоподобия 35
3.2. Модифицированные методы Бартлетта и Писаренко 52
3.3. Введение морфологических признаков в процесс классификации 59
3.4. Классификация модифицированным методом Кейпона 63
3.5. Многопараметрическая нелокальная классификация 70
3.6. Краткие выводы раздела 3 74
4. Классификация модельных структур, состоящих из элементов различной формы и размеров, модифицированным методом кейпона 76
4.1. Классификация структуры, состоящей из характерных элементов с близкими размерами на пулевом фоне 79
4.2. Классификация структуры, состоящей из характерных элементов с различными размерами 84
4.3. Влияние фона с ненулевой яркостью 87
4.4. Классификация структуры, состоящей из элементов с яркостью, ниже яркости фона 90
4.5. Конфигурационная классификация элемента структуры на основе экспериментальных данных без строгого восстановления изображения 94
4.6. Краткие выводы раздела 4 . 98
5. Численная реализация методов классификации акустомикроскопических изображений биологических тканей и композитных структур 99
5.1. Исходные изображения и классифицируемые типы структур 99
5.2. Пространственно-спектральный подход 103
5.2.1. Классификация методами Бартлетта и Писаренко 103
5.2.2. Классификация на основе отношения правдоподобия 104
5.2.3. Оценка ширины зоны классификационной неопределенности. 107
5.2.4. Недостаток пространственно-спектрального подхода 108
5.3. Спектрально-морфологический подход и модифицированный метод Ксйпона 109
5.3,1. Применение метода Кейпона для классификации изображений биотканей 110
5.3.6. Преимущество спектрально-морфологического подхода. Исключение признаков ориентационного типа 111
5.4. Сравнительный анализ методов классификации 116
5.5. Краткие выводы раздела 5 120
6. Перспективы применения метода пространственно-спектральной классификации на примере клинических изображений злокачественных лейкоцитов 141
7. Основные результаты и выводы 153
Литература 155
- Введение морфологических признаков в процесс классификации
- Классификация структуры, состоящей из характерных элементов с различными размерами
- Конфигурационная классификация элемента структуры на основе экспериментальных данных без строгого восстановления изображения
- Преимущество спектрально-морфологического подхода. Исключение признаков ориентационного типа
Введение к работе
Актуальность темы
В настоящее время существует большое количество работ, посвященных задаче классификации изображений случайных структур, которая остается актуальной на протяжении многих лет в различных областях, связанных с анализом изображений. Особое место занимает медицинская акустика, так как здесь для правильного определения диагноза возникает необходимость распознавания патологической структуры биологической ткани. Это, в частности, важно в онкологии, где центральное место в диагностическом процессе занимают физические (нередко акустические) методы получения изображений внутренних органов организма. По сей день диагностика, например, ткани молочной железы включает в себя и рентгеновскую маммографию, и ультразвуковое исследование (УЗИ). Рентгеновская маммография широко применяется во всех странах как один из основных способов диагностирования, хотя он и не всегда дает верную диагностическую картину, и его негативное воздействие на организм пациентов было бы желательно исключить или свести к минимуму. Несмотря на все возрастающую роль УЗИ, здесь, по-прежнему, играет основную роль качество получаемого (по сути эхолокапионного) изображения и опыт врача, интерпретирующего данное изображение. Таким образом, основная доля диагностического процесса лежит в области субъективного восприятия эксперта, делающего вывод о том или ином диагнозе.
В целом, исследования в области определения характеристик биотканей с помощью ультразвука направлены на то, чтобы сделать эту методику количественной, позволяющей автоматизировать процедуру классификации. К потенциальным преимуществам автоматизированных методов количественного анализа можно отнести возможность получения более стабильных и достоверных результатов благодаря снижению роли субъективного фактора (заключения врача-диагноста), а также возможность анализа достаточно большого числа характерных признаков, в том числе таких тонких признаков, которые не выявляются при визуальном наблюдении. Кроме того, субъективная диагностика дает прекрасные результаты при проведении сравнительного анализа, т.е. относительных изменений структуры в пределах малых областей пространства и отрезков времени, но интерпретация абсолютных значений многочисленных параметров, которые могут медленно меняться, оказывается более трудной для врача-диагноста. При этом основная цель применения автоматизированных систем анализа состоит не в том, чтобы заменить врача-диагноста, а в том, чтобы с помощью компьютера помочь ему в принятии правильного решения. Следовательно, существует необходимость в объективном количественном методе классификации изображений тканей. Томография, включая и ультразвуковую (а также ультразвуковая микроскопия), являются эффективными методами получения изображений, нуждающихся в объективной количественной классификации.
На кафедре акустики физического факультета МГУ разрабатывается акустический томограф, данные с которого нуждаются в количественной интерпретации. В диссертационной работе осуществляется классификация непосредственно изображений биологических тканей и композитных структур, полученных сканирующим акустическим микроскопом, а также изображения модельного рассеивателя средней силы в форме цилиндра, восстановленного в
первом приближении Борна (без строгого решения обратной задачи рассеяния, ОЗР); сделано предположение, что в дальнейшем можно будет напрямую классифицировать томографические данные (см. схему).
Существующие методы классификации томографических и
микроскопических изображений композитных структур и биологических тканей
можно разделить на три класса, между которыми, тем не менее, нет резких
границ: локально-параметрические методы, нелокальные спектрально-
статистические и морфологические. В диссертационной работе подход к задаче
классификации основывается на одновременном анализе спектральных и
морфологических параметров тканей, с той разницей, что в данном контексте
понятие морфологии структурных элементов и понятие их формы смягчены,
т. е. задается некоторая выборка более или менее отличающихся друг от друга
форм близкого морфологического типа. Такой классификационный анализ по
спектральным, морфологическим и параметрическим признакам в дальнейшем
можно обобщить на случай многокомпонентных изображений, где в роли
компонентов будут выступать данные, полученные с томографа, о
пространственном распределении таких параметров как, например, скорость
звука, плотность, затухание и нелинейные характеристики. Прямая
классификация по параметру яркости (типа "темное-светлое") в излагаемом
далее подходе не рассматривается; по этой причине яркостный признак, по
возможности, предварительно исключается из изображений. Итак,
актуальность работы обусловлена важностью надежной интерпретации
данных, получаемых ультразвуковым микроскопом или томографом, при их
клиническом применении, с целью вынесения общего диагностического
решения. Также актуальны полученные в работе обобщения в приложении к
многопараметрической классификации акустических изображений
биологических тканей на основе статистических (спектральных и морфологических, а не яркостных) особенностей их структур.
Цели диссертационной работы:
Разработка методов спектрально-морфологической классификации акустических изображений структур и биологических тканей.
Обобщение методов спектрально-морфологической классификации на случай многопараметрических изображений.
Проверка применимости разработанных методов на примерах классификации реальных акустических изображений.
Из сформулированных выше целей вытекают задачи диссертационной работы:
1. Использование байесовского подхода к задаче проверки статистических гипотез для классификации и фрагментации акустических изображений
биологических тканей и структур.
Разработка метода формирования комбинированного базиса Карунена-Лоэва и формирования правила решения (отношения правдоподобия) в этом базисе.
Рассмотрение особенностей и области применимости модифицированных методов Бартлетта и Писаренко как частных случаев общего подхода к классификации.
Формирование и внесение морфологических признаков в процесс классификации на основе отношения правдоподобия. Рассмотрение метода Кейпона как предельного случая "жесткой" морфологической классификации.
Обобщение разработанного подхода на случай много параметрической классификации.
Проверка разработанного подхода на примерах его применения к реальным акустомикроскопическим изображениям биологических тканей и композитных структур.
Научная новизна:
Разработаны методы классификации (фрагментации) изображений структур и биологических тканей, предназначенные для выделения областей с определенными статистическими, параметрическими и морфологическими свойствами.
Показано, что методы могут быть применены как для обработки непосредственно изображений, независимо от способа их получения, так и для классификации исследуемых структур на основе прямой обработки экспериментальных акустических данных рассеяния, регистрируемых разрабатываемыми рядом лабораторий томографами, акустическими микроскопами и т.п.
Предложена оригинальная схема осуществления многопараметрической классификации тканей на основе многомерного перекрестного спектрально-морфологического анализа комплекса изображений.
Практическая ценность результатов работы
Созданная в среде MATLAB программная реализация алгоритма для классификации изображений структур различных типов может быть использована в медицине для принятия диагностического решения, а также во многих других областях применения.
Классификация может основываться как на анализе самого изображения, так и на обработке непосредственно экспериментальных акустических данных, полученных в первом приближении Борна.
Основные положения, выносимые на защиту:
Разработка методики классификации акустических изображений структур и
биологических тканей на основе отношения правдоподобия; модификация
радиофизических методов Бартлетта, Писаренко и Кейпона в свете
приложения к поставленной задаче, связь этих методов с общим подходом
к классификации как его частных реализаций.
Внесение морфологических признаков, выразившихся в корреляционных связях коэффициентов разложения по базису Карунена-Лоэва, в спектральный алгоритм классификации.
Обобщение спектрального-морфологического подхода на задачи многопараметрической классификации.
Возможность применения разработанной в диссертации методики классификации, продемонстрированная на примерах приложения к акустомикроскопическим изображениям реальных биологических тканей и к оптомикроскопическим изображениям клеток крови, полученных в клинических условиях.
Апробация работы
Материалы работы докладывались на семинарах кафедры акустики и на следующих конференциях: Международная конференция студентов и аспирантов по фундаментальным наукам "Ломоносов-2000" (Москва, 2000); Международная конференция студентов и аспирантов по фундаментальным наукам "Ломоносов-2001" (Москва, 2001); XI сессия Российского Акустического Общества (Москва, 2001); 26th International Acoustical Imaging Symposium (Windsor, Canada, 2001); XV сессия Российского Акустического Общества (Нижний Новгород, 2004); II Евразийский конгресс по медицинской физике и инженерии "Медицинская физика - 2005" (Москва, 2005).
Работа выполнена в рамках исследований, проводимых по гранту РФФИ №04-02-16043, гранту Президента РФ №НШ-1575.003.2, стипендии поддержки аспирантов Акустического Общества Америки (2004).
Публикации
По материалам диссертации опубликовано 9 научных работ, список которых приведен в конце автореферата.
Структура и объем диссертации
Диссертация состоит из семи разделов, включающих введение, обзор литературы, теоретическую и численные части, заключение, и списка цитируемой литературы. Общий объем работы составляет 164 страницы машинописного текста, содержащих 124 рисунка. Список цитируемой литературы содержит 111 наименований.
Введение морфологических признаков в процесс классификации
Человек легко ориентируется в окружающем мире, причем основную роль в этом играет зрительный анализатор, состоящий из "датчика", роль которого играют светочувствительные клетки сетчатки глаза, "проводников" сигналов -нервов, и "блока принятия решений" - мозга. Пользуясь зрением, человек отличает предметы один от другого, оценивает их размеры и расположение в пространстве, состав материала, из которого они изготовлены. Это умение приходит с опытом и свидетельствует о том, что плоские изображения, формируемые хрусталиком на сетчатке глаза, несут достаточно подробную информацию о реальных свойствах пространственных предметов и сцен.
Попытки промоделировать работу зрительного анализатора человека началась во второй половине XX века в связи с проблемами робототехники и машинного видения. Первые исследования связывались с выделением на изображении системы признаков, или информативных деталей, после чего вместо самого изображения анализировался его код - система количественных или качественных признаков, составляющих его описание.
Трудности такого подхода связаны, с одной стороны, с неоднозначностью выбора самих описаний, и успех решения той или иной задачи в основном зависит от того, насколько удачны выбранные признаки. С другой стороны, наиболее информативные признаки, как правило, трудно формализуемы и для их оценки опять-таки привлекается человек. Тем не менее, ряд задач успешно решен на основе такого подхода - например, распознавание цифр или букв одного и того же вида (класса) были близки друг к другу и образовывали области в пространстве признаков, формирующие образы классов. Наиболее интересными с теоретической точки зрения являлись методы М. Бонгарда, изложенные к книге [1]. Они давали подходы к формированию образов на основе обучающей последовательности. Алгебраический подход к проблемам узнавания разрабатывается в школе академика Ю.И. Журавлева [2].
В определенном смысле противоположный сценарий развития задачи классификации состоит в создании такой системы, которая сама формировала бы наиболее информативные признаки изображений и, используя их, создавала бы математические образы тех или иных изображаемых объектов. На основе этого подхода был создан, например, нейронный перцептрон, положивший начало тому, что сейчас называется нейронными сетями. Перцептрон содержал несколько слоев элементов, играющих роль нейронов. Первый слой состоял из светочувствительных элементов, они были соединены нелинейными, как правило, пороговыми, связями с несколькими слоями элементов-сумматоров; последний слой элементов выдавал решение относительно объекта, породившего наблюдаемые входные сигналы. Обучение прерцептрона сводилось к формированию параметров связи и весов сумматоров, при котором на последнем слое активизировался лишь нейрон, соответствующий тому классу, к которому принадлежало входное изображение.
Итак, формирование признаков является первостепенным этапом в любой системе распознавания изображений. Качество всей классификационной системы зависит от того, насколько хорошо подобраны признаки для описания этих изображений. Задача формирования признаков сама по себе достаточно сложна, т.к. процесс описания изображения (также говорят "построение набора признаков") в некоторых случаях и по сей день остается процедурой эвристической, зависящей от опыта и квалификации разработчика. Поэтому при разработке каждой новой системы классификации чаще всего даже специалистам в распознавании образов приходится решать ее заново, ориентируясь на специфику обрабатываемых изображений и изображенных на них объектах. В связи с этим, например, в задачах классификации изображений с использованием искусственного интеллекта на базе нейронных сетей развиваются параллельно два конкурирующих друг с другом направления: обучаемые и самообучающиеся нейронные сети. Обученная тем или иным способом система способна узнавать ситуации, характеризующиеся входными сигналами, сходными с эталонными, путем формирования выходных образов, близких к запомненным при обучении, причем понятие "сходности" ситуации при этом априори не формализовано, а вырабатывается в процессе обучения [3, 4]. В наши дни нейросетевые системы находят свое применение во многих прикладных задачах распознавания образов [5, 6, 7, 8]. Однако использование нейросстевого подхода имеет преимущества перед традиционными математическими методами только в тех случаях, когда: 1) рассматриваемая задача не поддается адекватной формулировке и формализации; 2) задача формализуема, но на настоящее время отсутствует аппарат для ее решения; 3) задача формализуема и для нее существует соответствующий математический аппарат, но реализация вычислений с его помощью на базе имеющихся вычислительных систем не удовлетворяет требованиям получения решений по времени, размеру и т.п. [4].
В настоящее время есть компании, предлагающие уже готовую коммерческую продукцию по распознаванию символов и жестов, обнаружению и анализу движения, распознаванию автомобильных номеров и человеческих лиц [5,9, 10]. Разработаны программы, позволяющие классифицировать желательные и нежелательные интернет сайты на основе анализа содержащихся в них изображений, системы поиска изображений в базах данных по характерным параметрам т.п. [11]. Однако наряду с большим количеством практических работ по этой тематике заметен явный дефицит информации о методах классификации, используемых в подобных коммерческих проектах. Также обращает на себя внимание сравнительно небольшое количество информации о количественной классификации изображений биологических тканей, отличающихся наибольшим интересом к надежности принятия объективного диагностического решения.
Классификация структуры, состоящей из характерных элементов с различными размерами
В настоящей работе предлагается и развивается общий подход к классификации изображений сложных структур, а также рассматриваются его частные реализации - модифицированные методы Бартлетта, Писаренко, Кейпона. Этот общий подход несколько условно будет называться оптимальным, поскольку в его основе лежит идея оптимального метода теории проверки статистических гипотез - построение логарифма отношения правдоподобия. Некоторые конкретные методы, вытекающие из общего подхода, относятся к пространственному многомерному спектрально-корреляционному анализу и в этом смысле смыкаются с разработанными ранее алгоритмами [74, 77]. Отличие состоит во введении последовательности прямых и обратных, линейных и нелинейных преобразований, обеспечивающих обострение реакции алгоритмов при обнаружении пространственной области со структурой заданного типа. Далее будет показано, что предлагаемые методы могут применяться как для обработки изображений, независимо от способа их получения, так и для классификации структур на основе непосредственно экспериментальных акустических данных рассеяния. В этом смысле они занимают промежуточное и, в то же время, объединяющее положение между методами классификации, рассмотренными в обзорной части работы (глава 2).
Физическая сущность развиваемого подхода заключается в следующем. Классифицируемое яркостное изображение сложной структуры (т.е. объекта, например, биологической ткани) описывается, в формальной записи, двумерной неотрицательной функцией Г0(г). В этом изображении требуется выделить области, имеющие структуру заданного типа. Каждый тип во многом определяется формой и размерами характерных элементов, формирующих данную структуру, а также их взаимным расположением. Пусть априори определены два произвольных типа структуры, которым соответствуют индексы / и П. Тогда критерий решения о принадлежности каждого текущего фрагмента Ху (г - центр фрагмента) изображения Г0(г) к одному из заданных типов строится на основе общего соотношения - функции отношения правдоподобия L(Xr) s I(r) в каждой фиксированной точке г: Здесь Р(ХГ /) и P(Xr \ II) - плотность условной вероятности того, что фрагмент Хг принадлежит к структуре первого типа (это предположение является гипотезой) или второго типа (это - альтернатива), соответственно.
В [89] близкий подход применен к подобной (в определенной степени) задаче классификации случайных шумовых сипіалов по заданной форме их спектра с одновременной оценкой параметров этого спектра. Однако задача классификации изображений имеет ряд особенностей. Во-первых, изображения ие одномерны, а двумерны. Во-вторых, в рассматриваемом подходе в качестве пространства, в котором происходит классификация, выбирается пространство собственных векторов авто ковариационной матрицы, задаваемой априори или оцениваемой для каждого типа структуры. Тем самым, классификация осуществляется с помощью собственных векторов в координатном пространстве, а не в сопряженном к нему пространстве пространственных частот. В то же время, для однородных (стационарных) процессов между автокорреляционной функцией и спектром мощности существует взаимнооднозначное соответствие. Поэтому классификация изображений на основе заданной автоковариациошюй матрицы равнозначна, с точки зрения исходной информации, классификации на основе пространственного спектра мощности, причем в данном случае известного полностью (а не с точностью до неизвестных параметров, как в [89]).
Практическая реализация описанного подхода предполагает, что для структуры каждого фиксированного типа задается выборка, состоящая из определенного количества "обучающих" образцов, т.е. участков изображения данного типа. Каждый такой образец описывается двумерной функцией «(г). Поскольку речь идет об изображениях, то и(г) считается действительной величиной, что, однако, не ограничивает общности получаемых аналитических соотношений в случае трактовки w(r) (при определенной постановке задачи) как комплексной величины (см. п. 4.1.5). Для практических целей важно, чтобы обучающая выборка достаточно полно отражала характерные статистические свойства структуры данного типа, позволяя тем самым классифицировать предъявляемые (тестируемые) изображения с высокой степенью достоверности. Размер каждого образца, с одной стороны, много меньше размера полного классифицируемого изображения. С другой стороны, образец должен включать в себя характерные особенности структуры классифицируемого типа. Для каждого из заданных типов структур строится базис, описывающий их статистические свойства. В дальнейшем рассматривается базис типа базиса Карунена-Лоэва. Он формируется с помощью автоковариационной матрицы А(г,г ) ансамбля случайных величин, т.е. функций и(г) в рассматриваемой задаче классификации: и далее черта над функцией означает усреднение по ансамблю заданного типа; знак означает комплексное сопряжение. Далее всюду применяются комплексные обозначения для сохранения общности рассмотрения, хотя, как упоминалось, вес величины являются действительными, если не оговорено особо. В рассматриваемом оптимальном подходе из всего классифицируемого изображения Г0(г), а также из каждого образца и(г) исключается средняя яркость Г0 и й, соответственно. Это устраняет влияние яркостного фактора на процесс классификации и увеличивает относительный контраст характерных элементов структуры. Значения Г0, Ї7 могут быть приближенно рассчитаны как усреднением по выборке изображений и выборке образцов, так и усреднением величин Г0(г), w(r) по координатам (что использовалось при численном моделировании в предположении пространственной эргодичности). Можно также профильтровать пространственный спектр функции Г0(г), исключая самые низкочастотные пространственные составляющие, за счет чего так или иначе и устраняется яркостный фактор в процессе классификации. В итоге получается знакопеременное "изображение" Tdlf (г) = Г0 (г) - Г0 с нулевой средней яркостью.
Конфигурационная классификация элемента структуры на основе экспериментальных данных без строгого восстановления изображения
В проанализированном в п.п. 3.1,3.2 пространственно-спектральном варианте оптимального метода при построении комбинированных матриц предполагалось, что рассматривается полный гипотетический ансамбль, состоящий из всех возможных изображений, корреляционные свойства которых описываются заданной оценкой (1) автоковариационной матрицы А(г,г ), которой при ее построении придается блочно-теплицев вид. В то же время, в случае пространственно-однородного (стационарного) эргодического процесса, автоковариационная матрица А(г,г ) взаимнооднозначно связана, по теореме Винера-Хинчина, с пространственным спектром мощности, усредненным по полному ансамблю. Этот спектр приближенно совпадает со спектром К(-%) образцов данной обучающей выборки, где К($) - пространственный фурье-образ выборочной автоковариационной функции К(р) данного типа. В спектре же мощности, в отличие от амплитудного спектра, утрачивается исходная информация о взаимных фазовых соотношениях между частотными компонентами, характерных для классифицируемого типа структуры. Как следствие, эта информация утрачивается и в Л(г,г ). Построенная на основе соотношения (3) матрица А(г,г ) является блочно-теплицевой матрицей, но не обладает свойством цикличности. Поэтому собственные векторы этой матрицы (базис Карунена-Лоэва (4), (5)) не являются строго гармоническими двумерными функциями, а разложение по ним выбранного фрагмента изображения или структуры определенного типа не представляет собой строгого фурье-разложения. Однако наибольшие по величине элементы матрицы A(r, г1) сосредоточены в узкой полосе вблизи ее главной диагонали, и отличие этой матрицы от циклической не столь существенно. Благодаря этому, собственные векторы близки к гармоническим, а оптимальный метод классификации в случае использования соотношений (23)-(29) очень близок к спектральному, хотя не является строго таким, с математической точки зрения, из-за отклонения собственных векторов от гармонических двумерных функций. В методе классификации (23)-(29), основанном на разложении по двум базисам Карунена-Лоэва, комбинированные матрицы строятся с помощью этих базисов. Следовательно, в комбинированных матрицах содержится та же информация о структурах классифицируемых типов, которая содержится в спектрально-мощностных свойствах структур, и нет какой-либо дополнительной информации. Итак, речь, в сущности, идет о спектральном подходе, в котором классификация осуществляется только по пространственно-спектральному признаку, без учета морфологических особенностей искомой структуры. Тем самым, спектральный алгоритм классифицирует любой фрагмент изображения (дискретизованный пространственный формат которого совпадает с
соответствующим форматом собственных векторов) с близким к К(-%) спектром мощности, как структуру искомого типа. Это обстоятельство будет проиллюстрировано далее при обсуждении результатов численной классификации на примере обработки искусственно генерируемой случайной комбинированной структуры. В методах Бартлетта и Писаренко происходит дополнительная потеря информации, поскольку в классификации участвуют не все собственные векторы.
Потеря существенной информации о морфологических признаках при чисто спектральном подходе означает то, что использованы не все возможности, позволяющие обеспечить наиболее высокую достоверность результата классификации. В связи с этим, настоящий параграф посвящен обобщению спектрального подхода на случай спектрально-морфологического подхода, учитывающего, помимо спектральных, таюке и морфологические особенности структуры заданного типа. Теперь классификационное опознавание осуществляется не только на основе условия, что пространственный спектр мощности искомой структуры близок к заданному спектру, но и с учетом особенностей характерных пространственных деталей этой структуры. Такие особенности находят выражение в учете определенных корреляционных связей между коэффициентами разложения при построении комбинированных матриц (30). Собственный и альтернативный базисы { pj, {ц/.} остаются прежними, т.е. находятся из (5) как собственные векторы оцененных блочно-теплицевых матриц А , Аи. Следовательно, не изменяются и коэффициенты разложения (ХГУП), (Xt)!i] (см.(31)). Однако теперь, при построении корреляционных матриц коэффициентов разложения (13)-(16), усреднение по полному гипотетическому ансамблю заменяется усреднением по подмножеству (подансамблю) этого ансамбля. Это подмножество, являющееся также гипотетическим, образуется всеми реализациями изображений структуры определенного типа с искомыми морфологическими особенностями. Оно обладает тем же средним пространственным спектром мощности, что и полный ансамбль, т.е. все изображения из рассматриваемого подмножества по-прежнему разложимы по базису Карунена-Лоэва. Однако коэффициенты такого разложения, будучи попарно перемноженными и усредненными по этому подмножеству, не являются уже 5-коррелированными. Возникшая корреляция и отражает морфологические особенности данного типа структуры. При численной реализации описанного спектрально-морфологического подхода гипотетическое подмножество было представлено конкретной обучающей выборкой в виде образцов 1-го или 2-го типа, соответственно {q номер образца): udlf = T J _ или udif = Tf) _ . Тогда в (13)-(16) усреднение по полному гипотетическому ансамблю заменяется среднеарифметическим усреднением по выбранным образцалі соответствующего типа с дальнейшим использованием получаемых таким образом корреляционных связей в матрицах Каа, КаЪ, Kba, Kbb.
Преимущество спектрально-морфологического подхода. Исключение признаков ориентационного типа
По теореме о свертке, операция (58) сводится к поэлементному перемножению пространственных фурье-образов: пространственные спектры функций R{c)(r), Г" (г), S(c)(r), соответственно. Полученное произведение /?w() подвергается обратному фурье-преобразованию и последующему поэлементному обращению в каждой точке г: P c\r) = \/R c)(r). Тем самым, распределение P eJ(r) является результатом нелинейной обработки методом Кейпона (которая далее будет также называться кейпоновской фильтрацией) и представляет собой реакцию алгоритма на обнаружение областей с заданными структурными свойствами, отраженными в S (r). Наконец, сравнение (возможно, после определенного пространственного сглаживания) результатов Р(с)(г) подобной нелинейной обработки для всех типов с позволяет принять решение о принадлежности каждого фрагмента изображения к одному из заданных типов. Следует заметить, что корреляционной матрице W(r"-r ) можно также сопоставить обращенное изображение Г" (г )5(г"-г ). Тогда аналогом W" (г) является непосредственно исходное изображение Г(г), а СОЭ является некоторая новая функция-вектор S (r), отражающая особенности "обращенной" структуры Г-1 (г). Лучший результат получается, если функция, описывающая классифицируемое изображение, у которого ярко выражены локальные структурные особенности, имеет максимальные положительные значения, соответствующие этим структурным особенностям. Таким образом, можно работать как с изображением Г(г), так и с Г"1 (г). При этом для повышения разрешающей способности алгоритма важен тот факт, что в том и в другом случае сканируемое изображение и сканирующий СОЭ являются "обращенными" по отношению друг к другу. Данный прием повышения разрешающей способности означает, что метод Кейпона имеет принципиально нелинейный характер обработки, что отличает его от линейных методов, использующих спектральный анализ со скользящим окном, например, в виде алгоритма Габора [ЮЗ, 104]. Преимущество двойного обращения иллюстрируется на следующих простейших модельных примерах, наглядно отражающих принцип работы кейпоновского алгоритма (рис. 2). Весь процесс выделения и локализации заранее известного характерного элемента (СОЭ) в одномерном случае заключается в следующем (левая часть рисунка 2), На фоне шумовых помех присутствует характерный сигнал (рис. 2а; по горизонтальной оси отложены номера дискретных временных отсчетов); требуется определить его присутствие и точное местоположение. Для этого анализируемая реализация (зашумленный сигнал) подвергается обращению, а именно, ее значения в каждой точке (предварительно "регуляризовапные" для избежания строго нулевых значений) заменяются обратной величиной (рис. 26), Далее осуществляется непосредственно процедура сканирования. Она представляет собой свертку этого обращенного сигнала со сканирующим сигналом (у которого обращен знак аргумента) - аналогом СОЭ (рис. 2в), - параметры которого (форма и размеры) совпадают с параметрами ожидаемого сигнала в отсутствие помех. Минимальное значение результата свертки соответствует точке совпадения центров обращенного и сканирующего сигналов (рис. 2г). Для обострения итоговой реакции результат свертки (также регуляризованный, в случае необходимости) опять же обращается в каждом дискретном отсчете, и получаемый отклик (сплошная линия на рис. 2d) - пик реакции алгоритма на обнаружение сигнала или объекта с заданной конфигурацией - позволяет дать ответ на два исходных вопроса. Следует подчеркнуть, что если осуществляется свертка непосредственно зашумленного сигнала (рис. 2а) со сканирующим (рис. 2е) без упомянутого двойного обращения сигнала и результата свертки, то отклик будет менее острым (пунктирная линия на рис. 2d). При такой обработке результат решения аналогичной задачи, но для случая классифицируемого сигнала в виде совокупности нескольких типов зашумленных сигналов, окажется неудовлетворительным, так как широкие ("тупые") отклики при их взаимном перекрытии будут неразрешимы. Описанная последовательность операций очевидным образом обобщается на случай обработки изображений. Простейший двумерный пример приведен справа на рис. 2, где определяется наличие и местоположение элемента круглой формы в присутствии другого элемента треугольной формы (по двум горизонтальным осям отложены дискретные пространственные отсчеты). В результате выполнения аналогичных одномерному случаю процедур (с двойным обращением) получается острый пик реакции алгоритма на присутствие структуры с заданной круглой конфигурацией.
Как уже упоминалось, модифицированный метод Кейпона является предельным случаем спектрально-морфологического подхода. Так, выражения с комбинированными матрицами К!сотЬ, К"отЬ, формирующие отношение правдоподобия (33), можно преобразовать: аналогично для К"отЬ. В модифицированном методе Кейпона форма классифицируемой структуры определенного типа задана строго. Это предельный случай, когда при формировании корреляционных матриц коэффициентов разложения (55) в спектрально-морфологическом подходе каждая из двух обучающих выборок представлена единственным образцом становятся диадами. Тогда в (59) матрицу {X ГУП)({Х ,, как аналог текущего фрагмента сканируемого изображения (но в терминах коэффициентов разложения {с/}, {c j}), а матрицу К сотЬ - как аналог СОЭ заданного типа (в терминах коэффициентов.