Электронная библиотека диссертаций и авторефератов России
dslib.net
Библиотека диссертаций
Навигация
Каталог диссертаций России
Англоязычные диссертации
Диссертации бесплатно
Предстоящие защиты
Рецензии на автореферат
Отчисления авторам
Мой кабинет
Заказы: забрать, оплатить
Мой личный счет
Мой профиль
Мой авторский профиль
Подписки на рассылки



расширенный поиск

Алгоритмы сегментации изображений и их применение при создании автоматических систем распознавания объектов Верденская Наталья Владимировна

Алгоритмы сегментации изображений и их применение при создании автоматических систем распознавания объектов
<
Алгоритмы сегментации изображений и их применение при создании автоматических систем распознавания объектов Алгоритмы сегментации изображений и их применение при создании автоматических систем распознавания объектов Алгоритмы сегментации изображений и их применение при создании автоматических систем распознавания объектов Алгоритмы сегментации изображений и их применение при создании автоматических систем распознавания объектов Алгоритмы сегментации изображений и их применение при создании автоматических систем распознавания объектов Алгоритмы сегментации изображений и их применение при создании автоматических систем распознавания объектов Алгоритмы сегментации изображений и их применение при создании автоматических систем распознавания объектов Алгоритмы сегментации изображений и их применение при создании автоматических систем распознавания объектов Алгоритмы сегментации изображений и их применение при создании автоматических систем распознавания объектов Алгоритмы сегментации изображений и их применение при создании автоматических систем распознавания объектов Алгоритмы сегментации изображений и их применение при создании автоматических систем распознавания объектов Алгоритмы сегментации изображений и их применение при создании автоматических систем распознавания объектов
>

Данный автореферат диссертации должен поступить в библиотеки в ближайшее время
Уведомить о поступлении

Диссертация - 480 руб., доставка 10 минут, круглосуточно, без выходных и праздников

Автореферат - 240 руб., доставка 1-3 часа, с 10-19 (Московское время), кроме воскресенья

Верденская Наталья Владимировна. Алгоритмы сегментации изображений и их применение при создании автоматических систем распознавания объектов : диссертация ... кандидата физико-математических наук : 05.13.18.- Москва, 2001.- 144 с.: ил. РГБ ОД, 61 02-1/847-3

Содержание к диссертации

Введение

Глава 1. Задача сегментации изображения как задача байесовского оценивания разбиения области 14

1.1. Формальная постановка задачи сегментации 14

1.2. Решающая функция, функция потерь 17

1.3. Задание распределения на пространстве разбиений. априорное распределение 18

1.4. Функция риска, априорный и апостериорный риск 20

1.5. Примеры вычисления среднего риска для некоторых моделей изображения и решающих функций 21

Глава 2. Адаптивная процедура пороговой сегментации изображения 26

2.1 Выбор модели изображения 26

2.2. Наилучшая пороговая процедура 27

2.3. Оценка параметров распределений, отвечающих элементам разбиения 30

2.4. Использование алгоритмов разделения смеси распределений для получения оценок параметров распределений 30

2.5. Выбор начального приближения. энтропийная функция 31

2.6. Получение экспоненциально-взвешенных оценок параметров нормальных распределений, отвечающих элементам разбиения 34

Глава 3. Модель для приближенного описания негауссовских законов распределения вероятностей 38

3.1. Семейство модельных распределений 40

3.2. Приближение заданной плотности распределения с помощью плотностей типа I или II 41

3.3. Оценивание параметров распределений типа I или II по выборочным данным 44

3.4. Примеры 49

Глава 4. Модификация байесовской процедуры сегментации при уточненной модели изображения 56

4.1. Использование бем-алгоритма для формирования списка гипотез 56

4.2. Использование байесовской процедуры проверки гипотез для сегментации изображения 59

4.3. Итерационный алгоритм "байесовской сегментации" без использования априорной информации о параметрах распределений элементов разбиения 62

Глава 5. Алгоритмы выделения областей связности 66

5.1. Алгоритм полного обхода (цепного кода) 67

5.2. Быстрый алгоритм выделения связных областей 68

Глава 6. Применение разработанных алгоритмов сегментации для обработки микроскопических и радиолокационных изображений 73

6.1. Решение задачи сегментации микроскопических изображений мазка периферической крови в приборе автоматического анализа количественного состава периферической крови - аспек 73

6.1.1. Автоматизация общего клинического анализа крови 73

6.1.2. Состав прибора аспек 76

6.1.3. Сегментация изображений в приборе аспек 77

6.1.4. Сегментация исходного кадра 80

6.1.5. Выделение связных областей на изображении 82

6.1.6. Сегментация лейкоцита - выделение внутриклеточных структур 83

6.2. Решение зада чи сегментации радиолокационных изображений обработке радиолокационных изображений 86

6.2.1. Особенности радиоизображений земной поверхности 86

6.2.2. Малоразмерные объекты 87

6.2.3. Сложные объекты 87

6.2.4. Протяженные объекты 88

6.2.5. Выбор модели для описания изображений участков земной поверхности 88

6.2.6. Алгоритм обнаружения малоразмерных объектов 89

6.2.7. Обнаружение блестящих точек 90

6.2.8. Формирование сложного объекта 91

6.2.9. Алгоритм обнаружения протяженных объектов 91

Основные результаты главы 6 93

Заключение 94

Основные результаты диссертации 96

Приложение 1. Обзор литературы: сегментация - современное состояние вопроса 99

Приложение 2 132

Введение к работе

Актуальность темы

Одним из важнейших факторов, обусловливающих развитие современной науки, является быстрый рост производительности современной вычислительной техники. Увеличение мощности компьютеров позволило осуществлять обработку многомерных данных фактически в реальном времени и создавать автоматические системы, реализующие такую обработку. Среди бурно развивающихся в настоящее время направлений важное место занимают автоматические системы распознавания образов. В качестве исходных данных такие системы используют изображения, получаемые в различных диапазонах длин волн - радио, оптическом, рентгеновском. Общим свойством этих данных является их многомерность, чаще всего размерность данных равна двум или трем. Для обработки данных такого типа в реальном времени требуются быстродействующие и точные алгоритмы обработки изображений, позволяющие автоматически обнаружить, выделить, интерпретировать и измерить интересующие исследователя объекты. В большинстве случаев, первым этапом обработки является сегментация изображения, позволяющая выделить на нем участки, содержащие такие объекты.

Сегментация включает построение модели изображения, т.е. формальное описание статистических свойств и регулярной структуры участков, составляющих изображение. Следующим шагом является формирование алгоритмов сегментации - процедур, позволяющих выделять на изображении "области однородности". Области однородности - это участки изображения, структура которых хорошо описывается какой-либо из построенных на первом этапе моделей. Последним шагом является выделение на отсегментированном изображении элементов связности и формирование структуры изображения объекта, интересующего исследователя.

После сегментации изображение подвергается дальнейшей обработке, состав которой определяется решаемой задачей. Это может быть обнаружение объектов определенного типа, измерение характеристик объекта, доступных на изображении, распознавание и подсчет объектов различных типов, встречающихся на изображениях. Важным моментом при решении указанных задач является не только разработка алгоритмов сегментации, но и развитие математических методов, позволяющих сравнивать качество различных процедур сегментации и получать оптимальные алгоритмы сегментации. Важно отметить, что выбор того или иного алгоритма сегментации для использования в автоматической системе определяется не только его точностью, но и его быстродействием, а также удобством его программной реализации. Вопросам сегментации изображений на протяжении последних пятнадцати лет посвящено огромное количество работ, как в нашей стране, так и за рубежом, что говорит об актуальности данной проблемы. Исследования проводились, в основном, по трем направлениям. Первое - это создание математических моделей, наиболее точно отражающих свойства реальных изображений, включая случайно-регулярные соотношения цветояркостных характеристик соседних элементов - текстуру ([1] -[9]).

Во-вторых, огромное количество работ посвящено непосредственно созданию алгоритмов сегментации ([1]—[16]). И, наконец, третьим направлением исследований являются методы восстановления изображений, представляющие собой перенос на многомерный случай методов восстановления сигнала на фоне шумов [10]. Заметим, что последнее направление лежит несколько в стороне от решаемых автором задач. Несмотря на обилие публикаций, посвященных вопросам сегментации изображений данную задачу нельзя считать до конца решенной. Прежде всего, следует отметить, что в большинстве известных работ сама постановка задачи сегментации и, следовательно, критерии качества процедур сегментации зависят от выбранной модели изображения и от постановки задачи. Это приводит к тому, что при различных моделях изображения, а иногда и при одинаковых моделях, но при различных постановках задачи (см., например, [10] - [12]), предлагаемые процедуры сегментации оказываются несравнимыми по тому или иному критерию качества. В связи с вышесказанным, хотелось бы иметь единый критерий качества сегментации, не зависящий от выбора модели изображения. Такой критерий, использующий байесовский подход к постановке задачи сегментации, будет предложен ниже.

Как уже отмечалось, существенным фактором при обработке изображений является не только точность, но и быстродействие процедуры сегментации. В некоторых ситуациях быстродействие процедуры оказывается важнее, чем точность и выбор делается в пользу менее точной, но более быстрой процедуры. Этим объясняется особый интерес, проявляемый к пороговым процедурам сегментации. Дополнительная проблема, относящаяся не только к пороговым процедурам сегментации, состоит в том, что исследователю в большинстве случаев неизвестны точно ни параметры моделей изображения, описывающих области однородности, ни сами модели. Для их построения и оценки параметров приходится использовать те же данные, что и для проведения сегментации. Таким образом, процедуры сегментации должны быть полностью адаптивными, что, в свою очередь, снижает их точность. Задача состоит в построении полностью адаптивных и достаточно точных пороговых процедур, применительно к различным моделям изображений.

Огромное количество литературы посвящено выбору моделей для адекватного описания структуры изображения. Задача выбора модели включает также и задачу оценивания параметров этой модели по имеющимся данным. Эта задача легко решается далеко не всегда даже в случае простейшей модели независимых пикселов на решетке, когда область однородности определяется как область изображения, элементы которой распределены одинаково.

Как уже отмечалось, точность пороговых процедур невысока и ее не хватает для выявления более тонких особенностей на локальных участках изображения. Обработка таких участков необходима при подробном исследовании объектов, размер которых мал по сравнению с размером всего изображения. В такой ситуации точность процедуры оказывается более важной чем быстродействие, тем более, что размеры обрабатываемого в этом случае участка невелики по сравнению с размером всего изображения. Для решения задачи сегментации таких участков необходимо разработать оптимальные или квазиоптимальные процедуры сегментации без ограничений на затраты времени. До сих пор эта задача не была решена из-за отсутствия критерия качества процедуры сегментации.

Наконец, при обработке изображений необходимо решить задачу выделения связных участков на отсегментированном изображении. Известный [51] алгоритм цепного кода не дает удовлетворительного решения этой задачи, так как при обработке больших массивов данных является слишком медленным.

Данная диссертация посвящена решению указанных задач, что позволит в определенной степени заполнить существующие пробелы в проблеме сегментации изображений. Поэтому тема диссертации представляется весьма актуальной.

Цель работы

Целью диссертационной работы является разработка методов сегментации изображений, создание на их основе быстрых и высокоточных алгоритмов сегментации изображений, выделения на отсегментированных изображениях областей связности и построение на основе этих алгоритмов автоматизированных систем распознавания объектов для различных приложений (медицины, радиолокации, картографии и др.).

Задачи исследования

Для достижения указанной цели необходимо рассмотреть и решить ряд задач: рассмотреть задачу сегментации изображений в постановке, позволяющей использовать для описания областей изображения различные модели, отличающиеся не только значениями их параметров, но и структурой; определить критерий качества сегментации и условия оптимальности процедуры сегментации; построить оптимальное правило сегментации для простейшей модели изображения; моделируя изображение, заданное на решетке, с помощью гауссовских, независимых, одинаково распределенных в каждой области однородности случайных величин, разработать быструю адаптивную процедуру пороговой сегментации, устойчивую к засорению (несоответствию данных выбранной модели) и усечению данных; построить параметрическое семейство распределений, позволяющее моделировать негауссовские данные, и разработать метод оценки параметров распределений этого семейства по имеющимся данным; моделируя изображение, заданное на решетке, с помощью независимых, одинаково распределенных в каждой области однородности случайных величин, распределение которых описывается законом из построенного параметрического семейства распределений, разработать адаптивную процедуру сегментации, включающую этап формирования набора распределений, описывающих области однородности; разработать итерационной процедуры сегментации с автоматическим формированием набора распределений, описывающих области однородности; разработать быстрый алгоритм выделения связных областей на изображении.

Научная новизна работы

Научная новизна работы заключается в следующем: осуществлена формальная постановка задачи сегментации изображений, в рамках которой сегментация интерпретируется как задача оценивания разбиения. При этом для описания различных элементов изображения могут быть использованы различные модели изображения; предложен способ введения структуры вероятностного пространства на множестве разбиений; предложен критерий для оценки качества процедуры сегментации. Характеристикой качества сегментации предлагается считать величину априорного или апостериорного риска в задаче байесовского оценивания разбиения, а оптимальной считается байесовская процедура сегментации при данном априорном распределении разбиений; построена оптимальная процедура сегментации для ограниченного класса правил сегментации в рамках простейшей модели изображения - модели независимых пикселов на решетке; разработана быстрая адаптивная пороговая процедура сегментации, устойчивая к засорению (несоответствию данных выбранной модели изображения) и усечению данных в рамках гауссовской модели изображения; построено параметрическое семейство распределений. Плотностями из этого семейства можно, с заданной точностью, аппроксимировать произвольные плотности из указанного класса распределений. Предложен метод оценки параметров распределений из этого семейства по имеющейся выборке; разработана процедура сегментации, включающая формирование списка гипотез из распределений, принадлежащих указанному выше семейству, моделирующих изображение в областях однородности, и байесовскую процедуру сегментации; разработана итерационная процедура сегментации с автоматическим формированием набора распределений, описывающих изображение на элементах разбиения. предложен алгоритм выделения областей связности на изображении, существенно превосходящий по быстродействию известный алгоритм цепного кода

Практическая ценность работы

Практическая ценность работы состоит в: разработке и программной реализации комплекса алгоритмов, позволяющих решить задачу сегментации изображения и включающего четыре этапа обработки: первичную пороговую сегментацию исходного изображения, характеризующуюся высоким быстродействием; выделение на отсегментированном изображении элементов связности; первичное распознавание элементов изображения; выделение структурных элементов на участках изображения, содержащих интересующие исследователя объекты; использовании разработанных алгоритмов и реализующего их комплекса программ при сегментации радиолокационных изображений в системе распознавания объектов по их радиолокационным образам; использовании разработанных алгоритмов и реализующего их комплекса программ при обработке оцифрованных изображений полей зрения оптического микроскопа в приборе АСПЕК, предназначенном для проведения автоматического анализа крови.

Основные положения, выносимые на защиту

1. Постановка задачи сегментации плоских изображений как задачи оценивания разбиения области изображения. Использование априорного (апостериорного) риска при байесовском оценивании разбиения как характеристики качества сегментации. Введение структуры вероятностного пространства на множестве разбиений области изображения. Построение байесовской процедуры сегментации в ограниченном классе правил.

Устойчивая, быстродействующая, адаптивная пороговая процедура сегментации, рассматриваемая в рамках гауссовской модели изображения. Процедура включает: наилучшее (в смысле рассмотренной в п.1 постановки задачи) пороговое правило сегментации, двухэтапную процедуру оценки параметров распределений, описывающих области однородности. Для получения начального приближения параметров используется процедура максимизации энтропийной функции, затем процедура экспоненциально-взвешенного оценивания параметров распределений, отвечающих областям однородности.

Семейство распределений, имеющих непрерывную или кусочно-непрерывную плотность распределения вероятностей, сосредоточенную на конечном отрезке. Возможность приближения плотности распределения вероятностей, удовлетворяющей ряду условий, плотностью распределения, принадлежащей указанному семейству распределений, с заданной точностью. Метод оценивания параметров названного семейства распределений.

Быстрый алгоритм выделения связных областей на отсегментированном изображении, в котором каждый элемент изображения анализируется не более двух раз.

Процедура выделения структур на локальных участках изображения, включающая формирование списка гипотез из распределений, принадлежащих указанному семейству распределений, моделирующих изображение на элементах разбиения, и байесовскую (в рамках выбранной модели) процедуру сегментации.

Итерационная процедура сегментации с автоматическим формированием набора распределений, описывающих изображение на элементах разбиения.

Блок программ, предназначенный для автоматической сегментации микроскопических изображений мазка периферической крови в анализаторе крови АСПЕК.

Использование названных алгоритмов сегментации при обнаружении и распознавании объектов на радиолокационных изображениях земной и морской поверхности.

Достоверность результатов

Достоверность результатов подтверждается практическим использованием алгоритмов, построенных на основании приведенных результатов, в программном обеспечении системы анализа радиолокационных изображений, полученных космической радиолокационной станцией с синтезированной апертурой, и в программном обеспечении медицинского прибора автоматического анализа крови АСПЕК.

Апробация результатов работы

Материалы диссертации докладывались и обсуждались на пятнадцати союзных, российских и международных конференциях и симпозиумах. Прибор АСПЕК, в программном обеспечении которого реализованы разработанные в диссертации алгоритмы сегментации, выставлялся на ряде российских и международных выставок медицинской техники ("Медтехника-1999", "Медтехника-2000", 1-й международный форум "Высокие технологии оборонного комплекса", "Научное приборостроение 2000", Международная промышленная выставка-ярмарка в Ганновере (23-28 апреля 2001) и др.).

Публикации

По материалам данной работы опубликовано 30 научных работ, из них 7 статей в различных научных журналах, один патент Российской Федерации, 4 научно-технических отчета, один патент Российской Федерации и восемнадцать тезисов докладов на союзных, российских и международных конференциях и симпозиумах. Диссертация состоит из введения, шести глав, заключения, списка литературы, содержащего 78 наименований, и двух приложений.

В приложении 1 дается подробный обзор современного состояния проблемы сегментации изображений на основе отечественных и современных публикаций. В результате анализа состояния проблемы, а также в процессе решения практических задач по обработке радиолокационных и оптических изображений были сформулированы перечисленные выше задачи, составляющие существо диссертации. Решение этих задач должно в значительной степени устранить выявленные пробелы в проблеме сегментации изображений.

Задание распределения на пространстве разбиений. априорное распределение

Научная новизна работы заключается в следующем: 1) осуществлена формальная постановка задачи сегментации изображений, в рамках которой сегментация интерпретируется как задача оценивания разбиения. При этом для описания различных элементов изображения могут быть использованы различные модели изображения; 2) предложен способ введения структуры вероятностного пространства на множестве разбиений; 3) предложен критерий для оценки качества процедуры сегментации. Характеристикой качества сегментации предлагается считать величину априорного или апостериорного риска в задаче байесовского оценивания разбиения, а оптимальной считается байесовская процедура сегментации при данном априорном распределении разбиений; 4) построена оптимальная процедура сегментации для ограниченного класса правил сегментации в рамках простейшей модели изображения - модели независимых пикселов на решетке; 5) разработана быстрая адаптивная пороговая процедура сегментации, устойчивая к засорению (несоответствию данных выбранной модели изображения) и усечению данных в рамках гауссовской модели изображения; 6) построено параметрическое семейство распределений. Плотностями из этого семейства можно, с заданной точностью, аппроксимировать произвольные плотности из указанного класса распределений. Предложен метод оценки параметров распределений из этого семейства по имеющейся выборке; 7) разработана процедура сегментации, включающая формирование списка гипотез из распределений, принадлежащих указанному выше семейству, моделирующих изображение в областях однородности, и байесовскую процедуру сегментации; 8) разработана итерационная процедура сегментации с автоматическим формированием набора распределений, описывающих изображение на элементах разбиения. 9) предложен алгоритм выделения областей связности на изображении, существенно превосходящий по быстродействию известный алгоритм цепного кода Практическая ценность работы Практическая ценность работы состоит в: 1) разработке и программной реализации комплекса алгоритмов, позволяющих решить задачу сегментации изображения и включающего четыре этапа обработки: первичную пороговую сегментацию исходного изображения, характеризующуюся высоким быстродействием; выделение на отсегментированном изображении элементов связности; первичное распознавание элементов изображения; выделение структурных элементов на участках изображения, содержащих интересующие исследователя объекты; 2) использовании разработанных алгоритмов и реализующего их комплекса программ при сегментации радиолокационных изображений в системе распознавания объектов по их радиолокационным образам; 3) использовании разработанных алгоритмов и реализующего их комплекса программ при обработке оцифрованных изображений полей зрения оптического микроскопа в приборе АСПЕК, предназначенном для проведения автоматического анализа крови. Основные положения, выносимые на защиту 1. Постановка задачи сегментации плоских изображений как задачи оценивания разбиения области изображения. Использование априорного (апостериорного) риска при байесовском оценивании разбиения как характеристики качества сегментации. Введение структуры вероятностного пространства на множестве разбиений области изображения. Построение байесовской процедуры сегментации в ограниченном классе правил. 2. Устойчивая, быстродействующая, адаптивная пороговая процедура сегментации, рассматриваемая в рамках гауссовской модели изображения. Процедура включает: наилучшее (в смысле рассмотренной в п.1 постановки задачи) пороговое правило сегментации, двухэтапную процедуру оценки параметров распределений, описывающих области однородности. Для получения начального приближения параметров используется процедура максимизации энтропийной функции, затем процедура экспоненциально-взвешенного оценивания параметров распределений, отвечающих областям однородности. 3. Семейство распределений, имеющих непрерывную или кусочно-непрерывную плотность распределения вероятностей, сосредоточенную на конечном отрезке. Возможность приближения плотности распределения вероятностей, удовлетворяющей ряду условий, плотностью распределения, принадлежащей указанному семейству распределений, с заданной точностью. Метод оценивания параметров названного семейства распределений. 4. Быстрый алгоритм выделения связных областей на отсегментированном изображении, в котором каждый элемент изображения анализируется не более двух раз. 5. Процедура выделения структур на локальных участках изображения, включающая формирование списка гипотез из распределений, принадлежащих указанному семейству распределений, моделирующих изображение на элементах разбиения, и байесовскую (в рамках выбранной модели) процедуру сегментации. 6. Итерационная процедура сегментации с автоматическим формированием набора распределений, описывающих изображение на элементах разбиения. 7. Блок программ, предназначенный для автоматической сегментации микроскопических изображений мазка периферической крови в анализаторе крови АСПЕК. 8. Использование названных алгоритмов сегментации при обнаружении и распознавании объектов на радиолокационных изображениях земной и морской поверхности. Достоверность результатов Достоверность результатов подтверждается практическим использованием алгоритмов, построенных на основании приведенных результатов, в программном обеспечении системы анализа радиолокационных изображений, полученных космической радиолокационной станцией с синтезированной апертурой, и в программном обеспечении медицинского прибора автоматического анализа крови АСПЕК. Апробация результатов работы Материалы диссертации докладывались и обсуждались на пятнадцати союзных, российских и международных конференциях и симпозиумах. Прибор АСПЕК, в программном обеспечении которого реализованы разработанные в диссертации алгоритмы сегментации, выставлялся на ряде российских и международных выставок медицинской техники ("Медтехника-1999", "Медтехника-2000", 1-й международный форум "Высокие технологии оборонного комплекса", "Научное приборостроение 2000", Международная промышленная выставка-ярмарка в Ганновере (23-28 апреля 2001) и др.). По материалам данной работы опубликовано 30 научных работ, из них 7 статей в различных научных журналах, один патент Российской Федерации, 4 научно-технических отчета, один патент Российской Федерации и восемнадцать тезисов докладов на союзных, российских и международных конференциях и симпозиумах. Диссертация состоит из введения, шести глав, заключения, списка литературы, содержащего 78 наименований, и двух приложений.

Получение экспоненциально-взвешенных оценок параметров нормальных распределений, отвечающих элементам разбиения

Используем метод наименьших квадратов (МНК) для получения оценок параметров { на существенном интервале [х0, ]. Обозначим яо - первый уровень гистограммы, такой что х0 и 5/ - последний уровень, такой, что хх, / =5, -50 +1. Полученная переходом к логарифмам линейная регрессия на участке [х0, хх] будет иметь вид: или, в матричной записи Начальную оценку параметров распределения можно записать в виде В ([41], стр.260) показано, как уточнить оценку а0, используя разложение функции /(а0 ,...,ак ) = в ряд Тейлора. Там же показано, что оценка а0 является состоятельной и приведены формулы для оценки смещения в нелинейной регрессии. Отметим, что при гауссовских отклонениях е оценки параметров, полученные с помощью МНК, совпадают с оценками метода максимума правдоподобия ([41], стр 237). Поскольку, как было показано выше, в нашем случае е - асимптотически нормальны, можно считать, что построенные нами оценки в некотором смысле близки к оценкам метода максимума правдоподобия.

Рассмотрим теперь вопрос об оценке параметров (т, а) базового гауссовского распределения. Как уже отмечалось, параметры определяют поведение "хвостов" распределения х). Поэтому для их оценки естественно использовать наблюдения, не попадающие на интервал [х0,х)]. Таким образом, для определения (т, г) имеем выборку длины п-п1. Оценивание будем осуществлять по сгруппированным данным - по участку гистограммы вне отрезка методом наименьших квадратов. Как известно, при оценивании параметров гауссовского распределения оценки МНК совпадают с оценками метода максимального правдоподобия. Однако на практике длина выборки п - П1 может оказаться очень малой, что естественно приводит к снижению качества оценивания. Поэтому, в некоторой степени жертвуя точностью описания распределения на хвостах, предлагается рассмотреть в качестве рт (х) некоторое "базовое" гауссовское распределение, наилучшим образом приближающее исходное распределение. Тогда оценки параметров (т, а) можно определить, например, как выборочное среднее или выборочную дисперсию, или использовать процедуру экспоненциально-взвешенного оценивания [32] для определения гауссовского закона, наилучшим образом приближающего исходное негауссовское распределение. Может показаться парадоксальным, но практика показывает, что выбор в качестве параметров (т, а) выборочного среднего и дисперсии дает лучшую и более устойчивую аппроксимацию исходного распределения.

Последние соображения приводят к несколько иной интерпретации функции g(x), участвующей в определении плотности х). В такой постановке задачи функция g(x) это "поправка" на негауссовость исходного распределения. Чем ближе исходное распределение к гаусовскому, тем ближе к единице.

В качестве иллюстрации к вышесказанному рассмотрим задачу выбора модели для описания элементов области однородности изображения мазка периферической крови. Область однородности на изображении можно охарактеризовать как область, элементы которой представляют собой независимые, одинаково распределенные случайные величины. Требуется выбрать параметрическую модель для описания распределения этих случайных величин. Ниже приведены графики плотностей распределений вероятностей, которые предлагались в качестве модели распределения. В таблице 1 приведены расстояния в смысле Ь и Хеллингера между различными модельными плотностями выборочной плотностью распределения. Рис.6 соответствует графику плотности гауссовского распределения вероятностей, для которого среднее и дисперсия совпадают с соответствующими выборочными моментами исходного распределения (синяя кривая), а также графику плотности гауссовского распределения вероятностей, параметры которого определены с помощью процедуры экспоненциально-взвешенного оценивания (зеленая кривая). На рис.7 показано приближение исходных данных плотностью распределения Релея со сдвигом. На рис.8 представлено приближение исходной плотности распределения с помощью / -распределения. На рис.9 изображен график суммы первых трех членов в разложении Эджворта. График с рис.10 отвечает модели смеси двух гауссовских распределений. И, наконец, график на рис.11 соответствует распределению типа I с полиномом Рк(х) степени к=5. Анализ приведенных рисунков показывает, что наиболее точным является приближение выборочной плотности распределения данных (гистограммы) с помощью рассмотренного выше распределения типа I. Это приближение оказывается лучше, чем приближение с помощью двухкомпонентной смеси. Естественно, что увеличивая число компонент смеси или увеличивая степень полинома в показателе экспоненты для распределения типа 1(11), можно строить приближение с заданной точностью. При этом для аппроксимации плотности распределения с помощью двухкомпонентной смеси нужно оценить шесть параметров, также как и при аппроксимации распределением типа 1(11) с полиномом третьей степени в показателе экспоненты. Но главное преимущество использования предложенных выше распределений состоит в том, что их можно использовать в задаче разделения смеси распределений. Теоретически разделимость смеси распределений типа 1(11) не доказывалась, однако численно такая задача успешно решается. На рис. 12 приведен результат разделения четырехкомпонентной смеси распределений типа I с помощью SEM алгоритма. В таблице приведены оценки точности приближения выборочной плотности распределения с помощью различных модельных распределений. Как уже отмечалось, в качестве оценок точности аппроксимации выбраны расстояние между выборочной плотностью и модельным распределением в функциональном пространстве L2 и расстояние Хеллингера [21]. Как следует из таблицы, наилучшей является аппроксимация с помощью распределения типа

Оценивание параметров распределений типа I или II по выборочным данным

В случае, когда модель распределения элементов разбиения на изображении известна точно, например, распределение пикселов изображения хорошо приближается гауссовским распределением, байесовское правило проверки к гипотез по окрестности 8у может быть использовано как самостоятельная итерационная процедура. Байесовский алгоритм сегментации в виде итерационной процедуры может применяться, когда число областей однородности, которые необходимо выделить на сегментируемом участке, неизвестно, а размер этих областей мал по сравнению с размером сегментируемого изображения. В этом случае алгоритмы разделения смеси становятся мало эффективными. Для решения задачи мы предлагаем использовать алгоритм байесовской сегментации в следующем виде:

Разбиваем исходное изображение на прямоугольники таким образом, чтобы размер ячейки был не больше размера минимальной из областей однородности.

Для каждой из полученных ячеек строим ЭВ оценки параметров распределения в предположении о статистической однородности участка. На самом деле участок может содержать несколько областей однородности и, соответственно, быть неоднородным, но на данном этапе он рассматривается как однородный, с учетом возможного "засорения" путем использования ЭВ оценок. 3. Составляем список гипотез. В качестве гипотез рассматриваются распределения, параметры которых равны оценкам, полученным по каждой из ячеек. Задаемся малым числом д. Вычисляя попарно расстояние Какутани-Хеллингера между всеми гипотезами, выбрасываем из списка одну из каждой пары, если расстояние в этой паре меньше 5. В качестве критерия близости гипотез выбрано расстояние Какутани- Хеллингера, т.к. оно непосредственно связано со степенью различимости гипотез [21]. 4. Выбираем конфигурацию окрестности у и сегментируем изображение на к областей, где к - число оставшихся в списке гипотез. Далее возвращаемся к п.2. Процедура заканчивается, если на двух соседних шагах список и сегментация не меняются. Сходимость, скорость сходимости, а также точность алгоритма аналитически не оценивались, однако экспериментально проверялось, что при минимальной величине области однородности около нескольких сотен пикселов, ее относительной компактности и достаточно точном знании законов распределения, соответствующих областям однородности, процедура сходится за 10-20 шагов. Заметим, что при неточном выборе модели изображения применение байесовского алгоритма сегментации может приводить к возникновению дополнительных "ложных" областей. Впрочем, если в случае использования SEM алгоритма исходное (априорное) число компонентов смеси выбрано большим, чем истинное число областей однородности, а модель изображения тоже недостаточно точна, возникает аналогичный эффект. Рассмотренный итерационный алгоритм является полностью адаптивным, т.е. не требуют априорной информации о законах распределения и числе сегментируемых областей. В связи с этим он устойчивы к естественной вариабельности объектов, изменению условий получения изображений. На рис.14 приведено исходное изображение и результаты его сегментации с помощью байесовского итерационного алгоритма сегментации при различном выборе конфигурации окрестности Sy. 1. Предложена двухэтапная процедура сегментации локальных участков изображения. Для оценки параметров распределений, отвечающих элементам разбиения, используется SEM алгоритм разделения смесей вероятностных распределений. 2. В качестве процедуры сегментации используется байесовское правило проверки конечного числа простых гипотез. Проверка гипотез осуществляется в каждом пикселе изображения по выборке, составленной из элементов окрестности пиксела заданного вида. В этой главе рассмотрены алгоритмы выделения связных областей. Вопрос о выделении областей связности лежит несколько в стороне от основного направления исследований — получения и применения алгоритмов сегментации изображений. Однако выделение областей связности - необходимый этап практического решения задачи сегментации. Во второй главе работы были рассмотрены пороговые процедуры сегментации. Как уже упоминалось, использование таких процедур связано, прежде всего, с их высоким быстродействием. При обработке больших массивов данных быстродействие алгоритма оказывается настолько важным, что предпочтение отдается именно быстрым алгоритмам, часто даже в ущерб качеству. В то же время изображение не является однородным с точки зрения содержащейся в нем информации, и особый интерес представляют его отдельные участки, содержащие изображения интересующих исследователя объектов. Быстрые алгоритмы в большинстве случаев не позволяют описать структуру таких участков с необходимой точностью, поэтому сегментация изображения проводится в два этапа. На втором этапе наиболее важные для исследователя участки сегментируются повторно с помощью более точных, но в тоже время более медленных процедур. В автоматических системах распознавание и выделение участков изображения, требующих повторной обработки, производится также автоматически. Эта задача решается путем выделения элементов связности на отсегментированном изображении, последующего их группирования и распознавания. Ниже мы рассмотрим алгоритмы выделения элементов связности, а процедуры распознавания объектов на изображении остаются за рамками данной работы. Пусть изображение задано на решетке. Для простоты без ограничения общности будем предполагать, что область Т, на которой определено изображение, представляет собой прямоугольник размера М $1. Входными для данного алгоритма является отсегментированное изображение (маска) X. Маска представляет собой матрицу X = {хц } размера МхИ, элементы которой принимают значения из множества (0, к-1). Область соответствует полученной на первом этапе сегментации оценке элемента разбиения с номером 5.

Использование байесовской процедуры проверки гипотез для сегментации изображения

К требованиям, предъявляемым потребителем, можно отнести требование к быстродействию всей системы и отдельных алгоритмов, требование к адекватной цветопередаче и высокому разрешению. Требования, предъявляемые к быстродействию в системах автоматического анализа клеточного состава периферической крови очень высоки. Так полный анализ всех объектов на выборке от 600 до 2000 кадров, размером около 5-Ю5 элементов каждый, должен занимать не более 10 минут (от ! с до 300 мс на кадр). Однако, с точки зрения потребителя, это очень мягкое требование, поскольку вручную человек осуществляет подсчет лейкоцитарной формулы за 1-2 минуты, правда, при этом анализ количественных характеристик осуществляется отдельно. При работе с системой врач осуществляет контроль за работой прибора и визуальный анализ отдельных кадров. Высокое разрешение и корректная передача цвета необходимы, так как требуется обеспечить пользователю такое же качество изображения, как и при наблюдении в микроскоп. При этом требования быстродействия и высокого качества картинки являются противоречивыми, так как высокое разрешение ведет к большому размеру изображения, что, в свою очередь, замедляет обработку. Отсюда автоматически вытекает ограниченность набора возможных методов сегментации - исключаются итерационные методы, требующие многократной обработки одного и того же элемента изображения и методы, приводящие к перебору большого количества вариантов решений, например, методы оценивания изображения как реализации случайной величины, использующиеся при моделировании изображений марковскими случайными полями или схемами авторегрессии [3, 7].

В разработанном нами приборе АСПЕК в программе автоматического анализа, предназначенной для анализа клеточного состава периферической крови, обработка получаемых изображений строится по следующей схеме. При движении автоматического предметного стола по заданной траектории текущий кадр сегментируется, на нем выделяются связные области, которые, с помощью алгоритмов первичного распознавания идентифицируются как элементы крови. Осуществляется подсчет форменных элементов по каждому кадру. Если кадр содержит участки, идентифицированные как лейкоциты, то такие участки сегментируются повторно, с целью выделения внутриклеточных структур. Затем внутриклеточные структуры идентифицируются как ядра и участки цитоплазмы и измеряются (т.е. строится унифицированное описание выделенных объектов). На базе этих описаний определяется лейкоцитарная формула с помощью поэтапной процедуры распознавания. При определении лейкоцитарной формулы, без подсчета количества клеток и без анализа эритроцитов, проход осуществляется по следующей схеме: обнаруживаются кадры, содержащие лейкоциты, сегментируются, затем повторно сегментируются участки кадра, содержащие лейкоциты. В исследовательскую программу включена возможность сегментировать участки кадров, содержащие лейкоциты. В программе контроля технического состояния сегментируются кадры, содержащие изображения объекта-микрометра, с целью определения размеров элемента разрешения системы. С этой целью используется упрощенный алгоритм сегментации, включающий только процедуру оценки распределения фона. Структура изображения очень проста, оно содержит всего две области, причем текстурой темной области, соответствующей делениям линейки, можно пренебречь, поэтому такой простейшей процедуры сегментации достаточно для получения приемлемого качества разбиения.

Рассмотрим более подробно процедуру сегментации, использованную в программе стандартного анализа. Существенными особенностями исходного изображения, помимо названных, можно считать его большой размер (около 5-Ю5 пикселов), тот факт, что основную часть клеток на изображении составляют эритроциты (более одной трети изображения), а также то, что используемая при подготовке препарата стандартная окраска по Романовскому-Гимза, характеризуется достаточно интенсивной (темной) окраской тромбоцитов и ядер лейкоцитов. При этом тромбоциты и лейкоциты суммарно занимают значительно меньшую часть кадра, чем эритроциты и могут отсутствовать на кадре совсем. Отметим также, что интенсивность окраски эритроцитов является достаточно однородной как внутри клетки, так и при переходе от клетки к клетке. Фон изображения при правильной настройке микроскопа также является достаточно однородным (см. Рис. 16). Из сказанного следует, что в качестве модели изображения на первом этапе можно выбрать модель независимых, одинаково распределенных пикселов. Такая модель отвечает статистически однородным областям изображения, без выраженной текстуры. Будем считать распределение пикселов гауссовским, а гистограмму исходного изображения - гистограммой смеси двух или более гауссовских распределений (Рис.16) При этом основные пики гистограммы отвечают фону и эритроцитарной массе. Большой размер изображения, величина площадей, занимаемых эритроцитами и фоном в предположении их статистической однородности, позволяют с удовлетворительной точностью оценить параметры распределения эритроцитов и фона по гистограмме. Однако исследования показали, что распределение эритроцитарной массы на самом деле не является симметричным и, соответственно, гауссовским, что, естественно приводит к снижению точности оценивания. Однако для простоты и быстроты вычислений мы пренебрегли этим эффектом и остановились на гауссовской модели. С учетом перечисленных соображений задачу выделения основных (базовых) элементов изображения можно сформулировать следующим образом. Пусть Н = } - гистограмма изображения. Здесь Ь число уровней гистограммы (Ь 256), N - общее число точек изображения (N = 5-1& ). Считая Н гистограммой смеси двух или более гауссовских распределений, определим по ней параметры распределения основных областей изображения (фона и эритроцитов) и два порога Го и Гу, позволяющие разделить изображение на области фона, эритроцитов и темные области, объединяющие тромбоциты, ядра лейкоцитов, грязь и т.д. Для приблизительного определения участков гистограммы, на которых сосредоточены распределения фона и эритроцитов воспользуемся процедурой поиска порогового значения, разделяющего указанные области, сводящейся к отысканию максимума "энтропийной функции", рассмотренной во второй главе.

Похожие диссертации на Алгоритмы сегментации изображений и их применение при создании автоматических систем распознавания объектов