Электронная библиотека диссертаций и авторефератов России
dslib.net
Библиотека диссертаций
Навигация
Каталог диссертаций России
Англоязычные диссертации
Диссертации бесплатно
Предстоящие защиты
Рецензии на автореферат
Отчисления авторам
Мой кабинет
Заказы: забрать, оплатить
Мой личный счет
Мой профиль
Мой авторский профиль
Подписки на рассылки



расширенный поиск

Разработка алгоритма распознавания сложных объектов на основе текстурной информации Яковенко Максим Константинович

Разработка алгоритма распознавания сложных объектов на основе текстурной информации
<
Разработка алгоритма распознавания сложных объектов на основе текстурной информации Разработка алгоритма распознавания сложных объектов на основе текстурной информации Разработка алгоритма распознавания сложных объектов на основе текстурной информации Разработка алгоритма распознавания сложных объектов на основе текстурной информации Разработка алгоритма распознавания сложных объектов на основе текстурной информации Разработка алгоритма распознавания сложных объектов на основе текстурной информации Разработка алгоритма распознавания сложных объектов на основе текстурной информации Разработка алгоритма распознавания сложных объектов на основе текстурной информации Разработка алгоритма распознавания сложных объектов на основе текстурной информации Разработка алгоритма распознавания сложных объектов на основе текстурной информации Разработка алгоритма распознавания сложных объектов на основе текстурной информации Разработка алгоритма распознавания сложных объектов на основе текстурной информации
>

Данный автореферат диссертации должен поступить в библиотеки в ближайшее время
Уведомить о поступлении

Диссертация - 480 руб., доставка 10 минут, круглосуточно, без выходных и праздников

Автореферат - 240 руб., доставка 1-3 часа, с 10-19 (Московское время), кроме воскресенья

Яковенко Максим Константинович. Разработка алгоритма распознавания сложных объектов на основе текстурной информации : Дис. ... канд. техн. наук : 05.13.01 : Санкт-Петербург, 2003 145 c. РГБ ОД, 61:04-5/1333

Содержание к диссертации

Перечень условных обозначений и сокращений 5

Введение 6

1. Анализ предметной области 13

  1. Описание предметной области 13

  2. Методы дифференцирования лейкоцитов 19

Экспертное распознавание 19

Автоматическое распознавание 23

  1. Патентный поиск 30

  2. Предлагаемый подход к распознаванию 31

  3. Классификация методов автоматического распознавания клеток 34

  4. Выводы 35

2. Параметры классификации клеток 38

  1. Постановка задачи поиска инвариантных признаков 38

  2. Методы описания текстуры 39

Статистические моменты 39

Автокорреляционная функция 39

Описание посредством контуров 40

Статистика длин примитивов (СДП) 40

Спектр Фурье 41

Фрактальный подход 43

Фильтр Габора 44

Вэйвлеты 45

Распределение энергии текстуры (РЭТ) 46

Разность уровней яркости (РУР) 47

Марковские случайные поля (МСП) 47

Матрицы совместной встречаемости уровней яркости (МСВУЯ) 50

  1. Сравнительный анализ существующих методов описания текстуры .. 55

  2. Первая модификация метода МСВУВ на основе дискретных цепей Маркова 59

  3. Вторая модификация метода МСВУВ на основе дискретных случайных полей Маркова 62

  4. Предобработка изображений для использования метода МСВУВ 68

  5. Пространство признаков классификации 72

  6. Определение параметров признаков 72

  7. Метод поиска шага построения МСВУЯ. 73

2.10. Выводы 75

3. Алгоритм классификации 79

  1. Классификация с минимальным риском 79

  2. Оценка вероятности ошибки классификации 80

  3. Метод классификационного теста 84

  4. Выводы 84

4. Оценка результатов 86

  1. Сравнительная характеристика классического и двух предложенных методов формирования МСВУЯ 86

  2. Общие результаты классификации при использовании второй модификации МСВЯУ 88

  3. Анализ признаков, полученных при использовании второй модификации МСВЯУ, шаг 4 89

  1. Формирование кластеров 91

  2. Оценка качества кластеров, сформированных при использовании второй модификации МСВЯУ, шаг 4 93

На основе расстояния Махаланобиса 94

На основе классификации тренировочного множества 95

На основе проверки статистической независимости центров кластеров... 95

4.6. Сравнение экспертной классификации с реализованной автоматической
(вторая модификация МСВЯУ, шаг 4) 97

6.7. Выводы 102

Заключение 105

Список литературы и источников 110

Приложение 1. Программа проведения равновероятностной квантизации
(C++) 116

Приложение 2. Программа расчета текстурных дескрипторов (C++) 121

Приложение 3. Программа определения качества кластеров (Maple) 133

Приложение 4. Программа для проведения классификационного теста
(Maple) 137

Перечень условных обозначений и сокращений

ЦМ цифровой микроскоп

МСП марковские случайные поля

МСВУЯ матрицы совместной встречаемости уровней яркости

ЭДФ эллиптические дескрипторы Фурье

РУР разность уровней яркости

СДП статистика длин примитивов

РЭТ распределение энергии текстуры

Введение к работе

Распознавание сложных многопараметрических объектов является далеко нетривиальной задачей не только для систем искусственного интеллекта, но и для эксперта. В качестве яркого примера подобных объектов можно отметить биологические материалы живых организмов. Их изображения могут быть получены при помощи как специальных технологий, например, ультразвукового исследования, рентгеновского излучения, так и посредством видеокамеры, установленной на микроскоп.

Микроскопия является единственной областью лабораторной диагностики, где все еще доминирует трудоемкий субъективный качественный анализ [23]. Большинство медицинских методик ручного микроскопического анализа клеток эксплуатирует замечательные свойства глаз человека мгновенно распознавать соотношения формы, оттенков, текстуры сложных изменчивых объектов. Врач узнает клетки без их измерения, на основе качественных характеристик. Если исследуемых клеток много, а требуемый объем выборки невелик (100 - 200), то такой анализ на «узнавание» при наличии достаточного числа опытных врачей-лаборантов может выполняться в массовом порядке. Значительно хуже справляются глаза человека с дифференциальным подсчетом более серьезных выборок клеток (500) и тем более с большим количеством измерений [24]. Очень трудны и даже вредны для человека анализы с подсчетом флуоресцирующих меток (например, подсчет субпопуляции меченых FITC лимфоцитов). Поэтому доминировавшая до последнего времени ручная микроскопия даже при высокой квалификации врача-лаборанта тяжела, субъективна и ограничена по своим реальным возможностям.

На данный момент широким кругом международных исследователей проведена большая работа по информатизации микроскопии, то есть подключении к микроскопу компьютера и использовании для анализа препарата современные информационные технологии. Компьютерные, или «цифровые» микроскопы отличаются от обычных микроскопов так же, как пишущая машинка от компьютера. В состав ЦМ входят микроскоп (с тринокуляром), средства ввода изображений

7 (аналоговая или цифровая камера или цифровой фотоаппарат плюс плата ввода), компьютер и программное обеспечение.

Функции ЦМ сводятся к следующему: поле зрения микроскопа отображается на экране монитора компьютера; по указаниям врача изображение на экране сохраняется в базе данных компьютера вместе с сопровождающей текстовой информацией; информация из базы данных может быть вызвана на экран, передана в другие компьютеры, отредактирована, распечатана; при выполнении количественных анализов изображения из базы данных подвергаются компьютерной обработке, целью которой является выделение границ клеток и внутриклеточных структур. Данная процедура называется сегментацией и может проводиться как в автоматическом (для контрастных границ) так и в диалоговом режиме (для слабоконтрастных границ).

Первые ЦМ появились более 40 лет назад, однако только в последние 5 лет их применение стало массовым и экономически выгодным. Это связано с бурным прогрессом в области средств съемки изображений, персональных компьютеров, информационных технологий, математических методов обработки изображений. ЦМ стал стандартным недорогим оборудованием современной лаборатории.

Хотя цифровой микроскоп революционно расширил возможности врача-лаборанта, он не принимает самостоятельных решений и оставляет за врачом ответственность за сбор выборки исследуемых клеток и за условия их наблюдения. Применение ЦМ требует такой же высокой квалификации, как и ручная микроскопия. Накопленный за последние 30 лет опыт [22], [30], [55], [78] показал однако, что реализовать на практике потенциальные диагностические возможности ЦМ весьма непросто. Это связано с высокой вариабельностью клеток и клеточных структур, ограниченным разрешением в средствах телевизионного съема изображений, недостаточной контрастностью границ клеточных структур, частичной утратой информации в плоских изображениях по сравнению с трехмерным оригиналом, неравномерностью окраски в процессе приготовления образцов, огромным объемом материала. Разработанные в 70-е годы алгоритмы для анализа крови не смогли обеспечить получение приемлемых устойчивых результатов

8 корректного распознавания клеток. В качестве альтернативы были разработаны проточные счетчики. Основные недостатки этих систем таковы: сложная и дорогостоящая процедура подготовки препарата для анализа; требование увеличенного количества анализируемого биоматериала; отсутствие визуального контроля результатов экспертом; невозможность повторного исследования; ограниченный набор проводимых тестов; высокая стоимость оборудования.

Указанные недостатки помешали массовому распространению подобных систем. В начале 90-х годов коммерчески доступно было только очень небольшое число таких систем на базе микроскопа (например, Leitz Hematrak, Microx Omron Analyzer, Hitachi 8200) [25]. Особо нужно отметить принципиальный недостаток проточных анализаторов - даже самые совершенные из них не могут полностью заменить визуальный анализ мазка крови, который является «золотым стандартом» в гематологии.

В настоящее время на новом витке развития телевизионной и компьютерной техники появляется возможность создания эффективного анализатора мазков крови оптического типа, свободного от перечисленных выше недостатков анализаторов проточного типа и позволяющего осуществлять визуальный контроль и корректировку автоматической классификации.

В данной работе в качестве анализируемых клеток выбраны белые кровяные тельца (лейкоциты) человека. Составление лейкоцитарной формулы (процентного соотношения различных видов лейкоцитов) очень важная и массовая процедура. Изменение лейкоцитарной формулы сопутствуют многим заболеваниям и нередко являются неспецифическими. Тем не менее, диагностическое значение этого исследования велико, оно дает представление о тяжести состояния, эффективности терапии. Например, повышение числа нейтрофилов - нейтрофилез, как правило, сочетается с увеличением общего числа лейкоцитов в крови и наблюдается при острых воспалительных процессах, интоксикациях, шоковых состояниях, при кровотечениях, инфаркте миокарда. Если происходит резкое увеличение общего

9 числа лейкоцитов в крови, то можно диагностировать сепсис, туберкулез, метастазы злокачественных опухолей в костный мозг. Напротив, снижение числа нейтрофилов - нейтропения - обычно наблюдается при вирусных инфекциях, после лучевой терапии.

Подавляющее большинство анализов для составления лейкоцитарной формулы делается вручную при помощи микроскопа и механического счетчика, который равносилен обыкновенным счетам. С помощью малого увеличения (Юх) находят начало мазка крови. Далее при помощи большего увеличения (90х) производят дифференцирование лейкоцитов. Подсчет лейкоцитов проводят, соблюдая следующие правила: начинают, отступив 2-3 поля зрения от края мазка, проходят 3-5 полей зрения вдоль края мазка. Затем 3-5 полей зрения под прямым углом по направлению к середине мазка, снова 3-5 полей зрения параллельно краю, затем под прямым углом и так далее до противоположного края мазка. Затем меняют положение стекла и другую половину клеток считают на противоположном крае. Минимальное количество лейкоцитов, необходимых для проведения анализа - 100. Для более точного результата (например, если при подсчете первой сотни отмечаются какие-либо отклонения) считают еще 100. Существуют и более высокие требования к статистической правдоподобности анализа. При этом необходимо дифференцировать от 500 до 1000 клеток.

Актуальность проблемы создания автоматического классификатора основывается на необходимости проведения в повседневной жизни огромного количества рутинных исследований с привлечением высококвалифицированного медперсонала. Даже частичная компьютеризация с поиском клеток для анализа (с помощью ЦМ) не позволяет кардинальным образом увеличить мощность и эффективность лаборатории, так как в каждом анализе необходимо обработать 100 -1000 клеток. И произвести эту работу по классификации лейкоцитов может только опытный врач-гематолог.

Следует отметить, что лейкоциты - одни из наиболее сложных для классификации биологических объектов ввиду их значительной вариабельности. Помимо разных этапов жизненного цикла самих клеток (они могут быть молодыми, зрелыми, отработанными), на вид лейкоцитов в значительной мере оказывает влияние физическое состояние и здоровье человека. Также сказываются

10 экологические условия, вредные воздействия (например, радиоактивное) и даже время суток, в которое был взят анализ. В настоящее время не получено приемлемых устойчивых результатов корректного распознавания этих клеток оптическим способом. Основной акцент в попытках распознавания лейкоцитов делался на цветовые, метрические и морфологические характеристики клеток. В данной работе в качестве основной дискриминационной характеристики выбрана текстура ядра и цитоплазмы клетки, что позволило получить высокие и стабильные результаты корректного распознавания.

Целью данной работы является разработка алгоритма распознавания сложных биологических объектов на основе текстурной информации на примере белых кровяных телец (лейкоцитов) человека. Эффективность работы алгоритмов, основанных на разрабатываемом методе, должна быть сопоставима с экспертным распознаванием объектов исследования.

Для решения поставленной цели необходимо реализовать следующие задачи: проанализировать объекты предметной области, существующие подходы распознавания лейкоцитов; на основе проведенного анализа оценить информативность параметров описания клеток, сформировать набор наиболее информативных описателей, исключив параметры-артефакты; создать набор инвариантных к группе аффинных преобразований описателей найденных параметров; рассмотреть возможности модификации метода получения классификационных признаков с целью повышения их дискриминационной способности; решить задачу классификации для дифференцирования имеющихся классов с использованием сформированного вектора аффинных инвариантов; оценить полученные результаты, проверить качество кластеризации, обеспечиваемое найденными инвариантными признаками;

Научная новизна работы описывается следующими положениями: введен новый метод распознавания лейкоцитов на основе предложенного набора текстурных дескрипторов, обеспечивающий высокое качество разделения классов объектов, сопоставимое с экспертным распознаванием; разработана модификация метода построения матриц совместной встречаемости уровней яркости (МСВУЯ) на основе дискретных цепей Маркова, позволяющая повысить информативность формируемых текстурных описателей за счет эффективного применения более высоких шагов построения МСВУЯ; разработана модификация метода построения МСВУЯ на основе дискретных случайных полей Маркова, позволяющая существенно повысить информативность получаемых текстурных описателей за счет пространственного (двумерного) сбора статистики совместной встречаемости уровней яркости и формирования единственной матрицы с полной и непротиворечивой информацией о текстуре изображения объекта. Применение модификации обеспечивает высокий дискриминационный потенциал построенных текстурных дескрипторов при классификации объектов с ярко выраженными текстурными хар актеристиками; предложен новый метод определения шага построения МСВУЯ на основе интегральных оценок по критерию Фишера, позволяющий значительно упростить и ускорить необходимую процедуру первоначальной настройки системы распознавания; разработан программный комплекс, обеспечивающий среднюю вероятность корректной классификации лейкоцитов на уровне 97.2%, что сопоставимо с производительностью высококвалифицированного эксперта.

Положения, выносимые на защиту: предложенный подход к распознаванию, основанный на применении предложенного множества текстурных дескрипторов, обладает высокой (более 97%) дискриминационной способностью при классификации лейкоцитов, сопоставимой с экспертным распознаванием; модификация метода формирования МСВУЯ на основе дискретных цепей Маркова позволяет заметно увеличить информативность текстурных дескрипторов, что подтверждено экспериментально; модификация метода формирования МСВУЯ на основе дискретных случайных полей Маркова существенно увеличивает информативность текстурных дескрипторов. Применение модификации позволяет добиться высокого процента корректной классификации лейкоцитов, что подтверждено проведенными экспериментами; предложенный метод определения шага построения МСВУЯ на основе интегральных оценок по критерию Фишера позволяет значительно упростить и ускорить процедуру предварительного обучения системы распознавания.

Практическая ценность работы обуславливается высокими и стабильными показателями работы разработанного программного комплекса. Этот факт дает возможность использовать полученные алгоритмы в составе системы автоматического дифференциального анализа крови, которая является автоматизированным рабочим местом врача-гематолога.

Научные результаты, изложенные в диссертации, реализованы автором в виде программного комплекса для автоматического распознавания динамических объектов с ярко выраженной текстурной характеристикой.

Основные научные результаты диссертации были использованы при проведении в ООО «ОЭС» (г. Санкт-Петербург) фундаментально-поисковой НИР «Исследование эффективности применения текстурных дескрипторов при классификации объектов урбанистической сцены». Алгоритмические разработки и научно-практические рекомендации были применены научно-коммерческой фирмой «Диамант» (г. Санкт-Петербург) при реализации проекта «Анализатор качества характеристик объектива промышленного сканера», внутреннее техническое задание №0371ТЗ.

В процессе работы над диссертацией были осуществлены публикации [16-21], отражающие поэтапное появление основных результатов исследования.

Похожие диссертации на Разработка алгоритма распознавания сложных объектов на основе текстурной информации