Электронная библиотека диссертаций и авторефератов России
dslib.net
Библиотека диссертаций
Навигация
Каталог диссертаций России
Англоязычные диссертации
Диссертации бесплатно
Предстоящие защиты
Рецензии на автореферат
Отчисления авторам
Мой кабинет
Заказы: забрать, оплатить
Мой личный счет
Мой профиль
Мой авторский профиль
Подписки на рассылки



расширенный поиск

Аналитические и процедурные модели анализа изображений для системы поддержки принятия решений врачом маммологом Карасев Павел Игоревич

Диссертация - 480 руб., доставка 10 минут, круглосуточно, без выходных и праздников

Автореферат - бесплатно, доставка 10 минут, круглосуточно, без выходных и праздников

Карасев Павел Игоревич. Аналитические и процедурные модели анализа изображений для системы поддержки принятия решений врачом маммологом: диссертация ... кандидата Технических наук: 05.25.05 / Карасев Павел Игоревич;[Место защиты: ФГБОУ ВО Тамбовский государственный технический университет], 2017

Содержание к диссертации

Введение

1 Современное состояние вопроса распознавания графических объектов в медицинских информационных системах 15

1.1.1 Способы обследования и диагностирования молочной железы 16

1.1.2 Место и роль маммографического обследования в диагностировании патологий молочной железы 20

1.2 Обзор технических и программных средств обработки маммограмм 22

1.2.1 Технические средства обработки маммограмм 22

1.2.2 Программное обеспечение для работы с маммограммами 27

1.3 Анализ подходов к решению задачи распознавания графических объектов в информационных системах 29

1.3.1 Общая концепция методик распознавания 29

1.3.2 Распознавание на основе словарей признаков 31

1.3.3 Обучающиеся системы 32

1.3.4 Оптимизация и повышение точности 33

1.3.5 Методы распознавания на основе кластеризации 34

1.3.6 Последовательные схемы 35

1.4 Анализ методов фильтрации графических объектов 37

1.4.1 Бинаризация изображения по определенному порогу 37

1.4.2 Классические способы фильтрации 39

1.4.3 Вейвлет-преобразование 41

1.4.4 Корреляция цифровых изображений 43

1.4.5 Фильтрация функций 44

1.4.6 Преобразование Хафа 44

1.4.7 Фильтрация контуров 46

1.4.8 Прочие фильтры 52

1.5 Анализ методов логической обработки результатов фильтрации графических объектов 52

1.5.1 Контурный анализ 53

1.5.2 Код Фримена 55

1.5.3 Поиск особых точек 56

1.6 Анализ методов обучения информационных систем распознавания графических объектов 57

1.6.1 Классификация в одномерном пространстве признаков 60

1.6.2 Классификатор AdaBoost 62

1.6.3 Классификатор SVM 62

1.6.4 Классификатор на основе нейронной сети 63

1.7 Выводы по главе 1. Постановка задачи на исследование 64

2 Модели и методы распознавания графических объектов в медицине 66

2.1 Метод сегментации изображений молочной железы при помощи модели улучшенного пространственного алгоритма нечеткой кластеризации 67

2.1.1 Обычный алгоритм нечеткой кластеризации 67

2.1.2 Инициализация 68

2.1.3 Предложенный улучшенный пространственный алгоритм нечеткой кластеризации 69

2.2 Метод сегментации изображений молочных желез с помощью

вероятностного алгоритма нечёткой кластеризации 70

2.2.1 Модифицированный алгоритм нечеткой кластеризации 70

2.2.2 Вероятностный алгоритм кластеризации 72

2.2.3 Нечёткий вероятностный алгоритм кластеризации 73

2.2.4 Адаптивная система нейро-нечеткого вывода 74

2.3 Выводы по второй главе 84

3 UML модели информационной системы поддержки принятия решения врача маммолога 86

3.1 Классификация типов диаграмм UML 86

3.2 Диаграмма классов 90

3.3 Диаграммы последовательности 98

3.4 Диаграмма деятельности 112

3.5 Диаграмма прецедентов 118

3.6 Диаграмма компонентов 122

3.7 Диаграмма развертывания 123

3.8 Выводы по третьей главе 125

4 Результаты работы информационной системы поддержки принятия решения врача онколога-маммолога 127

4.1 Работа интерфейса 127

4.2 Структура программного комплекса и описание блоков 130

4.3 Анализ и статистическая обработка результатов исследования

4.3.1 Ошибки первого рода 147

4.3.2 Ошибки второго рода

4.4 Анализ работы аналитической и процедурной моделей улучшенного пространственного алгоритма нечеткой кластеризации 153

4.5 Анализ работы аналитической и процедурной моделей предложенного вероятностного алгоритма нечеткой кластеризации 154

4.6 Выводы по четвертой главе 156

Заключение 157

Список использованных источников

Введение к работе

Актуальность темы исследования. Согласно официальной статистике Всемирной организации здравоохранения патологии молочной железы разной степени тяжести встречаются у женщин чаще каких-либо других заболеваний. Наибольшую опасность представляет рак молочной железы, встречающийся у порядка 20 % всех европейских женщин по достижении 75 лет.

Среди онкологических заболеваний у женщин рак молочной железы (РМЖ) также имеет наибольшую частотность. В европейском регионе на его долю приходится 28 % всех раковых заболеваний (на втором месте находится колоректальный рак с показателем 13,2 %, что более чем в два раза меньше). Статистика по смертности от онкологических заболеваний также свидетельствует о высокой опасности РМЖ, на долю которого приходится 17 % всех смертельных исходов, связанных с онкологией.

В России статистические данные несколько отличаются из-за иного подхода к ранней диагностике онкологических и прочих заболеваний молочной железы. В последние десятилетия наблюдается рост числа впервые выявленного РМЖ. В 1992 г. данный показатель составил 45 случаев на 100 тысяч женского населения, в 2001 - 59 случаев, 2010 - уже 75. Несмотря на совершенствование методов, а также расширение аудитории, проходящей регулярные профилактические осмотры, процент своевременного выявления онкозаболеваний молочной железы (МЖ) в нашей стране остается достаточно низким.

Ранняя диагностика онкологических заболеваний позволяет значительно повысить шансы на полное выздоровление, тогда как опухоли, обнаруженные на поздних стадиях, плохо поддаются лечению. Своевременная диагностика позволяет проводить эффективное лечение с применением только терапевтических средств, благодаря чему в перспективе будет возможно значительно снизить женскую смертность от рака молочной железы во всем мире.

С помощью использования систем поддержки принятия решения (СППР) врача, диагностический инструментарий медиков пополнился такими возможностями как изменение контраста и яркости маммограмм, обработка с помощью специфических фильтров, а также более точное вычисление размеров новообразований, обнаруженных в тканях.

К сожалению, мощное и функциональное программное обеспечение современных маммографов является полностью проприетарным и распространяется в комплекте с аппаратами. Медикам, вынужденным работать с аналоговыми методами обследования, приходится довольствоваться простейшим программным обеспечением с минимумом возможностей. Таким образом, в России выявление посторонних новообразований на ранних стадиях сильно затруднено по причине недостатка средств для полноценного анализа результатов обследования (как аппаратных, так и программных).

Перечисленные проблемы делают особенно актуальной потребность в разработке автоматизированных систем для каталогизации, обработки и анализа маммограмм. Медицинские центры России нуждаются в качественных и функциональных аналогах зарубежных программно-аппаратных комплексов для своевременного выявления и идентификации патологических новообразований в МЖ. Именно от качества программной части будет зависеть скорость и точность обработки каждого снимка. Кроме того, наличие базы данных, объединяющей десятки тысяч клинических случаев с разной динамикой развития болезни, позволит значительно повысить объективность диагноза.

Компьютерные технологии уже давно применяются в медицине. Так, информационные системы поддержки принятия решения при диагностировании активно внедряются с конца 1960-х годов. Такие программы эффективно используются в различных медицинских направлениях, например, в хирургии. И хотя на протяжении последних 30 лет проводились исследования в области автоматизированной постановки диагноза, их результаты не получили широкого признания в медицинских кругах.

Сегодня врачам-онкологам приходится сталкиваться в работе с большими объемами информации. Даже опытным врачам трудно учитывать все характеристики исследуемых пациентов, что в итоге отражается на точности и эффективности принятия решения.

Степень разработанности темы исследования. Методы, связанные с расширением возможностей сегментации медицинских, изображений представлены в работах М. Batouche, S. Mazouzi. Yu. Jinhua, Yuanyuan Wang, Hadi Sadoghi Yazdi, A. Nasiri Jalal, G. Sudhavani, K. Sathyaprasad, B. Sowmya. B. Sheelarani, Agus Zainal Arifin, Akira Asano, S. Murugavalli. V. Rajamani. T. Bala Ganesan, R. Sukanesh, H. C. Sateesh Kumar, Gabriel Thomas, Kenji Suzuki. Kazunori Okada, Ingrid Sluime, Ghosh, M. Antonelli, Ye. Xujiong, Wang.

Алгоритмы обработки и анализа маммограмм представлены в работах Н. Moradmand, S. Setayeshi, A. R. Karimian, М. Sirous, М. Esmaeil, R. Garg, В. Mittal, S. Garg. M. Anguh, A. Silva и др. В России практически не ведутся исследования по автоматизированной обработке и анализу маммографических снимков.

На мировом рынке существует несколько фирм, предлагающих компьютерные системы обработки маммограмм (от англ. Computer Aided Detection (CAD)). Самые распространенные CAD системы: AccuDetect, Second Look Digital, The MAMMEX MammoCAD, TotalLook MammoAdvantage, syngo MammoCAD. Fujifilm's Digital Mammography System, но ни одна из фирм, производящих коммерческие CAD системы не раскрывает алгоритмы предварительной обработки, сегментации, распознавания маммографических снимков. Стоимость коммерческой CAD системы не отличается от стоимости цифрового маммографического аппарата. 2


В связи с вышесказанным актуальной является разработка автоматизированной системы обработки и анализа маммограмм, которая будет недорогим и тиражируемым аналогом существующих зарубежных компьютерных систем диагностики новообразований в молочной железе, позволит провести обработку как скрининговых, так и снимков обследования, сократить время обработки и анализа каждого снимка, получить новые данные о динамике развития опухолей, повысить точность и объективность диагноза за счет использования большего количества данных, сформировать единую базу данных обследований и вести статистические исследования по различным параметрам.

Вышесказанное определяет практическую задачу - повышение эффективности работы врача маммолога в постановке правильного диагноза путем создания информационной системы, для решения которой необходимо рассмотреть научную задачу, заключающуюся в разработке моделей: аналитических, которые позволят повысить процент правильной диагностики новообразования молочной железы, и процедурных, описывающих алгоритмы работы системы.

Объект исследования: информационные системы поддержки принятия решения врача.

Предмет исследования: нечеткие аналитические и процедурные модели для информационной системы поддержки принятия решения врача маммолога.

Цель и задачи исследования. Целью исследования является повышение эффективности диагностики патологии молочной железы за счет применения СППР врача маммолога, построенной с использованием нечетких аналитических и процедурных моделей обработки маммографических снимков.

Для достижения цели были поставлены следующие задачи:

  1. Осуществить обзор и анализ моделей, методов, информационных систем обработки и анализа маммоірафических снимков.

  2. Разработать аналитические модели предварительной обработки маммограмм.

  3. Разработать аналитические и процедурные модели выделения областей и идентификации новообразований двух типов (доброкачественная и злокачественная патологии) на маммографических снимках.

  4. Создать СППР врача маммолога на основе разработанных моделей.

  5. Провести экспериментальную оценку возможностей разработанной системы.

Методология и методы исследования. Методология исследования основывается на принципах сегментации и кластеризации изображения, контурного анализа и распознавания образов. При решении поставленных задач в работе использованы методы: нечеткая кластеризация С-средних, теория распознавания образов, математическая статистика, моделирование.

Диссертация выполнена в соответствии с требованиями паспорта специальности 05.25.05 «Информационные системы и процессы» (технические науки) и соответствует пункту 7 «Прикладные автоматизированные информационные системы, ресурсы и технологии по областям применения (технические, экономические, гуманитарные сферы деятельности), форматам обрабатываемой, хранимой, представляемой информации (табличная, текстовая, ірафическая, документальная, факгографическая, первичная или вторичная). Аналитические, процедурные, информационные модели предметной области (системы принятия групповых решений, системы проектирования объектов и процессов, экспертные системы и др.), включаемые в контур обработки информации и принятия решений».

Научная новизна исследования заключается в разработке:

  1. Аналитической и процедурной моделей улучшенной пространственной нечеткой кластеризации, которая отличается введением информации о пространственном расположении в стандартную процедуру нечеткой кластеризации С-средних с помощью априорной вероятности. Вероятность определяет пространственное влияние соседних пикселей на пиксель в центре, что возможно смоделировать с помощью механизма нечеткой принадлежности. Новая нечеткая принадлежность текущего центрального пикселя пересчитывается в отношении вероятности, полученной ранее. Метод основан на гистограмме, полученной с помощью стандартной процедуры нечеткой кластеризации С-средних, что способствует ускорению сходимости метода.

  2. Аналитических и процедурных моделей вероятностной нечеткой кластеризации, в которых кластеризация рассматривается как вероятностное разделение, а также используется функция принадлежности. Вместо одного слагаемого, в целевую функцию включены два, в результате чего величина принадлежности возрастает без ограничений на максимальное значение.

  3. Процедурных моделей анализа изображений для системы поддержки принятия решений врачом маммологом, позволяющих построить диаграммы классов, последовательности, деятельности, развертывания, прецедентов и компонентов.

Теоретическая и практическая значимость работы. Теоретическая значимость работы обоснована разработанными моделями предварительной обработки изображения, моделями выделения областей и идентификации новообразований двух типов (доброкачественная и злокачественная патологии) на маммографических снимках, расширяющих методы теории нечетких множеств.

Практическая значимость работы заключается в использовании полученных аналитических и процедурных моделей при реализации информационной системы, применение которых позволит упростить и повысить эффективность работы врача маммолога при постановке диагноза, сократит время приема пациента, повысит точность и объективность обследования.


Положения, выносимые на защиту:

  1. Аналитические и процедурные модели улучшенной пространственной нечеткой кластеризации.

  2. Аналитические и процедурные модели вероятностной нечеткой кластеризации.

  3. Процедурные модели анализа изображений для системы поддержки принятия решений врачом маммологом.

Внедрение результатов исследования. Программная реализация аналитических и процедурных моделей анализа изображений для СППР врачом маммологом использована для повышения эффективности работы врачей онкологов государственного бюджетного учреждения здравоохранения «Тамбовский областной онкологический клинический диспансер».

Аналитические и процедурные модели анализа изображений для данной СППР использованы в в/ч 61460 при анализе изображений, полученных с использованием беспилотных летательных аппаратов.

Результаты диссертационной работы используются в учебном процессе на кафедре «Информационные системы и защита информации» ФГБОУ ВО «ТГТУ».

Степень достоверности и апробация результатов исследования. Достоверность результатов диссертационного исследования подтверждается достаточным числом наблюдений, современными методами исследования, которые соответствуют поставленным в работе целям и задачам. Научные положения, выводы и рекомендации, сформулированные в диссертации, подкреплены убедительными фактическими данными, наглядно представленными в приведенных таблицах и рисунках. Подготовка, статистический анализ и интерпретация полученных результатов проведены с использованием современных методов обработки информации и статистического анализа.

Основные результаты представлены и обсуждены на: Международной научно-практической конференции «Техника и безопасность объектов уголовно-исполнительной системы» (г. Воронеж, 3 октября 2013 г.); Международной научно-практической конференции «Современные предпосылки развития инновационной экономики» (г. Тамбов, 22 апреля 2014 г.); II Всероссийской научно-практической конференции «Методологические аспекты развития метеорологии специального назначения, экологии и систем аэрокосмического мониторинга» (г. Воронеж, 26 - 27 мая 2015 г.); Международной научно-практической конференции «Охрана, безопасность, связь» (г. Воронеж, 27 ноября 2014 г.): XVI Международной научно-методической конференции «Информатика: проблемы, методология, технологии» (г. Воронеж, 11-12 февраля 2016 г.); военно-научной конференции «Роботизация вооруженных сил Российской Федерации» (г. Москва, 12 февраля 2016 г.); Международной заочной научно-практической конференции «Актуальные направления научных исследований XXI века: теория и практика» (г. Воронеж, 2 ноября 2015 г.); Всероссийской открытой конференции студентов ву-

зов и молодых исследователей «Взгляд молодых ученых на проблемы региональной экономики» (г. Тамбов. 8 октября 2015 г.); XI открытой Всероссийской конференции «Преподавание информационных технологий в Российской Федерации» (г. Воронеж. 16-17 мая 2013 г.); III Международной научно-практической конференции «Виртуальное моделирование, прототипиро-вание и промышленный дизайн» (г. Тамбов, 15-17 ноября 2016 г.), а также на семинарах кафедры «Информационные системы и защита информации» ФГБОУ ВО «Тамбовский государственный технический университет».

Публикации. По теме диссертации опубликовано 23 работы, из них:

11 статей (7 статей в изданиях из перечня ВАК при Минобрнауки РФ),

12 тезисов докладов.

Выносимые на защиту результаты получены лично соискателем. В тех публикациях, которые написаны в соавторстве, личный вклад автора заключается в: проектировании аналитических и процедурных моделей выделения областей и идентификации новообразований; разработке предлагаемых моделей сегментации и кластеризации медицинских изображений.

Структура и объем работы. Диссертация включает: введение, четыре главы, заключение, список используемых источников и приложение. Работа изложена на 178 страницах, содержит 56 рисунков, 6 таблиц и одно приложение. Список используемых источников содержит 153 наименования.

Анализ подходов к решению задачи распознавания графических объектов в информационных системах

Пленочная (аналоговая) маммография основана на высокочувствительной рентгенографии. Он позволяет обнаружить практически любые новообразования в молочной железе, включая доброкачественные и злокачественные опухоли, а также предраковые образования. Изначально все маммографы были аналоговым, для их работы требовались специальные одноразовые кассеты с рентгеновской плёнкой. Несмотря на появление более современных цифровых устройств, в России они пока что остаются редкостью [4, 61, 65].

Тем не менее, имеющаяся в наличии аналоговая аппаратура обладает достаточно обширными возможностями, такими как: - своевременное обнаружение непальпируемых новообразований в молочной железе; - проведение широко спектра инвазивных и неинвазивных обследований; - точное трехмерное позиционирование для проведения биопсии подозрительных образований в молочной железе; - сравнительный анализ изображений путем их совмещения. Однако возможности пленочной маммографии сильно ограничиваются следующими недостатками: - для обследования и дальнейшей обработки снимков необходимо громоздкое оборудование (проявочная машина весит порядка 60 кг); - для каждой процедуры необходима одноразовая кассета и набор химических реактивов, нуждающиеся в особых условиях хранения (холодильный шкаф или специальное помещение); - любая ошибка в процедуре проявки (неточные пропорции реактивов, неплотно закрытая крышка и т.п.) может значительно снизить качество изображения и, как следствие, точность обследования; - процедура стереобиопсии длится около часа из-за необходимости проявлять снимки и вручную проводить расчеты (проблема в том, что грудь в течение всего этого времени должна быть зафиксирована на аппарате).

Цифровая маммография - современная компьютерная форма обычной рентгеновской маммографии, в которой фоточувствительная пленка заменена цифровой матрицей, передающей изображение непосредственно на компьютер. Цифровая маммография обладает всеми возможностями пленочной, при этом многие процедуры занимают гораздо меньше времени. Кроме того, присутствует большой спектр возможностей по обработке изображений с целью повышения контрастности и выделения важных областей с помощью различных фильтров [72, 81].

Цифровой маммограф значительно компактнее и не требует дополнительного оборудования (кроме компьютера). Он позволяет значительно ускорить процедуру стереобиопсии, поскольку все снимки сразу попадают на компьютер, а точные координаты новообразования, анализ которого требуется произвести, вычисляются в автоматическом режиме. К сожалению, большинство российских медицинских центров по-прежнему использует в работе классические плёночные аппараты [57, 61, 113].

Ультразвуковая маммография (УЗМ) – это специализированное обозначение УЗИ молочной железы. Это классический и недорогой способ неинвазивного обследования, позволяющий изучать внутреннюю структуру молочной железы с помощью ультразвуковых волн. Поскольку процедура доступна и безвредна, её назначают при любых отклонениях (непонятные пальпируемые образования, выделения из соска и т.п.). УЗИ МЖ позволяет подробно изучать структуру даже плотных молочных желез, благодаря чему активно применяется для обследования женщин в возрасте до 35 лет (а для нерожавших женщин и в более зрелом возрасте). УЗМ позволяет выявить и идентифицировать следующие патологии: - инфекционные процессы, сопровождающиеся отёками; - кисты (вместо эха они дают эффект усиления); - фиброаденомы (идентифицируются по гладким стенкам); - галактоцеле (патология, характерная для кормящих матерей); - воспаление лимфоузлов; - папилломы. УЗМ достаточно эффективна для выявления раковых образований, но не на самых ранних стадиях. В целом этот метод даёт достаточно подробную картину, но его точность и чувствительность относительно невысока [133].

Компьютерная томография (КТ) – это также рентгенологический неинвазивный метод обследования, при котором орган просвечивается под разными углами. Компьютер обрабатывает полученные снимки и формирует на их основе графическое изображение среза обследуемого органа на требуемой глубине. Результат отчасти напоминает снимок, получаемый с помощью МРТ.

В исследовании молочной железы компьютерная томография применяется для локализации опухоли в ретромаммарном пространстве, а также для диагноза непальпируемых опухолей, недоступных для биопсии. Обычно КТ назначают для оценки текущего состояния опухоли и её операбельности, а также для изучения состояния лимфатических узлов в груди [74, 95, 100, 102].

Магнитно-резонансная томография (МРТ) – наиболее современный метод неинвазивного обследования, основанный на взаимодействии атомных ядер с мощным магнитным полем (от десятых долей до 9,4 Тл). Особенность метода в том, что он позволяет получить достаточно точное изображения среза любого органа, при этом разрешающая способность зависит от мощности электромагнита и может достигать долей миллиметра. Благодаря этим особенностям метод позволяет получать очень точные объемные изображения молочной железы [105, 114, 116].

Возможности МРТ: - ранняя диагностика опухолей, невидимых для других методов; - обследование пациенток с имплантами и шрамами, затрудняющими изучение рентгенографических маммограмм; - обследование состояния имплантов; - получение точной картины распределения опухоли перед операцией; - изучение состояния молочной железы после операции или химиотерапии; - исследование послеоперационных шрамов, диагностика рецидивирующих опухолей. Среди достоинств МРТ наиболее важными являются ее высокая чувствительность и точность, многократно превышающая таковые у маммографии и УЗИ. Она позволяет анализировать патологии, скрытые за плотными тканями, шрамами и имплантами. Однако есть у данного вида исследований и серьезные недостатки: - дороговизна метода (стоимость самой установки и её эксплуатации); - не все включения удаётся идентифицировать; - кальцинаты "невидимы" для магнитных полей; - нельзя применять при наличии кардиостимуляторов. Для расширения возможностей магнитно-резонансной томографии применяются контрастные вещества, которые пациентка принимает перед обследованием. Равномерно распределившись по кровеносным сосудам, они позволяют выявлять уплотнения и прочие неоднородности в молочной железе. Контраст значительно повышает точность обследования, в частности, позволяя отличать доброкачественные опухоли от злокачественных [80, 106].

Обычный алгоритм нечеткой кластеризации

В отдельную группу принято выделять фильтры, предназначенные для выделения контуров графических объектов с целью их последующего анализа. Для комплексных объектов, хорошо поддающихся выделению, данный подход является единственным достаточно эффективным [84, 103, 124, 150].

Существует несколько популярных алгоритмов поиска контуров. Это операторы Кэнни, Собеля, Робертса, Прюитт и другие. Наиболее популярным является оператор Кэнни, реализованный в OpenCV (оператор Собеля там тоже реализован, но с задачей поиска контура он справляется не так эффективно и точно). Оператор Кэнни разработан Джоном Кэнни в 1986 году. В его основе лежит многоступенчатый анализ изображения, позволяющий сильно расширить диапазон интенсивности определяемых границ и контуров.

При разработке данного фильтра Джон Кэнни выделял как наиболее важные три критерия: высокая чувствительность (выделение полезного сигнала в условиях сильной зашумленности); точная локализация линий; единственный отклик на контур (линии не должны раздваиваться). Несмотря на то, что алгоритм Кэнни создавался на заре развития компьютерного зрения, и сегодня он остаётся в числе лучших детекторов. Для многих частных задач можно подобрать или создать детектор, работающий эффективнее и точнее, но в общем случае наилучшие результаты обеспечивает именно оператор Кэнни [130].

В процессе анализа границы объекта составляются из пикселей изображения, для которых достигается локальный максимум по направлению вектора градиента. Для повышения точности и снижения вероятности ошибочного срабатывания автор предложил использовать подавления немаксимумов.

При построении контура в качестве составляющих его пикселей отмечаются только максимумы градиента, а соседние точки удаляются. При анализе каждого пикселя учитывается текущее направление границы, что позволяет снизить вероятность ошибок и сделать сами границы сплошными [134].

Далее проводится двухпороговая фильтрация, позволяющая удалить слабые границы. При этом фрагменты контуров рассматриваются как единые объекты. В процессе исследования отдельного фрагмента используется специальный гистерезис: при наличии точек, где значение градиента превышает определенный порог, весь фрагмент считается значимым контуром, даже если в остальных точках значение градиента ниже (но остается в рамках определенного диапазона). Если же значение градиента на всём фрагменте оказывается ниже требуемого порога, он помечается как ошибочный и удаляется.

Такой подход к шумоподавлению повышает устойчивость результатов, снижает количество ошибочных разрывов и неверно определенных границ, что делает алгоритм Кэнни оптимальным для большинства задач анализа графики. В то же время он достаточно ресурсоемок, а в некоторых ситуациях вносит дополнительные погрешности, среди которых скругление углов и нарушение контуров на стыках.

Особенности детектора Кэнни

По сути, любой контур или граница на изображении являются участками резкой смены яркости или цветового оттенка. Это могут быть не только значимые элементы объекта, но и особенности освещения, связанные с пространственным его положением. В любом случае, все однозначно идентифицированные контуры отражают важные характеристики изображения. Оператор Кэнни реализует несколько шагов: 1. Убирает лишние элементы. 2. Рассчитывает градиент. 3. Производит утонение краёв (edge thinning). 4. Составляет из полученных краев контуры (edge linking). В своей работе он восприимчив к помехам, поэтому на необработанных изображениях может генерировать большое количество ложных объектов. Рекомендуется перед его использованием производить свёртку графических данных с гауссовым фильтром. Поскольку направление линий может быть любым, алгоритм Кэнни применяется для четырех основных направлений: горизонтального, вертикального и двух диагональных [45, 84].

Вероятностный алгоритм кластеризации

Согласно теории марковских случайных полей пиксели изображения в основном принадлежат к тому же кластеру, что и их соседи. Если в процессе кластеризации учесть пространственную информацию, то алгоритм станет устойчивым к шумам и размытым краям. Вместе с тем, при использовании пространственной информации целевая функция может сойтись в точках локального минимума. Чтобы избежать этой проблемы, предложенный пространственный алгоритм нечеткой кластеризации базируется на гистограммах, полученных с помощью обычного алгоритма нечеткой кластеризации. Функция оптимума для алгоритма нечеткой кластеризации с гистограммами представлена в выражении (4) 0hfCm (U, С) = Y, Z (ua )mH(l)d2 (/, c,.) (2.4) где Н - гистограмма изображения с L уровнями серого. Уровни серого цвета всех пикселей изображения образуют новое дискретное множество G = {0,1,....,Z-1}. Расчет степени принадлежности для Н(1) пикселей сводится к расчету для одного пикселя с / уровнем серого. Функция принадлежности uil и центры кластеров для -алгоритма нечеткой кластеризации с гистограммами рассчитываются по формулам Щ= (2.5) vd V1 и 1 \dvj 1(ий )"#(/)/ Сг=±Ч (26) zw 1=1 где dli – это расстояние между i-ым центром и l-ым уровнем серого.

Алгоритм нечеткой кластеризации с гистограммами сходится быстро, поскольку он кластеризует гистограмму вместо всего изображения. Центр и степени принадлежности всех пикселей являются начальными данными для предлагаемого пространственного алгоритма нечеткой кластеризации, главной целью которого является использование пространственной информации для классификации пикселей изображения [41, 121].

Целевая функция предложенного пространственного алгоритма нечеткой кластеризации с N (2.7) о/cm (и, с) = S 1 («fk )md2(4, ci) k=1i= где xk – k-ый вектор размерности D, ci – центр i-го кластера, uik – степень принадлежности xk i-му кластеру, m – весовая степень, d(xk, ci) – расстояние между данными xk и центром кластера ci, c – количество кластеров , N – количество наборов данных.

Пространственная функция принадлежности uisk uik = z 7=1 Ay P Nk \N,J: z=1 z 7=1 d Ay т-1 УУ (2.8) где m – весовая степень, V– кол-во кластеров, diz – расстояние между i-ым, кластером и его z-ой окрестностью, Pik – априорная вероятность, того, что k-ый пиксель принадлежит i-му кластеру, определяется как: P NNt(k) (2.9) Где NNifk) - количество пикселей в окрестности к-го пикселя, которые принадлежат і-му кластеру после снятия нечёткости. Nk - общее количество пикселей в окрестности. dtz - расстояние между /-ым кластером и его z-ой окрестностью. Таким образом, центр каждого кластера cf рассчитывается как И / ч = — (2.10) 1кУ к=\ В функцию принадлежности обычного алгоритма нечеткой кластеризации включается пространственная информация двух видов: априорная вероятность и нечёткая пространственная информация [38]. Априорная вероятность определяет пиксель шума в один из кластеров, к которым соседние ему пиксели принадлежат. Пиксель шума включается в кластер, чьи элементы составляют большинство из его окрестности.

Нечёткая пространственная информация. В уравнении (8) второй сомножитель в знаменателе - это среднее от нечёткой принадлежности соседних пикселей данному кластеру. Таким образом, пиксель имеет большее значение степени принадлежности, если соседние пиксели имеют большие степени принадлежности соответствующему кластеру [37, 143].

Основным недостатком стандартного алгоритма нечеткой кластеризации является то, что целевая функция не учитывает пространственной зависимости, т.е. изображение рассматривается как набор отдельных точек. Для того, чтобы уменьшить эффект шума во время сегментации изображений, предлагаемый метод включает в себя как локальный пространственный контекст, так и нелокальную информацию, с помощью нового индекса несходства вместо обычной метрики расстояний.

Алгоритм нелокальных средних использует высокую степень избыточности в изображениях. Степень принадлежности, определяющая результаты сегментации, оценивается с помощью меры расстояния dki . Модификация алгоритма заключается в изменении определения меры расстояния, которая должна учитывать как локальную, так и нелокальную информацию dki (x., v,.) = 1 - A}. ]d2 (x;, v,.)+ Ajdl (x}, v,.) (2.11) где 2(ху,у,.) - мера расстояния, определяемая локальной информацией, а 4( , ) - мера расстояния, определяемая нелокальной информацией; А}., в пределах от 0 до 1, - весовой множитель, определяющий вклад каждой из мер. Мера расстояния, определяемая локальной информацией, рассчитывается по формуле: ai\xj,vi) у ю / х \ (2.12) є#, где "/ \Xj,Vi) - эвклидово расстояние, Мера расстояния dnl, определяемая нелокальной информацией, рассчитывается как взвешенная средняя по всем пикселям данного изображения / d2Axj,vi)= Z (v, V2(M) (213) гдесо1{хк,х.) - вес каждого пикселя в Nj. Модифицированный алгоритм нечеткой кластеризации включает в себя следующие шаги 1. Задать количество кластеров с и индекс нечёткости /и . Инициализировать вектор V центров нечётких кластеров случайными числами, задать е 0 малым числом; 2. Задать размер окрестности и окна, включая оценки центров кластеров и матрицы принадлежности; 3. Рассчитать модифицированное расстояние (х;,уг); 4. Обновить матрицу принадлежности и величину расстояния [35, 51].

Анализ работы аналитической и процедурной моделей улучшенного пространственного алгоритма нечеткой кластеризации

Каждый объект-участник имеет собственную "линию жизни" - временной отрезок, изображенный вертикальной пунктирной линией. Исполнение определенных действий или функций изображается с помощью вертикальных прямоугольников - фокусов управления. Их длина соответствует общему времени деятельности (в случае многопоточного выполнения отрезки активности разных объектов могут пересекаться на временном промежутке).

Если участник владеет фокусом управления с момента своего создания и до момента уничтожения, вся его линия жизни может изображаться в виде полосы активности. Важно отметить, что полоса в таком случае изображается выходящей непосредственно из объекта и полностью замещает собой линию жизни [27,51].

События или сообщения, отправляемые одними участниками взаимодействия другим, отображаются в виде горизонтальных стрелок. Все сообщения следует читать сверху вниз и по направлению стрелок. Главное преимущество временных диаграмм - наглядность их нотации. Несмотря на формализованные требования к оформлению, они являются интуитивно понятными даже для незнакомого со спецификацией UML человека.

Следует отметить, что участники диаграммы в большинстве случаев являются объектами (и в спецификации UML 1 это было жестко закреплено). Однако спецификация UML 2 предусматривает и другие варианты. Поэтому в общем случае предпочтительно использовать термин "участники" (participants). При описании конкретных приложений можно называть их объектами и подчеркивать их названия.

Период деятельности каждого объекта может отображаться на его линии жизни полосой активности, обозначающей, что фокус управления находится у данного участника взаимодействия. Согласно спецификации, такие полосы не являются обязательными, однако их применение позволяет значительно повысить наглядность диаграммы без лишнего её усложнения.

Активность и взаимодействие

Любая активность отображается стрелочками между временными линиями. Запрос отображается сплошной линией со стрелочкой на стороне получателя, а ответ – пунктирной линией. Если участник совершает некоторую активность без обращения к другим участникам, она обозначается стрелочкой, замыкающейся на свою же линию жизни. Стрелочки, обозначающие ответ (response), именовать не обязательно, но указание над ними результата позволяет сделать представление более наглядным.

Если сообщение приходит в систему извне (то есть от неизвестного источника), его называют найденным сообщением (found message) и изображают стрелочкой с закрашенным кружочком на стороне источника. Обычно на диаграммах так обозначается событие, инициирующее жизненный цикл системы, но появляться они могут на любом этапе деятельности.

Диаграммы с распределенным управлением

Этот способ оптимизации позволяет распределить активность по всем участникам системы, локализуя изменения более наглядно (визуально привязывая их к связанным объектам). Но такой стиль управления, несмотря на улучшенную локализацию изменений, является более сложным и часто неочевидным. С точки зрения наглядности также удобнее, когда обработка производится в одном месте, управление в другом, а большинство объектов являются пассивными. На распределенной диаграмме плотность информации резко повышается, что может создать дискомфорт при восприятии.

Важное преимущество распределенного управления – расширенные возможности применения полиморфизма. Например, алгоритмы вычисления патологий могут отличаться для разных новообразований. Распределяя управление по объектам, задачу вычисления можно перекладывать на подклассы класса новообразований.

Децентрализованный подход к управлению больше соответствует парадигме объектно-ориентированного стиля проектирования, когда разработчик стремится создать множество небольших объектов, обладающих небольшими методами и широкими возможностями для переопределения. Создание и удаление участников На диаграммах последовательности для создания и удаления участников применяются дополнительные обозначения. Создание обозначается стрелкой сообщения, направленной к создаваемому объекту. При использовании конструктора имя сообщения указывать не обязательно. Часто участник сразу после создания получает фокус управления и начинает выполнять некое действие, что отображается полосой активности на его линии жизни. В таком случае полоса выходит из самого объекта, иначе должен присутствовать небольшой участок пунктирной линии [22, 34, 41].

Для обозначения удаления используется большой диагональный крест (в форме перечеркивания или большой буквы "X"). Если при удалении участник передаёт некоторые данные, это обозначается соответствующей пунктирной стрелкой, идущей от знака удаления. Если один объект явным образом удаляет другой, от него в направлении знака удаления идёт стрелка. Если никаких зависимостей не показано, значит, объект удаляет сам себя.

Даже если принудительное удаление не производится (в системе присутствует сборщик мусора), на диаграмме всё равно следует отметить конец жизненного цикла объекта, чтобы указать, что он больше не используется, и упростить восприятие.

Обозначение циклов и ветвлений

Описание условных и циклических алгоритмов - слабая сторона диаграмм последовательности, оптимизированных для описания линейных процессов. Следует понимать, что данный инструмент для описания сложных модифицирующихся алгоритмов просто не предназначен. Однако инструменты для применения условий в него всё же введены.

Условное исполнение и циклы можно описывать с помощью фреймов взаимодействий. Фрейм отделяет некоторую область диаграммы последовательности, которая дополнительно может быть поделена на фрагменты. У каждого фрейма есть оператор, а для фрагментов может выставляться защита (специальный индикатор, указывающий, что фрагмент должен быть выполнен).