Электронная библиотека диссертаций и авторефератов России
dslib.net
Библиотека диссертаций
Навигация
Каталог диссертаций России
Англоязычные диссертации
Диссертации бесплатно
Предстоящие защиты
Рецензии на автореферат
Отчисления авторам
Мой кабинет
Заказы: забрать, оплатить
Мой личный счет
Мой профиль
Мой авторский профиль
Подписки на рассылки



расширенный поиск

Разработка рекуррентных алгоритмов распознавания и применение их для вычисления диагностики острых кишечных инфекций Храпко Владимир Николаевич

Разработка рекуррентных алгоритмов распознавания и применение их для вычисления диагностики острых кишечных инфекций
<
Разработка рекуррентных алгоритмов распознавания и применение их для вычисления диагностики острых кишечных инфекций Разработка рекуррентных алгоритмов распознавания и применение их для вычисления диагностики острых кишечных инфекций Разработка рекуррентных алгоритмов распознавания и применение их для вычисления диагностики острых кишечных инфекций Разработка рекуррентных алгоритмов распознавания и применение их для вычисления диагностики острых кишечных инфекций Разработка рекуррентных алгоритмов распознавания и применение их для вычисления диагностики острых кишечных инфекций Разработка рекуррентных алгоритмов распознавания и применение их для вычисления диагностики острых кишечных инфекций Разработка рекуррентных алгоритмов распознавания и применение их для вычисления диагностики острых кишечных инфекций
>

Данный автореферат диссертации должен поступить в библиотеки в ближайшее время
Уведомить о поступлении

Диссертация - 480 руб., доставка 10 минут, круглосуточно, без выходных и праздников

Автореферат - 240 руб., доставка 1-3 часа, с 10-19 (Московское время), кроме воскресенья

Храпко Владимир Николаевич. Разработка рекуррентных алгоритмов распознавания и применение их для вычисления диагностики острых кишечных инфекций : ил РГБ ОД 61:85-3/1096

Содержание к диссертации

Введение

ГЛАВА I. Обзор литературы и постановка задачи

1.1. Медицинская диагностика и методы распознавания образов 9

1.2. Методы преобразования пространства исходных признаков 19

1.3. Диалоговые системы распозначания образов 22

1.4. Постановка задачи 24

ГЛАВА 2. Обобщенная задача статистического решения

2.1. Постановка задачи вычислительной медицинской диагностики 26

2.2. Постановка классической задачи статистического решения

2.3. Обобщение задачи статистического решения 34

2.4. Примеры преобразований исходного пространства признаков 38

2.5. Применение информационных характеристик распределений к отбору признаков 40

2.6. О двух подходах к минимизации байесовского риска 46

2.7. Равномерная аппроксимация истинного

риска при помощи эмпирического риска... 47

2.8. Минимизация риска прямыми релаксационными алгоритмами стохастического программирования 52

2.9. Метод потенциальных функций и выбор вида потенциальной функции как функции расстояния 66

2.10. Выводы к главе 2 71

ГЛАВА 3. Реализация обобщенной задачи статистического решения в врще диалогового пакета прикладных программ

3.1. Общие сведения о пакете прикладных программ КЛОФОР 74

3.2. Структура пакета прикладных программ

КЛОФОР 77

3.3. Алгоритмы Байеса и фазового интервала 82

3.4. Алгоритмы потенциальных функций 89

3.5. Модифицированные релаксационные алгоритмы построения гиперплоскостей 92

3.6. Алгоритмы отбора и формирования признаков 99

3.7. Общая структура программного обеспечения пакета КЛОФОР 101

3.8. Выводы к главе 3 104

ГЛАВА 4. Применение пакета прикладных программ клофор для диагностики некоторых заболеваний

4.1. Общая характеристика клинического материала, использованного для вычислительной диагностики 105

4.2. Характеристика клинического материала, использованного для дифференциальной диагностики острой дизентерии и пищевой токсикоинфекции, вызванной бактериями

рода Сс± го barter ПО

4.3. Результаты дифференциальной вычислитель ной диагностики острой дизентерии и пищевой токсикоинфекции, вызванной ВаС-Ctirodacier

4.4. Обсувдение результатов вычислительной дифференциальной диагностики острой дизентерии и пищевой токсикоинфекции, вызванной бактериями рода CitroBacter П9

4.5. Характеристика клинического материала, использованного для вычислительной диагностики форм острой дизентерии 123

4.6. Результаты вычислительной диагностики клинических форм острой дизентерии

4.7. Обсувдение результатов диагностики форм тяжести острой дизентерии 130

4.8. Характеристика клинического материала, использованного для диагностики язвенной этиологии острых гастродуоденальных кровотечений 132

4.9. Результаты вычислительной диагностики этиологии острых гастродуоденальных кровотечений 134

4'.Ю.0бсужение результатов дифференциальной диагностики этиологии острых гастродуоде нальных кровотечений 140

4.1. Выводы к главе 4 141

Литература

Введение к работе

В течение двух последних десятилетий происходит быстрое проникновение математических методов в медицину и биологию, что обусловлено и стимулируется широким внедрением современных быстродействующих ЭВМ во все сферы науки и производства.

В директивах ХХУІ съезда КПСС предусмотрено "развитие математической теории, повышение эффективности ее использования в прикладных целях", а также "совершенствование профилактики, диагностики и лечения наиболее распространенных заболеваний". Таким образом, применение, в частности, математических методов в медицинской диагностике является актуальной задачей.

Одним из способов применения математических методов в диагностике заболеваний является использование для этой цели методов распознавания образов [17-26]. Большинство из этих методов ориентированы на применение ЭВМ. Работы, проведенные различными авторами в области применения ЭВМ в медицинской диагностике [3-6, 8, 10, 11-15, 43-51]и др. показывают, что использование вычислительной техники для сбора, хранения и обработки медико-биологической информации значительно повышает эффективность научных исследований и лечебно-диагностической работы в лечебно-профилактических учреждениях.

При реализации на ЭВМ вычислительных алгоритмов распознавания образов с целью применения их в клинической практике удобно использовать режим диалогового взаимодействия пользователя с вычислительной системой [124]. Это позволяет с одной стороны, упростить выбор алгоритма и облегчить выбор свободных параметров алгоритма, с другой стороны более эффективно

использовать методы отбора признаков. Кроме того, диалоговый режим позволяет следить за работой алгоритмов и оперативно получать информацию о классификации.

Среди большого набора алгоритмов распознавания образов широко известны алгоритмы, основанные на рекуррентных соотношениях [7, 16-25J , однако, вопросу применения этих алгоритмов в медицинской диагностике посвящено сравнительно небольшое количество работ [70, 87-89J .

Несмотря на широкое использование методов вычислительной диагностики в хирургии, терапии, онкологии и других областях медицины, следует отметить, что для диагностики инфекционных заболеваний, в частности, острых клинических инфекций, вычислительные методы применялись мало ( [1541 ).

Таким образом, целью диссертации является разработка и исследование рекуррентных алгоритмов построения разделяющих поверхностей и применении их для вычислительной диагностики острых кишечных инфекций, а также для установления язвенной этиологии острых гастродуоденальных кровотечений.

Для достижения поставленной цели были сформулированы следующие задачи:

а) разработка и исследование рекуррентных алгоритмов
распознавания образов (вычислительной диагностики);

б) использование таких алгоритмов для дифференциальной
диагностики некоторых инфекционных заболеваний, а также раз
личения их форм (степени) тяжести;

в) исследование влияния различных наборов признаков,отоб
ранных с помощью разных информационных характеристик,на эффек
тивность вычислительной диагностики этих заболеваний;

г) построение диалогового пакета прикладных программ вычислительной диагностики для БС-ЭВМ.

При решении поставленных задач были получены следующие результаты.

1. Сформулирована и исследована обобщенная задача стати
стического решения, включающая в себя как этап предварительно
го преобразования пространства исходных признаков, так и

этап распознавания (классификации)»

  1. Установлена связь между информационным уклонением Кульбака-Лейблера-Санова и числом ошибок правила Неймана-Пирсона*

  2. Найдены необходимые и достаточные условия равномерной сходимости эмпирического риска к истинному относительно семейства непрерывных функций потерь.

  3. Обоснован выбор потенциальной функции, использующейся в методе потенциальных функций, как функции расстояния для симметрических поостранств с произвольным числом элементов*

  4. Разработана структура пакета прикладных программ вычислительной диагностики КЙОФОР и создано соответствующее программное обеспечение.

  5. Предложены и использованы релаксационные алгоритмы стохастического программирования, на основе которых построены релаксационные схемы алгоритмов персептрона и стохастической аппроксимации.

7* Исследована эффективность алгоритмов вычислительной диагностики при различении острой дизентерии и пищевой токсико-инфекции, степени тяжести течения острой дизентерии, а также установлении этиологии острых гастродуоденальных кровотечений.

8. Исследована {эффективность различных информационных характеристик при отборе информативных наборов признаков.

Теоретическая значимость работы заключается в использовании двухэтапной процедуры принятия статических решений и применении на втором этапе - этапе классификации - релаксационных алгоритмов построения разделяющих гиперплоскостей.

Практическая значимость работы заключается в .- обосновании применения рекуррентных алгоритмов построения разделяющих гиперплоскостей с целью повышения эффективности ранней диагностики острых кишечных инфекций, а также найдены наборы наиболее информативных признаков для диагностики некоторых острых кишечных заболеваний.

Практическое применение.

Результаты диссертационной работы внедрены в кустовом информационно-вычислительном центре Ялтинского территориального совета по управлению курортами профсоюзов, в инфекционном отделении 7-й городской клинической больнице г.Симферополя, на кафедре физиологии и биофизики Симферопольского государственного университета, на кафедре инфекционных болезней Крымского медицинского института.

Теоретические результаты включены в специальный курс по математическому и стохастическому программированию, читаемому в течение трех лет студентам 5-го курса математического факультета СІУ.

Методы преобразования пространства исходных признаков

Метод Байеса применялся для диагностики желтухи, болезней печени, ревматических поражений клапанов сердца [43, 47] . Число правильных диагнозов колебалось от 80 до 100$.

Применение байесовского алгоритма для дифференциальной диагностики опухолей костей дало 90$ правильных диагнозов [48]. В этом случае условные вероятности признаков в каждом классе заболеваний были откорректированы врачом-экспертом на основе личного опыта.

При использовании метода Байеса для диагностики заболеваний щитовидной железы получено 97,2$ правильных диагнозов [49]. В [50] описывается применение байесовского метода для диагностики инфаркта миокарда. Этот метод дал значительно лучшие результаты по сравнению с врачебным диагнозом.

Используя всего 6 признаков, алгоритм Байеса дал 90$ правильных диагнозов при диагностике острого инфаркта миокарда [51] . - 14 1.1.7. В процедурах статистического решения часто исполь зуется методы последовательного анализа [52-54] Для медицин ской диагностики этот метод применялся в виде последовательной неоднородной диагностической процедуры [55] В [56] приведены результаты вычислительной диагностики угрожающих состояний при острых респираторно-вирусных инфекциях у детей (92$ пра вильных диагнозов). Эта же процедура использовалась в примене нии табличных методов для диагностики инфарктов мозга [57] .

В [58] описывается медицинская информационная система (МИС), в которую включены алгоритм: Байеса, последовательный метод Вальда и составное решающего правила, причем алгоритм Байеса приспособлен для случая, когда векторы, описывающие состояние больных, имеют разную длину. Алгоритмы из МИС были использованы для диагностики ревматических пороков сердца [59]. Число правильных диагнозов 93$.

В [60] приведены результаты успешного применения алгоритмов из МИС для диагностики нейроинфекций на основе простых клинических признаков.

В [бі] байесовский метод использовался при построении информационной модели медицинского обслуживания - с его помощью прогнозировалось состояние больных и отдыхающих.

Алгоритм, основанный на методе Байеса, алгоритм Вальда, алгоритм, опирающийся на информационную оценку признаков с успехов использовались в вычислительной диагностике врожденных и приобретенных пороков сердца [62] .

Характерным для задач распознавания [17] является то, что восстанавливать можно сразу коэффициенты разделяющих поверхностей. Для этого применяются рекуррентные алгоритмы, - 15 - -минимизирующие выражение (I.I) по о [7, 16, 17, 19, 21, 22 и др.] В зависимости от вида функции потерь L(otX) получаются различные алгоритмические схемы и различные виды разделяющих поверхностей. В 50-х годах в связи с распространением ЭВМ появились модели, описывающие зрительное восприятие на языке переключательных схем. Такие модели получили название персептронов [21, 63-64] В дальнейшем оказалось, что схема персептрона реализует линейную функцию классификации.

Коэффициенты оптимальной разделяющей гиперплоскости можно найти, решая задачу (I.I) при так называемой персептронной функции потерь [24] Методами решения такой задачи являются рекуррентные алгоритмы, основанные на схеме градиентного спуска и некоторых его модификациях [24] .

Кроме персептронной функции потерь для построения разделяющей гиперплоскости используется квадратичная функция [65] и в качестве метода минимизации такой функции используется метод стохастической аппроксимации [66-68] . В [22] рассмотрен метод обобщенного портрета, тагше строящий разделяющую гиперплоскость с помощью рекуррентного алгоритма минимизации - метод сопряженных градиентов. В медицинской диагностике алгоритм обобщенного портрета применялся для дифференциальной диагностики злокачественных и доброкачественных опухолей пищевода [69] . В [70] использовался алгоритм построения гиперплоскости в пространстве более высокой размерности в случае линейно неразделимых классов, что позволило улучшить диагностику (до 90% правильных диагнозов).

Примеры преобразований исходного пространства признаков

Пространство Г преобразований {-Ьу содержит СЛ элементов, т.е. является конечным. &есь через С а обозна чено число сочетаний из ҐІ элементов по k . Следовательно, по следствию Б существует оптимальное -Ь f которое при фик сированном О решает (2.3), причем это решение может быть найдено не более, чем за Сп шагов.

Рассмотршл теперь случай, когда X - [R ,Х -X для любого "С из Т , где Т есть множество линейных невырожденных преобразований, заданных на X , причем Т предполагается компактным. Каждый объект X представляется в виде вектора: X - (х\ х 9 ..., Xth). Рассмотрим новый вектор, который получен из старого преобразованием: и - -Ьз2 = „x1 ti;Lxa + + Tf„ х Такие линейные преобразования исходных данных часто используют в приложениях, где матрица А преобразования Ь определяет из различных дополнительных соображений. Из того, что линейное преобразование невырожденное, следует, что существует обратная матрица А и индуцированная мера Р на X будет иметь плотность р(-Ь}х) = dei А 1 р(х).

Рассмотрим пример, когда преобразование невырожденное нелинейное дифференцируемое преобразование. Этот пример обобщает предыдущий на нелинейный случай.

Пусть как и в п.2.4.2 X Я. [Rn , -Ь: X X , -Ь непрерывно зависит от некоторого параметра d . Параметр CL принадлешіт некоторому замкнутому и ограниченному множеству в из т . В этом случае индуцированная преобразованием плотность будет иметь вид: р , «) - р (а, х) = dei {- 1] Р(х) здесь через -і обозначено обратное преобразова ние. Таким образом, поставленная задача (2.3) и в этом случае имеет решение. 2.4.4. Соединим два преобразования проектирования & и нелинейного невырожденное преобразование Ь , т.е. рассмотрим их композицию S : S = а:- ,

Как было показано в п.2.4.1 и 2.4.3 JC и -L непрерывны в соответствующих топологиях, следовательно, непрерывна и их композиция S . Тогда по следствию А в предположении, что множество Т , к которому принадлежит S , компактно задача (2.3) имеет решение.

Для того, чтобы использовать преобразование проектирования для отбора признаков, необходимо каким-либо образом оценивать каждый признак, чтобы затем отобрать наиболее подходящие с точки зрения этой оценки признаки.

Самым простым критерием является значение байесовского риска при данном наборе признаков.

Для этого необходимо вычислить величину R (д у ОС) І где JL - обозначает операцию проектрования на пространство размерности k - П - m . Таким образом, вычисляется С я, чисел и из них выбирается такой набор признаков, который дает наименьшее значение байесовского риска.

Вместо прямого подсчета байесовского риска можно применять другие информационные характеристики.

Рассмотрим следующую общую схему. Пусть объект ХЄ (R Z= (0С\...У Хп), и пусть # = -{4, ее,..., еш] т.е. мы имеем в нашем распоряжении 171 классов. Вычислим для і -ой компоненты Xі , і L П- ,и J -ого класса J- 171 некоторое число I; . Если эти числа записать в виде матрицы

Модифицированные релаксационные алгоритмы построения гиперплоскостей

Для бинарных признаков нелинейным преобразованием является формирование из них конъюнкций и дизъюнкций, т.е. булевской функции. Обозначим булевскую функцию от п переменных через Scxiy ...f ос ) . По известной теореме ( EI50J , с.43) любую булеву функцию можно представить в виде нормальных форм: дизъюнктивной или конъюнктивной. Учитывая это, можно считать, что достаточно широкий класс преобразований можно описать булевскими функциями и основными функциями являются либо конъюнкции, либо дизъюнкции.

Назовем конъюнкции, входящие в дизъюнктивную нормальную форму, либо дизъюнкции, входящие в конъюнктивную нормальную форму вторичными признаками. В данном параграфе и далее мы будем всегда понимать под признаком любой первичный (исходный), либо вторичный признак.

3.6.2. Для того, чтобы отобрать признаки в системе КЛОФОР используются два основных варианта. Первый вариант представляет собой такой режим работы, при котором пользователь в диалоговом режиме на основе частот появления признака в том или ином классе отбирает или отбрасывает предъявленный признак.

Во втором варианте - автоматическом - отбор признаков ведется на основе вычисленных информационных характеристик признаков в сравнении с заданным порогом 8 .

По выбору пользователя можно использовать любой из этих вариантов Обозначим через ре(ос), t=d, ..., 777 значение вероятности появления некоторого признака і в f -ом классе, тог да представляется возможность применить следующие информационные характеристики (выбор их осуществляется пользователем в диалоговом резшме):

4= rrdru Z -тЧ Т Н М асеХ. к Ш J = min (pe(l-P ))-(l-pt)P ) \t - есть разность частот появления признака в разных классах. I - информационное уклонение Кульбака-Лейблера-Санова. I, - усредненное расстояние меаду классами. После сравнения J с в принимается решение.

Пакет прикладных программ вычислительной медицинской диагностики КЛОФОР реализован на языке Фортран-1У ЕС ЭВМ и небольшая часть на языке Ассемблера. Данная система работает под управлением Дисковой Операционной Системы (ДОС) версии 2.2, а также Операционной Системы (ОС) версии 6.1. Минимальный объем оперативной памяти 200 К.

По функциям все программы, входящие в систему КЗІ0Ф0Р, можно разделить на следующие группы: 1) программа управления, 2) программы, реализующие алгоритмы классификации и преобразования исходного пространства признаков, 3) программы, обеспечивающие ввод-вывод информации, 4) программа подготовки данных для вычислительных алгоритмов диагностики, 5) обслуживающие программы.

Программы первой группы характеризуются тем, что они выполняют функцию переключения, то есть выбор той или иной функции в зависимости от желания пользователя.

Программы второй группы представляют собой модули, реализующие численные алгоритмы, описанные во второй главе и в пп.3.2-3.6.

Программы третьей группы обеспечивают обмен с внешними устройствами: вводом с перфокарт, с магнитными лентами и т.д.

Программы подготовки данных фордируют в нужной форде те наборы данных, которые необходимы для работы конкретных алго ритмов численной классификации.

Программы обслуживания выполняют специальные функции типа перевода чисел из одного представления в другое и т.п.

Как уже указывалось, система КЛ0Ф0Р построена по иераркическому принципу. Основному модулю подчинены все остальные подпрограммы, которые в свою очередь вызывают и другие программы.

Рассмотрим структуру и функцию основной программы. Основная программа выполняет несколько функций: 1. Распределение памяти. 2. Открытие файлов. 3. Управление основными функциями в режиме диалога.

Вся оперативная память распределяется в основной программе. Таким образом, если количество признаков, объектов и классов изменяется, то это легко исправить в одном месте - в основной программе. Кроме того, можно заранее распределить память по максимуму, который позволен ресурсами вычислительной системы, а затем пользоваться ее частью.

В режиме диалога пользователь с экрана дисплея задает основные параметры, с которыми будет работать, данная система. К ним относятся: длина обучающей и экзаменационной выборок, количество классов, число объектов по классам, число признаков это выполняется п/п INMN . Затем пользователь указывает, откуда будут вводиться данные и какой из основных режимов работы он вибирает - режим отбора и формирование признаков или режим классификации.

Результаты дифференциальной вычислитель ной диагностики острой дизентерии и пищевой токсикоинфекции, вызванной ВаС-Ctirodacier

Для сравнения результатов машинной диагностики с врачебной из общего списка, содержащего 83 признака, были исключены признаки, описывающие данные лабораторных методов исследования, а оставлены только 74 признака, включающие жалобы, анамнез заболевания, эпидемиологический анамнез и данные объективных методов исследования - осмотра, пальпации, аускультации, термометрии и измерения артериального давления (АД).

Результаты диагностики приведены в таблице 4.2. Напомним, что число ошибок врачебной диагностики (в $) были следующими: Пищевая токсикоияфекция - 6$. Острая дизентерия - 48$. Общее число ошибок - 27$.

Как видно из приведенных данных (табл.4.2), лучшими являются алгоритмы потенциальных функций - число диагностических ошибок равно нулю. Модифицированные релаксационные алгоритмы правильно распознали диагноз у 96-97$ больных. Классический алгоритм Байеса (АБ) сделал 16$ ошибок. Наибольшее число ошибок (до 43$) допустили неполяошаговые алгоритмы АЇЇУШ и АСА.

При сравнении эффективности алгоритмов вычислительной диагностики с врачебной, обращает на себя внимание тот факт, что только неполяошаговые алгоритмы сделали больше ошибок, чем врач, остальные алгоритмы оказались лучше.

Б таблице 4.3 приведены значения t -критерия при попар - 115 -ном сравнении числа ошибок, допущенных вычислительными диагностическими алгоритмами, а также с числом врачебных ошибок.Особый интерес в этой таблице имеют 2 столбца - первый и последний.

В последнем столбце приведены значения ±-статистики при сравнении врачебного диагноза с вычислительным. Из него видно, что статистически значимая разница (с уровнем значимости р = 0,001) имеет место для алгоритмов метода потенциальных функций (ДАШ и ВАШ) и релаксационных алгоритмов (МРАП и МРАСА). При сравнении с байесовским алгоритмом (АБ) нет статистически значимой разницы ( р 0,05).

При сравнении результатов диагностики классического алгоритма Байеса статистически значимо отличаются результаты диагностики алгоритмов ДАЛФ, ВАШ, МРАП и МРАСА, которые сделали меньше ошибок.

При полном наборе признаков, т.е. при добавлении признаков, описывающих лабораторные данные (общий ая.мочи.крови и копрограммы) отмечается увеличение качества диагностики: релаксационные алгоритм построения разделяющей гиперплоскости (МРАСА) и алгоритмы потенциальных функций не делают ни одной ошибки (см.таблицу 4.4).

При сравнении числа ошибок, допущенных эталонным алгоритмом Байеса, с числом ошибок, сделанных другими алгоритмами (см.первый столбец таблицы 4.5) только для алгоритма фазового интервала (АФИ) разница в числе ошибок не является статистически значимой ( р 0,05). Статистически значимы отличия алгоритмов, не сделавших ни одной ошибки, со всеми другими алгоритмами, за исключением МРАП.

Рассмотрим теперь влияние отбора наиболее информативных признаков на число ошибок, допущенных алгоритмами вычислительной диагностики. При использовании первой информационной характеристики І - модуля разности частот признака в классах - при пороге отбора = 0,039 было отобрано 50 признаков.

В эту группу признаков попали как признаки, описывающие поражение пищеварительного тракта, так и общую реакцию организма на инфекцию.

При таком уменьшенном описании отмечается ( по сравнению результатами, полученными на полном наборе признаков ) незначительное ухудшение эффективности алгоритмов Байеса и фазового интервала ( АБ и АФИ ), а также работы алгоритмов построения разделяющей гиперплоскости ( см. таблицу 4.6 ).

При сравнении эффективности алгоритмов с эффективностью алгоритма Байеса, статистически значимая разница с доверительным уровнем р 0,001 имеется у алгоритмов, не сделавших ни одной ошибки ( ДАПФ, ВАШ ) ( см. таблицу 4.7 ).

Следует отметить, что неполношаговые алгоритмы (АПУШ и АСА ) статистически значимо ( р 0,05 ) отмечается в худшую сторону от алгоритма Байеса.

Похожие диссертации на Разработка рекуррентных алгоритмов распознавания и применение их для вычисления диагностики острых кишечных инфекций