Содержание к диссертации
Введение. 7
Глава 1. Основные понятия и элементы. 36
1.1 Особенности медицинских задач и данных. 36
1.2 Типовые подзадачи 39
1.3 Диагностические игры. 44
1.4.0 непараметрической статистике. 47
1.4.1. Квантильные точки распределения. 48
1.4.2. Таблица сопряженности 2x2. 49
1.4.3. Характеристики таблицы 2x2, используемые в медицине. 50
1.4.4. Критерий х2 для таблицы 2x2. 51
1.4.5. Точный метод Фишера (ТМФ). 52
1.4.6. Критерий х2 общего вида. 53
1.4.7. Критерий Вилкоксона-Манна-Уитни (WMW). 5 6
1.4.8. Критерий Смирнова. 57
1.4.9. Ранговые меры связи двух выборок, 59
1.4.10. Непараметрическая регрессия. 61
1.4. П. Критерий множественного сравнения Краснела-Уоллиса.
1.4.12. Критерий Данна. 63
1.4.13. О множественности критериев. 63
1.5 Об использовании классических функций распределения. 64
1.6 Нормативы численных переменных. 68
1.6Л. Пороговые значения. 72
1.6.2. Пороги, зависящие от параметра. 75
1.6.3. Серийные нормативы. 77
Глава 2. Моделирование как инструмент выработки и уточнения 81 базовых понятий.
2.1. Примеры динамических моделей 82
2.1.1 Раскрытие родового канала. 82
2.1.2 Фибринолиз в тонком слое. 86
2.2. Модели динамики параметров популяции, скользящие нормативы.
2.3. Модель отбора информации, используемой экспертами. 102
Глава 3. Логические симптомы. 106
З Л - Симптомы в задачах классификации. 108
3.2. Чистые классы. 114
3.3. Частичная классификация. 118
3.4. Построение маски по симптомам. 119
3.5. Быстрый алгоритм генерации маски. 120
3.6. Построение маски наследованием. 122
3.7. Использование симптомных моделей при анализе наблюдений.
3.8. Примеры подбора симптомов для разделения классов. 129
3.9. Заключение. 133
Глава 4. События, динамический сценарий. 135
4.1. Факты. 136
4.2. Свойства фактов. 138
4.3. Факты для прогнозирования итога. 139
4.4. События. 143
4.5. Использование сценариев при анализе наблюдений и выводов врача.
Глава 5. Программные инструменты. 152
5.1. Базы данных. 154
5.2. Калькулятор над базой данных (CLC). 155
5.3. Программа подготовки текстов для диагностических игр (WJ).
5.4. Программа контроля и первичного анализа (HN). 160
5.5. Программа анализа числовых переменных (S2). 161
5.6. Программа графического сопровождения (GRFM). 162
5.7. Программа симптомного анализа (SB). 167
5.8. Программа регрессий и скользящих нормативов (SN). 16S
5.9. Комплекс анализа сценариев и событий (DT). 170
5.10. Заключение. 172
Глава 6. Прогноз гипертензии после операции коарктации аорты. 175
6.1. Медицинская постановка. 176
6.2. Информационные задачи. 176
6.3. Формирование классов. 177
6.4. Сравнение устойчивых классов. 178
6.5. Итог. 181
Глава 7. Плацентарная недостаточность. 183
7.1. Медицинская постановка. 184
7.2. Информационные задачи. 186
7.3. Организация клинических данных. 18 8
7.4. Практическое решение задачи о раннем прогнозе задержки внутриутробного развития плода (3BYP).
7.5. Итог. 204
Глава 8. Выбор тактики родов у женщины с рубцом на матке. 205
8.1. Медицинская постановка. 205
8.2. Материал. 206
8.3. Информационные задачи. 206
8.4. Стратегия принятия решения. 207
8.5. Роль различных сведений в принятии решения. 208
5.1. Первый этап. Первичное обследование. 209
8.1. Второй этап. Состояние перед родами. 212
8.2. Третий этап. Активная фаза родов. 216
8.3. Медицинский итог. 220
8.10. Заключение. 222
Глава 9. Выработка тактики ведения беременных с сахарным диабетом при отсроченном результате лечения.
9.1. Медицинская постановка. 226
9.2. Информационные задачи. 226
9.3. Прогноз по состоянию свертывающей системы крови. 227
9.4. Прогноз по уровням гормонов, сахарам крови и ультразвуковым размерам плода.
9.5. Прогноз по динамике массы тела матери. 236
9.6. Плацентарная недостаточность при беременности, отягощенной сахарным диабетом.
9.7. Итог. 242
Глава 10. Классификация тяжести состояния новорожденных у матерей с сахарным диабетом.
10.1. Медицинская постановка. 245
10.2. Информационные задачи. 246
10.3. Врачебная классификация. 246
10.4. Выделение представителей крайних классов. 247
10.5. Промежуточные градации. 249
10.6. Укрупнение классов. 252
10.7. Формальный анализ динамики состояния. 254
10.8. Факты и события. 258
10.9. Классификация на основе событий. 259
10.10. Итог. 263
Глава 11. Согласование решений экспертов при освоении нового сегмента профессиональной области.
11.1. Информационные задачи. 265
11.2. Медицинская постановка. 267
11.3. Описание процедуры. 269
11.3.1. Решающее правило 1 этапа (правило 1). 270
11.3.2. Очное обсуждение. 278
11.3.3. Решающие правила 2 и 3 этапов (правила 2 — 3). 279
11.4. Динамика общей точки зрения экспертов. 282
11.5. Итог. 285
Глава 12. Выделение наиболее пострадавшего контингента. 287
12.1. Медицинская постановка. 288
12.2. Информационные задачи. 288
12.3; Анализ измененных значений. 293
12.4. Количество "напряженных" и "угнетенных" признаков. 296
12.5. Связь численных значений параметров с количеством напряженных (угнетенных) параметров.
12.6. Итог. 304
Глава 13. Геомагнитные возмущения. 305
13.1. Ионосферный ядерный взрыв. 306
13.2. Краткое описание теоретической модели генерации ГМВ 308
13.3. Обработка магнитограмм 314
13.4. Математическая модель 315
13.5. Обсуждение результатов 319
13.6. Итог 1. 320
13.7. Подземный ядерный взрыв без выхода на поверхность. 321
13.8. Общая постановка задачи 322
13.9. Однопараметрическая аппроксимация сигнала 324
13.10. Экспериментальное исследование начальной стадии ГМВ 328
13.11. Обсуждение результатов 332
13.12. Итог 2. 333
13.13. Итог геофизических задач. 335
Заключение. 336
Внедрение 340
ЛИТЕРАТУРА. 341
Приложение 1. 372
Приложение 2.
Введение к работе
Исследование интеллектуальной деятельности человека развивалось по двум основным направлениям: моделирование отдельных сторон мыслительных процессов и анализ профессиональной деятельности.
Первое направление привело к созданию ряда больших областей научных исследований. Результаты, полученные в этих областях, в дальнейшем были эффективно использованы в задачах медицинской диагностики и во многом стимулировали ее развитие. Напомним некоторые из них.
1. Теория поведения автоматов (модель рационального поведения индивидуума в предложенных обстоятельствах) [44, 177, 178, 221]. В работах М.Л. Цеглина [221, 222, 223, 224] были определены понятия состояния, действия, выигрыша за действие, стационарной случайной среды. Этот четкий язык описания взаимодействия равноправных элементов системы во многом помог выработке строгих понятий для формализованного описания элементов тактики врача.
2. Теория игр (модель поведения нескольких индивидуумов при наличии несовпадающих интересов) [163] привнесла понятие смешанной стратегии. Оно оказалось полезным при анализе совокупностей вариантов решений, когда информации для выбора между вариантами недостаточно, или причины выбора (если он уже совершен) неизвестны.
3. В теории игр автоматов (модель предельно формализованного поведения нескольких индивидуумов в случае конфликтных интересов) [43,44, 221] была показана важность конкретной структуры взаимодействия элементов системы для организации их поведения. Результаты этих исследований вошли в основы описанных в диссертации методов структуризации взаимодействия больного и врача. 4. Теория распознавания образов (модель целесообразного восприятия окружающей среды) [3, 34, 40, 42, 111, 160] ввела в оборот понятия процедуры обучения, обучающей выборки, процедуры экзамена, чистого класса. С одной стороны, в рамках этого направления были развиты гибкие методы преобразования информации, сохраняющие отличия разных классов объектов. С другой — получены многочисленные алгоритмы распознавания, пригодные для практической классификации объектов. С третьей - развитие этой проблематики привело к пониманию пределов точности анализа информации, если отброшена ее содержательная первоначальная структура. Положительный результат этого направления состоит, прежде всего, в выработке строгих определений основных понятий, в точной постановке вопросов о системах, о взаимодействии их элементов, В рамках этого направления были созданы языки описания входных ситуаций и результатов обработки сигналов. При разработке языков для представления данных и моделирования структуры решения врача в данной диссертации использованы идеи, методы и концепции этого научного направления.
В диссертации основное внимание обращено на второе направление исследований - анализ профессиональной деятельности специалиста, прежде всего, врача. Принятие врачебного решения традиционно ассоциируют с процессами поиска и связанным с ними перебором вариантов. Описание состояния больного, поиск известных признаков заболеваний, проверка наличия определенных сочетаний таких признаков у больного, выбор вариантов лечения, анализ ограничений, связанных с несовместимостью лекарств, прогноз вариантов развития заболевания - это неполный ряд примеров типичных информационных медицинских задач. К таким же задачам относятся задачи анализа и моделирования структуры решений врача, составляющие предмет диссертации.
Задача медицинской диагностики, с информационной точки зрения, состоит в создании правила классификации, позволяющего каждого больного из за данного множества отнести к определенному классу (диагнозу). Работа по созданию правила включает в себя три блока действий.
1. Сбор информации о больных сравниваемых классов.
2. Выработка конструкции заключения.
3. Медицинская интерпретация полученного решения.
Эти блоки эволюционировали по мере работы различных групп исследователей над практическими задачами формальной (она же автоматическая, машинная, компьютерная) диагностики.
Исторически первыми были созданы электронные справочники. Они представляли собой попытку свести болезни и симптомы к коротким спискам. В основу их были положены описанные в руководствах симптомы заболеваний.
В работе [26] электрокардиограммы (ЭКГ) делили на 5 априори заданных диагностических категорий. Доля ошибочных диагнозов составила 18%. Информационная система по ишемической болезни сердца [37] содержала 490 примеров больных с патологией коронарных сосудов. Специальный формат запроса позволял получать частоту выбранных нарушений на справочном массиве. Для выбора противоаритмических лекарств в работе [112] используются две таблицы: таблица противопоказаний для 9 лекарств по 21 группе диагнозов и таблица показаний для 7 лекарств по 9 группам нарушений ЭКГ. Для реабилитации больных сердечно-сосудистыми заболеваниями в работе [И5] предложена таблица из 17 градаций физической нагрузки. Соответствие состояния больного категориям нагрузки предложено контролировать наборами клинических исследований, привязанными к градациям нагрузки.
Общие черты подходов этой группы: небольшое количество вариантов на входе таблицы и жесткая связь ответа с входной градацией. Разнообразие проявлений одного и того же заболевания и возможные осложнения сопутствующими заболеваниями и другими индивидуальными особенностями больных оставались «за кадром». Более того, как отметили М.А. Алексеевская и B.C. Переверзев-Орлов [14], одни и те же признаки заболеваний получают различные названия у врачей, принадлежащих различным школам. В работе И.М. Гельфанда с соавторами [71] также обращено внимание на несовпадение определений медицинских терминов у врачей разных клиник. В работе [270] отмечено наличие разночтений в описании одних и тех же симптомов разными специалистами. Этот фактор вносит дополнительные ошибки при пользовании жесткими таблицами диагностики.
В работе [121] использовали ПО качественных и количественных признаков для 636 больных. Признаки разделили на 3 группы, соответствующие синдромам стенокардии, промежуточных форм заболевания, круттноочагового инфаркта миокарда. Авторы отмечают, что некоторые важные с точки зрения врача признаки оказались статистически мало значимыми на массиве обучения.
Для задач дифференциальной диагностики [142]: (1) отличить рак от доброкачественного заболевания и (2) отличить центральный рак легкого от хронического воспалительного процесса были закодированы заранее подобранные симптомы. По первой задаче массив обучения составил: 120 случаев - рак, 110 - доброкачественное заболевание. Правильный диагноз: у машины 94%, у цитолога 78%. Процедура верификации диагноза, принципиально важная для диагностических работ, к сожалению, авторами не описана.
В упомянутой группе работ медицинские термины используются по-прежнему, «буквально», т.е. в смысле, придаваемом им учебниками. Не сделана попытка выяснить смысл, вкладываемый в термин врачом - участником работы.
В качестве одного из рецептов борьбы с этим недостатком предлагалось использовать исключительно общеупотребительные термины [165]. Там же предлагается создать единую форму истории болезни и единую схему обследования для каждой медицинской специальности. Предложенному подходу препятствует отсутствие соответствующей диагностической аппаратуры во многих и учреждениях здравоохранения, изменение со временем требований к составу процедур обследования и потеря возможности использовать накопленный диагностический опыт.
В работе [59] сделана интересная попытка создать исчерпывающий словарь употребления медицинских терминов в рамках одной, достаточно узкой, задачи. Стандартизация терминологии позволила бы избежать разночтений в названиях одних и тех же болезней и симптомов. Это заметный шаг на пути уточнения смысла терминов. К сожалению, стандартизация не могла помочь в привлечении всей нужной информации.
Многие авторы возлагали надежды на комбинированные признаки, составленные из первичных наблюдений. В работе [30] рассмотрена матрица корреляций между 11 параметрами ЭКГ, полученная при обследовании 227 больных. Кроме того, авторы проанализировали корреляционную связь анатомической массы некроза с динамикой 8 параметров ЭКГ для 9 периодов развития некроза миокарда. Наиболее коррелирующий параметр, индекс некротизации миокарда, показывает корреляцию с массой некроза в различные периоды наблюдения от 0.52 до 0.91. Нарастание этого индекса после 30-36 суток заболевания авторы считают пессимистическим признаком. Индивидуальный прогноз выздоровления не сформулирован.
Другие работы ориентировались на механическое увеличение количества используемых признаков, благо компьютер это позволяет. Рассматривались варианты «больших» умозрительных конструкций, построенных по известной медицинской литературе. В работе [165] использован стандартный список из 400 неврологических симптомов и рефлексов. Результаты практического применения этой таблицы отсутствуют. Автор утверждает, что описание заболеваний в синдромах по классическому руководству потребует более 500 переменных, и предлагает остановиться на уровне клинических симптомов.
В работе [115] автор предлагает шкалу градаций физической активности пациентов на стадии реабилитации, основанную на продолжительности упраж 12
нений и приблизительной оценке энергозатрат. Эта шкала отражает степень нагрузки организма, но не учитывает особенностей перенесенного заболевания
В работе [270] опытных хирургов просили изложить используемые ими диагностические критерии. Эти определения были использованы для постановки машинного диагноза, который сравнивали с диагнозом хирурга и заключением патоморфолога после операции. Во многих случаях обнаружены различия. Как отмечают многие авторы [17, 71, 72, 149, 152, 153, 155], то, что врач назвал, не обязательно совпадает с тем, что он использовал в работе.
Применяли и смешанную схему [48] - часть признаков брали из литературы, а остальные (в основном, субъективные заключения) включали на основании собственного опыта и назначали малое число градаций.
В работе [205] были использованы сведения о топической диагностике поражений нервной системы из стандартного руководства. Эти данные авторы дополнили описаниями основных клинических форм течения закрытой травмы черепа и головного мозга. Всего образовано 145 единиц патологии. Диагноз формируется как список возможных патологических процессов.
Пополнение списков признаков, почерпнутых из руководств и учебников, дополнительными признаками, сообщенными врачами - участниками решения диагностической задачи, улучшает описание состояния больных. Недостатком этого подхода является выбор только признаков, названных и описанных врачами, тогда как признаки, не названные врачом, но используемые в практической деятельности, могут иметь не меньшее значение.
Популярность справочников (диагностических таблиц) быстро исчерпалась. Во-первых, признаки «из учебников» достаточно общи, расплывчаты и неконкретны. Они охватывают широкие классы заболеваний и не учитывают особенности конкретного больного. Их использование в диагностике напоминает личный диагноз на основе эпидемиологических сведений. Во-вторых, признаки, названные врачом, уже сформулированные им и обобщенные на основе длительных разъяснений коллегам и студентам, содержат не весь клинический опыт врача, а наиболее устоявшуюся и консервативную его часть. В-третьих, диагностические таблицы реализуют очень простую модель вывода, жесткую связь списка (обычно, единственного) симптомов с диагностическим выводом. Врач редко бывает настолько категоричен.
Приемы оперирования признаками, предложенные в некоторых работах «табличного» направления, были использованы впоследствии. Главное отличие последующих работ состояло в усилении внимания ко второму блоку - выработке конструкции заключения.
Многие авторы стали предлагать программы, реализующие простейшие схемы вывода на основе клинических симптомов [26, 83, 112, 113, 116, 205]. Этот подход стимулировал новый этап анализа первичных признаков. Во многих работах обращается особое внимание на способы формализованного отбора признаков.
М.Л. Быховский [38, 39] вводит понятие фазового интервала - сферической области в «фазовом» пространстве признаков. Гипотеза автора состоит в том, что фазовые интервалы являются центрами притяжения объектов исследуемых классов. Диагноз ассоциируется с набором фазовых интервалов, каждый из которых использует ограниченное подмножество входных переменных. Вызывает возражение использование евклидовой метрики, поскольку невозможно равноправие различных признаков (например, непрерывных и логических переменных). Сама конструкция сферической области представляется, также достаточно произвольной.
В работе [Пб] автор строит «вручную» решающее правило в виде логической формулы. Предлагается отбирать в решающее правило градации признаков, максимизирующие отношения частот для двух сравниваемых классов. Само правило строится как дизъюнкция конъюнкций, полученных для отдельных градаций признаков. Для диагноза предынфаркта было отобрано 7 дизъюнкций, включающих 10 из 29 первоначальных признаков. При экзамене на 151 больном получено 2 ошибки. Использование логических функций позволяет избе 14
жать использования априорных гипотез о структуре пространства данных. В ряде работ также принимают во внимание частоты входных признаков [37, 62, 121,178].
Е.В. Гублер [99] предлагает включать клинические симптомы в диагностический набор на основании сравнения распределений этих симптомов на сравниваемых классах. Для сравнения предложено использовать непараметрические критерии. Этот подход вносит рациональные основания в процедуру отбора входных признаков, во всяком случае, в ее формальную часть.
Включение признаков состояния больного, связанных с описанием изучаемого заболевания и состояния больного, позволяет избавиться от излишних «директивных» переменных и достаточно подробно проанализировать те, которые оказались важны для решения конкретной диагностической задачи.
Для перечисленных выше работ характерно активное участие авторов в конструировании решающего правила. Это обстоятельство, с одной стороны, давало возможность авторам детально разобраться в использовании входной информации, но, с другой - затрудняло выработку общего подхода к совокупности задач диагностики.
Следующим этапом стала автоматизация процесса получения решающих правил. Для этого использовались программы распознавания [179, 272]. Наиболее популярными оказались: «Кора» [34, 40], «Потенциальные функции» [3], «Обобщенный портрет» [7,42] и некоторые другие [83, 158,159, 160, 169,227].
Все эти программы требовали специальной кодировки входной информации. Ответ, как правило, был категорическим по форме, что породило дискуссию о правильном использовании машинных результатов в медицине [17, 62, 71, 270]. При излишне категоричной формулировке диагноза возможны ошибки из-за неоднозначности описания состояния больного на языке разных клинических специалистов [243, 270].
Врач при постановке диагноза (особенно, если ему же и лечить) часто формулирует диагноз «с запасом» [182]. Это помогает ему уменьшить риск для больного в случае незначительной ошибки в данных и стимулирует перепроверку показаний к лечению в случае остаточной неясности.
Авторы работы [142] показали, что снижение категоричности формального диагноза (добавление категории «не знаю») улучшает качество диагностики. При диагностике центрального рака легкого против хронического воспалительного процесса получается в 78% случаев уверенный диагноз, в 5% ошибка и в 17% - отказ. Если введена категория «отказ» (вместо ошибок в 22% случаев), уверенный диагноз лучше соответствует рентгенологическому.
В работе [114] показано, что наилучшее качество диагностики (92%) получается, когда врач использует компьютер как диалогового партнера, а не как «окончательного» судью. Врач анализировал ЭКГ дважды: первый раз - самостоятельно, не зная результата машинного анализа, второй раз (спустя 2-3 недели) - вместе с распечаткой машинного диагноза. При втором сеансе работы с ЭКГ врач был обязан либо подписаться под машинным заключением, либо (если не согласен) обосновать свою точку зрения. Результат чисто машинной диагностики (78%) был заметно хуже результата врача. Количество синдромов, установленных врачами во время повторного анализа той же ЭКГ, оказывалось больше. Интересно, что активная позиция врача при решении задачи формальной диагностики заметно улучшает результат.
А.Л. Сыркин [197] отмечает, что правильное соотношение категоричности и гибкости формального заключения обычно бывает итогом длительной и трудной работы врача и математика вместе.
Прогноз тяжелого исхода (например, гибель больного) нужен врачу не сам по себе [185, 186], а как сигнал к интенсификации лечения. При этом целесообразно формулировать диагноз не в форме категорического утверждения, а в виде рекомендаций, предостережений, советов, которые более адекватно воспринимаются лечащими врачами. Это еще один способ побудить врача занять более активную позицию. Трудности сопоставления медицинских и машинных диагнозов [17, 26, 62, 65, 72,121, 142,169, 205, 253, 255, 256, 270] стимулировали постановку исследовательских задач в форме прогноза хорошо верифицируемых ситуаций [10, 11, 25, 28, 30, 55, 63, 64, 65, 78, 180, 219, 241, 244, 252, 253, 257, 259, 267, 271], иногда отдаленных от момента постановки прогноза и периода лечения.
В работах И.М. Гельфанда и его школы задача прогнозирования результата лечения ставилась с четкой ориентировкой на возможные действия врача. Контингент больных, относительно которых решалась задача, выбирали в соответствии с предстоящими вариантами действий врача. Например, в задаче о прогнозировании рецидива язвенного кровотечения [60, 61, 62] в исследование включали больных без активного кровотечения при поступлении в стационар, т.е. ранее обнаруженное кровотечение было к моменту поступления уже остановлено. Прогнозировали рецидив кровотечения в первые 10 суток пребывания в стационаре. Это тот интервал времени, в течение которого может быть выполнена плановая операция. В задаче о прогнозировании исходов при геморрагическом инсульте [62, 63, 78] давали два прогноза на выживание: при консервативном и при хирургическом лечении. Врач сам принимал решение на основании всех необходимых ему данных и этих двух прогнозов. Задача прогнозирования осложнений у мужчин с инфарктом миокарда [62,64, 65, 66, 67, 68, 73, 74, 75, 198] решалась для мужчин с крупноочаговым или трансмуральным инфарктом миокарда, госпитализированных не позднее 48 часов от начала острого приступа и оставшихся в живых спустя трое суток с момента госпитализации. Для этих больных дается прогноз осложнений, которые могут возникнуть на вторые и последующие сутки пребывания в стационаре.
Как видно из этих примеров, не следует прогнозировать очевидные варианты (например, если больной в коме на момент поступления, то нужен не прогноз, а экстренные реанимационные мероприятия), нужно четко оговорить сроки контроля и прогнозируемые состояния. Важно также, чтобы прогноз давал врачу направление действий в пределах его возможностей. Прогностические правила даже стали признаком конструктивного решения диагностических задач. Например, в сборнике [52] (1968 г.) в заголовках всех 22 работ слово «прогноз» отсутствует, в сборнике [200], изданном на десятилетие позже (1981 г.), в одном только разделе «Математические методы в диагностике и классификации ишемической болезни сердца» слово «прогноз» встречается 10 раз в заголовках 21 работы.
Причиной невысокой эффективности решающих правил для индивидуального применения могли стать несколько факторов. Во-первых, многие авторы были «неразборчивы», они брали у врачей весь материал мало-мальски относящийся к изучаемой проблеме. При этом в обучающей выборке оказывались даже стертые случаи, пограничные варианты (произвольно, «волевым» способом отнесенные к одному из классов), больные, излишне отягощенные сопутствующими заболеваниями. Во-вторых, входные переменные проходили, в лучшем случае, лишь «статистический» фильтр (например, отношения частот). В-третьих, градации переменных, чаще всего, определялись высказанными доводами врачей, а не свойствами задачи. В-четвертых, структура решающего правила, обычно, задавалась заранее, по соображениям, скорее вычислительным, нежели свойственным рассуждению врача. В-пятых, полученный ответ был далек от привычной врачу терминологии, и поэтому затруднялась корректировка правила.
На каждом этапе развития методов работы с клиническими данными в начальной стадии возникало впечатление, что наконец-то удалось достичь понимания «как это делает врач». Но критерий «совпадение результата равно совпадению метода» оказывался обманчивым. Каждый раз выяснялось, что есть ряд интересных и важных вариантов течения заболевания, выпадающих из возможностей формальной методики, которые, тем не менее, прекрасно диагностировал врач. После первых успехов программ распознавания [10, 57, 58, 63, 64, 78, 121, 182, 181, 185] обнаружили, что успешность диагностики хорошего врача все еще не достижима для формальных методов. По-видимому, это связано с тем, что врач фактически использует большую информацию, чем способен рассказать. Для машинных решающих правил считается хорошим результат: 75-85% правильных ответов [27,48, 97,105,142,226].
Исследователи школы И.М. Гельфанда [71, 72] и некоторых других впервые обратили внимание на то, что у хорошего врача постановке точного диагноза обязательно предшествует осмотр больного. Объем информации, получаемой при осмотре, оставался неизвестным, но, по-видимому, эта информация была существенна, возможно даже играла решающую роль. Косвенно об этом можно было судить по тому, что каждое правило хорошо работало в клинике, в которой его создавали, и гораздо хуже — в других клиниках, хотя квалификация врачей в обеих клиниках была сравнимой [14, 9]. Более того, врачи разных клиник легко (буквально, в несколько фраз) могли согласовать свои решения относительно конкретного пациента [14, 15, 16, 62, 69, 71, 72]. Согласование формальных описаний больных для использования общего правила оказалось трудоемкой работой [69, 71, 72]. Результаты этих исследований стимулировали перенос основного внимания на самого врача, на его приемы анализа сведений о больных и нужную ему для этого фактически информацию.
Попытки организовать входную информацию в задачах формальной диагностики имеют длительную историю. Непригодность обычной больничной истории болезни с ее аморфной структурой, необязательной фиксацией отдельных сведений, произвольной формой записей и другими недостатками, стала очевидна уже первым исследователям. Простейшим средством организации данных стали тематические вопросники. К сожалению, отсутствие четкой ориентации на конкретную задачу и, даже наоборот, стремление «охватить материал пошире» приводили к созданию гигантских вопросников [165, 193, 194] с количеством пунктов порядка тысячи. В вопросниках [193, 194] сделана попытка собрать воедино все варианты симптомов по группам болезней оперированного желудка (1219) и заболеваний печени, желчных путей и поджелудочной железы (994). Эти вопросники должны были послужить основой машинного банка прецедентов. Ясно, что полноценное заполнение такого вопросника для достаточного количества больных нереально.
Психологические исследования показали, что принимать решение по такому объему информации человек не может. Он обычно либо объединяет эти сведения в несколько (3-9) блоков, либо игнорирует большую их часть [106, 152, 195, 265]. Спрашивать врача напрямую, что именно ему нужно из вопросника, бесполезно, он далеко не всегда сам осознает это [17, 71, 72, 154, 155, 169]. Для отбора реально используемой врачом информации И.М. Гельфанд предложил метод «диагностических игр» [13, 17, 61, 62, 71, 72]. Основные приемы этого метода были выработаны в процессе решения задачи прогнозирования отдаленных результатов электроимпульсной терапии у больных с постоянной формой мерцательной аритмии [И, 13,199].
Согласно [17, 71], диагностическая игра представляет собой диалог двух специалистов, врача и математика (последний термин используется условно, чтобы подчеркнуть несовпадение профессиональных областей). В процессе диалога врач решает свою профессиональную задачу (постановку диагноза, назначение лечения, выработку прогноза течения заболевания) на основе информации, которую доставляет второй участник игры (подробнее см. раздел 1.3).
Диагностические игры использовались при создании разнообразных тематических вопросников. Среди них были вопросники для решения различных медицинских задач: об удержании синусового ритма сердца после электроимпульсной терапии мерцательной аритмии[11, 12]; о прогнозировании исхода тяжелого инфаркта миокарда [8, 46, 47, 62]; о дифференциальном диагнозе этиологии гнойного менингита [18,17]; о выборе оптимального метода лечения гипертонических внутримозговых кровоизлияний [62]; о прогнозировании заживления дуоденальных язв [62]; о морфологической диагностике гломерулонефрит по клинико-функциональным данным [70, 71,36]; о прогнозировании рецидива язвенного кровотечения [61, 71]; о выборе типа операции для больного аденомой гипофиза [117]; о диагностике и выборе лечения плацентарной недостаточности [19J и других [54].
Эти вопросники оказывались заметно компактнее, содержали только необходимые для решения задачи сведения. Кроме того, при этом методе составления вопросника удается придать ему четкую структуру, облегчающую контроль полноты заполнения и последующую работу с собранными данными.
В ходе анализа протоколов диагностической игры удается также зафиксировать некоторые приемы использования информации врачом, выявить простейшие структуры оперирования данными. Так, например, для ряда задач были построены структурные единицы данных, которые врач использует как единое неразделимое целое [62, 66, 67], типы течения заболевания [47, 75, 198]. Использование структурных единиц делает решение задачи прогнозирования более прозрачным и понятным врачу. Типы течения инфаркта миокарда, выявленные в ходе упомянутых работ, вошли в правило прогноза.
Поскольку диагностические игры подразумевают исключительно словесный способ обмена информацией между участниками работы, в них возможно выяснение только тех сторон исследования, которые уже получили словесное определение или, хотя бы, название. Вместе с тем, многие важные факторы проявляются в ходе исследования впервые в невербальном виде, как досадные недоразумения, помехи, неопределенная нехватка данных. Их обнаружение и вербализация требуют специфических приемов. Для этого приходится входить в детали анализа и интерпретации данных врачом. Эти вопросы будут рассмотрены в последующих главах.
Среди большого количества работ по диагностике преобладают задачи однократного принятия решения. Между тем, для клинической практики характерны, скорее, проблемы наблюдения длительного течения заболеваний и длительного лечения, когда контакт врача и больного не является однократным, а длится некоторое время, в течение которого врач имеет возможность всесторонне изучить больного. Иногда для успешного лечения приобретают значение особенности характера и психического склада больного, социальные контакты с привычным окружением, особенности реакции на больничное окружение, и другие, обычно не учитываемые факторы. Обладая всей этой информацией, врач может проверять правильность назначенного лечения и корректировать его. К сожалению, найти в литературе адекватный язык для описания таких ситуаций не удалось. Вариант такого языка предложен в главе 4.
Непрерывное принятие решений с постоянной их корректировкой по текущему результату, вообще, типично для профессиональной деятельности человека. Алгоритм выработки решения в этом случае, вряд ли, удастся свести к последовательности однократных решений. Ведь в ходе длительного процесса человек накапливает опыт, учитывающий все стадии процесса, от самого его начала, т.е. каждое последующее решение принимается на основе все большей информации.
В теории принятия решений обычны задачи принятия оптимального решения по заданному критерию или набору критериев [4, 106, 144, 145, 147, 148, 150, 152, 157, 274]. Для описания тактики действий врача в процессе лечения больного ближе проблема выработки критериев по предыдущему опыту, нежели использование готовых [151, 164].