Введение к работе
Актуальность темы.
Одна из важнейших тенденций современного медицинского приборостроения для научной и практической медицины связана с увеличением вычислительных ресурсов медицинского прибора (Викторов В.А., 1997). Функциональные и потребительские свойства этого нового типа медицинской техники определяются се программным и алгоритмическим обеспечением, а вычислительные средства эффективны в той степени, в какой эффективно программное обеспечение этих средств.
В последние годы появился широкий спектр автоматизированных диагностических приборов, содержащих как функции вычисления основных показателей, так и интерпретацию физиологических сигналов. Это прикроватные мониторы фирмы Hewlett-Packard (США), интерпрс-гарующие электрокардиографы фирм Siemens (Германия), Schiller AG [Швейцария), Marquette (США), элекгроэнцефалографы фирмы Oxford Medical Ltd (Англия), системы для исследования функции внешнего аыхания фирмы Jaeger (Германия) и др.
Особое место в этом ряду занимают приборы и системы для функциональных исследований. В основе алгоритмов интерпретации, эсущсствлясмой такими медицинскими приборами, лежат модели принятия іслиничсских решений (Палссв Н.Р., Кольцун С.С, Мучник Л.Б., 1987; Garbay С, 1995; Davant В., 1995; Дитятсв В.П., 1997), соответствующие широкому спектру методологических подходов. Можно выделить по крайней мере два типа знания, ориентированного на -[нтерпретациго первичных медицинских данных (Shortlife Е., Feigenbaum Е.,1979):
-знания, полученные в результате анализа первичных медицинских іанньїх методами статистической классификации;
-оценочные, экспертные знания, отражающие опыт и мнение экс-юртов, сформулированные в виде тех или иных логических посылок и іспользующис методы формального моделирования содержательного :ывода.
Типовой путь обработки данных в интерпретирующих медицинах приборах для функциональных исследований в общем случае іслючаст оценку качества введенного сигнала, организацию регистрами, обмер характерных элементов и интерпретацию в терминах рачебного языка. Другими словами, такие приборы содержат специали-ированную проблемно-ориентированную экспертную систему, входная
информация для которой формируется в результате обработки сигнала.
Развитие этой области за последнее десятилетие, по мнению ряда авторов, характеризуется все возрастающим вниманием к формальным методам представления знаний более высокого уровня, базирующихся на первичных данных (Komaroff А., 1979; Shortlife Е., 1985; Feigenbaum Е., 1979; Яхно Т.М., 1995; Nykanen P., Saranummi N., 1995; Simmers R., Carson E., 1995). Этому способствует осознание медико-технической общественностью особых свойств медицинских знаний и данных и связи с использованием идей искусственного интеллсіста в медицинской технике.
Особенностью медицины как предметной области, по мнению специалистов (Shortlife Е., Feigenbaum Е., 1979), является формализация представления знания в виде продукционной модели как наиболее соответствующей процессу принятия решения врачом. В классической продукционной модели знания представляются в виде ЕСЛИ [PJ TO[Z]. В этой модели посылкой Р выступают сочетания элементарных высказываний - симптомов, принимающих только значения "истинно" и "ложно" и образующих симптомокомплекс, синдром, синдромокомплекс и т.д. Заключением Z, соответственно, могут быть диагноз или рекомендации по лечению и прогнозу развития заболевания, также принимающие значения "истинно" и "ложно".
Уже первые сравнительные исследования ряда программ автоматической интерпретации ЭКГ, проведенные в рамках рабочей группы Уильямса, выявили спектр проблем, связанных с оценкой качества определения врачебных показателей и качества интерпретации продукционных правил. В частности, продукционные правила, реализованные в технике классической логики, оказываются неустойчивыми по отношению к естественной физиологической вариабельности сигнала, наличию помех и артефактов различной природы (Bailey J.J. ct al. 1990, Surawicz et al., 1977, Van Bemmcl J.H., Willems J.L., 1990).
Дело в том, что для медицинского знания характерно не только определение наличия симптома, но и оценка степени его выраженности и значимости для того или иного заболевания. Однако, классическая схема формирования продукционных правил не предоставляет инструмента для описания выраженности симптома.
Наличие проблемы устойчивости интерпретирующих правил отмечали Е. Shortlife и Е. Feigenbaum 1979, Ю.Ф Варламов с соавт. (1983), В.П Булыгин., Н.Ф. Иванов (1983), R Dcgani., G. Bortolan (1987,1989,1991), D. Dubois и H Pradc. (1985), В.П. Дитятсв (1997), С.Я. Гринберг (1993).
Похожие проблемы, проявились и при создании программ автоматиче
ской интерпретации спирограммы и пневмотахограммы (Gardner R. et al.,
1990). . , :. , .. , .: :
Декларированные в ряде европейских и американских стандартов подходы ("Common Standards for Quantitative Electrocardiography" (CSE,1985), "MIT-BIH Arhytmia Database", "Slandarlisation of lung function testing", 1993, "Standnrtisalin of spirometry". 1987). связанные с созданием эталонной базы физиологических сигналов, ориентированы а первую очередь на оценку точности измерения параметров на сигнале, а не на оценку качества интерпретации.
В связи с этим актуальной является задача по созданию теоретических основ представления знаний для медицинских приборов и систем, работающих в терминах продуїсционньїх правил. Такое представление должно обеспечивать учет неточности в данных, оценку качества работы интерпретирующих, правил и возможность использования в продукционных правилах статистических классификаторов. Необходимо разработать методы оценки, качества функционально-устойчивых программных средств медицинских интерпретирующих приборов и систем в условиях неточных знаний и высокой вариабельности входных данных.
Работа выполнялась в рамках ряда плановых тем. Цель исследования.
Создать теоретические основы и методологию разработки функционально-устойчивых программных средств медицинских интерпретирующих приборов и систем в условиях неточных знаний и высокой вариабельности входных данных. Реализовать полученные результаты в автоматизированных интерпретирующих приборах для функциональных исследовании.
Основные задачи исследования.
-
Разработать теоретические методы представления медицинских інаний в продукционных правилах, реализуемых в медицинских -штерпретирующих приборах, учитывающих вариабельность данных и преемственные по отношению к знаниям, реализующим классическую югиісу.
-
Разработать универсальные методы создания программных ;редств медицинских интерпретирующих приборов и систем для функциональных исследований. Разработать методы оценки качества и функциональной устойчивости для продукционных и статистических
решающих правил интерпретирующих медицинских приборов.
-
Провести исследование методов представления интерпретирующих правил, реализуемых в интерпретирующих медицинских приборах, на устойчивость к вариациям данных и неточному представлению знаний.
-
Разработать проблемно - ориентированное программное обеспечение интерпретирующих систем, в том числе для системы формирования групп риска по онкологии, автоматической интерпретации ЭКГ, автоматической интерпретации пневмотахограммы.
-
Разработать автоматизированный электрокардиограф, включающий программное обеспечение автоматической интерпретации ЭКГ. Разработать требования к техническим характеристикам стенда, обеспечивающего оценку качества вычисления врачебных параметров и оценку качества интерпретации ЭКГ.
-
Разработать автоматизированный пневмотахометр, включающий программное обеспечение интерпретации пневмотахограммы. Разработать требования к техническим характеристикам стенда, обеспечивающего оценку качества вычисления врачебных параметров и оценку качества интерпретации пневмотехограммы.
Методы исследования.
Тема настоящей работы находится на стыке проблем медицинского приборостроения, медицинской и биологической кибернетики, многозначной (неклассической) логики, прикладной математической статистики, теории экспертных систем, теории распознавания образов.
Методы представления неточных знаний в электрокардиографических исследованиях являются развитием работ рабочей группы Уильямса по созданию стандарта количественной электрокардиографии, а также целого ряда исследователей R Dcgani., G. Bortolan, Y. Tsukamolo, P.N. Nikiforuk and M.M. Gupla, J.M. Jenkins, R.M. 'long and P.P. Boiiissonc, D. Dubois и H Prade, Дж. Уильямса с соаторами, А.П.Немирко, К.М.Матуса с сотрудниками.
Алгоритмы интерпретации ЭКГ, база "эталонных" сигналов ЭКГ (экспериментальный материал ~1000 записей ЭКГ) и алгоритмы интерпретации пневмотахограммы (экспериментальный материал ~550 пневмотахограмм) разрабатывались совместно с отделением функциональной диагностики МОНИКИ (рук. - проф. Кольцун С.С.) и с отделением кардиопульмонологии (рук. - акад. РАМН Палеев Н.Р.).
Предварительная статистическая обработка и алгоритмы экспертных систем по скрининг}7 онкологических заболеваний отрабатывались
совместно с отделением лучевой диагностики МОНИКИ (рук. - проф. Портной Л.М.) и ЛОР - отделением (рук. - проф. Зенгер В.Г.) Объем обучающего статистического материала составляет более 2000 случаев.
Предварительная статистическая обработка и алгоритмы экспертной системы ПЕРИТОН отрабатывались совместно с проф. А.В. Ватазиным (МОНИКИ). Экспериментальный материал -236 случаев.
Методы представления знания п терминах трехзначной логики примыкают tc работам Л.Лукассвича, Э.Л.Поста, С.Клппп, Д.Бочвара, Собочиньского по неклассичсской логике и работам Л.А.Заде по нечеткой логике.
Методы оценки устойчивости статистического классификатора примыкают к исследованиям группы российских ученых (Айвазян С.А., Бухштабср В.М., Дссв А.Д., Енюков И.С., Лбов Г.С., Мсшалкин Л.Д., Вапник В.Н. и Червоненкис А.Я.) Научная новизна работы.
-
Впервые разработана методология создания программного обеспечения интерпретирующих медицинских приборов, основанная на использовании аппарата трехзначной логики, учитывающая выраженность симптомов и позволяющая оценивать качество работы интерпретирующих правил. Предложенный метод обладает преемственностью по отношению к правилам, выписанным в виде бинарной (двузначной) логики, позволяет в едином ключе работать как с правилами продукционного типа, так и с классификаторами, построенными на основе обучающих выборок (логико-вероятностный подход), учитывает неточность медицинских знаний и высокую вариабильность физиологических сигналов.
-
Разработаны новые методы оценки качества интерпретации и оценки устойчивости шперпрстпрующих правил медицинских диагностических приборов и систем для функциональных исследований к физиологической вариабельности данных и неточным знаниям.
-
Предложен оригинальный подход единой оценки устойчивости интерпретирующего правила медицинского прибора, включающий эталонные сигналы как физиологической, так и нефизиологической природы. На этих сигналах предлагается оценивать не только устойчивость измерений параметров к воздействию шумов, но и устойчивость к физиологической вариабельности и неточности знания.
-
Предложен новый метод создания многообразия входных физио-тогических сигналов с помощью семейства є—неразличимых относительно заданной функции кривых. Модель с-неразличимых кривых
является альтернативой модели белого шума. Для электрокардиографических данных величину є естественно связать с конечной толщиной линии при записи ЭКГ в нормальных условиях (скорость записи 25mm/sec, чувствительность 10mm/mV).
-
Впервые введено представление о варьировании правила интерпретации диагностического прибора, которое позволяет оценить устойчивость правила к неточности знания и тем самым выявить способность правила сохранять свою функцию при неблагоприятных внешних и ипуїреиних факіорах. Показано, чіо соїімссіпос использование в продукционном правиле "центральных" (логические связки Клини) и "левых" (логические связки Собачиньского) операций обеспечивает более высокую эффективность и лучшую устойчивость к многообразию входных данных.
-
Введена характеристика взаимного расположения групп данных-матрица информативности V2, коррелированная с ошибками классификации, и изучены ее свойства. Мерой неточности знания статистического классификатора является различие в показателях качества на обучении (определяется через V2) и на "скользящем контроле".
-
Практическая ценность работы.
Предлагаемая методология создания функционально-устойчивых программных средств интерпретирующих диагностических приборов и систем позволяет значительно повысить эффективность интерпретирующих правил, учесть выраженность отдельных симптомов, обеспечивает преемственность по отношению к знаниям, реализующим классическую логику. Разработаны методы оценки функциональной устойчивости дня продукционных правил, работающих в условиях неточных знаний и ненадежных данных.
Разработаны методы построения и оценки устойчивости статистических решающих правил для числа классифицируемых групп больше двух. Использование разработанных методов оценки неточности знания для статистических классификаторов и отбора информативного набора признаков в скрининг - системе РИСК-ОНКОЛОГИЯ позволило оптимизировать набор первичных показателей и обеспечить высокую эффективность системы.
Разработано программное обеспечение автоматической интерпретации ЭКГ в терминах продукционных правил на основе трехзначной логики. Использование развитых методов позволило значительно поднять эффективность и устойчивость интерпретирующих правил
Разработан автоматизированный электрокардиограф, включающий
рограммнос обеспечение автоматической интерпретации ЭКГ. 'азработаны требования к техническим характеристикам стенда, беспечивающего оценку качества вычисления врачебных параметров и ценку качества интерпретации ЭКГ.
Разработан автоматизированный пневмотахомстр, включающий программное обеспечение интерпретации пневмотахограммы. Разрабо-аны требования к техническим характеристикам стенда, обеспечпппю-дего оценку качества вычисления врачебных параметров и оценку ачества интерпретации пневмотахограммы.
Предложена концепция испытаний интерпретирующих медицинских іриборов и систем в части программного обеспечения, включающая юпользование эталонных сигналов как физиологической, так и [ефизиологической природы, механизмы оценки эффективности и стойчивости интерпретирующих, правил. [пройацил работы.
Основные теоретические положения и результаты диссертации докладывались:
на научной конференции, посвященной 220-летию МОНИКИ, 17 декабря 1993г., Москва;
на областной научно-практической конференции "Информационные технологии в медицине", 26 октября 1993г., Москва;
на научно-практической конференции "Методы эффективной и квантовой терапии в клинической практике", 1995г., Ижевск;
на Международной конференции "Биомсдприбор-95",2-10 октября 1995г., Украина, Крым, Ялта-Гурзуф;
на международном экологическом конгрессе, IV Международный форум информации,25 ноября 1995г.. Москва;
па I съезде онкологов стран СІ ІГ, 3-(> декабря 19У(>г.;
на Всероссийском совещании специалистов по функциональной диагностике, 10-11 октября 1997г., Нахабино;
на третьей Международной научно-практической конференции "Пилотируемые полеты в космос", Звездный городок, 11-12 ноября 1997г.;
на 2-й Международной конференции "Радиоэлектроника в медицинской диагностике. Оценка функций и состояния организма", Москва; на конференции ЗАО ВНИИМП-ВИТА, 6-8 октября 1998г., Москва.;
на международном симпозиуме "Компьютерная электрокардиография на рубеже столетий", Россия, Москва, 27-30 апреля 1999г.
Автоматизированная система интерпретации ЭКГ СКАЗ, электрокардиограф Лекард и пневмотахометрическая система ЛЕСПИ (МУССОН) неоднократно выставлялись на различных выставках, в том числе на международных выставках "Здравохранение-95", "Здравохраненис-97",''Здравохранение-99". Реализация.
Автоматизированная скрининговая система РИСК-ОНКОЛОГИЯ работает в МОНИКИ и установлена в раде регионов Московской области. С ее помощью обследовано свыше 100 тысяч пациентов. В группы риска попато от 1G до 26 % всех опрашиваемых. Выявлясмость в группе высокого риска с учетом последующих инструментальных методов составила: рака легкого -37%, рака желудка-12,2%, рака толстой кишки - 23%,рака молочной железы -9,2%. Подготовлены методические и информационные письма по их использованию в практическом здравоохранении Московской области.
Разработанная система интерпретации ЭКГ - СКАЗ, являющаяся алгоритмическим ядром интерпретирующего электрокардиографа, работает в МОНИКИ более восьми лет. С ее помощью только в МОНИКИ обследовано более 9 тысяч пациентов. Верифицированная часть архива использовалась при создании "эталонной" базы физиологических сигналов ЭКГ.
Разработанная экспертная система выбора метода экстракорпоральной детоксикации при синдроме полиорганной недостаточности у больных перитонитом - ПЕРИТОН, отличающаяся глубокой предварительной статистической проработкой интерпретирующих правил, используется в отделениях и на факультете усовершенствования врачей МОНИКИ.
Разработанная автоматизированная пневмотахометрическая система ЛЕСПИ (МУССОН) работает в МОНИКИ и ряде регионов Московской области.
Автоматизированный электрокардиограф Лекард зарегистрирован в Государственном реестре 15932-97 (ТУ-9441-001-29085682-97), освоен в серийном производстве на фирме Лептамед и в настоящее время работает в ряде клиник различных городов России.
Публикации
По теме диссертации опубликовано 42 работы.
Объем и структура диссертации.
Диссертация изложена на 268 страницах и состоит из введения, шести глав, заключения, выводов и приложения. Список литературы включает 356 источников. Работа иллюстрирована 35 рисунками и 61 таблицей. Основные положения, выдвигаемые на ншиипу.
-
Разработанная методология создания программного обеспечения интерпретирующих медицинских приборов позволяет решать задачи построения интерпретирующих правил, устойчивых к неточным данным и неточным знаниям, оценки качества интерпретации, в едином ключе работать как с правилами продукционного типа, так и с классификаторами, построенными на основе обучающих выборок (логико-вероятностный подход).
-
Введенное представление о варьировании правила интерпретации позволяет оценить устойчивость правила к неточности знания и тем самым выявить способность правила сохранять свою функцию при неблагоприятных внешних и внутренних факторах. Процедура варьирования связана с представлением посылка в продукционном правиле в терминах логических связок различных трехзначных логик. Мерой неточности знания статистического классификатора является различие в показателях качества на обучении и на "скользящем контроле". За меру неточности знания продукционного правила можно принять разницу между верхними вероятностями для правила, посылка которого сфорлгулирована в терминах различных логик
-
Предложенный метод создания многообразия входных данных с помощью ссмсїісгна /; - неразличимых огноапелыю заданной функции кривых, позволяет оценивать не только устойчивость измерений параметров к воздействию шумов, по и устойчивость правила к физиологической вариабельности и неточности знания, используя эталонные сигналы как физиологической, так и нефизиологической природы.