Содержание к диссертации
Введение
1. Анализ математического и программного обеспечения интеллектуальных решающих систем 10
1.1 Назначение и особенности ИСППР 10
1.2 Возможные области применения ИСППР 20
1.3 База знаний ИСППР 24
1.4. Технология построения базы знаний (Data mining) 49
1.5 Постановка задачи создания программной оболочки для разработки ИСППР 55
1.6 Выводы 57
2. Метод эволюционного синтеза моделей 58
2.1 Задача разработки метода построения лингвистических моделей 58
2.2 Метод эволюционного синтеза моделей 59
2.3 Аналитическое исследование метода 62
2.4 Экспериментальные исследования метода 68
2.5. Выводы 70
3. Средства обеспечения рациональности получаемых решений 71
3.1 Метод априорной оценки рациональности решений 71
3.2 Закономерности распределения термов входных лингвистических переменных 74
3.3 Выводы 79
4. Программная оболочка «DSIS» 80
4.1 Назначение и возможности DSIS 80
4.2 Структура программы 82
4.3 Подсистема накопления информации 89
4.4 Подсистема моделирования 90
4.5 Подсистема оптимизации 91
4.6 Экспериментальная часть системы 93
4.7 Основные программные модули системы DSIS 97
4.8 Использование DSIS в системе медицинской диагностики 104
Выводы 113
Заключение 114
Литература 117
Приложение 1 (акты внедрения) 123
Приложение 2 125
- Технология построения базы знаний (Data mining)
- Метод эволюционного синтеза моделей
- Закономерности распределения термов входных лингвистических переменных
- Использование DSIS в системе медицинской диагностики
Введение к работе
Актуальность темы. Устойчивой тенденцией развития современных процессов, протекающих в сфере человеческой деятельности (социальной, экономической, биотехнической, медицинской, технологической), становится усложнение задач, которые приходится решать на различных уровнях управления. Это связано с ростом объемов разнородной информации, необходимой для обоснованного принятия решений, и с сокращением времени, имеющегося для принятия решений.
Для повышения качества принимаемых решений в этих условиях все шире применяются интеллектуальные решающие системы (ИРС), на которые перекладываются процедуры непосредственной подготовки решений различных задач. При этом, как показывает накопленный опыт применения ИРС, качество вырабатываемых ими решений напрямую зависит от того, насколько математические методы преобладают над эвристическими методами, используемыми для подготовки решений. С этой точки зрения все возможное множество задач, условно можно разделить на три класса: формализуемые, трудноформализуемые и неформализуемые. При этом подавляющее большинство задач, возникающих в технике, экономике, политике, медицине, биологии, бизнесе и в других областях, относятся ко второму классу - трудноформапызуемым задачам. Основными признаками этого класса задач являются: большое количество факторов, влияющих на поведение системы, относительно которой принимается решение; разнотипность данных, в среде которых она функционирует; значительная априорная неопределенность, которая не позволяет, используя традиционные методы анализа данных, определить основные закономерности ее поведения (адекватные ей в статистическом смысле). Однако при этом известно, что такие закономерности существуют, и примерно определен основной состав информативных переменных. Для решения таких трудноформализуемых задач используются, появившиеся сравнительно недавно, интегрированные системы поддержки принятия решений (ИСППР). От традиционных ИРС (систем ситуационного управления, экспертных систем и др.) их отличает наличие в составе ИСППР модуля преобразования данных, накопленных в процессе функционирования исследуемой системы, в основные, наиболее устойчивые закономерности ее поведения, представляемых в виде приближенных математических моделей. Такие модели составляют основу базы знаний ИСППР - наиболее важного элемента любой ИРС.
Работа ИСППР основана на современной технологии извлечения знаний - Data Mining. Основным препятствием для широкого распространения таких систем является сложность, требующая от разработчиков ИСППР высокой квалификации в области искусственного интеллекта и компьютерных технологий. В то время как на сегодняшнем рынке программных средств высоким спросом пользуются программные инструментальные средства, не требующие сложной настройки, длительного обучения пользователей и обладающие высокой степенью автоматизации выполнения сложных операций и дружественным интерфейсом, предусматривающим, в частности, подсказки пользователю о рациональности того или иного выбора при принятии решения.
Одна из проблем рассматриваемого класса трудноформализуемых задач принятия решения связана с получением информации о предыстории исследуемого процесса достаточной длины. Так, например, отличительной чертой российской экономики, как на макро-уровне, так и на уровне отдельных предприятий, является ее нестабильность; кроме того, она подвержена и действию многочисленных, неожиданно возникающих факторов. В то время как на Западе предприятия, в основном, работают в рамках уже устоявшейся законодательной базы, в сложившихся структурах товарных, финансовых и информационных потоков, российские предприятия вынуждены подстраиваться под постоянно меняющиеся правила игры. Это же касается российских финансовых рынков, где примерно раз в полгода происходит существенная корректировка правил работы.
Указанные обстоятельства определили направление исследований в настоящей работе.
Объектом исследования является интегрированная система поддержки принятия решений трудноформализуемых задач в различных областях человеческой деятельности.
Предметом исследования является технология Data Mining, используемая для создания базы знаний ИСППР, основу которой составляют наиболее устойчивые закономерности исследуемого процесса или системы, позволяющие использовать математические методы для выработки решений и оценки их рациональности.
Цель и задачи диссертации. Целью является разработка метода извлечения закономерностей из апостериорной информации, позволяющего автоматизировать создание базы знаний и повышающего степень рациональности решений, принимаемых на ее основе. В соответствии с указанной целью были поставлены и решены следующие задачи:
1. На основе анализа особенностей трудноформализуемых задач и моделей представления знаний показано, что, с точки зрения автоматизации технологии Data Mining и с учетом разнотипности исходной информации, наиболее рациональной формой представления закономерностей поведения процессов, относительно которых принимается решение, являются лингвистические модели.
2. На основе теории обеспечения рациональности решений определены требования, которым должны удовлетворять лингвистические модели и предложен метод эволюционного синтеза таких моделей (ЭСМ) в условиях ограниченной длины предыстории функционирования системы, относительно которой принимаются решения и отвечающей условиям рациональности поддерживаемых решений.
3. Разработан метод подстройки функций принадлежности соответствующим термам входных лингвистических переменных с целью обеспечения требуемого качества получаемых лингвистических моделей.
4. Разработан метод априорной оценки рациональности решений, получаемых с помощью ИСППР на основе лингвистических моделей.
5. На основе разработанных алгоритмов создано программное инструментальное средство "DSIS" (Decision Support Integrated System) для разработки базы знаний интегрированной системы поддержки принятия решений трудноформализуемых задач на основе лингвистических моделей.
Методы исследования. Для решения указанных задач использованы теории искусственного интеллекта, математической статистики, нечетких множеств и теории обеспечения рациональности решений, разработанные трудами как отечественных ученых
Научная новизна. В работе получены следующие основные результаты, которые являются дальнейшим развитием теории обеспечения рациональности решений и определяют ее научную новизну:
1. Показано, что в условиях разнотипности информации, в среде которой функционируют исследуемая система или процесс, лингвистические модели являются наиболее рациональной формой представления приближенных моделей, составляющих базу знаний ИСППР.
2. Разработан метод эволюционного синтеза моделей (ЭСМ), обеспечивающий получение лингвистической модели, отвечающей условиям рациональности поддерживаемых решений, заключающийся в итерационном формировании модели путем анализа генерируемых гипотез, оценки их истинности с помощью предложенной информационной меры и принятия решения о завершении процедуры с помощью информационного тестового критерия.
Выявлена зависимость качества моделей, получаемых с помощью метода ЭСМ, от параметров функций принадлежности термов входных лингвистических переменных исследуемого процесса.
Разработан метод априорной оценки рациональности решений, получаемых с помощью интегрированной системы поддержки принятия решений на основе лингвистических моделей. Новизна метода заключается в использовании показателей размытости оценок основных аргументов функции полезности, используемой для оценки рациональности на начальной стадии работы ИСППР, а при "накоплении опыта" работы ИСППР - в использовании композиционного правила вывода значения функции принадлежности вектора критериев, отражающего цель решения, по информации «задача - решение -критерий», отражающей "накопленный опыт".
Достоверность полученных результатов подтверждена результатами имитационного моделирования и экспериментальных исследований с применением разработанного программного инструментального средства.
Практическая ценность работы. Методы ЭСМ и оценки рациональности решений, формируемых на основе лингвистической модели, могут использоваться при создании интегрированных систем поддержки принятия решений трудноформализуемых задач прогнозирования, управления, диагностики в различных областях человеческой деятельности, таких как бизнес, экономика, медицина, образование. Применение разработанных методов позволяет: сократить сроки разработки ИСППР конкретных задач, так как наиболее трудоемкий этап создания решающей системы выполняется автоматически путем запуска программы; снизить требования к уровню квалификации разработчиков ИСППР настолько, что позволяет создавать конкретную ИСППР непосредственно пользователю, знакомому с компьютерными технологиями; снижает требования к объему исходной информации - длине предыстории функционирования процесса или системы, относительно которых принимается решение, настолько, что позволяет создавать конкретные ИСППР для большинства современных процессов (в экономике, в бизнесе, в медицине и др.). упростить пользователю выбор решения, поскольку каждое выработанное решение сопровождается оценкой степени рациональности его принятия в конкретной ситуации.
Реализация результатов диссертационной работы. Создано программное инструментальное средство DSIS (Digital Solve Integrated System) для разработки интегрированных решающих систем на основе лингвистических моделей. На его основе разработана система медицинской диагностики сердечно-сосудистых заболеваний. В системе реализована трехуровневая структура постановки диагноза, на каждом из уровней привлекается разнотипная информация. Внедрение программного средства "DSIS" дало эффект, заключающийся в уменьшении сложности и сокращении сроков разработки автоматизированной системы медицинской диагностики.
Предложенный подход к решению задачи Data Maning использован в работах, выполняемых по гранту РФФИ No 03-07-96395-р2003 Центр-В Лингвистические модели исследуемого процесса и метод определения на их основе рациональности решения используются в учебных курсах «Экспертные системы и базы знаний» и «Системы выбора и принятия решений» на кафедре ЭВМ Тульского государственного университета.
Апробация работы. Основные положения диссертационной работы докладывались на следующих конференциях и семинарах: Всероссийская научно-методическая конференция. Телематика 2003. - Санкт-Петербург; семинары аспирантов кафедр РТиАП и кафедры ЭВМ в Тульском государственном университете, 2000-2003 г.; Всероссийская научно-методическая конференция Телематика - 2002. -Санкт-Петербург, 2002.; Международная научно-методическая конференция Телематика - 2001. -Санкт-Петербург, 2001.; Электронная научно-практическая конференция ЭНИТ-2000. - Ульяновск, 2000.; Конференция ассоциации научных и учебных организаций-пользователей сетей передачи данных Relarn. -2000.; Всероссийская научно-методическая конференция Телематика -2000. -Санкт-Петербург, 2000.
Публикации. По результатам исследований опубликовано 8 работ, в том числе 4 статьи и 4 тезиса докладов.
Характеристика работы:
Диссертационная работа состоит из введения, четырех разделов и заключения, изложенных на 122 страницах машинописного текста, включает 30 рисунков, 1 таблицу, содержит список использованной литературы из 80 наименований и два приложения.
Во введении показана актуальность диссертационной работы, сформулированы цели и задачи, выбран объект и предмет исследований, так же научная и практическая ценность диссертационной работы. Кратко изложены ее основные результаты.
В первом разделе рассмотрены основные подходы к решению трудноформализуемых задач. Показано, что для обеспечения рациональности получаемых решений трудноформализуемых задач база знаний кроме традиционных декларативных знаний должна содержать приближенные закономерности поведения исследуемой системы. При этом основной проблемой является отсутствие надежного аппарата представления знаний, отвечающих необходимым требованиям, обеспечивающих рациональность решений, получаемых на основе знаний.
Во втором разделе разработан метод эволюционного синтеза моделей (ЭСМ), обеспечивающий получение лингвистических моделей, отвечающих условиям рациональности поддерживаемых решений.
В третьем разделе описан разработанный метод априорной оценки рациональности решений, получаемых с помощью ИСППР на основе лингвистических моделей.
В четвертом разделе описывается программное инструментальное средство DSIS, созданным для разработки интегрированной системы поддержки принятия решений трудноформализуемых задач. Основными требованиями к программе являются: высокая степень автонастройки на конкретную предметную область (создания базы знаний); универсальность (простота адаптации на конкретную предметную область); простой и наглядный интерфейс для пользователя — лица, принимающего решения.
В заключении приведены основные результаты и выводы по работе.
Технология построения базы знаний (Data mining)
Data Mining - технология анализа информации с целью нахождения в разнотипных данных ранее не известных, нетривиальных и практически полезных знаний, необходимых для принятия рациональных решений в различных областях человеческой деятельности [15]. В частности, ИСППР вырабатывают рациональные решения на основе устойчивых приближенных закономерностей поведения исследуемой системы.
Выделяют пять стандартных типов закономерностей, которые позволяют выявлять методы Data Mining [49]: ассоциация; последовательность; классификация; кластеризация; прогнозирование
Ассоциация имеет место в том случае, если несколько событий связаны друг с другом. Например, исследование, проведенное в супермаркете, может показать, что 65% купивших кукурузные чипсы берут также и "кока-колу", а при наличии скидки за такой комплект "колу" приобретают в 85% случаев. Располагая сведениями о подобной ассоциации, менеджерам легко оценить, насколько действенна предоставляемая скидка.
Если существует цепочка связанных во времени событий, то говорят о последовательности. Так, например, после покупки дома в 45% случаев в течение месяца приобретается и новая кухонная плита, а в пределах двух недель 60%о новоселов обзаводятся холодильником.
С помощью классификации выявляются признаки, характеризующие группу, к которой принадлежит тот или иной объект. Это делается посредством анализа уже классифицированных объектов и формулирования некоторого набора правил.
Кластеризация отличается от классификации тем, что сами группы заранее не заданы. С помощью кластеризации средства Data Mining самостоятельно выделяют различные однородные группы данных.
Основой для всевозможных систем прогнозирования служит историческая информация, хранящаяся в БД в виде временных рядов. Если удается построить математическую модель и найти шаблоны, адекватно отражающие эту динамику, есть вероятность, что с их помощью можно предсказать и поведение системы в будущем. 1.4.2 Методы технологии Data mining. Статистические методы Хотя последние версии почти всех известных статистических пакетов включают наряду с традиционными статистическими методами также элементы Data Mining, основное внимание в них уделяется все же классическим методикам — корреляционному, регрессионному, факторному анализу и другим. Самый последний детальный обзор пакетов для статистического анализа приведен на странице http://is 1 .cemi.rssi.ru/ruswin/index.htm. Недостатком систем этого класса считают требование к специальной подготовке пользователя. Также отмечают, что мощные современные статистические пакеты являются слишком "тяжеловесными" для массового применения в финансах и бизнесе. К тому же часто эти системы весьма дороги — от $1000 до $8000. Есть еще более серьезный принципиальный недостаток статистических пакетов, ограничивающий их применение в Data Mining [8]. Большинство методов, входящих в состав пакетов опираются на статистическую парадигму, в которой главными фигурантами служат усредненные характеристики выборки. А эти характеристики при исследовании реальных сложных жизненных феноменов часто являются фиктивными величинами. В следующих разделах будут специально более подробно обсуждены эти вопросы. В качестве примеров наиболее мощных и распространенных статистических пакетов можно назвать SAS (компания SAS Institute), SPSS (SPSS), STATGRAPICS, STATISTICA, STADIA и другие. Это большой класс систем, архитектура которых пытается имитировать построение нервной ткани из нейронов. В одной из наиболее распространенных архитектур, многослойном перцептроне с обратным распространением ошибки, эмулируется работа нейронов в составе иерархической сети, где каждый нейрон более высокого уровня соединен своими входами с выходами нейронов нижележащего слоя. На нейроны самого нижнего слоя подаются значения входных параметров, на основе которых нужно принимать какие-то решения, прогнозировать развитие ситуации и т. д. Эти значения рассматриваются как сигналы, передающиеся в вышележащий слой, ослабляясь или усиливаясь в зависимости от числовых значений (весов), приписываемых межнейронным связям. В результате на выходе нейрона самого верхнего слоя вырабатывается некоторое значение, которое рассматривается как ответ, реакция всей сети на введенные значения входных параметров. Для того чтобы сеть можно было применять в дальнейшем, ее прежде надо "натренировать" на полученных ранее данных, для которых известны и значения входных параметров, и правильные ответы на них. Эта тренировка состоит в подборе весов межнейронных связей, обеспечивающих наибольшую близость ответов сети к известным правильным ответам [3]. Основным недостатком нейросетевой парадигмы является необходимость иметь очень большой объем обучающей выборки. Другой существенный недостаток заключается в том, что даже натренированная нейронная сеть представляет собой черный ящик. Знания, зафиксированные как веса нескольких сотен межнейронных связей, совершенно не поддаются анализу и интерпретации человеком (известные попытки дать интерпретацию структуре настроенной нейросети выглядят неубедительными - система "KINOsuite-PR"). Примеры нейросетевых систем — BrainMaker (CSS), NeuroShell (Ward Systems Group), OWL (HyperLogic). Стоимость их довольно значительна: $1500-8000.
Метод эволюционного синтеза моделей
При этом возможна ошибка первого рода, когда имеет место гипотеза Но, но значение (Хн (с :J) попадает в область значений (Хн (С:і) т и принимается Hi. Вероятность а ошибки первого рода называется уровнем значимости критерия и определяется следующим образом: Невозможен и другой случай, когда имеет место гипотеза Нь но значение Cjj Т и принимается гипотеза Н0. Это случай ошибки второго рода. Его вероятность Р (СІІ) определяет мощность критерия Р = 1 — Р с ), т.е. вероятность того, что при справедливости Н) принимается Hi определяется формулой Так как минимизация вероятностей а(с ) и(3 (С;;) - противоречивая задача, поэтому фиксируется одна из них - уровень значимости а0 = sup (x(Cjj), как наиболее важный с практической точки зрения, и CjieC0 среди множества мер, имеющих заданный уровень значимости do, выбирается наиболее мощный статистический критерий, т.е. удовлетворяющий условию [1]: CjjeC, Такие равномерно наиболее мощные меры существуют только в наиболее простых случаях. Чем больше значение CJ;, тем больше вероятна справедливость гипотезы HQ. В ряде задач, хотя не существует равномерно наиболее мощного критерия, можно построить равномерно мощный несмещенный критерий, для которой выполняется неравенство: Для построения такого критерия необходима статистика, которая должна обладать следующими свойствами [45]: 1) должна вычисляться по разнотипной, чаще всего дискретной, выборке данных; 2) должна быть асимптотически несмещенной; 3) должна существенно возрастать с ростом вероятности справедливости гипотезы Но. Такими свойствами обладает дивергенция Кульбака, для данной задачи определяемая выражением: где cjji - оценка вероятности различения элементом nij дискретного значения b;; Pjj - оценка вероятности неразличения элементом rrij дискретного значения bj. D(Cji(w))- оценки дивергенции информации Кульбака и ее дисперсии, вычисляемые по обучающей выборке данных W, st(5) - показатель устойчивости оценок критерия, вычисляемый по выражению пр(8)/пр; k- =p(bjj)- расстояние в заданной метрике р(-) подмножества bj в і-й строке матрицы наблюдений WN ОТ начала области значений выходной переменной у; кв- число подмножеств bjeB; См - параметр регуляризации модели, предназначенный для повышения ее обусловленности, или априорная оценка критерия качества решения, полученного процедурой Tz(x,M) с помощью модели М, когда такую оценку можно получить, например, с помощью процедуры логического вывода. Эти оценки вычисляются по обучающей выборке W по формулам: где N; - мощность множества Gj = {w : bj є w}, т.е. число строк обучающей матрицы W, содержащих значение b;, NJ; - мощность подмножества Gjj={mjew}c=Gj; N-N; - мощность дополняющего Gj множества G;# = W\Gj, Njj# - мощность подмножества Gjj#={mjew}c;Gj# . Известно, что для N »1 оценка дивергенции информации является асимптотически несмещенной [15]. Теперь следует показать, что среди всех мер (настроечных критериев) заданного уровня значимости а, проверяющих две гипотезы Н0 и Ні мера d(nij), построенная на основе дивергенции Кульбака Cjj(w), является наиболее мощной. Пусть мера d(nij) уровня значимости а для проверки Но и Hi задается критической областью Ci(W). Рассмотрим любой другой критерий того же уровня значимости, что и (2.5) для проверки тех же гипотез и обозначим через C i(W) его критическую область. Тогда при попадании d(irij) в область V = Cj(W) \ Cj (W) мы должны принять гипотезу Ні по критерию (2.5), но отвергнуть в соответствии со вторым критерием, а в область V = Cj(W) \ Cj (W)- наоборот, отвергнуть по критерию (2.5), но принять в соответствии со вторым критерием. Вторым критерием является дисперсия дивергенции Кульбака. Тогда, поскольку оба критерия имеют одинаковый уровень значимости, то вероятности попадания d(irij) в области V и V при условии справедливости гипотезы Но равны, то есть. Далее, мощность р критерия (2.5) задается как суммарная вероятность попадания d(nij) в пересечение областей ( (W) OC W) и области V при условии справедливости гипотезы Н 66 Аналогично определяется мощность второго критерия:
Закономерности распределения термов входных лингвистических переменных
Для каждой степени полинома и доли его влияния (коэффициента) установить закон распределения термов входных переменных, обеспечивающих наибольшую степень адекватности получаемой модели.
На основе созданной системы, был проведен ряд исследований, позволяющих выявить закономерности поведения моделей, основанных на выборках, соответствующих разным видам зависимостей. Это позволило сформулировать рекомендации лицу, принимающему решение (ЛПР), относительно ввода вспомогательных данных, необходимых для построения модели, адекватной исследуемому объекту.
Выборки для исследований были сформированы на основе зависимостей первого, второго, третьего порядков, а так же зависимости вида 1/х =у(х) Одной из основных целей исследований являлось выявление зависимости адекватности получаемой модели объекта от различных параметров настройки алгоритма ЭСМ и особенностей исследуемой системы.
Суть экспериментов заключалась в следующем. Формировалось две модели - обученная и тестовая. Обученная модель формируется в соответствии с алгоритмом, описанным во второй главе на базе выборки исходных данных. Тестовая модель формируется по аналогичному алгоритму, отличающегося тем, что он не исключает из модели неинформативные гипотезы. Исходными данными для тестовой модели служит выборка, описывающая поведение той же исследуемой системы в другой момент времени (отличного от того, при котором формировалась обученная модель).
Далее высчитывалась совокупная разница значений, характеризующих прогноз состояния исследуемой системы (ошибка). Если это значение, слишком велико, то обученная модель считается неадекватной. Величину ошибки оценивает ЛПР в зависимости от решаемой задачи.
Зависимость адекватности моделей от помех. Суть эксперимента заключалась в определении адекватности тестовой и реальной моделей при добавлении к выходным значениям случайных значений, соответствующих белому шуму. Выяснилось, что если шум подается на выход тестовой выборки, то это значительно влияет на результаты сравнения работы этой выборки с реальной выборкой. Если же шум подавать на выход выборки обученной модели, то его действие значительно менее заметно, а при небольшом коэффициенте этого шума он оказывает вовсе незначительное влияние на модель. Это значит, что обученная модель достаточно помехоустойчива. На графиках рис. 3.1 и рис. 3.2 показаны зависимости значений ошибки от величины коэффициента «шума», подаваемого на выходы обученной и тестовой моделей. Зависимость адекватности моделей от вида нелинейности полинома, на основе которого формируется выборка. В этом эксперименте использовались различного рода функций при формировании исходных выборок, на основе которых производилось построение модели. То есть значения выборок, соответствующие «выходу» модели зависят от значений «входов» выборки на основании зависимостей: линейной, второго порядка, третьего, и вида 1/х2 Зависимости этого вида были выбраны потому, что они наиболее часто встречаются в реальных условиях и могут быть априорно известны пользователю (ЛПР). Одним из ключевых этапов построения лингвистической модели (см. главу 2) является определение функции принадлежности исходных информативных значений термам лингвистических переменных. То есть каждому диапазону изменений соответствующих переменных исходной выборки соответствует набор термов. Качество и сложность модели напрямую зависит от количества термов и функции принадлежности значений исходной выборки этим термам. Цель эксперимента заключается в том, чтобы найти такую функцию принадлежности, при которой модель будет обладать достаточной с точки зрения пользователя адекватностью и минимальной сложностью. В данном эксперименте исходные выборки формировались на основе одних и тех же значений «входов». В ходе эксперимента менялся вид полинома, на основе которого формировались выходные значения выборки (х+...=у(х), ). зависимость выходных значений выборки от менялось количество термов лингвистических переменных, а так же . Кроме этого, был произведен анализ зависимости качества модели от закона распределения термов на диапазонах изменения соответствующих исходных данных.
Использование DSIS в системе медицинской диагностики
Программное инструментальное средство "DSIS" использовалось для создания системы медицинской диагностики сердечно-сосудистых заболеваний в ГУЛ "НИИ новых медицинских технологий" (г. Тула). Одним из существенных недостатков современных систем медицинской диагностики является использование только наблюдаемых данных для постановки диагноза. Использование предлагаемой системы позволяет использовать в качестве исходной информации для постановки диагноза не только наблюдаемые данные, но и данные, характеризующие предрасположенность пациента к одному или другому виду заболеваний.
Задачу медицинской диагностики можно сформулировать следующим образом. Имеется множество имен заболеваний, семантическую связь между которыми можно представить в общем случае в виде ориентированного семантического графа G(S,U), имеющего трехуровневую древовидную структуру (рис. 4.14). Вершины графа SjjeS отображают объекты - наименования заболеваний, а дуги - отношения между объектами типа "является частью" (is-part-of). На рис. 4.14 все дуги направлены снизу вверх.
Например, если рассматривать категорию внутренних болезней, то вершинами графа G(S,U) первого уровня будут следующие виды заболеваний: Sn - заболевания сердечно-сосудистой системы; Si2 -коллагеновые болезни; Si з - болезни системы крови; S14 - болезни органов пищеварения; s - заболевания системы органов дыхания; Sig -заболевания печени и желчных путей; Sn - болезни эндокринных желез и др. Вершинами графа второго уровня - S21 - аритмии; S22 - атеросклероз; S23 - гипертоническая болезнь; S24 - гипотония; S25 - кардиосклероз атеросклеротический; S26 - коронарная недостаточность; S27 - легочное сердце; S28- миокардит и др.
Вершинами графа третьего уровня - S31 - блокада сердца; S32 -мерцательная аритмия; S33 - синусовая аритмия; S34 - экстрасистолия; S35 -атеросклероз брыжеечных артерий; S36 - атеросклероз брюшной аорты; S37 - атеросклероз грудной аорты; S38 - атеросклероз коронарных сосудов; s39 -атеросклероз почечных артерий и др.[69]. Имеется также набор показателей Zj, характеризующих состояние здоровья пациента на j-й стадии постановки диагноза. Условно можно принять, что номер j соответствует номеру уровня графа G(S,U): j = 1,2,3. Тогда набор Ъ\ может быть получен в результате первичного осмотра пациента, его опроса, ознакомления с сопроводительными документами. Последующие наборы Z2, Z3 получаются в итоге проведенных анализов, целевых обследований и т.п. В них же могут быть включены показатели, проявившие себя не в начальном периоде, а в дальнейшем течении болезни или обнаруженные при последующих осмотрах. В любом случае набор показателей Zj содержит всю имеющуюся информацию, по которой вырабатывается наиболее вероятный диагноз - диагностическое решение
Таким образом процесс принятия диагностического решения можно описать кортежем Z, S, С, Р , где С - критерии сравнения альтернатив seS на основе имеющейся водной информации Z; Р - процедура или средство выбора альтернативы: формирования пути выбора диагноза в графе G(S,U) и оценивания значений с є С.
Под диагностическим решением понимается определение вершины графа соответствующего уровня (Sji). Математически задачу вывода диагноза можно сформулировать следующим образом где c(dji) - некоторая мера доверия, отражающая истинность высказывания dji = Sjj с определенной степенью c(dji) е [0,1], зависящей в свою очередь от количества информации, содержащейся в Zj - векторе входной информации; Sj - множество вершин j-ro уровня; Прмощность множества S;.
Повышение меры доверия c(dji) возможно только путем увеличения количества информации, содержащейся в Zj. Это возможно либо путем расширения набора показателей (результатов лабораторных анализов, инструментальных исследований), что обычно осуществляется на последующих (2-й и 3-й) стадиях диагностирования, либо путем привлечения дополнительной информации об общем состоянии здоровья пациента и тенденциях его изменения, что возможно уже на ранних стадиях диагностирования (на 1-й и 2-й). В [75] показано, что такая информация может быть получена с помощью модели состояния пациента (МСП), корректирующей меру c(dji) с учетом информации об общем состоянии здоровья пациента, характеризуемого историей его болезней перенесенных и имеющихся, наследственностью, условиями проживания, работы, образа жизни и других факторов.
Учитывая разнотипность форм входной информации, содержащейся в Zj - симптомы и другие показатели могут быть как количественные так и качественные - семантические, выраженные словесно, решение задачи (4.1) необходимо выполнять средствами, инвариантными к типу данных (их физической природе, шкалам измерений, оценок и т.п.). Одним из таких средств являются логические модели :