Электронная библиотека диссертаций и авторефератов России
dslib.net
Библиотека диссертаций
Навигация
Каталог диссертаций России
Англоязычные диссертации
Диссертации бесплатно
Предстоящие защиты
Рецензии на автореферат
Отчисления авторам
Мой кабинет
Заказы: забрать, оплатить
Мой личный счет
Мой профиль
Мой авторский профиль
Подписки на рассылки



расширенный поиск

Построение баз экспертных знаний для интеллектуальных обучающих систем Кочин Дмитрий Юрьевич

Построение баз экспертных знаний для интеллектуальных обучающих систем
<
Построение баз экспертных знаний для интеллектуальных обучающих систем Построение баз экспертных знаний для интеллектуальных обучающих систем Построение баз экспертных знаний для интеллектуальных обучающих систем Построение баз экспертных знаний для интеллектуальных обучающих систем Построение баз экспертных знаний для интеллектуальных обучающих систем Построение баз экспертных знаний для интеллектуальных обучающих систем Построение баз экспертных знаний для интеллектуальных обучающих систем Построение баз экспертных знаний для интеллектуальных обучающих систем Построение баз экспертных знаний для интеллектуальных обучающих систем
>

Диссертация - 480 руб., доставка 10 минут, круглосуточно, без выходных и праздников

Автореферат - бесплатно, доставка 10 минут, круглосуточно, без выходных и праздников

Кочин Дмитрий Юрьевич. Построение баз экспертных знаний для интеллектуальных обучающих систем : диссертация ... кандидата технических наук : 05.13.01.- Москва, 2006.- 115 с.: ил. РГБ ОД, 61 07-5/95

Содержание к диссертации

Введение

1 ПРОБЛЕМЫ ПЕРЕДАЧИ ЭКСПЕРТНЫХ ЗНАНИЙ 8

1.1 Типы экспертных знаний 8

1.2 Характеристики экспертного знания 10

1.3 Интеллектуальные обучающие системы 13

1.4 Задача экспертной классификации 15

1.5 Методы выявления экспертных знаний 18

1.6 Вербальный анализ решений 20

1.6.1 Метод ОРКЛАСС 23

1.6.2 Метод КЛАНШ 24

1.6.3 Метод STEPCLASS 25

1.6.4 Метод ЦИКЛ 28

1.7 Достоверность извлеченных экспертных знаний 30

1.8 Выводы 34

2 ПОРЯДКОВАЯ ЭКСПЕРТНАЯ КЛАССИФИКАЦИЯ АЛЬТЕРНАТИВ: МЕТОД КЛАРА 37

2.1 Основные определения 37

2.2 Алгоритм классификации 39

2.3 Процедура поиска максимальной цепи 47

2.4 Оценка вычислительной сложности алгоритма клара 50

2.5 Устранение логических противоречий в ответах эксперта 51

2.6 Сравнение алгоритмов порядковой классификации 52

2.7 Оценка эффективности алгоритма клара 56

2.8 Выводы 5S

3 ИЗВЛЕЧЕНИЕ ДОСТОВЕРНЫХ ЭКСПЕРТНЫХ ЗНАНИЙ 60

3.1 Выявление решающих правил классификации 60

3.2 Построение минимального набора решающих правил 63

3.3 Процедура проверки решающих правил 69

3.4 Упрощенные задачи классификации 70

3.5 Оценка эффективности упрощенных задач 73

3.6 Гипотеза о зоне «неустойчивых знаний» 77

3.7 Методика извлечения достоверных экспертных знаний 80

3.8 Выводы 83

4 ИНТЕЛЛЕКТУАЛЬНЫЕ ОБУЧАЮЩИЕ СИСТЕМЫ 84

4.1 Кардиологические заболевания 84

4.2 Система извлечения экспертных знаний клара 86

4.2.1 Архитектура и функции системы 86

4.2.2 Структуризация задачи классификации 87

4.2.3 Построение базы знаний 89

4.3 Обучающие системы : 95

4.3. 1 Обучение декларативным знаниям 95

4.3.2 Обучение процедуралъным знаниям 98

4.3.3 Практическое применение 101

5 ЗАКЛЮЧЕНИЕ 103

6 ПРИЛОЖЕНИЯ 106

6.1 Алгоритм нумерации вершин орграфа доминирования альтернатив 106

6.2 Оценка эффективности алгоритмов порядковой классификации 107

7 СПИСОК ИЛЛЮСТРАЦИЙ 109

8 СПИСОК ТАБЛИЦ 110

ЛИТЕРАТУРА 111

Введение к работе

Во многих областях человеческой деятельности, путь развития от новичка до опытного специалиста занимает значительное время. Поэтому весьма актуальной является проблема поиска путей более быстрого и более эффективного обучения. Доступность персональных компьютеров делает возможным их повсеместное использование и в учебных заведениях, и для самостоятельной подготовки. Однако отсутствие эффективных обучающих программ не позволяет решить эту задачу в полной мере. Одной из причин такого положения вещей являются значительные методологические трудности в построении баз экспертных знаний, которые отражают практические навыки опытных специалистов - экспертов и составляют основу интеллектуальных обучающих систем (ИОС). К точности и полноте баз экспертных знаний, используемых в ИОС, предъявляются повышенные требования. Поэтому разработка новых методов построения баз экспертных знаний для интеллектуальных обучающих систем является актуальной теоретической и практической задачей.

Цель настоящей работы - развитие методов и технологий построения полных и непротиворечивых баз экспертных знаний в слабоструктурируемых предметных областях, в которых в настоящее время отсутствуют объективные модели принятия решений, и решения принимаются экспертом на основе своего профессионального опыта и интуиции. Научная новизна работы состоит в следующем: Разработан новый метод КЛАРА (КЛАссификация Реальных Альтернатив) построения полных и непротиворечивых баз экспертных знаний для слабоструктурируемых предметных областей, позволяющий повысить эффективность опроса эксперта, и применимый к широкому кругу задач порядковой экспертной классификации.

Формализовано понятие экспертного решающего правила и построен алгоритм их выявления.

Введено понятие зоны неустойчивых экспертных знаний и предложена методика выявления этой зоны.

Предложена общая методика построения достоверных баз экспертных знаний, минимизирующая случайные ошибочные суждения эксперта, а также выявляющая суждения эксперта с низкой степенью уверенности.

Построены базы знаний по диагностике острого инфаркта миокарда и расслаивающей аневризмы аорты, на основе которых созданы соответствующие интеллектуальные обучающие системы.

В первой главе рассматриваются проблемы извлечения и последующей передачи экспертных знаний с помощью интеллектуальных обучающих систем с точки зрения информационного подхода - одного из основных направлений в современной когнитивной психологии.

Указывается принципиальное различие в подходах к построению ИОС для хорошо структурируемых областей знаний, к которым относится, например, решение типовых задач математики, физики, программирования, и слабоструктурируемых областей, таких как медицинская диагностика. Рассмотрены особенности мышления экспертов, порождающие основную проблему построения ИОС для слабоструктурируемых областей, таких как, например, медицинская диагностика - проблему извлечения экспертных знаний, когда эксперты не могут сформулировать правила, которыми они пользуются при принятии решений.

На основе анализа наиболее известных обучающих систем, основанных на экспертных знаниях, делается вывод, что эффективность обучающей системы в слабоструктурируемой области зависит, главным образом, от полноты и достоверности базы экспертных знаний. Все недостатки базы знаний, в том числе неполнота, наличие противоречий и возможные несовпадения с решениями эксперта, непосредственно отражаются на качестве обучающей системы и, следовательно, на качестве обучения. При этом главную сложность представляет именно извлечение процедуральных знаний, практических навыков, потому что эти знания носят подсознательный характер и не могут быть выражены (вербализованы) экспертом в явном виде.

Формулируется задача порядковой экспертной классификации и приводится обзор подходов к её решению. Для каждого подхода анализируются его достоинства и недостатки по отношению к проблеме построения баз экспертных знаний для интеллектуальных обучающих систем. Также рассматривается проблема достоверности извлеченных знаний. Указывается, что искажение знаний может происходить из-за ошибок эксперта, связанных с рядом причин, таких как усталоств, редкая встречаемость случая на практике, недостаточность информации в формализованной задаче.

На основании проведенного анализа делаются выводы и формулируются цели исследования.

Во второй главе описывается новый алгоритм КЛАРА решения задачи порядковой экспертной классификации, имеющий широкую область применения, низкую вычислительную сложность и эффективно применимый для случаев разреженных пространств классифицируемых объектов, что особенно важно для задач медицинской диагностики.

Приводятся результаты численного моделирования, позволяющие оценить эффективность предложенного алгоритма и сравнить его с алгоритмами пространственной дихотомии, КЛАНШ, ОРКЛАСС и ЦИКЛ.

В третьей главе рассматривается проблема извлечения достоверных экспертных знаний. Результатом работы всякого метода порядковой классификации являются границы классов, по которым любую альтернативу из классифицированного множества можно отнести к одному из классов.

Путем анализа получившихся границ классов возможно выявить правила, которые породили данную классификацию.

Формализуется понятие экспертного решающего правила, приводятся алгоритмы для выявления набора решающих правил, описывающих классификацию.

Описывается методика разбиения исходной большой задачи классификации на серию задач меньшей размерности. Такая декомпозиция позволяет снизить нагрузку на эксперта и уменьшить вероятность ошибок.

Выдвигается гипотеза о возможном наличии у эксперта зоны неустойчивых знаний, когда эксперт может относить одну и ту же ситуацию к разным классам в разное время. Приводится метод локализации этой зоны, поскольку неустойчивые знания не пригодны для обучения.

Строится общая методика извлечения достоверных экспертных знаний, учитывающая все изложенные аспекты.

В четвертой главе описываются система КЛАРА извлечения экспертных знаний, реализующая предложенный метод построения полных и непротиворечивых баз экспертных знаний; система ОСДИМ для обучения навыкам диагностики острого инфаркта миокарда и система РАА для обучения навыкам диагностики расслаивающей аневризмы аорты, построенные на основе предложенных методов. Приводятся результаты применения обучающих систем при обучении молодых врачей в учебно-научном центре по внедрению передовых медицинских технологий городской клинической больницы (ГКБ) им. С. П. Боткина, г. Москва и на кафедре анестезиологии и реаниматологии Московского государственного медико-стоматологического университета (МГМСУ) в ГКБ № 33 им. А.А.Остроумова, г. Москва.

Типы экспертных знаний

Стремительный рост знаний, создаваемых человеком, делает все более актуальными задачи обучения и переобучения. Значительная часть человеческой лсизни уходит на овладение знаниями, необходимыми как для получения общего образования, так и для овладения той или иной профессией. Принято различать два типа знаний: декларативные и процедуральные. К декларативным знаниям относят описания фактов, изложение теорий, наблюдений. Учебники и научные монографии являются примерами декларативных знаний.

Процедуральные знания можно также назвать умениями, навыками. Человек овладевает процедуральными знаниями, когда он не только знает теорию, но и умеет применить ее на практике. Человека, в совершенстве овладевшего процедуральными знаниями в какой-либо области, принято называть экспертом. Путь от новичка в какой-то профессиональной области до эксперта, находящегося на вершине профессионального мастерства, требует не менее 10 лет интенсивной практики [Ericsson, Lehnmann, 1996]. Как показали исследования, этот отрезок времени является примерно одинаковым для столь разных областей человеческой деятельности, как медицина, игра в шахматы, сочинение музыки, спорт и т. д. [Ericsson, 1996].

Высокая востребованность в специалистах и большая длительность периода их становления делает актуальной проблему создания интеллектуальных обучающих систем (ИОС), позволяющих передавать знания от эксперта к новичку [Brehaut et al., 2006], [Fryer-Edwards et al., 2006], Построение ИОС является одним из направлений искусственного интеллекта и, также как и искусственный интеллект, представляет собой экспериментальную научную дисциплину. Под экспериментом в данном случае понимается построение, проверка и уточнение моделей на многочисленных примерах - наблюдениях над человеком с целью раскрыть эти модели и лучше понять функционирование человеческого разума [Лорьер, 1991]. Однако, работа по созданию ИОС представляет собой не просто использование известных методов искусственного интеллекта, а является расширением самого понятия исследований в этой области [Clancey, 1986]. То есть для решения одной задачи - построения ИОС - становится необходимым целый комплекс исследований, затрагивающих извлечение и представление знаний, модели мышления, понимание языка и т.д. (Self, 1990).

Среди моделей современной когнитивной психологии доминирует так называемый информационный подход [Hunt, 1989], рассматривающий человека как систему переработки информации [Newell, Simon, 1972]. Знание в рамках этого подхода рассматривается как комплекс реально существующих элементов (символов, образов), хранящихся в памяти человека, которые обрабатываются мозгом подобно программе в компьютере и являются источником интеллектуального поведения. В данном случае не важно, из чего состоит символ сам по себе (как он реализован на более низком уровне - уровне межнейронных связей), а под самим словом «символ» имеется в виду некоторый внутренний образ (паттерн). При этом знание рассматривается как набор взаимосвязанных и относительно статичных элементов, которые можно хранить, извлекать, модифицировать, передавать экспертной системе или другому человеку. В рамках данного подхода был разработан ряд успешных вычислительных моделей памяти (ЕРАМ [Simon, 1997]), процессов мышления и обучения (SOAR [Newell, 1990]), ACT-R [Anderson, 1983]), эксперименты с которыми показали адекватность их поведения поведению человека в психологических экспериментах.

Алгоритм классификации

Алгоритм КЛАРА (КЛАссификация Реальных Альтернатив) основан на идее дихотомии цепей альтернатив, начиная с цепи максимальной длины, впервые использованной в алгоритме ДИФКЛАСС [Ларичев, Болотов, 1996], затем в алгоритме КЛАНШ [Нарыжный, 1998], и адаптирует эту идею на случай разреженных пространств Y. Кроме того, в алгоритме КЛАРА используется новая идея адаптивной дихотомии, позволяющая быстрее находить границы классов решений и ускоряющая классификацию.

Рассмотрим основные шаги алгоритма классификации КЛАРА:

1. В начале классификации коэффициент дихотомии dt для поиска границы классов С,- и Сж полагается равным У2.

2. Орграф доминирования альтернатив G(Y,E) может иметь несколько компонент связности, поэтому последовательно исследуются все допустимые, но еще не классифицированные альтернативы из множества У . Последовательность выбора альтернатив имеет значение, она выбирается специальным образом, который описан ниже. Очередная выбранная альтернатива х$ называется исходной.

3. В текущей компоненте связности (которой принадлежит xs) орграфа G( Y, Е) строится цепь wmax альтернатив максимальной длины, проходящая через исходную альтернативу xs и содержащая максимальное число ещё неклассифицированных альтернатив из У .

4. Поскольку классы {Сп} упорядочены по качеству, границы между классами на цепи строятся последовательно, отделяя класс большего качества С„ от класса меньшего качества Сп+\.

5. Для предъявления эксперту выделяется элемент Xd цепи wmax, где d dn-L(wmax), причем если альтернатива Xd оказалась недопустимой или уже классифицированной, то в качестве нового х берется неклассифицированный допустимый элемент цепи с ближайшим индексом.

6. Эксперту предъявляется допустимая альтернатива Xj цепи wmax и проводится распространение его решения на максимально возможное число элементов, принадлежность которых к классам Сп и Сп+\ остается неопределенной.

7. Если цепь wmax еще содержит допустимые неклассифицированные элементы, то продолжается дихотомия цепи wmaxf которая завершается, когда все входящие в нее допустимые альтернативы оказываются прямо или косвенно классифицированы относительно классов Сп и С„+\. В противном случае, на цепи ищется следующая граница между классами (производится возврат на шаг 4). Если лее цепь классифицирована относительно всех классов, то для каждого класса находится индекс к в цепи wmax, где происходит смена класса с С„. на Сп+\. Полагается dm =k/L(wma). На каждом последующем шаге d„ есть среднее арифметическое всех посчитанных до этого d„w.

8. Цикл выполняется до тех пор, пока все допустимые альтернативы из допустимого множества Г не окажутся классифицированными относительно этой пары классов.

Выявление решающих правил классификации

Результатом работы всякого метода порядковой классификации являются границы классов, по которым любую альтернативу из классифицируемого множества можно отнести к одному из классов. Например, при разбиении альтернатив, оцененных по 5 критериям, на два класса простое решающее правило «Я классу 1 относятся альтернативы, у которых не менее трех высших ОЦЄУЮК» порождает следующую классификацию:

Как видно, в результате применения экспертом лишь одного простого правила, получается 20 граничных элементов.

Можно ли по виду границы класса установить правило, которое её породило? В данном случае - очень легко. Дело в том, что нижняя граница первого класса представляет собой всевозможные перестановки из трех лучших оценок и двух худших. Фактически, все десять элементов этой границы можно записать одним выражением P l) 2(2), которое означает множество перестановок из 5 элементов, 3 из которых - первая оценка, и остальные 2 - вторая оценка. Легко видеть, что такая запись весьма близка к исходному смыслу решающего правила и представляет собой только более формализованную его запись.

Подобным образом можно каждой нижней границе (кроме самой последней, которая не нужна для разделения классов) сопоставить одно или несколько таких правил. Тогда, имея какую-нибудь альтернативу, можно пройтись по этим правилам сверху вниз (от классов, соответствующих более высокому качеству, к классам, соответствующим менее высокому качеству), проверяя, удовлетворяет она правилам данного класса или нет. Если альтернатива удовлетворяет ли эта альтернатива правилам класса и не удовлетворяет правилам предыдущих классов, значит, она относится к этому классу. Подобным образом строилась модель «оракула» при оценке эффективности алгоритма классификации в разделе 2.6.

Дадим формальную постановку задачи формирования набора решающих правил. Пусть имеется некоторое произвольное множество разных альтернатив, оцененных по N критериям. Требуется описать эту совокупность альтернатив минимальным числом правил вида так, чтобы каждая альтернатива попадала ровно в одно правило.

Назовём запись (3.1) шаблоном правила. Шаблон описывает некоторое множество альтернатив. У этих альтернатив может быть некоторая общая часть, например, у всех альтернатив по первому и второму критерию выставлены оценки а и b (соответствует значениям ключевых признаков решающего правила). Запись ab именно это и означает. Вообще же, зафиксированы могут быть оценки по любым критериям и по любому их количеству. Например, если фиксированы оценки по всем критериям, то шаблон описывает единственную альтернативу. Первую часть шаблона правила, то есть а будем называть фиксированной частью правила.

К критериям, по которым в фиксированной части проставлены звёздочки , относится вторая часть шаблона которую будем называть перестановочной частью правила. Вторая часть шаблона задаёт параметры перестановок, которые осуществляются на местах, помеченных , и соответствует сочетаниям значений дополнительных признаков. Здесь п равно числу звёздочек, kj - числу оценок х-ь участвующих в перестановке.

Например, множество задаёт все перестановки из двух единиц и двух двоек, то есть шесть элементов Следовательно, шаблон задаёт тоже шесть элементов {121322, 122312, 122321, 221312, 221321, 222311}. Можно заметить, что в перестановках из множества / 2[1];2[2] участвовали только две оценки - 1 и 2, а

при объединении с фиксированной частью 2 3 в получившихся альтернативах участвуют уже 3 оценки. Тройка добавилась из фиксированной части правила. Вообще, перестановочная и фиксированная части правила независимы друг от друга, их связь состоит только в том, что число звездочек в фиксированной части должно быть равно общему числу оценок, участвующих в перестановках.

Кардиологические заболевания

Разработанная методика извлечения достоверных экспертных знаний для построения компьютерных обучающих систем была использована при создании интеллектуальных систем обучения диагностике острого инфаркта миокарда [Кочин, 2005], и расслаивающей аневризмы аорты [Кочин, Подлипский, 2004]. Работа проводилась совместно с доцентом I кафедры терапии Российской государственной медицинской академии постдипломного образования к. м. н. В. П. Кузнецовой и врачом-методистом Учебно-научного центра по внедрению передовых медицинских технологий при Городской клинической больнице (ГКБ) им. СП. Боткина Э. И. Брук. Построению базы знаний по диагностике РАА велось совместно с O.K. Подлипским.

Острый инфаркт миокарда (ОИМ) - одно из самых распространенных сердечно-сосудистых заболеваний, которое занимает первое место среди причин внезапной смерти. Наибольшее число смертельных исходов при ОИМ имеет место в первые два часа от начала заболевания. Поэтому врач должен владеть быстрыми навыками диагностики, близкими к автоматическим. Особенно драматично стоит проблема экстренной, точной диагностики ОИМ в отделениях многопрофильных больниц, в которые часто попадают больные с атипичной клинической картиной ОИМ. В этих отделениях смертность от ОИМ значительно выше, чем в профильных кардиологических отделения и в кардиореанимационных отделениях.

Овладение автоматическими навыками безошибочной экстренной

диагностики особенно важно для широкого круга врачей скорой помощи и

хирургов, анестезиологов-реаниматологов, эндокринологов,

инфекционистов, гастроэнтерологов и др.

Расслаивающая аневризма аорты (РАА), или расслоение аорты, или расслаивающая гематома - достаточно редкое и опасное заболевание, трудно диагностируемое и дающее очень высокую летальность.

Различают три формы течения РАА.

1. острая - ведет к смерти в течение нескольких часов или 1-2 дней половины больных РАА,

2. подострая - длится несколько дней, до 2-4 недель (наблюдается у трети больных РАА),

3. хроническая - длится несколько месяцев или лет (встречается очень редко).

В течение месяца умирает более 80% больных.

Данное заболевание практически не распознается врачами по причине своей уникальности, а определить начало расслоения необходимо в первые часы от начала заболевания, в противном случае больного будет уже невозможно спасти.

Достигнутые за последние годы успехи в диагностике и лечении РАА делают прогноз не таким безнадежным, как это было прежде, но требуют усовершенствования знаний и навыков врачей в своевременной диагностике этой патологии.

Таким образом, актуальной задачей является создание обучающих систем, позволяющих начинающим врачам за короткий срок существенно улучшить навыки диагностики ОИМ и РАА и тем самым уменьшить число роковых ошибок.

Для построения баз знаний обучающих систем была разработана специальная система извлечения знаний КЛАРА, реализующая метод КЛАРА.

Похожие диссертации на Построение баз экспертных знаний для интеллектуальных обучающих систем