Содержание к диссертации
Введение
Глава 1 Анализ проблем построения ПИС разработки СППР трудноформализуемых задач диагностики 10
1.1 Проблема поддержки решений задач диагностики 11
1.1.1 Обзор трудноформализуемых задач диагностики и средств для поддержки их решения 11
1.1.2 Математическая постановка задачи диагностики 15
1.1.3 Использование приближенных моделей для поддержки решений задач диагностики 16
1.1.4 Интегрированная СППР задач диагностики
1.2 Обзор существующих ПИС разработки СППР задач диагностики 25
1.3 Задача формирования базы знаний СППР
1.3.1 Анализ диагностических моделей 35
1.3.2 Классификация и анализ методов формирования функций принадлежности 38
1.3.3 Постановка задачи формирования и оценки качества диагностической лингвистической модели 40
1.3.4 Задача настройки функций принадлежности 44
1.4 Задача построения ПИС разработки СППР задач диагностики Выводы по главе 1 49
Глава 2 Метод формирования базы знаний СППР 50
2.1 Критерии оценки лингвистической модели 50
2.2 Математическая постановка задачи формирования и настройки параметров лингвистических моделей 51
2.3 Анализ возможных способов решения поставленной задачи 52
2.4 Выбор рационального способа решения задачи 57
2.5 Теоретические обоснования предложенного метода 59
2.6 Алгоритм реализации метода 60
2.7 Доказательства возможности решить поставленную задачу предложенным методом 67
Выводы по главе 2 68
Глава 3 Исследования предложенного метода 70
3.1 Задача исследования 70
3.2 Имитационные диагностические модели 71
3.3 Разработка ПС для реализации метода построения диагностических лингвистических моделей 74
3.4 Экспериментальные исследования и результаты 77
Выводы по главе 3 90
Глава 4 Разработка программного инструментального средства 91
4.1 Задача разработки ПИС 91
4.2 Разработка структуры ПИС 92
4.3 Входные данные для ПИС 96
4.4 Разработка интерфейса ПИС для ЛПР 97
4.5 Реализация и тестирование ПИС 99
4.6 Методика создания базы знаний ИСППР средствами ПИС 101
4.7 Методика построения диагностических систем повышенной точности 105
4.8 Разработка СППР задач диагностики на основе ПИС
4.8.1 АСМД анемий 108
4.8.2 Интеллектуальная система диагностики неисправностей тормозной системы автомобиля 123
Выводы по главе 4 126
Заключение 128
Библиографический список 131
Список используемых сокращений 141
- Математическая постановка задачи диагностики
- Математическая постановка задачи формирования и настройки параметров лингвистических моделей
- Разработка ПС для реализации метода построения диагностических лингвистических моделей
- Методика построения диагностических систем повышенной точности
Введение к работе
Актуальность темы исследований. Проблемам компьютерной поддержки принятия решений задач диагностики традиционно уделяется много внимания. Это связано с постоянным увеличением сложности объектов диагностики и возрастающей ролью решения задач диагностики в современном обществе. В настоящее время эта задача стала особенно актуальной ввиду скачкообразного развития мощности электронных вычислительных машин, при помощи которых стало возможным переработка огромных массивов информации и превращение их в базы знаний для интеллектуальных решающих систем, позволяющих существенно повысить качество диагностических решений за счет использования современных математических методов. Значительный вклад в исследование и решение проблем построения интеллектуальных систем внесли отечественные учёные Д.А. Поспелов, О.И. Ларичев, Э.В. Попов, Г.С. Осипов, Г.В. Рыбина, В.Н. Вагин, В.Б. Тарасов, А.Н. Аверкин и другие, а также ряд зарубежных учёных Л. Заде, У. Клэнси, Э. Шортлиф, Ф. Форсайт, К. Нейлор и др.
Для создания системы поддержки принятия решений (СППР) задач диагностики достаточно наличие базы знаний и интерпретатора. Двумя основными проблемами, которые возникают при разработке таких систем, являются: 1) сложность организации механизма получения знаний от экспертов, заключающаяся в необходимости высокой квалификация экспертов (обучение, сертификация), их согласованности, формализации экспертных знаний и фактов, а также преодоления ряда субъективных для каждого эксперта факторов (например, личной заинтересованности); 2) большие затраты времени на решение задач представления, преобразования данных в модели и выбора их параметров, а также непосредственного создания решающих правил.
Наличие относительно универсального интерпретатора делает возможным построение СППР для широкого круга задач диагностики и сводит процесс её создания в основном к процедуре разработки базы знаний. В настоящее время существует большое количество программных инструментальных средств (ПИС) для разработки СППР различного целевого назначения, но все они обладают недостатками ввиду отсутствия решений указанных выше проблем.
Таким образом, задача построения ПИС, позволяющего упростить процедуру наполнения базы знаний и ускорить процесс построения СППР, является актуальной и научнозначимой. Большой вклад в развитие технологий построения указанных ПИС для разработки интеллектуальных решающих систем внесли отечественные и зарубежные специалисты Г.В. Рыбина, И.Б. Фоминых, Б.А. Кобринский, В.Ф. Хорошевский, С.А. Романенко, О.Ю. Реброва, К.Р. Червинская, , П. Джексон, Ф. Хейес-Рот, Д. Ленат, Д. Уотермен и др.
Объектом исследования является ПИС разработки интеллектуальных СППР задач диагностики.
Предметом исследования являются теория и методы разработки ПИС.
Целью диссертационной работы является построение ПИС разработки интеллектуальных СППР задач диагностики, позволяющего сократить сроки их создания и повысить адекватность принимаемых с их помощью решений.
В соответствии с указанной целью в диссертационной работе были поставлены следующие задачи:
1. Анализ существующих методов разработки интеллектуальных СППР.
2. Разработка и исследование метода формирования моделей объектов диагностики с автоматической настройкой их параметров.
3. Построение и исследование ПИС разработки интеллектуальных СППР задач диагностики.
4. Экспериментальное исследование ПИС с целью сравнительной оценки рациональности вырабатываемых решений.
5. Практическое решение задачи создания СППР с применением разработанного ПИС и оценивание полученных результатов.
Методы исследования. Для решения поставленных задач в работе использованы методы искусственного интеллекта (модели представления и обработки знаний, методы нечеткой логики, методы инженерии знаний и имитационного моделирования), дискретной математики, системного анализа, теории оптимизации, теории принятия и обеспечения рациональности решений.
Научная новизна диссертационной работы состоит в следующем:
1. Разработан метод формирования лингвистических моделей объектов диагностики и автоматической настройки параметров.
2. Предложена структура ПИС разработки интеллектуальных СППР задач диагностики на основе метода формирования лингвистических моделей.
3. Предложена и исследована методика создания базы знаний для интегрированной СППР с помощью разработанного ПИС, позволяющая структурировать декларативные знания, процедурные знания и закономерности.
4. Предложена методика построения автоматизированных систем диагностики на основе разработанного ПИС, позволяющих повысить точность вырабатываемых решений за счет привлечения дополнительной информации, отображающей особенности объекта диагностики.
Достоверность научных результатов подтверждена теоретическими и экспериментальными исследованиями, выполненными путем моделирования; результатами функционирования ПИС разработки интеллектуальных СППР задач диагностики, а также актами о практическом внедрении и использовании в производственной деятельности.
Практическая значимость. Результаты работы могут быть использованы при создании подсистем моделирования, а также для поддержки процессов формирования базы знаний интегрированных СППР трудноформализуемых задач диагностики в различных областях человеческой деятельности. Их применение позволяет:
- сократить объем данных, требуемый для инициализации СППР;
- уменьшить количество времени, затрачиваемое на формирование базы знаний, за счет увеличения степени автоматизации этого процесса;
- повысить адекватность формируемых моделей диагностики, а также эффективность СППР.
Созданное ПИС позволяет разрабатывать и настраивать интеллектуальные СППР для различных задач диагностики, а также производить формирование лингвистических моделей диагностики на основе экспериментальных выборок данных.
Предложенная методика построения автоматизированных систем диагностики может быть полезна при создании интеллектуальных медицинских систем, способных вырабатывать диагностическое решение с учетом индивидуальных особенностей состояния здоровья конкретного пациента за счет формирования соответствующей модели.
Практическая значимость работы подтверждается использованием ПИС разработки СППР задач диагностики на основе предложенного в диссертационной работе метода для реальных, а также для виртуальных объектов диагностики, поведение которых описывается линейной и нелинейной функциями.
Реализация и внедрение результатов диссертационной работы. Разработанные средствами ПИС интеллектуальные системы используются в дилерском центре ООО "Лаура-Тула" для классификации и выявления наиболее устойчивых закономерностей причин неисправностей автотранспортных средств по накапливаемой в процессе обслуживания клиентов информации с целью улучшения качества и скорости выполнения процедур их диагностики и ремонта.
Разработанный с помощью ПИС и предложенных методик программный комплекс "Автоматизированная система медицинской диагностики анемий" прошел тестовую эксплуатацию. Результаты диссертационной работы используются в диагностической и лечебной практике в ГУП ТО НИИ новых медицинских технологий. В рамках разработанного программного комплекса сформированы диагностическая лингвистическая модель и модель состояния здоровья пациента, позволяющая учитывать предрасположенность пациента к определенным заболеваниям.
Теоретические результаты работы используются в учебных курсах «Введение в системы искусственного интеллекта», "Теория принятия решений", "Теория интеллектуальных компьютерных систем" на кафедре ЭВМ Тульского государственного университета, в дипломном проектировании бакалавров и инженеров по специальностям «Вычислительные машины, комплексы, системы и сети» и «Комплексное обеспечение информационной безопасности автоматизированных систем», а также в лабораторном практикуме указанных дисциплин.
Положения, выносимые на защиту:
1. Метод формирования лингвистических моделей объектов диагностики и автоматической настройки параметров функций принадлежности термов лингвистических переменных по экспериментальным выборкам данных, позволяющий обеспечить стохастическую устойчивость получаемых решений.
2. Структура ПИС, базирующаяся на разработанном методе и позволяющая упростить процесс создания СППР задач диагностики.
3. Методика создания базы знаний для интегрированной СППР с помощью разработанного ПИС, позволяющая встраивать в систему декларативных и процедурных знаний закономерности.
4. Методика построения автоматизированных систем диагностики повышенной точности за счет использования разработанного ПИС.
Апробация работы. Основные положения и результаты диссертационного исследования докладывались и обсуждались на научных конференциях и семинарах: 1.«Проблемы экономики и информатизации образования». IV научно-практическая конференция, ТИЭиИ, Тула, 2007г. 2.«Системы управления электротехническими объектами». IV Всероссийская научно-практическая конференция, ТулГУ, Тула, 2007г. 3.«Интеллектуальные и информационные системы». Всероссийская научно-техническая конференция, ТулГУ, Тула, 2007- 2009г.г. 4.«Интеллектуальные системы и технологии». Научная сессия МИФИ, Москва, 2008г. 5.«Реинжиниринг бизнес-процессов на основе современных информационных технологий. Системы управления знаниями». XI научно-практическая конференция, МЭСИ, Москва, 2008г. 6.«Перспективы развития телекоммуникационных систем и информационные технологии». Заочная международная научно-практическая конференция, СПбГПУ, Санкт-Петербург, 2008г. 7.«Информационные технологии». 45 научно-практическая конференция профессорско-преподавательского состава ТулГУ, Тула, 2009г.
Публикации. По теме диссертационного исследования опубликовано 11 печатных работ, в том числе 5 статей и 6 работ в сборниках трудов конференций.
Структура и объем работы. Диссертация состоит из введения, четырех глав, заключения, библиографического списка (121 наименование), списка используемых сокращений и приложений. Объем работы без приложений составляет 140 страниц.
Математическая постановка задачи диагностики
Задача диагностики заключается в определении (оценке) состояния объекта диагностики по его признакам.
Множество всех задач, в том числе и задач диагностики, можно условно разделить на 3 класса [1-3]: хорошо формализуемые (структурированные), неформализуемые (неструктурированные) и трудноформализуемые (частично структурированные).
В структурированной задаче известны все её элементы и связи между ними, имеется возможность выразить её содержание в форме точной математической модели. Хорошо формализуемой задачей, например, является расчет заработной платы [4].
В неструктурированной задаче невозможно выделить её элементы и установить связи между ними. Их решение из-за невозможности создания математического описания и разработки алгоритмов обычно принимает человек из эвристических соображений на основе своего опыта, косвенной информации [5]. В качестве примера неформализуемой задачи можно привести [6] задачу оценивания художественного произведения. Таких задач не много, и с задачей диагностики они почти не пересекаются.
В работах [7,8] показано, что в практике существует сравнительно немного полностью структурированных или совершенно неструктурированных задач диагностики. Обычно задачи имеют часть известных элементов и связей между ними. Такие задачи называются трудноформализуемыми (ТФЗ) и имеют ряд особенностей [9-11]: 1) отсутствует четкая формальная постановка задачи и/или цель решения; 2) имеет место неполнота, ошибочность, неоднозначность и противоречивость исходной информации и методов её преобразования; 3) необходимо применение эвристических процедур поиска решения; 4) априорно неизвестны закономерности процессов, протекающих в системе; 5) поведение системы отображается в среде разнотипных данных; 6) не существует числового критерия, однозначно отображающего качество функционирования системы при влиянии на неё возмущающих воздействий; 7) решение задачи требует большого количества информации, которая не может быть получена обработкой только количественных данных; 8) система, относительно которой принимается решение, обладает большим количеством внутренних связей, которые могут проявляться в процессе её функционирования; 9) состояние системы, определяющее значения всех выходных переменных, не доступно для непосредственных измерений; 10) случайные воздействия на систему, относительно которой принимается решение, не доступные для измерений, не могут быть описаны конкретным законом распределения, известно только, что значения ограничены; 11) невозможно долгосрочное прогнозирование траектории движения системы.
К ТФЗ диагностики относятся, например, задача распознавания образов, задача определения и оценки состояния сложных систем (не обязательно технических), задача медицинской диагностики и др.
По виду и количеству используемой для принятия решения информации ТФЗ диагностики можно разделить на два больших класса [10]: 1) задачи, решение которых не требует диагностических моделей; 2) задачи, решение которых не эффективно без привлечения информационных диагностических моделей.
Задачи первого класса успешно решаются системами поддержки принятия решения или системами выбора альтернатив (СВА) [12-15] и экспертными системами (ЭС) [16,17]. Такие диагностические системы содержат базу данных (БД), содержащую информацию об анализируемых объектах (фактографические данные, ID), и базу моделей, где хранятся модели многокритериального сравнительного анализа альтернатив. Главным отличием ЭС является возможность редактирования базы моделей инженером по знаниям с привлечением экспертных правил (1К), например в виде некоторого набора эвристических правил типа «ЕСЛИ-ТО». Это позволяет эффективно решать задачи экспертной оценки и диагностики [18] в тех предметных областях, где знания представлены в описательной форме, и где затруднительно, а иногда и невозможно, использовать математический аппарат.
Из наиболее известных современных отечественных СВА можно выделить: СППР «Выбор» (www.ciritas.ru), СППР «Курс» (www.curs.ru), а также «СППР при управлении товарными запасами и закупками» (ООО «Тримас Групп», г.Москва); из экспертных систем - ЭС «Эксперт» (ГНЦ РФ ВНИИ геосистем).
Информационные модели (ИМ) позволяют определить состояние объекта диагностики путем обработки входной информации в соответствии с функциями элементов, его составляющих. Обычно они представляют собой функциональные модели.
Для ТФЗ диагностики ИМ априорно неизвестны, но при достаточном количестве информации различного типа (как априорной, так и апостериорной) они могут быть построены с помощью системы моделирования, ориентированной на поддержку решения такой задачи. Для этого привлекается информация более высокого уровня, получаемая путем обработки информации более низких уровней: ID, Ік и др.
В зависимости от достижимости качества, задачи диагностики второго класса могут быть разделены на две группы: задачи с ИМ, адекватность которых достижима (Z{), и задачи с ИМ, адекватность которых недостижима из-за недостатка информации (Z2). В последнем случае в качестве ИМ используются приближенные модели, которые могут быть как функционального, так и логического или лингвистического типов. Для задач Z2 достижимо только рациональное решение, отстоящее в метрике критерия на некоторую допустимую величину. Таким образом, ТФЗ диагностики с большим количеством альтернатив, решение которых требуется получить при помощи СППР, разрабатываемых средствами ПИС, можно описать кортежем Zl2={S,X,D,Y,I,G,0,T,L), (1) где S — конечное множество состояний объекта диагностики; X — множество факторов, влияющих на состояние объекта диагностики; Y — множество показателей, определяющих состояние объекта диагностики; D — множество возможных диагностических решений; / — информация, необходимая для принятия диагностических решений; G — принцип оптимальности (цель решения); О - векторный критерий оценки качества диагностического решения; Т - возможные действия над множеством альтернатив D или алгоритм решения задачи; L — система предпочтений лица, принимающего решение (ЛПР). Здесь I = (lD,IK,IS: JM), где ID - информация, заключающаяся в массиве фактографических данных и хранящаяся в БД диагностической системы; 1К — информация, заключающаяся в наборе знаний о предметной области, включающих эвристические правила, и хранящаяся в БЗ диагностической системы; Is — информация, необходимая для выполнения процедур классификации ситуаций; 1М - информация, заключающаяся в математических моделях, тип которых зависит от объекта диагностики. Это такие задачи диагностики, как оценивание состояния сложной системы (технической, экономической, медицинской, социальной и др.), распознавание образов, оценивание параметров сигналов с априорно неизвестными характеристиками, медицинская диагностика и т.п.
Для поддержки задач диагностики (1) применяются интегрированные СППР [19,20]. Основной их особенностью является использование для принятия решений приближенных диагностических моделей, с удовлетворительной точностью описывающих поведение и особенности объекта диагностики. Указанные интегрированные СППР и будут являться объектом разработки ПИС, исследуемого в данной диссертационной работе.
Математическая постановка задачи формирования и настройки параметров лингвистических моделей
Полный перебор — метод решения задачи путем перебора всех возможных вариантов. В работе [84] показано, что любая задача из класса NP может быть решена полным перебором, но, в зависимости от количества всех возможных решений, метод может потребовать экспоненциального времени работы [85].
Случайный поиск [86] на каждой итерации предполагает генерацию значений параметров на основе генератора случайный чисел с заданным законом распределения. Основным входным параметром является глубина случайного поиска s. Метод случайного поиска параметров сходится быстрее [87], чем метод их полного перебора, но не гарантирует достижение глобального оптимума. В методе покоординатного спуска выбирается начальная точка, с которой поочередно производится спуск по каждой координате Xj, т.е. решается задача одномерной минимизации. Если линия уровня имеет изломы, что соответствует "оврагам" на поверхности, то данный метод становится непригодным.
Градиентные методы решения задач математического программирования [88-91] основаны на поиске экстремума функции путем последовательного перехода к нему с помощью градиента этой функции. Формально решение состоит в построении релаксационных последовательностей вида fi k+l = Q k $ Srad J(eM (Я k )) где gradj{e {Q.jcyj=j{e /i{Q.jiy) - направление спуска, определяемого градиентом; Л — длина шага вдоль этого направления (длина шага может быть постоянной и переменной, причем оптимальный ее размер обеспечивает наискорейший спуск или подъем), к — дискретное время.
В общей ситуации, теоретическая скорость сходимости метода наискорейшего спуска не выше скорости сходимости градиентного метода с постоянным (оптимальным) шагом [92]. Методы же сопряженных градиентов отличаются более высокой скоростью сходимости [93,94], которая при определенных предположениях относительно целевой функции, приближается к скорости сходимости методов второго порядка.
Заметим, что методы одномерной оптимизации, т.е. алгоритмы поиска экстремума функции одной переменной, являются составной частью многих методов многомерной оптимизации [95]. От правильной организации одномерного поиска существенно зависит успех решения всей задачи [96].
Процесс оптимизации на основе математических методов второго порядка будет иметь вид П +1 =&к -ак-{гП{ем(Пк))У1 -У(ем(Пк)). (26) Итерационный процесс (26) строит последовательность точек {О. }, которая при определённых предположениях сходится к некоторой стационарной точке Q функции j(e (Q)), т.е. к точке, в которой J \д,/\р ])=0- Если матрица вторых производных J (ед/ір )) положительно определена, эта точка будет точкой локального минимума функции J(e2\,j (п)). Для квадратичной целевой функции метод Ньютона находит минимум за один шаг. В общем случае вектор и (ем&к))) J (ем( к)) имеет большую составляющую вдоль оси оврага и значительно ближе к направлению на минимум, чем антиградиент. Этим объясняется более высокая сходимость метода Ньютона. Недостатками метода Ньютона является то, что он, во-первых, предполагает вычисление вторых производных и, во-вторых, может расходиться, если начальное приближение находится слишком далеко от минимума.
Более совершенной реализацией классического метода Ньютона является метод Левенберга (или регуляризованный метод Ньютона), в котором предполагается формирование нелинейной функции релаксации. Однако его сходимость значительно снижается при аппроксимации производных конечными разностями [10].
Метод с экспоненциальной функций релаксации, также как и все методы оптимизации рассматриваемого класса требует вычисления матрицы вторых производных, при этом, при определенных условиях, имея более высокую скорость сходимости [10], чем градиентный метод наискорейшего спуска.
Метод с чебышевскилш функциями релаксации использует смещенные полиномы Чебышева второго рода. Метод требует приблизительно в 11 раз меньше вычислений по сравнению с методом сопряженных градиентов, но может приводить к значительному возрастанию влияния вычислительных погрешностей, т.е. снижению точности.
Гибридные методы поиска решений заключаются в использовании нескольких математических или эвристических методов в различных сочетаниях [97]. Это позволит преодолеть сложности, связанные с поиском глобального минимума функции в заданной области, где она не являются унимодальной, а также значительно сократить время поиска решения.
Для выбора наиболее рационального способа решения задачи многомерной оптимизации (23) необходимо выделить основные достоинства и недостатки возможных подходов к её решению, теоретические аспекты которых были рассмотрены в предыдущем разделе.
Решение задачи (23) полным перебором значений векторов Ф, X при любом виде функционала (22) позволяет найти их наилучшую комбинацию, т.е. определить глобальный минимум целевой функции. Данный подход является наиболее универсальным, но в отличие от всех остальных возможных требует максимального количества времени на выполнение процедуры поиска. Это его единственный, но крайне значимый недостаток.
В отличие от метода полного перебора процедуры минимизации функций методом случайного поиска параметров на практике требуют меньшего времени для выполнения. Несмотря на это преимущество, данный подход не дает полной уверенности в нахождении глобального минимума. Определяющим фактором отношения "сходимость — затраченное время" здесь является количество итераций случайного поиска. Установка этого значения является отдельной и зачастую сложной и неоднозначной задачей.
Эвристический поиск параметров с привлечением экспертов в проблемной области или инженера по знаниям недопустим исходя из задач, поставленных в диссертационной работе.
Известно, что класс градиентных методов оптимизации имеет относительно высокую скорость сходимости и небольшую вычислительную трудоемкость. В зависимости от типа градиентного метода и его начальных параметров, они позволяют найти окрестность минимума многомерной функции, являющейся унимодальной. Учитывая тот факт, что целевая функция в оптимизационной задаче (23) может не удовлетворять этим условиям, имеется большая вероятность того, что при использовании данных методов в "чистом" виде решение будет найдено в окрестностях одного из локальных минимумов.
Методы многомерной оптимизации второго порядка имеют наибольшую скорость сходимости, но требуют вычисления вторых производных. Данная процедура связана с параметрической перестройкой всей модели, и, вероятнее всего, будет иметь максимальную трудоемкость.
Теоретически наилучшее решение задачи многомерной оптимизации (23) может быть получено при использовании сочетания математических методов. В основном это объясняется тем, что ни один из рассмотренных методов не позволяет определять глобальный минимум функционала (22) или будет требовать для выполнения этой процедуры очень большого количества времени.
Учитывая то, что выбранный способ решения поставленной задачи по возможности должен обладать минимальной сложностью программной реализации и иметь максимальную производительность процедур поиска решений, в качестве математических методов могут быть с успехом применимы методы оптимизации первого порядка. При этом решение задачи одномерной минимизации вдоль направления антиградиента может быть найдено методом полного перебора.
Таким образом, для решения задачи (23) может быть использован метод случайного поиска для выработки векторов начальных приближений Ф и X, каждый из которых становится начальным параметром для очередной процедуры минимизации целевой функции одним из градиентных методов. Основная идея такого подхода - минимизация целевой функции, которая имеет несколько локальных минимумов.
Разработка ПС для реализации метода построения диагностических лингвистических моделей
Выводить требуемую информацию в числовом (значения критериев, максимальное и текущее количество уникальных конъюнкций модели, её различимость, степень полноты и др.) или графическом виде (графики зависимости ошибки модели от её параметров, гистограммы распределения значений переменных по интервалам и термам и др.).
Разрабатываемая средствами ПИС СППР должна работать в двух режимах: режиме обучения, позволяющему настроить разрабатываемую систему средствами ПИС, и рабочем режиме, дающем пользователю возможность непосредственной выработки диагностических решений.
Для реализации поставленных задач ПИС должна иметь следующую структуру (рис.13). Модуль инициализации начальных параметров позволяет вводить начальные значения множества Q в ручном режиме или производить их автоматическое определение по обучающим выборкам данных. Указанный модуль реализует начальный этап процедуры Тмі м) построения лингвистических моделей, предложенной во второй главе диссертации, производя формирование первого приближения лингвистической модели. Модули изменения параметров р и % совместно с модулем формирования модели служат для реализации ядра процесса моделирования. f ( Пользователь )
Модуль обучения служит для пополнения базы данных контрольными и обучающими выборками вида (13). Модули оценки модели и вывода информации позволяют получать всю требуемую пользователем информацию в текстовом или графическом виде, например, рассчитывать значения критериев, строить графики зависимости критериев от параметров множества Q и гистограммы распределения значений заданных переменных по равным интервалам или имеющимся термам лингвистических переменных и др. Модуль автоматической корректировки параметров позволяет пользователю выполнить процедуры настройки имеющейся модели по контрольным выборкам данных. Данный модуль реализует настроечный этап процедуры Tj\f {Ем) - итерационный процесс (28).
Внешними модулями по отношению к ПИС являются база данных и база знаний. В базе данных хранятся обучающие и контрольные выборки, глобальная информация для процесса моделирования. В базе знаний хранятся сформированные лингвистические модели вида (12), которые, в зависимости от реализации СППР задач диагностики, отображают зависимости (2) и/или (3), а также параметры Q ФП термов их ЛП. Графический интерфейс пользователя обеспечивает ему доступ к разработанному инструментарию, предоставляемому созданным программным средством.
Рассмотрим взаимодействие основных модулей, представленных на рис.13. Модуль инициализации начальных параметров может быть активирован через графический интерфейс пользователя. Он, получая выборки данных из базы данных, полностью определяет всю матрицу Q начальных параметров модели и передает её модулю изменения параметров.
Модуль изменения параметров производит получение матрицы Q, и, после передачи её модулю проверки параметров и получения «положительного решения», активирует модуль формирования модели, параллельно занося матрицу Q в базу знаний. Модуль изменения параметров возвращает результат, полученный от модуля проверки параметров.
Модуль формирования модели взаимодействует с базой данных, получая выборки данных, и базой знаний, получая матрицу Q. и записывая полученную лингвистическую модель.
Модуль автоматической корректировки параметров может быть активирован через графический интерфейс пользователя. Данный модуль в зависимости от информации, полученной от модуля оценки модели, корректирует значения матрицы Q, отправляя её модулю изменения параметров.
Модуль оценки модели может быть активирован модулем автоматической корректировки параметров или модулем вывода информации. Этот модуль производит оценку качества лингвистических моделей, получаемых из базы знаний, по заданным в ПИС критериям. Его выходом является значение критерия (15) или (22).
Модуль вывода информации взаимодействует с модулем оценки модели, базой данных для получения выборок и базой знаний для получения лингвистической модели и матрицы Q. с целью отображения требуемой ЛПР информации в удобном и понятном для него виде.
Предполагается, что матрица текущих параметров модели Q., первоначально определенная модулем инициализации начальных параметров, на этапе разработки СППР доступна всем модулям ПИС. По завершении настройки СППР она записывается в её базу знаний.
Общая последовательность действий пользователя для создания новой СППР задач диагностики средствами ПИС будет описана далее в рамках разработки требований к интерфейсной части (раздел 4.4).
Указанный механизм формирования лингвистической модели, не требующего участия инженера по знаниям, позволяет значительно увеличить степень автоматизации процесса приближенного моделирования.
Названия блоков и соответствующих процедур, представленных на рис.14, отражают их функциональное назначение, которое было описано выше к рис.13. 4.3 Входные данные для ПИС
Выборки данных вида (13) могут быть получены в результате проведения экспериментов над объектом диагностики и зафиксированы при помощи датчиков в виде количественных значений, упорядоченных в форме матрицы. Каждая строка матрицы представляет собой одно наблюдение за объектом диагностики. При этом если значение того или иного показателя является качественным, в матрицу заносится только номер строки в таблице соответствия, которая хранит её значение на естественном языке. В разделе 4.8 будет показано на примерах каким образом возможно сформировать экспериментальные выборки данных в области медицинской и технической диагностики.
Достоверность данных. Это обязательное требование, которое напрямую связано с адекватностью получаемой лингвистической модели объекту диагностики. Указанное требование должно быть выполнено пользователем ПИС. 2. Полнота данных. Это обязательное требование, которое позволяет избежать пропусков значений в матрице (13). Его необходимость обусловлена требованием достоверности данных, которое будет обеспечено только путем исключения наблюдений, содержащих неопределенные значения показателей. К примеру, при замене неопределенных значений показателей нулевыми будет выполнено требование полноты, но не выполнено требование достоверности данных. Требование полноты данных может быть выполнено самим ПИС в автоматическом режиме при загрузке выборки.
Методика построения диагностических систем повышенной точности
Объективность полученных оценок, а, следовательно, и степень адекватности модели, будет зависеть от количества экспертов и от выбранного метода их (оценок) получения. Например, можно воспользоваться процедурой итеративного опроса, основанной на методе «Дельфи» [121], которая обеспечивает высокий уровень объективности экспертных оценок за счет применения механизмов обратной связи. В результате для оценки адекватности МСЗП был выбран первый подход - использование статистических выборок данных.
В качестве критерия для оценки качества лингвистической МСЗП как с привлечением так и без привлечения экспертов предлагается использовать усредненную ошибку модели: где bf —основании факторов общего состояния здоровья пациента наименование терма выходной переменной, имеющего максимальное значение ФП, полученного по лингвистической МСЗП в результате г-го эксперимента; b — наименование заболевания (поставленного пациенту диагноза), на которое указывает внешний источник (в нашем случае контрольная выборка данных) на на / -ом эксперименте; к — количество экспериментов.
Адекватность МСЗП оценивалась следующим образом. Количество экспериментов было установлено как к = 1000, т.е. объем контрольной выборки данных составил N вд = 1000 строк. На каждом эксперименте i = \,...,k из /-строки контрольной выборки данных бралось N = 47 (см. приложение 1) значений факторов общего состояния здоровья пациента. Эти входные переменные для сформированной МСЗП преобразовывались в лингвистические. В результате определялось наименование заболевания как наименование выходного терма лингвистической МСЗП, имеющего максимальное значение ФП, полученного на основании совокупности входных Это наименование заболевания сравнивалось с указанным в контрольной выборке данных, также преобразованного в терм выходной ЛП МСЗП. По формуле (42) определялась усредненная ошибка модели, представляющая оценку (обратную) степени её адекватности.
Для рассматриваемой МСЗП, используемой на третьей СВДР, значение усредненной ошибки Еа составило 1,2% (988 из 1000 экспериментов завершились совпадением результатов), что позволяет говорить об эффективности предложенного метода формирования лингвистических моделей и репрезентативности выборки.
Для построения МСЗП средствами ПИС для начальной стадии диагностирования в АСМД анемий использовалась информация в виде следующих факторов общего состояния здоровья пациента, характерные для всех видов анемий: сонливость, вялость; характер питания, бледность кожных покровов, утомляемость, общая слабость, головокружение, снижение работоспособности, головная боль, нарушение памяти. Указанная информация была представлена так же, как это показано в приложении 1.
По результатам тестирования в ГУП ТО НИИ новых медицинских технологий была показано эффективность созданной средствами ПИС АСМД анемий.
Задача диагностики автотранспортных средств является достаточно распространенной. Одной из важных систем автомобиля является тормозная система. Эффективная и точная диагностика неисправностей тормозной системы является крайне важной для человека, эксплуатирующего транспортное средство, а, следовательно, и для организации, предоставляющей ему данный вид услуги.
С помощью ПИС разработана интеллектуальная система диагностики неисправностей тормозной системы автотранспортных средств, которая используется в дилерском центре ООО "Лаура-Тула". Принципы построения данной диагностической системы аналогичны рассмотренной ранее АСМД анемий, поэтому остановимся на наиболее важных моментах её реализации и результатах внедрения.
Общая схема определения неисправности в разработанной средствами ПИС диагностической системе представлена на рис.22.
Согласно предложенной методике повышения точности (см. раздел 4.7) функция correct (40) представляет собой механизм определения значений вектора Tj с учетом числовых показателей датчиков диагностического стенда и общего состояния автомобиля. Неисправности упорядочиваются по степени опасности или по возрастанию сумм прямых и косвенных убытков, которые будут с ними связаны.
Произведено формирование диагностической лингвистической модели тормозной системы автомобиля вида (12), где каждый терм а „/ 1-й входной ЛП представляет р-е значение 1-го показателя для определенного вида диагностики технического состояния элемента тормозной системы, а терм Ь выходной ЛП- наименование А:-й неисправности, k = l...Lj. Аналогичным образом сформирована модель общего состояния автомобиля. Для этого получена выборка данных, которые были накоплены в процессе диагностики и ремонта автомобилей в период с 2007 по 2009 г.г. и зафиксированы в виде значений показателей результатов проведенных видов диагностики по ГОСТР 51709-2001 специализированным программно-аппаратным комплексом «RAV4».
Программно-аппаратный комплекс «RAV4» включает два специальных диагностических стенда и программное обеспечение, позволяющее управлять процедурой диагностики. Программная часть содержит базу данных, в которой хранятся все количественные значения показателей датчиков, полученные в результате проведения диагностики каждого транспортного средства. Недостатком данного комплекса, определившим потребность в создаваемой СППР диагностики неисправностей тормозной системы, явилось отсутствие интеллектуальной подсистемы, способной самостоятельно вырабатывать диагностическое решение, включая возможность привлечения дополнительной информации для повышения его точности.
В рассмотренной интеллектуальной системе определено пространство выходных признаков-неисправностей в виде следующих термов ЛП (12 шт.): «тормозные колодки» (для каждой оси), «воздух в системе» (для каждого колеса), «главный тормозной цилиндр», «рабочий цилиндр» (для каждого колеса), «вакуумный усилитель». Пространство входных признаков-факторов в виде числовых показателей датчиков диагностического стенда определено следующими ЛП (16 шт.): «Тормозное усилие колеса автомобиля» (для каждого колеса, в т.ч. с использованием ручного торможения), «Разность тормозных усилий на одной оси» (для каждой оси, в т.ч. с использованием ручного торможения), «Биение тормозных дисков» (для каждого колеса). Пространство входных признаков-факторов общего состояния автомобиля определено следующими ЛП (11 шт.): ««Количество лет эксплуатации», «Климатические условия эксплуатации», «Количество месяцев до предыдущего технического осмотра», «Наличие «не родных» деталей в тормозной системе автомобиля» и др.
Применение разработанной средствами ПИС интеллектуальной системы в дилерском центре ООО «Лаура-Тула» позволило сократить время диагностики тормозной системы одного транспортного средства приблизительно на 4 минуты («25%), что сделало возможным принимать дополнительно 2 автомобиля за рабочую смену на данном диагностическом стенде. Таким образом, основной эффект (в частности, экономический) от использования указанной системы заключается в увеличении прибыли организации приблизительно на 18000 руб./мес. вне зависимости от формы оплаты труда диагностов. В качестве косвенного положительного эффекта от внедрения системы можно отметить уменьшение времени ожидания клиентом дилерского центра окончания данного вида диагностики, а также и остальных видов за счет использования освободившегося времени диагностом на выполнение других видов работ.
Показано, что для разработки и настройки двух реализованных СППР необходимость привлечения инженера по знаниям отпадает, поскольку всю сложную работу по построению модели как основной части диагностической системы выполняет ПИС полностью автоматически, исключая этап «ручного» задания её параметров. Задача создания СППР средствами ПИС в таком случае сводится к введению выборки данных и указанных выше входных параметров лицом, принимающим решение.