Введение к работе
Актуальность темы. Важнейшим классом интеллектуальных информационных систем являются нечеткие системы (НС), в которых используется продукционная модель представления знаний в виде «если-то» правил, совокупность которых составляет базу правил (БП). Особенностью НС является то, что для описания поведенческих характеристик моделируемой системы используется лингвистическая аппроксимация, которая обеспечивает «прозрачность» представления моделируемой системы за счет использования естественного языка. Поэтому в случаях, когда необходимо представить алгоритм работы системы в форме, удобной для восприятия (например, для его анализа человеком-экспертом), возникает задача автоматизированного проектирования наблюдаемых НС с заданным соотношением точности аппроксимации и уровнем интерпретируемости, которая позволяет наглядно представить механизм вывода и произвести его верификацию и анализ до реальной эксплуатации разработанной системы.
Однако, само определение интерпретируемости применительно к НС является достаточно размытым, и в настоящий момент среди исследователей (F. Herrera, M. Gasto, Y. Jin,S. Guillaume, H. Ishibuchi, J.Alonso, V. De Oliveira, P. Pulkkinen, W. Pedrycz,R. Alkala) отсутствует однозначное понимание, что подразумевать под этим свойством. Вследствие этого, возникает необходимость в уточнении понятия интерпретируемости, а также в определении набора показателей, которые максимально полно характеризуют данное свойство как с количественной, так и с качественной стороны. С практической точки зрения решение данной проблемы позволит повысить эффективность работы НС и их объяснительную способность.
Таким образом, актуальность диссертационного исследования обусловлена необходимостью формализации понятия интерпретируемости, а также разработки модельных и алгоритмических решений для обеспечения оптимального соотношения между точностью и интерпретируемостью НС различного назначения.
Тематика диссертационной работы соответствует одному из основных научных направлений ФГБОУ ВПО «Воронежский государственный технический университет» - «Вычислительные комплексы и проблемно- ориентированные системы управления».
Цель работы и задачи исследования. Целью диссертационной работы является развитие подходов для формализации свойства интерпретируемости и разработки интерпретируемых нечетких систем с применением эволюционных вычислений.
Для достижения поставленной цели решались следующие задачи:
-
Анализ подходов к определению свойства интерпретируемости НС.
-
Формализация свойства интерпретируемости на различных этапах проектирования НС.
-
Разработка комплекса алгоритмов для проектирования баз знаний НС с учетом требований интерпретируемости, а также динамических и статических ограничений для параметров интерпретируемых НС.
-
Разработка и тестирование программного комплекса (ПК), реализующего эволюционные алгоритмы нечеткой кластеризации, для проектирования интерпретируемых НС на основе экспериментальных данных.
Методы исследования основаны на теории нечеткого моделирования, теории оптимизации, нечеткой логике, методах эволюционных вычислений. При написании программного обеспечения использовалась технология объектно-ориентированного программирования.
Научная новизна. В диссертации получены следующие результаты, характеризующиеся научной новизной:
-
перечень формализованных свойств интерпретируемости НС, отличающийся иерархическим представлением и позволяющий обеспечить интерпретируемость на разных уровнях проектирования;
-
многоагентная система, реализующая эволюционный алгоритм для проведения нечеткой кластеризации с использованием пула целевых функций, основанных на различных индексах нечеткого разбиения, что позволяет учитывать различные свойства исследуемых данных и критерии качества кластеризации;
-
совокупность статических и динамических ограничений на значения параметров гауссовых функций принадлежности, позволяющих учитывать свойства интерпретируемости на уровне термов и шкал лингвистических переменных при проектировании нечеткого классификатора;
-
многокритериальный эволюционный алгоритм, отличающийся оригинальными операторами кроссинговера и мутации и позволяющий проектировать базы нечетких классификаторов с учетом статических и динамических ограничений на функции принадлежности термов для обеспечения свойства интерпретируемости;
-
архитектура программного комплекса «FuzzySystemDesigner» для разработки баз знаний интерпретируемых НС, отличительной особенностью которого является возможность пошаговой настройки параметров алгоритмов в соответствии с необходимым уровнем показателей интерпретируемости.
Практическая значимость работы. В рамках диссертационного исследования разработан программный комплекс, позволяющий автоматизировать процедуру проектирования нечетких классификаторов, обладающих оптимальным соотношением точности и интерпретируемости. Предложенные в диссертации модели и методы формирования интерпретируемых НС значительно повышают степень восприятия результатов работы программного комплекса и могут найти практическое применение в областях, где необходима прозрачность формирования результата логического вывода, например в таких экспертных системах, где предусмотрен механизм объяснений.
Область исследования. Содержание диссертации соответствует следующим пунктам Паспорта специальности 05.13.01 «Системный анализ, управление и обработка информации»: п.5 - «Разработка специального математического и алгоритмического обеспечения систем анализа, оптимизации, управления, принятия решений и обработки информации», п.10 - Методы и алгоритмы интеллектуальной поддержки при принятии управленческих решений в технических системах», п.12 - «Визуализация, трансформация и анализ информации на основе компьютерных методов обработки информации».
Реализация и внедрение результатов работы. Теоретические результаты диссертации используются в учебном процессе ФГБОУ ВПО «Воронежский государственный технический университет» при чтении спецкурсов, выполнении дипломных проектов. Разработанный ПК используется в качестве подсистемы анализа данных в ООО «KeySoft» для формирования наблюдаемых экспертных систем с заданным уровнем интерпретируемости.
Апробация работы. Основные результаты диссертации докладывались и обсуждались на следующих конференциях и семинарах: Всероссийская конференция «Новые технологии в научных исследованиях, проектировании, управлении, производстве» (Воронеж, 2008-2012); VIII-XII Международная научно-методическая конференция «Информатика: проблемы, методология, технологии» (Воронеж, 2008-2012); Международная конференция «Актуальные проблемы прикладной математики, информатики и механики» (Воронеж, 2012), а также на ежегодных научных конференциях Воронежского государственного технического университета (Воронеж, 2009-2012).
Публикации. Основные результаты диссертации опубликованы в 13 научных работах, в том числе 5 - в изданиях, рекомендованных ВАК РФ.
Структура и объем работы. Диссертационная работа состоит из введения, четырех глав, заключения, списка литературы из 101 наименований и приложений. Основная часть работы изложена на 135 страницах и содержит 52 рисунков и 12 таблиц.