Введение к работе
Актуальность. В настоящее время интеллектуальные методы анализа данных получили широкое распространение при решении практических задач в различных сферах человеческой деятельности. В области исследований интеллектуальных систем анализа данных помимо совершенствования отдельных технологий, можно выделить интенсивно развивающееся направление, заключающееся в совместном использовании различных типов интеллектуальных информационных технологий (ИИТ) с целью увеличения качественных характеристик конечной системы.
Искусственные нейронные сети (ИНС) характеризуются адаптивным обучением, самоорганизацией, возможностью работы в режиме реального времени, отказоустойчивостью. Область их применения охватывает широкий спектр практических приложений. Они обладают эффективной способностью извлекать существенные признаки из сложных и неточных данных, где другие компьютерные методы, как правило, не справляются с поставленной задачей. Однако нейронные сети представляют собой модель "черного ящика", т.е. интерпретация построенных решений является практически невозможной.
Отличительной чертой систем на нечеткой логике (НЛС) является построение решения в форме лингвистических правил-продукций, что предоставляет "прозрачную" модель (т.е. модель "белого ящика"). Нечеткие системы концептуально понятны, гибки, устойчивы к неточным данным, основываются на естественном языке. Они позволяют инкорпорировать опыт экспертов предметной области, а также способны моделировать нелинейные функциональные зависимости произвольной сложности. Однако нечеткие системы не имеют автоматических обучающих алгоритмов, вследствие чего они не могут быть использованы при отсутствии экспертных знаний.
Среди различных способов гибридизации технологий, выделяются нейро-нечеткие системы (ННС), объединяющие преимущества систем на нечеткой логике и аппарата нейронных сетей, а также эволюционные нейронные сети и эволюционные нечеткие системы, позволяющие автоматизировать процесс создания модели и решения задач анализа данных.
Обобщающая эффективность отдельной технологии может быть ограничена в виду сложности решаемой задачи. Выходом из данной ситуации могут служить ансамбли интеллектуальных систем, представляющие собой набор моделей, каждая из которых способна решить поставленную задачу и комбинация которых позволяет повысить эффективность и робастность системы в целом по сравнению с отдельной технологией.
Создание эффективного алгоритмического ядра интеллектуальных информационных технологий требует значительных временных и финансовых затрат и очень высокой квалификации разработчиков, что на практике конечным пользователям (врачам, инженерам, менеджерам и др.) далеко не всегда удается обеспечить. Автоматизация генерирования алгоритмического ядра ИИТ с помощью эволюционных алгоритмов позволяет значительно упростить процесс разработки интеллектуальных систем поддержки принятия решений для конечных пользователей, не являющихся экспертами в области интеллектуальных информационных технологий.
Таким образом, разработка и исследование методов
автоматизированного генерирования алгоритмического ядра
интеллектуальных информационных технологий и их коллективов при решении сложных задач анализа данных в различных областях человеческой деятельности, позволяющих повысить эффективность и надежность конечной системы при принятии решений, является актуальной научно-технической задачей.
Целью диссертационной работы является повышение обоснованности и надежности принятия решений при использовании интеллектуальных информационных технологий за счет автоматизации их проектирования и применения на основе эволюционных алгоритмов.
Достижение поставленной цели работы предполагает решение следующей совокупности задач:
-
Усовершенствовать стандартный генетический алгоритм для повышения его надежности при решении задач оптимизации на сложных структурах данных.
-
Автоматизировать процесс проектирования структуры искусственных нейронных сетей и настройки ее весовых коэффициентов.
-
Автоматизировать процесс проектирования базы правил и настройки семантики лингвистических переменных для систем на нечеткой логике.
-
Разработать подход, автоматически настраивающий семантику лингвистических переменных в нейро-нечетких системах.
-
Разработать метод автоматизированного проектирования коллективов ИИТ.
-
Реализовать предложенные методы и показать их работоспособность на тестовых и практических задачах анализа данных.
Методы исследования. При выполнении диссертационной работы использовались методы системного анализа, теории вероятности и математической статистики, теории обработки информации, теории оптимизации, теории эволюционных вычислений, методика разработки интеллектуальных информационных систем.
Научная новизна результатов диссертационной работы состоит в следующем:
-
Разработан новый самонастраивающийся эволюционный алгоритм для решения задач безусловной и условной оптимизации, отличающийся от известных сочетанием асимптотического генетического алгоритма с автоматическим выбором типа селекции.
-
Разработан новый эволюционный метод автоматизации проектирования структуры НЛС и одновременной настройки ее базы правил, отличающийся от известных представлением решения в виде хромосомы генетического алгоритма и позволяющий одновременно настраивать количество правил в базе и длину каждого правила.
-
Разработан новый алгоритм настройки лингвистических переменных в нейро-нечетких системах, отличающийся от известных способом представления решения и позволяющий одновременно выбирать центр и ширину базы лингвистических термов.
-
Разработан новый метод создания коллективов ИИТ на основе алгоритма генетического программирования, отличающийся от известных способом формирования коллектива и его решения и позволяющий получать более эффективные коллективы ИИТ.
Теоретическая значимость результатов диссертационного исследования состоит в том, что разработаны новые эволюционные алгоритмы для автоматического проектирования интеллектуальных информационных технологий и их коллективов, предназначенных для решения задач аппроксимации, классификации и прогнозирования, обладающие более высокой эффективностью, надежностью и адаптивностью, что имеет существенное значение для теории интеллектуальных технологий представления знаний и практики их применения в системах обработки информации и интеллектуального анализа данных.
Практическая ценность. На основе разработанных в ходе исследования алгоритмов и методов реализована программная система поддержки принятия решений при управлении реальными инвестициями машиностроительного предприятия на основе многоагентных стохастических алгоритмов, а также программная система, позволяющая осуществлять проектирование нейросетевых моделей, систем на нечеткой логике и нейро-нечетких систем, а также их коллективов на основе эволюциошюго подхода для решения сложных задач анализа данных: аппроксимации, классификации и прогнозирования. Полученные в диссертационной работе самонастраивающийся асимптотический генетический алгоритм, а также рекомендации по настройке параметров метода генетического программирования позволяют конечным пользователям, не являющимися экспертами в области эволюционных вычислений и проектирования ИИТ, применять программные системы при
решении сложных задач в различных сферах человеческой деятельности. Программные системы апробированы на реальных практических задачах.
Реализация результатов работы. Диссертационная работа
поддержана Фондом содействия развитию малых форм предприятий в
научно-технической сфере по программе «У.М.Н.И.К.» («Участник
молодежного научно-инновационного конкурса») в рамках НИОКР
«Автоматизированное проектирование интеллектуальных
информационных технологий для задач анализа данных на основе самонастраивающегося генетического алгоритма» на 2010-2012 гт. Работа финансировалась из средств госбюджета в рамках НИР 1.7.08 «Разработка теоретических основ решения задач автоматизации проектирования распределенных многопроцессорных вычислительных комплексов интеллектуального анализа данных в режиме реального времени» темплана ЕЗН СибГАУ, а также по проекту "Математическое моделирование инвестиционного развития региональных экономических систем" Аналитической ведомственной целевой программы "Развитие научного потенциала".
Результаты диссертационного исследования использовались при
выполнении НИР 2.1.1/12096 «Математическое моделирование
инвестиционного развития региональных экономических систем» АВЦП
«Развитие научного потенциала высшей школы (2009-2011 годы)», НИР
2009-1.2.2 «Автоматизированная система решения сложных задач
глобальной оптимизации многоагентными стохастическими алгоритмами»
ФЦП «Научные и научно-педагогические кадры инновационной России»
на 2009-2011 годы и российско-германского проекта 2011-1.2.1-113-025-
002 «Математическое и алгоритмическое обеспечение
автоматизированного проектирования аппаратно-программных
комплексов интеллектуальной обработки информации в распределенных высокопроизводительных системах космического назначения» ФЦП «Научные и научно-педагогические кадры инновационной России на 2009-2013 годы (с участием научно-исследовательских и научно-образовательных организаций Германии)».
Созданная в ходе исследования программная система «Система
поддержки принятия решений на основе многоагентных стохастических
алгоритмов для управления реальными инвестициями
машиностроительных предприятий» апробирована на реальных данных Химзавода - филиала ОАО «Красмашзавод» и передана для эксплуатации двум предприятиям.
Одна программная система прошла государственную экспертизу и была зарегистрированы во ВНТИЦ, четыре программные системы зарегистрированы в Роспатенте.
Разработанные в диссертации программные системы используются в учебном процессе Института информатики и телекоммуникаций
СибТАУ при выполнении лабораторных и курсовых работ и, кроме того, переданы для использования в две инновационные ГГ-компании. Основные защищаемые положения:
-
Самонастраивающийся асимптотический генетический алгоритм безусловной оптимизации обеспечивает эффективность, сравнимую со стандартным генетическим алгоритмом, но обладает значительно меньшим числом настроек.
-
Разработанные алгоритмы автоматизации проектирования ИИТ позволяют эффективно решать сложные задачи анализа данных и не требуют от конечного пользователя экспертных знаний в области эволюционных вычислений.
-
Разработанный подход к построению коллектива интеллектуальных информационных технологий на основе метода генетического программирования позволяет повысить эффективность и надежность принятия конечного решения в задачах аппроксимации и классификации по сравнению с альтернативными методами.
Апробация. Результаты диссертационной работы были доложены и обсуждены более, чем на 20 научных и научно-практических конференций, среди которых: International Conference on Hybrid Artificial Intelligence Systems (HAIS'12) и International Symposium on Distributed Computing and Artificial Intelligence (DCAF12), г. Саламанка, Испания, 2012; Всероссийская научная конференции «Теория и практика системного анализа» (г. Рыбинск, Институт системного анализа РАН и РГАТА, 2012); Joint ШЕЕ Conference "The 7th International Conference on Natural Computation & The 8th International Conference on Fuzzy Systems and Knowledge Discovery" - FSKD'2011, China, 2011; конференция-конкурс «Технологии Microsoft в теории и практике программирования» (г. Томск, ТПУ, 2011); Национальные конференции по искусственному интеллекту с международным участием КИИ-2010 и КИИ 2012 (г. Тверь, 2010, г. Белгород, 2012); Международные научно-практические конференции «Решетневские чтения» (г. Красноярск, СибТАУ, 2008, 2009, 2011); Всероссийские научно-практические конференции с международным участием «Информационные технологии и математическое моделирование» (г. Томск, ТГУ, 2008, 2009); Всероссийские научно-практические конференции «Актуальные проблемы авиации и космонавтики», (г. Красноярск, СибГАУ, 2008, 2009), а также ряд молодежных и студенческих конференций. Отдельные аспекты исследования обсуждались на научном семинаре института информационных технологий университета г. Ульм (Германия). Диссертация в целом обсуждалась на научных семинарах Института проблем управления РАН им. В.А. Трапезникова (г. Москва) и Института системного анализа РАН (г. Москва) и научно-техническом семинаре кафедры системного анализа и исследования операций СибГАУ.
Публикации. По материалам данной работы опубликовано более 25 печатных работ, в том числе 4 статьи в научных изданиях Перечня ВАК.
Структура работы. Диссертация состоит из введения, четырех глав, заключения, списка литературы и приложений.