Содержание к диссертации
Введение
Глава 1. Анализ динамически сложной среды 14
1.1. Сущность системных исследований динамически сложной среды 14
1.1.1. Типологические исследования понятия «система» 14
1.1.2. Классификация систем по категориальным признакам 21
1.2. Сущность деятельностного подхода к анализу динамически сложной среды 29
1.2.1. Иерархическая структура деятельности 29
1.2.2. Категориальные схемы акта деятельности 35
1.3. Сущность ситуационного подхода к анализу динамически сложной среды 44
1.3.1. Базовые идеи и основные принципы ситуационного анализа и проектирования модели предметной области 44
1.3.2. Концептуальная структура единичного решения 50
Выводы по главе 1 57
Глава 2. Методика и программная реализация выделения концептуальных планов 58
2.1. Методика выделения концептуальных планов 58
2.1.1. Концептуальная структура акта деятельности 58
2.1.2. Концептуальные планы акта деятельности
2.1.2.1. Функциональный план 68
2.1.2.2. Процессный план 76
2.1.2.3. План контекста 84
2.1.2.4. План закономерностей 88
2.2. Программное обеспечение представления баз знаний 92
2.2.1. Программное обеспечение для построения концептуальной модели 92
2.2.2. Программное обеспечение для выделения концептуальных планов 96
Выводы по главе 2 105
Глава 3. Разработка полиструктурных и полифункциональных систем поддержки принятия решений 107
3.1. Интеллектуальная поддержка принятия управленческих решений 107
3.1.1. Проблематика принятия решений в динамически сложной среде 107
3.1.2. Сущность теории модельно-параметрического пространства 114
3.2. Разработка автономных моделей на основе концептуальных планов 119
3.2.1. Сущность методов имитационного моделирования 119
3.2.2. Проектирование имитационных динамических моделей 127
3.2.3. Сущность методов эволюционного моделирования 137
3.2.4. Проектирование гибридной генетической модели 147
3.3. Прикладные исследования разработки полиструктурной и
полифункциональной системы поддержки принятия решений 157
3.3.1. Эволюционная модель выбора оптимальных решений для противодействия развитию инфекционных заболеваний 157
3.3.2. Система предупреждения и противодействия эпидемиям 168
Выводы по главе 3 179
Заключение 180
Список сокращений и условных обозначений 182
Список литературы 185
- Сущность деятельностного подхода к анализу динамически сложной среды
- Базовые идеи и основные принципы ситуационного анализа и проектирования модели предметной области
- Концептуальные планы акта деятельности
- Разработка автономных моделей на основе концептуальных планов
Введение к работе
Актуальность темы исследования. Объективная реальность современного мира такова, что лица, принимающие решения (ЛПР) вынуждены действовать в динамически сложной среде (ДСС), которая характеризуется следующими особенностями:
для достижения целей необходимо принимать множество решений, каждое из которых должно рассматриваться в контексте остальных;
принимаемые решения зависимы друг от друга, обладают стохастическими и длинными связями;
среда изменяется как под воздействием определенной совокупности систем, так и вследствие принимаемых решений.
ДСС всегда находится во взаимной зависимости от некоторой совокупности систем (экономических, социальных, техногенных и др.), в которых центральную роль играет логика человеческих целей и действий. При таком условии знания о ДСС определены трудно формализуемым характером (нечёткостью, неопределённостью, неточностью и др.). Для выработки решений в такой предметной области (ПрО) традиционно используются системы поддержки принятия решений (СППР - DSS, Decision Support System) основанные на синергетической комбинации методов искусственного интеллекта (ИИ). Соответственно для выработки решений в ДСС необходимо использовать комплекс интеллектуальных СППР (ИСППР - IDSS, Intelligence DSS), который автором диссертации называется полиструктурной и полифункциональной СППР (ПП СППР).
Для разработки ИСППР существует широкий спектр методов, технологий и средств, которые обладают разнообразными свойствами и возможностями. При этом наибольшее распространение получили CASE-технологии. В них используются два принципиально разных подхода к проектированию программного обеспечения (ПО): структурный ( - Structured Analysis and Design Technique (метод структурного анализа и проектирования) и др.) и объектно-ориентированный (UML - Unified Modeling Language (Унифицированный язык моделирования)), которые в известной мере между собой не согласуются, хотя имеют общие основания - системные представления. Несмотря на популярность CASE-технологий, использование их для поддержки и принятия решений сопровождается рядом затруднений для разработчика:
ему предлагается множество избыточных или практически неиспользуемых концептуальных конструкций;
ему предлагается не единый, а разнородный синтаксис, то есть разнородные правила составления конструкций языка;
ему не предлагаются эффективные способы моделирования ПрО на электронной вычислительной машине (ЭВМ);
в своей практике он не может опереться на формальные заключения о свойствах используемой модели знаний - непротиворечивости и согласованности.
Несовершенства CASE-технологий делают проблематичным их изучение и
внедрение для проектирования ИСППР, в большей степени они ориентированы на проектирование информационных систем, чем на интеграцию моделей ИИ.
Практика использования ИСППР показывает, что на сегодняшний день в ее теоретическом обосновании не существует:
методики и концептуальной структуры объединяющей ситуационные, имитационные, экспертные, эволюционные и другие подходы к моделированию ДСС;
целостной модели знаний о проектировании ИСППР;
единого языка графического описания для моделирования в области разработки ИСППР;
ПО представления баз знаний (БЗ) для проектирования ИСППР.
Эти обстоятельства указывают на существование в области поддержки принятия решений проблемы, состоящей в отсутствии единой концептуальной структуры обоснованных решений относительно управления ДСС и программном извлечении различных знаний из концептуальной модели для проектирования ИСППР.
Объектом исследования в работе является процесс проектирования ПО для реализации деятельности по принятию решений в ДСС.
В качестве предмета исследования выступают методика и программное обеспечение выявления и представления баз знаний для разработки полиструктурных и полифункциональных систем поддержки принятия решений (определен паспортом специальности 05.13.11, областями исследования 1 и 4).
Цель работы: разработать методику и программное обеспечение представления баз знаний для разработки полиструктурных и полифункциональных систем поддержки принятия решений, повышающих качество принимаемых решений в ДСС.
Следовательно, в диссертации решается следующая научная задача: создание методики разработки ПП СППР, позволяющей построить целостную модель ДСС с использованием единого графического языка и выделить из неё на программном уровне частные представления (концептуальные планы) БЗ соответствующие методам ИИ.
Гипотезы исследования. Научная задача будет решена, если:
будут расширены теоретические представления о возможностях метода ситуационного анализа и проектирования модели ПрО произвольной природы (Л.С. Болотовой);
моделирование ДСС будет основано на синтезе деятельностного и ситуационного подходов к анализу ПрО;
будет разработана концептуальная структура акта деятельности (КСАД) как совокупность единичных решений, которую можно использовать как БЗ для экспертного моделирования;
будет разработана целостная концептуальная модель принятия решений в ДСС;
ПО представления БЗ о ДСС будет разработано на основе концептуальных планов акта деятельности, соответствующих определенным
методам ИИ;
ИСППР будет спроектирована на основе совокупности или синтеза концептуальных планов актов деятельности;
ПП СППР будет спроектирована как совокупность ИСППР.
Для достижения цели в работе поставлен ряд следующих задач, которые были решены в ходе исследования:
провести анализ возможностей современного методического и программного обеспечения разработки модели ДСС для ее использования в ПП СППР;
обосновать применение синтеза деятельностного подхода и ситуационного анализа для разработки модели БЗ относительно ДСС;
разработать КСАД на основе синтеза категориальной схемы акта деятельности и концептуальной структуры единичного решения (КСЕР);
разработать концептуальную модель принятия решений в ДСС как целостную структуру, которая определена матрицей решений;
разработать концептуальные планы, которые является частью КСАД и на программном уровне рассматриваются в виде отчетов с текстовыми описаниями БЗ для разработки моделей ИИ;
разработать витрину знаний для проектирования ИСППР как синтез концептуальных планов актов деятельности;
разработать методику проектирования ПП СППР.
Методология и методы исследования. Для решения поставленной задачи в работе проводятся теоретические исследования на основе общелогических методов познания.
Для построения концептуальной модели принятия решения в ДСС применены: деятельностный подход (Н. Леонтьев, Э.Г. Юдин, Г.П Щедровицкий, СП Никаноров и др.); метод ситуационного анализа и проектирования модели ПрО произвольной природы (Л.С. Болотова); метод ситуационного управления (Д.А. Поспелов, В.Н. Пушкин, Ю.И. Клыков, Л.С. Болотова, Ю.А. Шрейдер, А.Г. Теслинов и др.).
Концепция проектирования ПП СППР основана на выявлении системных представлений из концептуальной модели принятия решения. Определение системных представлений основано на работах в области системологии ( С. Оптнер, СП Никаноров, ИВ. Блауберг, В.Н. Садовский, В.Н. Волкова, А.А. Денисов, и др.).
Системные представления определены концептуальными планами, которые построены по аналогии с CASE-технологиями (Г. Буч, А. Якобсон, Дж. Рамбо, Д.А. Марка, К. МакГоуэн, Р. Баркер, Г.Н Калянов, А.М. Вендров и др.).
Специфика принятия решений в ДСС изучалась на компьютерных имитационных моделях (Дж. Форрестер, Б. Бремер, Д. Дёрнер, Дж. Стерман, Дж. Томас, А.В. Федотов, В. В. Емельянов, Н.П. Бусленко и др.)
комбинация для различных моделей обусловлена гибридным подходом к проектированию систем основанных на знаниях (Л.Р. Медскер, С. Вермтер, Г.В. Рыбина, А.В. Колесников, Ю.Р. Валькман, А.В.
Гаврилов, Н.Г. Ярушкина и др.).
Научная новизна и теоретическая значимость диссертационного исследования состоят в следующем:
модифицированы теоретические представления о возможностях ситуационного анализа, деятельностного подхода и теории модельно-параметрического пространства;
предложен новый подход к представлению и описанию процесса принятия решений в ДСС на основе синтеза деятельностного и ситуационного подходов к анализу ПрО;
разработана концептуальная структура акта деятельности (КСАД) как совокупность единичных решений, которую можно использовать для создания экспертных систем;
разработана целостная концептуальная модель принятия решений в ДСС, использующая КСАД;
на основе выделения и методического синтеза концептуальных планов КСАД, соответствующих определенным методам ИИ, разработана методика функционирования ПО представления БЗ о ДСС;
предложена методика проектирования ПП СППР как совокупность ИСППР, параметрически связанных между собой.
Практическая значимость работы. Предложенные теоретические основы, методика и программные средства представления БЗ позволяют:
исследовать структуру, параметры и характеристики ДСС с позиции различных системных представлений;
фиксировать существенную информацию о моделируемой ДСС в графическом и текстовом представлении;
верифицировать концептуальную модель принятия решений в ДСС. Сделать формальные выводы об её свойствах непротиворечивости и согласованности;
находить соответствия между совокупностью концептуальных планов и методами ИИ.
Предложенные решения могут использоваться для проектирования широкого спектра ПП СППР.
Положения, выносимые на защиту
1. Новый подход представления и описания процесса принятия решений в
ДСС. Подход основан на:
синтезе деятельностного и ситуационного подходов к анализу ПрО;
выявлении из ДСС различных актов деятельности и построении их концептуальных структур;
выделении из КСАД частных представлений и нахождении для них соответствующие модели ИИ.
2. КСАД как совокупность единичных решений, которая обладает
следующими особенностями:
- представляет собой паттерн, в котором фиксируется состояние
деятельности до и после принятия решений;
учитывает частные представления: функциональный, процессный, контекстный и план закономерностей;
используется для создания концептуальной модели принятия решений.
3. Концептуальная модель принятия решений в ДСС как синтез различных
КСАД, которая обладает следующими особенностями:
представлена матрицей решений, в которой на уровне КСЕР фиксируются решения как по актам деятельности, так и по проблемным ситуациям;
учитывает возможную типизацию пересечений КСЕР и декомпозицию концептуальных планов;
используется для создания БЗ на программном уровне проектирования ИСППР.
4. Методика проектирования ПП СППР как совокупности ИСППР. В
методике в центр внимания ЛПР ставится одна из ИСППР и находятся пересечения
по параметрам с другими ИСППР. При этом методически обеспечивается фиксация
логической организации анализа ДСС и синтеза моделей ИИ.
Степень достоверности и апробация результатов. Достоверность изложенных в работе положений подтверждаются использованием подходов и методологий, зарекомендовавших свою эффективность и адекватность. Разработанная методика и программное обеспечение реализованы в ПП СППР «Противодействия Развитию Инфекционных Заболеваний» («ПРИЗ»), нечеткая модель управления водоснабжением в системе «Умный дом».
Основные положения работы докладывались и обсуждались на следующих конференциях:
XVI Международной научно-практической конференции «Системный анализ в проектировании и управлении», Санкт-Петербург, 2012;
IV Международная научно-техническая конференция «Робототехника и искусственный интеллект», Железногорск, 2012;
VIII Международной научно - технической конференция «Дни науки -2012». - Прага, 2012;
ХL юбилейной Международной научно-практической конференции «Неделя науки СПбГПУ», Санкт-Петербург, 2011;
V, VI, VII, VIII Всероссийских конференциях «Искусственный интеллект, философия, методология, инновации», МГТУ МИРЭА, Москва, 2011 -2014;
Всероссийской научно-практической конференция «Информационные технологии в профессиональной деятельности и научной работе», Йошкар-Ола, 2012;
Всероссийская научная конференция «Статистика и прикладные исследования», Краснодар, 2011;
61, 62, 63, 64 научно-технических конференциях в МГТУ МИРЭА, Москва, 2012 - 2015;
Научные сессии «НИЯУ МИФИ - 2014» и «НИЯУ МИФИ - 2015», МИФИ, Москва, 2014 - 2015 год.
Публикации. В результате теоретических и прикладных исследований опубликовано 17 научных работ, из них шесть в ведущих рецензируемых научных журналах, определенные перечнем Высшей аттестационной комиссии (ВАК), и одно методическое указание по выполнению курсовой работы. По теме диссертации в Федеральной службе по интеллектуальной собственности получено, два свидетельства о регистрации:
программы для ЭВМ № 2014619158 «Противодействие Развитию Инфекционных Заболеваний»;
базы данных № 2015621317 «Интеллектуальная база данных для проектирования систем основанных на знаниях».
Публикации на тему диссертационной работы заняли третье место в конкурсе на лучший научный цикл работ, выполненных в МИРЭА и опубликованных в течение 2014 года.
Структура и объем работы. Диссертация состоит из введения, 3 глав, заключения, списка использованных источников, содержащего 118 наименований и 5 приложений. Объем основного текста составляет 196 печатных страниц, 9 таблиц и 86 рисунков. Объем приложений - 126 печатных страниц.
Сущность деятельностного подхода к анализу динамически сложной среды
Подходы к классификации систем осуществляются по двум принципам: по предметному или по категориальному. Цель этих классификаций - ограничить выбор подходов к отображению системы, сопоставить выделенным классам приемы и методы системного анализа и дать рекомендации по выбору методов для соответствующего класса систем. При этом система в принципе может быть одновременно охарактеризована несколькими признаками, т.е. ей может быть найдено место одновременно в разных классификациях, каждая из которых может оказаться полезной при выборе методов моделирования.
В ДСС существуют разнообразные классы систем с учётом вида отображаемого объекта или с учётом вида моделирования. Поэтому при классификации систем необходимо использовать категориальный принцип, который разделяет их по общим характеристикам, присущим любым системам независимо от их мате риального воплощения (таблица 1).
Классификация категорий системного подхода Основание классификации Виды категорий Базовые категории Целое, целостность; Множество; Совокупность; Организация. Категории системы Надсистема; Система; Подсистема; Система-универсум. Категории составляющих системы Элемент; Связь; Прямая связь; Обратная связь; Отношение; Структура; Организация; Системообразующий фактор Категории, характеризующие свойства Свойство; Цель; Эмерджентность; Гомеостаз; Сложность; Простота; Закрытость; Открытость; Энтропия. Категории состояний системы Состояние системы; Процесс; Организация; Хаос; Переходное состояние; Стабильное состояние; Кризисное состояние. Категории окружения системы Среда; Окружающая среда; Внутренняя среда. Категории процессов Функция; Функционирование; Управление; Интеграция; Адаптация; Разрушение; Деградация; Рост; Агрессия; Поглощение. Категории отражения системы Информация; Модель системы; Проект системы. Категории, характеризующие эффекты системности Эффект целостности; Интегральный эффект; Гомеостаз; Эмерджентность; Синергетический эффект. Таблица 1 по материалам Ю.П. Сурмина [98, с. 60 ]. Поскольку системные исследования находятся в постоянном развитии, то категориальное их осмысление требует времени, многократного употребления и постоянного уточнения. На современном этапе развития понятийный ансамбль системного анализа включает более 300 категорий [98, с 59]. Поэтому предлагается не рассматривать все категории, а выстроить логическую цепочку классификации ДСС по категориальным признакам.
1) Сложность состава. Главная трудность в определении состава заключается в том, что разделение целостной системы на части является относительным, условным, зависящим от целей моделирования - это относится не только к границам между частями системы, но и к границам самой системы. Кроме того, относительным является и определение самой малой части - элемента.
Сложность состава определена как сумма различных видов сложностей, которые в каждом конкретном случае нуждаются в анализе и уточнении. Как правило, выделяются четыре вида сложностей состава (1.10): CC = S + + D + G (1.10) - субстратная S(substrate) - складывается из сложности компонентов, под систем и уровней организации. ДСС обусловлена не отдельными системами, изо лированными от окружающей их среды, а сложной их комбинацией в зависимо сти от сложившейся ситуации; - параметрическая Р(parametric) - включает сложность субстратных свойств, интегральных свойств, связей и отношений. ДСС определена высокой размерностью поливариантности состояний. Состояние системы - это совокупность объектов, значений их свойств и связей между ними, зафиксированные в некоторый момент времени. Очень часто синонимом термина «состояние» является термин «ситуация» [22, С 40].
Теоретической основой для осмысления этого понимания выступает ситуационный анализ. Тогда существует возможность рассчитать мощность множества возможных ситуаций N(d) определяемых данной структурой из допустимых сочетаний свойств к, отношений Т и их значений [22, С 333]: N(d) = к± х к2 х ... х ks х 2Т где (1.11) к± X к2 X ... X ks - число возможных значений каждого свойства; Т - число отношений, участвующих в данной структуре. - динамическая D (dynamic) - интегрирует в себе сложность состояний, стадий, фаз и переходных процессов. В ДСС необходимо учитывать высокую динамику объектов, большое число и относительно быстрые изменения существенных показателей, внешних факторов, и трудность их измерения; - генетическая G (genetic) - включает эволюцию состояний, стадий фаз, уровней развития. В ДСС этот вид сложности определяется множеством точек бифуркаций, через которые реализуются различные ситуации.
Таким образом, можно констатировать, что сложность состава ДСС определяется исходя из ситуационных представлений.
2) Сложность организации. Понятие термина «организация» в рамках системного анализа можно рассматривать двояко как свойство упорядочивания элементов и согласованности действий, и как деятельность по созданию или усовершенствованию взаимосвязей между элементами с целью внесения упорядоченности в процессы. В первом случае «организация» выступает термином отражения статики системы, а во втором - присутствует динамический контекст, распределения функций. При этом необходимо учитывать, что понятие термина «органи зация» относится к базисным категориям. Для определения системы всегда выделяется точка опоры в виде базового понятия.
Организация — представляется в качестве свойства материальных и абстрактных объектов обнаруживать взаимозависимое поведение частей в рамках целого. Организация выступает не только как свойство всего сущего, а как некоторая упорядоченность содержания, упорядоченность системы в соответствии с системообразующим фактором [98, с. 340].
Системообразующий фактор определен объективным явлением, ибо характеризует способность материи обретать и проявлять системность и выступает средством (инструментом) для вычленения системы из среды. Очевидно, что главным системообразующим фактором в ДСС является активное взаимодействие живого существа с окружающим миром - деятельность.
Сложность организации обусловлена многообразием законов функционирования LF (laws functioning) и сложной организацией компонентов ОС (organization components). СО = LF + ОС (1.12) LF - определяются множеством действий системы во времени. Для определения LF в ДСС необходимо выделить множество функций, которые соответствуют целям. При этом необходимо учитывать, что функция означает способность к деятельности и определена как: - Функция представляется в виде наблюдаемых последствий деятельности элемента системы, способствующего выживанию и сохранению системы (Р. Мер-тон) [Цит. по 70, с. 40]. - Функцией является целенаправленная деятельность, активность системы (Афанасьев В. Г.) [Цит. по 70, с. 40]
Учитывая тот факт, что ДСС характеризуются множественностью состояний, ситуаций и альтернатив, то можно утверждать: большинство элементов среды полифункциональны. Включение полифункционального элемента в систему неизбежно разделяет функции по значимости: одни из них являются главными, а другие - второстепенными (лишними). Однако избыток лишних функций служит резервом для адаптации ДСС к новым условиям. Смена цели, изменчивость среды может перевести второстепенные функции в ранг главных функций. При высокой динамке ситуация в каждый момент времени может кардинально меняться, поэтому создать детерминированную систему для ДСС невозможно.
Базовые идеи и основные принципы ситуационного анализа и проектирования модели предметной области
Процессный план оперирует множеством действий, определяется в какое состояние перейдёт в будущем объект из заданного текущего состояния. Таким образом, может быть сформулирована задача поиска целевого продукта деятельности в пространстве состояний. При этом путь решения задачи не всегда известен. Следовательно, необходимо найти такую точку опоры, в которой путь после нее известен. Очевидно, этой точке будет соответствовать некоторое состояние объекта действия Si на пути от состояния начального исходного материала 5н до целевого продукта 5ц. Если точка опоры Si определена, то к ней уже можно применить какое-либо действие и этим изменить состояние объекта, т.е. приблизиться к возможному решению. Рис. 2.19. Логическая связность Рис. 2.20. Обратная логическая связность Согласно принципу логической связанности, между полученными при разбиении подзадачами могут быть отношения согласованности их решения (отношение И), или отношение альтернативности (отношение ИЛИ). Тогда данные отношения можно отобразить на графе И/ИЛИ (рис.2.21) в котором отношения типа И отмечаются дугой, связывающей ребра графа [22, с. 69].
Однако примитивное использование редукционизма для решения задач в ДСС, приводит к упрощенному видению проблемы, что влияет на принимаемые решения. Также необходимо учитывать, что опорное состояние, согласно проблемно-категориальной схеме акта деятельности1, определено продуктом.
Поэтому предлагается ввести понятие трасса как последовательный процесс действий, при котором происходит трансформация исходного материала RM в конечный продукт Рг. Трасса процесса определена единственным устойчивым состоянием Рг и множеством переходных состояний, которые характеризуются многовариантным и неоднозначным поведением [5, с. 8]. Таким образом, в переходных состояниях развитие системы в дальнейшем непредсказуемо, оно может происходить по разным сценариям пока не будет достигнута следующая точка бифуркации и не появится новое решение.
На рис. 2.22 показано единственное решение трансформации RM в Рг, но при параметре Рх (под параметром в плане процессов акта деятельности подразумеваются средства достижения цели) единственность уступает место множественным решениям. Точки переходных состояний, выделенные синим цветом, являются первичные бифуркации, а красным вторичные. Отношение ИЛИ на дан Рисунок 1.8. ной диаграмме интерпретируется как альтернативное решение, а отношение И как управленческое. При этом общеизвестно, что при изменении управляющих параметров в системе наблюдаются разнообразные переходные явления.
Соответственно задача сводится не к выбору решения как таковому, а к определению необходимых параметров для приближения к состоянию Р. При этом необходимо учитывать, что в окрестностях точек бифуркации параметры определены случайным характером, а параметры действий детерминированы. Логично предположить, что параметры группируются в определенные зависимости.
Таким образом, план процессов определяет «как делать». Предполагается, что на его основе может разрабатываться диаграмма потоков и уровней для имитационных динамических моделей (ИДМ) [24, 93].
Статические аспекты описывают КСАД в определенный момент времени (до или после действия). При проектировании моделей ИИ часто возникает необходимость знать устойчивое состояние, сформированное процессом акта деятельности. Тогда под планом контекста понимается организованность исходного материала объекта. Толкование понятия, именуемого термином «контекст» основан на лингвистическом аспекте как условии употребления слова, позволяющие уточнить его значение. Контекст (от лат. contextus — сцепление, соединение, связь), относительно законченный по смыслу отрывок текста или речи, в пределах которого наиболее точно и конкретно выявляется смысл и значение отдельно входящего в него слова, фразы, совокупности фраз [103, с. 274].
Однако под этим термином можно понимать не только языковое окружение и ситуацию речевого общения, но и среду, в которой существует системный объект. При этом исходный материал RM сам способен формировать устойчивое состояние процесса, тем самым ограничивая его определенными рамками и задавая определенное направление течения.
Пересечение по субъекту и средствам акта деятельности План контекста используется для лучшего осмысления определенного акта деятельности и как дополнение к остальным концептуальным планам. Структура контекстного плана на уровне единичных решений идентична структуре ментальных карт с той разницей, что используется иная графическая нотация.
Ментальные карты [52, 63] позиционируются авторами1 как эффективный инструмент структурирования и анализа информации. Ее можно применять для создания и фиксации новых идей, анализа и упорядочивания информации, принятия решений и т.д. Это не традиционный, но очень эффективный и естественный и способ организации мышления. В основе этой техники лежит принцип «ради-антного мышления», относящийся к ассоциативным мыслительным процессам, отправной точкой которых является центральный объект. На данной технике мышления основан когнитивный подход к моделированию, который обеспечивает перевод объекта управления в целевое состояние с учетом сходства и различия в влиянии различных факторов на объект управления. Использование данного инструментария дает возможность применять способ обратного проектирования концептуального плана, т.е. не выделять его из КСАД, а строить на основе ментальных карт.
Таким образом, план контекста определяет «из чего делать» и служит не только для объяснения руководящих принципов акта деятельности. Предполагается, что на его основе можно строить различные модели, основанные на идеях когнитивного подхода [15, 87, 94, 95].
Концептуальные планы акта деятельности
Развитием двухточечного оператора кроссинговера является N-точечный (многоточечный) оператор кроссинговера. Однако большое количество точек «разреза» может привести к потере «хороших» родительских свойств.
Операторы данного класса принадлежат к ГА с бинарным кодированием, которые существенно отличаются от операторов кроссинговера для алгоритмов вещественного кодирования (real-codedGA) [117, с. 270]. Для операторов скрещивания real-coded алгоритмов, требуется из двух векторов вещественных чисел получить новые векторы в окрестности родительских пар по каким-либо законам. Тогда постановка задачи заключается в следующем: Геометрическая интерпретация работы эвристического кроссинговера Необходимо отметить, что разрушающая способность при бинарном кодировании выше, чем при real-coded. Разрушающая способность кроссинговера для бинарного кодирования зависит от расстояния Хэмминга, которое обусловлено количеством различающихся позиций генов в хромосомах с одинаковой длинной. Таким образом, способность вещественного кроссинговера к разрушению зависит от того, насколько сильно он рекомбинирует содержимое родительских хромо-143 сом. Для кроссинговера real-coded способность к разрушению определяется тем, насколько велико расстояние в пространстве поиска между точками, соответствующими хромосомам родителей и потомков. Если w - 0, то способность к разрушению будет низкой. Поэтому необходимы предварительные знания и результаты о решаемой задаче. Однако одновременно со способностью к разрушению можно говорить о способности к созданию новых особей, которые ранее не встречаются в процессе эволюционного поиска.
Мутация - позволяет осуществить случайные изменения в позиции хромосомы (генов), тем самым обеспечивается генетическое разнообразие популяции, расширяется пространство поиска наилучших решений [36, с. 14]. Мутация необходима в ситуациях, когда популяция малочисленна и подвержена преждевременной сходимости (premature convergence). При этом оператор кроссинговера практически не изменяет популяции, т.к. все хромосомы почти одинаковы. В этом случае мутация способна инвертировать «застрявший» ген у одной из хромосом и вновь расширить пространство поиска.
Оператор мутации выполняется в два этапа: 1-й этап. В хромосоме А = а1;а2,..., ап случайным образом выбирается к-ая позиция 1 к п. При этом необходимо учитывать, что для ГА вероятность мутации должна быть на порядок ниже вероятности скрещивания. 2-й этап. Производится инверсия значения гена в к-й позиции: а к = ак.
В случае бинарного алфавита мутация состоит в случайном выборе гена в хромосоме и обмена его на рядом расположенный ген (одноточечный оператор) или перестановке генов, расположенных справа от точек разрыва (двухточечный оператор). Существуют различные модификации точечных операторов: - инверсия - это перестановка генов в обратном порядке внутри случайно выбранного участка хромосомы; - транслокация - это перенос какого-либо участка хромосомы, в другой сегмент этой же хромосомы.
Мутация над вещественными потомками выполняется путем сложения особи с небольшим случайным значением, которое определено заранее выбранным законом1: - мутация на основе распределения Гаусса (Gaussian) - добавляет не большое случайное число ко всем компонентам каждого вектора-особи, согласно формуле 3.12. xfc = х + N (, ), где (3.12) х, xfc - значения вещественной переменной до и после мутации; ц. - математическое ожидание; о - среднеквадратичное отклонение. - мутация на основе равномерного распределения (Uniform) - выбираются случайным образом компоненты векторов и вместо них записываются случайные числа из допустимого диапазона, согласно формуле 3.13. xfc = х + гхА, где (3.13) г - диапазон изменения переменной; Л - случайное число от 0 до 1. - мутация на основе адаптивной вероятности (Adaptive feasible) - генери рует набор направлений в зависимости от последних наиболее удачных и неудач ных поколений и с учетом налагаемых ограничений продвигается вдоль всех направлений на разную длину. Один из вариантов реализации данного оператора является шаг мутации, определяемый формулой 3.14. Ь( У) =У х 0-г{1 т)хЬ), где (3.14) A(t, у) - определяет шаг мутации, который с увеличением номера поколения t уменьшается; Т - максимальное число поколений; Ь - параметр определяющий степень неоднородности.
Необходимо отметить, что оператор кроссинговера - бинарная операция, а оператор мутации - унарная операция. При этом важным понятием является доля кроссинговера (Crossover fraction), которая указывает долю особей, созданных путем скрещивания, а остальная доля создается путем мутации.
Разработка автономных моделей на основе концептуальных планов
Характеристика городов по уровню экологии, основывается на рейтинге, составленном по экологическому индексу 1 (EPI – Environmental Performance Index) за 2014 год. При составлении индекса EPI, учитывается 25 критериев оценки качества экологии, такие как: общее состояние питьевой воды, воздуха, ситуации с отходами, биоразнообразие и политика государств, направленная на улучшение окружающей среды и т.д. По данному рейтингу страны подразделяются на страны со следующими уровнями экологии: очень высокий (Very High), высокий (High), средний (Middle), низкий (Low) и очень низкий (Very Low). Для сужения пространства анализируемых признаков и на основании того, что в последний 5 класс входит небольшое количество стран, города из которых не попадают в 155 рассматриваемых, пятый класс объединен с четвертым.
Опираясь на приведенные выше источники данных, сформирована многомерная БД городов мира. Многомерная БД построена на основе хранилища данных Deductor Warehouse аналитической платформы Deductor Professional на базе СУБД Firebird 1.5. Данная структура содержит 5 измерений (City – город, Сlimate – климат, Ecology – экология, Level of Living – уровень жизни), плюс одно измерение (pop – популяция) и 5 ссылок на перечисленные измерения. В таком виде к БД можно применять алгоритмы интеллектуального анализа данных (ИАД) для выявления правил оценки эпидемиологической опасности городов (рис. 3.36).
Применялись следующие методы ИАД: кластеризация на основе самоорганизующейся карты Кохонена и дерево решений.
Как известно, кластеризация – это группировка объектов по похожести их свойств; каждый кластер состоит из схожих объектов, а объекты разных кластеров существенно отличаются. Кластеризацию используют, когда отсутствуют априорные сведения относительно классов, к которым можно отнести объекты исследуемого набора данных либо, когда число объектов велико, что затрудняет их ручной анализ [15, с. 45].
Самоорганизующаяся Карта Кохонена (СКК) является одним из типов искусственной нейронной сети и позволяет визуализировать результаты кластеризации. Карта состоит из сегментов, называемых ячейками. Каждая ячейка связана с определенным выходным нейроном и представляет собой «сферу влияния» данного нейрона Распределение векторов весов нейронов карты происходит на основе конкурентного обучения. Объекты, векторы признаков которых оказываются ближе к вектору весов данного нейрона, попадают в ячейку, связанную с ним, и распределение объектов на карте в целом соответствует распределению векторов весов нейронов. Следовательно, если объекты на карте расположены близко друг к другу, то и векторы признаков этих объектов близки, и наоборот, если ячейки с объектами находятся далеко друг от друга, то и векторы их признаков различаются сильно [68, с. 45].
Хотя расстояние между объектами позволяет сделать выводы о степени их сходства или различия, также важна информация о том, в чем проявляется это сходство и различие, по каким признакам объекты различаются в наибольшей степени, а по каким – в наименьшей т.д. Именно специальная раскраска помогает получить ответы на эти вопросы, выполняя функцию третьего измерения. Идея состоит в том, что каждой ячейке на карте назначается цвет в соответствии со значениями признаков объектов в ней.
На основании данных о заболеваемости по 105 городам из 155 изучаемых, были разбиты на классы со следующими типами эпидемиологической опасности (ЭО): 1– низкая; 2 – средняя; 3 – высокая; 4 – чрезвычайно высокая. Выборка из 105 городов – обучающая, а остальные 50 городов относятся к тестовой выборке алгоритма кластеризации СКК (рис. 3.37).
В результате моделирования выделились: кластер 2, класс 1 – города с низкой ЭО; кластер 0, класс 2 – города со средней ЭО; кластер 1, класс 3 – город с высокой ЭО; кластер 3, класс 4 – город с чрезвычайно высокой ЭО.
Для составления правил ЭО городов необходимо провести классификацию на основе метода дерева решений (ДР). Классификация с помощью ДР представляет собой иерархический набор условий (правил вида «ЕСЛИ, ТО»), согласно которым данные относятся к тому или иному классу. В построенном дереве присутствует информация о достоверности того или иного правила.
Как и любая модель в ИАД, ДР строится на основе обучающего множества. Атрибуты (свойства) могут быть как числовыми, так и категориальными. Одно из полей обязательно должно содержать независимую переменную – метку класса. Иными словами, для каждой записи в обучающем множестве должна быть задана метка класса, определяющая классовую принадлежность связанного с ней объекта.
Решающие правила формируются в процессе построения ДР, и для каждого из них создается узел. Для каждого узла выбирается атрибут, по которому будет производиться проверка правила. Его принято называть атрибутом ветвления, или атрибутом разбиения, и от того, насколько удачно он выбран, зависит классифицирующая сила правила. Общая цель, которая преследуется при выборе атрибута ветвления – очередной выбранный атрибут должен обеспечивать наилучшее разбиение в узле. Т.е. то, которое позволяет классифицировать наибольшее число примеров и создавать максимально чистые подмножества с минимальной примесью объектов другого класса (то есть не ассоциированного с данным узлом или листом). Таким образом, мерой оценки чистоты возможного разбиения выступает отсутствие примесей.
В процессе построения ДР при определении параметра ветвления на каждом уровне иерархии, по которому происходит разделение на дочерние узлы, используется критерий наибольшего устранения неопределенности. Более значимые факторы, по которым проводится классификация, находятся на более близком расстоянии от корня дерева, чем менее значимые (рис.3.38). Тогда, наиболее значимым фактором (наиболее эффективным для ветвления) оказался параметр «Экология», затем «Климат». Фактор «Уровень жизни» оказался значимым только в сочетании с другими. Еще одним интересным примером значимости различ-174 ных факторов служит отсутствие в построенном дереве параметра "Популяция". Это произошло потому, что все 155 городов имеют разное количество населения, и алгоритм не смог вывести критерий оценки для такого случая.
Приведём примеры правил: ЕСЛИ Экология = 3 И Климат = Континентальный И Уровень жизни = Высокий ТО Класс = 2 (ЭО средняя); ЕСЛИ Экология = 4 (очень плохая экология) И Уровень жизни = Средний ТО Класс = 4 (ЭО чрезвычайно высокая); ЕСЛИ Экология = 3 И Климат = Тропический ТО Класс = 3 (ЭО высокая) и т.п. На основе построенных правил и опыта экспертов-эпидемиологов, для моделирования эпидемии назначаются коэффициенты иммунитета (доля восприимчивого населения) и коммуникабельности (интенсивность взаимодействия) для различных заболеваний. Таким образом, образуется пересечение по параметрам внутри СППЭ. 2) Информационная система анализа трафика (ИСАТ) пассажиров воздушного транспорта.
ИСАТ пассажиров воздушного транспорта, является составной частью СППЭ и создается для обеспечения информационно - программной поддержки ПП СППР «ПРИЗ». ИСАТ пассажиров воздушного транспорта формирует матрицу со строго регламентированным форматом (таблица 9). Таблица 9. Формат матрицы пассажиропотока.