Моделирование информационной системы управления предприятием на основе интеллектуального анализа данных Родионов Константин Владимирович

Диссертация - 480 руб., доставка 10 минут, круглосуточно, без выходных и праздников

Автореферат - бесплатно, доставка 10 минут, круглосуточно, без выходных и праздников

Родионов Константин Владимирович. Моделирование информационной системы управления предприятием на основе интеллектуального анализа данных : диссертация ... кандидата технических наук : 05.13.10 / Родионов Константин Владимирович; [Место защиты: ГОУВПО "Воронежский государственный технический университет"].- Воронеж, 2009.- 140 с.: ил.

Содержание к диссертации

Введение

Глава 1. Методы и средства обработки информации и данных, используемые для создания систем поддержки принятия решений 14

1.1. Классификация информационных систем, СГШР, их состав и решаемые задачи 15

1.2. Типовые задачи интеллектуального анализа данных 23

1.3. Методы обработки многомерных данных, используемые при интеллектуальном анализе в интересах поддержки принятия решений 27

1.4. Проблемные вопросы обработки и анализа многомерных данных в задачах ИАД 30

1.5. Анализ существующих подходов к обработке информации и обоснованию выбора альтернатив 35

1.6 Цель и задачи работы 49

Глава 2. Совершенствование методического обеспечения обработки информации с целью учета неопределенности в исходных данных 52

2.1. Основное содержание методического обеспечения 52

2.2. Методы снятия неопределенности при обработке многомерных данных в задачах поддержки принятия решений 53

2.3. Интеграция методов получения обобщенных показателей 59

2.4. Метод построения обобщенных показателей сложных систем, базирующийся на использовании принципа максимума энтропии 65

Выводы второй главы 73

Глава 3. Методика моделирования и оптимизации хранилища данных на основе анализа информационной потребности пользователей 75

3.1 Модель описания информационного массива хранилища данных СГШР 76

3.2 Модель оценки и оптимизации хранилища данных СГШР на основе информационной потребности пользователя 82

3.3 Разработка и адаптация сигнальной модели аналитического приложения СГШР для анализа предприятий 90

Выводы третьей главы 102

Глава 4. Поддержка принятия решений на предприятии на основе интеллектуального анализа данных 103

4.1. Разработка метода обработки информации в задаче оценивания риска для систем поддержки принятия решения в страховом деле 103

4.2. Структура интеллектуальной системы управления 124

4.3. Функции и алгоритм работы интеллектуальной системы управления 126

4.4 Представление знаний в объектно-ориентированной базе данных 129

Выводы четвертой главы 133

Заключение 134

Список использованных источников 135

Приложения 143

Методы обработки многомерных данных, используемые при интеллектуальном анализе в интересах поддержки принятия решений
Методы снятия неопределенности при обработке многомерных данных в задачах поддержки принятия решений
Модель оценки и оптимизации хранилища данных СГШР на основе информационной потребности пользователя
Функции и алгоритм работы интеллектуальной системы управления

Введение к работе

Актуальность темы. Назначением информационных систем (ИС), независимо от области их применения (в производстве, бизнесе, медицине, образовании, страховании, других областях народного хозяйства) является обеспечение должностных лиц (или лиц принимающих решение - ЛПР) информацией, необходимой для принятия решений в области его деятельности. Стратегическим направлением развития ИС является их интеллектуализация, заключающаяся в построении формализованных процедур обработки, интерпретации и представления информации в виде некоторых показателей (знания), позволяющих их использование непосредственно для принятия управленческого решения в целевой области, т.е. выбора одного из альтернативных вариантов действий ЛПР. В этом случае о подобных ИС говорят как об интеллектуальных информационных системах.

Независимо областей применения ИС они выполняют следующие типовые функции: сбора данных; их обработки, в том числе, направленной на получение сводных показателей; представления данных, результатов обработки и их интерпретации для непосредственного использования ЛПР при принятии решения.

Среди перечисленных функций наиболее сложной для автоматизации с точки зрения построения формальных процедур преобразования данных в информацию, позволяющую ее использование для принятия решения, является построение сводных показателей, характеризующих состояние, эффективность или качество функционирования объекта управления, и их интерпретация.

Если объект управления представляет собой сложную систему, описываемую большим числом характеристик, имеющих различную природу и широкий диапазон значений, когда не очевиден характер связей характеристик объекта между собой и внешними факторами, преобразование

данных в сводные показатели качества его функционирования и их интерпретация усложняется и приобретает характер проблемной задачи. Т.е., она не может быть выражена в терминах конкретного класса прикладных задач, для которого имеется соответствующий математический аппарат. В этом случае возникает необходимость выявить и описать факторы, влияющие на состояние объекта, выбрать или разработать методы обработки информации, ориентированные на учет неопределенности, методы представления и интерпретации информации в таком виде, чтобы решение было принято.

В общем виде информационную задачу, которую необходимо выполнять при поддержке принятия решений в указанных условиях, можно сформулировать, как преобразование исходных данных в некоторые сводные показатели свойств объекта управления, которые не поддаются непосредственному измерению.

Эти показатели могут интерпретироваться как некоторое качество объекта управления в целом или определенных его свойств (сторон): его эффективность, потенциал (потенциалы) достижения целей, вклад в эффективность или выигрыш от определенной деятельности, в которой участвует система и т.п. и характеризуют качественные и прагматические аспекты ее функционирования.

Условия, в которых приходится решать указанную информационную задачу, характеризуются неопределенностью, которая обусловлена одновременным действием целого ряда факторов.

Для решения задач поддержки принятия решений в этих условиях чрезвычайно актуальными являются выработка подходов, которые принципиально ориентированы на работу в так называемой неопределенной или нечеткой среде, а также разработка методов и средств их реализации в информационных системах.

На основании вышеизложенного можно заключить, что разработка (выбор) методов обработки информации и архитектуры информационных систем, предназначенных для поддержки принятия решений в условиях неопределенности, является актуальной и практически значимой задачей.

Основные исследования, получившие отражение в диссертации, выполнялись по направлению Воронежского государственного университета «Проблемно-ориентированные системы управления».

Цель и задачи исследования. Целью исследования является разработка методов моделирования и обработки информации и архитектуры информационных систем управления предприятием, предназначенных для поддержки принятия решений на основе анализа многомерных данных.

Для достижения поставленной цели необходимо решить следующие задачи:

провести системный анализ существующих методов и средств обработки информации в системах поддержки принятия решений;

предложить алгоритм и структуру анализа и обработки многомерных данных с целью учета неопределенности;

описать методику построения обобщенных интегральных показателей сложных систем, базирующуюся на энтропийном подходе;

разработать методику моделирования и оптимизации хранилища данных;

построить модель аналитического приложения системы поддержки принятия решений для предприятия;

предложить структуру базы знаний для функционирования интеллектуальной системы управления;

провести апробацию методики расчета обобщенных интегральных показателей.

Методы исследования. Для решения поставленных задач

использовались основные положения системного анализа, стратегического менеджмента, методов имитационного моделирования, теории управления, исследования операций и оптимизации, методов представления знаний, объектно-ориентированного проектирования и программирования.

Научная новизна. В диссертации получены следующие основные результаты, характеризующиеся научной новизной:

методика анализа и обработки многомерных данных для построения обобщенных интегральных показателей сложных систем, учитывающая неопределенность исходной информации, а также устраняющая формальные и вычислительные сложности в решении задач кластеризации и получении гарантированных оценок;

энтропийный функционал, учитывающий порядок следования элементов системы в задачах, где информация о структуре анализируемых данных является ключевой с точки зрения информационной поддержки принятия решений;

методика моделирования информационного массива хранилища данных, позволяющая проводить количественную оценку хранилища данных с точки зрения обеспечения информационной потребности пользователей, базируясь на теоретико-множественном описании многомерного информационного массива;

сигнальная модель системы поддержки принятия решений предприятия, отличающаяся простотой адаптируемости и учитывающая принципиальные схемы, свойственные мониторингу и анализу состояния предприятий. Практическая значимость и результаты внедрения

Разработанная в работе модель типового аналитического приложения СППР в области мониторинга и анализа состояния предприятий, а также дополняющие существующие алгоритмы аналитических приложений, позволяют оценить объект анализа, - предприятие - а также получить оценки возможных причин того или иного состояния. Предлагаемые в работе алгоритмы и модели позволяют производить построение оценок риска

энтропийным методом, что обеспечивает их гарантированность точки зрения равной значимости вкладов всех факторов риска в его обобщенный показатель. Метод оценивания рисков заключается в факторизации исходных данных, построении на них обобщенных показателей с использованием энтропийного подхода к анализу многомерных данных и разбиения выборки оценок на два класса по критерию среднего уровня риска, обусловленного симметрией кривой упорядоченных значений оценок, -низкого уровня риска и высокогоет организации параллельных вычислений. Предлагаемая в работе интеллектуальная система управления позволяет осуществлять поддержку принятия решений на предприятии и' адаптироваться к непредвиденным изменениям его состояния.

Созданный комплекс алгоритмических средств поддержки принятия управленческих решений апробирован в открытом акционерном страховом обществе «Ингосстрах»(г. Воронеж).

Теоретические и практические результаты работы внедрены в учебный процесс по специальностям «Финансы и кредит» и «Юриспруденция» в Воронежском институте высоких технологий и Воронежском филиале Российского Нового Университета.

Апробация работы. Результаты диссертационной работы докладывались и обсуждались на следующих конференциях и семинарах: Всероссийской конференции «Интеллектуальные информационные системы» (Воронеж, 2005-2007), Всероссийской конференции "Интеллектуализация управления в социальных и экономических системах (Воронеж, 2005-2007), межвузовской конференции «Моделирование систем и информационные технологии» (Воронеж, 2006-2007), семинарах кафедры систем автоматизированного проектирования и информационных систем Воронежского государственного технического университета и кафедры информатики и вычислительной техники Воронежского института высоких технологий (2005-2007).

Публикации. Основные результаты диссертации опубликованы в 10 научных работах, в том числе 1 - в издании, рекомендованном ВАК РФ.

В работах, опубликованных в соавторстве и приведенных в конце автореферата, лично соискателю принадлежат: структура системы поддержки принятия управленческих решений [1], подходы к управлению в социально-экономических системах [2], алгоритмы взаимодействия систем [3], метод построения обобщенных показателей сложных систем [7].

Структура и объем работы. Диссертация состоит из введения, четырех глав, заключения, списка литературы из 98 наименований и приложения. Работа изложена на 143 страницах и содержит 22 рисунка, 11 таблиц.

Во введении обоснована актуальность темы исследования, определены цели и задачи работы, методы решения сформулированных задач, отмечены основные результаты исследования, выносимые на защиту, определена их научная новизна и практическая значимость, приведены сведения об апробации и внедрении результатов работы.

Первая глава посвящена системному анализу методов и средств обработки информации и данных, используемых при создании систем поддержки принятия решений.

Методы обработки многомерных данных, используемые при интеллектуальном анализе в интересах поддержки принятия решений

Методы анализа многомерных данных изучаются и рассматриваются в рамках дисциплины прикладная статистика, где можно указать почти классическую работу [6] и ее более позднее переработанное в виде учебного пособия издание [53].

Основными методами анализа многомерных данных, используемых для ИАД, являются следующие. Метод главных компонент и факторный анализ.

Этот метод используется для наглядного представления (визуализации) исходных данных путем их проецирования на специально подобранное трехмерное пространство, плоскость и числовую прямую, чем одновременно достигается существенное снижение исходного признакового пространства [7]. Главные компоненты (ГК) служат для компактного описания коррелированных данных путем создания наиболее «эффективной», в определенном смысле, линейной комбинации переменных. ГК несут информацию о существенных свойствах исследуемого объекта, представляя собой своего рода его «резонансный» портрет, определяемый составом и структурой связей его элементов. Они позволяют визуализировать проекцию многомерных данных в пространстве меньшей размерности (например, на плоскости). К методу ГК примыкает факторный анализ, целью которого является получение более удачно интерпретируемых комбинаций переменных. Другие методы снижения размерности и графического анализа

Многомерное шкалирование (нахождение пространства наименьшей размерности для многомерных дискретных данных), целенаправленное проецирование (нахождение направлений и проекций данных, отвечающих заданным требованиям и свойствам — таким, как построение кривой регрессии с наименьшей среднеквадратической ошибкой или наиболее удачная кластеризация в пространстве проекции); анализ функциональных данных (в которых наблюдением является функция или изображение). Классификация и дискриминантный анализ.

Классификация данных состоит в выработке правил отнесения точек выборки к одному из классов. При этом число классов и их «метки» (например, названия политических партий, к которым относятся члены парламента) известны. Задача методов классификации - во-первых, найти характеристики, наиболее сильно связанные с принадлежностью к данному классу; во-вторых, анализируя данные характеристики для данного наблюдения, определить, к какому классу это наблюдение ближе всего [24]. Классическим методом классификации является линейный дискриминантный анализ (аналогом которого в эконометрической литературе является логит-регрессия), который разделяет пространство характеристик гиперплоскостью на два класса! Будут рассмотрены альтернативы, в т.ч. непараметрические, данному методу, которые позволяют получить границы более сложной конфигурации. Кластерный анализ.

В отличие от классификации кластерный анализ обеспечивает выявление в данных групп точек (кластеров), явственно отличающихся друг от друга по структуре значений признаков с использованием критериев их близости («подобия»). Важность решения этой задачи связана с тем, что применение- стандартных средств анализа данных (в т.ч. стандартных эконометрических процедур) при наличии кластеров в. данных приведет к смещению как точечных оценок (коэффициентов регрессии), так и стандартных ошибок, а значит, и к неверным статистическим выводам. Кроме того, структура данных и схожесть наблюдений могут представлять и самостоятельный интерес. Имеются два основных подхода к поиску кластеров - иерархический анализ, результатом которого является построение дендрограммы, описывающей близость отдельных точек и кластеров друг к другу, и неиерархический (композиционный) анализ, в котором число кластеров зафиксировано, и необходимо найти оптимальное разбиение точек по этим кластерам. Регрессионный анализ

Занимает центральное место в математико-статистическом инструментарии решения задач прогнозирования состояния и развития сложных систем и процессов, описываемых многомерными данными [7]. Прогноз состояния сложной системы (точечное или интервальное), который получают как значение функции f[X) регрессии (результирующей переменной у) в зависимости от значений объясняющих (предикторных) переменных Х= {х(1), х(2),..., х У (р - размерность вектора данных) формально (математически) записывается в виде ДЯ ) = Е (у/ X = X ). В большинстве случаев используется классическая линейная модель множественной регрессии, которая представляет собой наиболее простой вариант конкретизации требований к общему виду построения функции ДХ), природе объясняющих переменных (характеристик системы) X и статистических регрессионных остатков в общих уравнениях регрессионной связи у(Х) — ЛХ)МХ),ЕЕ(Х) = 0[7].

Задачи обработки и анализа многомерных данных при решении задач управления сложными объектами (процессами) в страховом деле, социально-экономической и образовательной областях принципиально решаются в условиях неопределенности значительного объема исходных данных.

При этом необходимо различать неопределенность в данных, связанную с неполнотой характеристик об условиях жизнедеятельности, определяющих поведение объектов управления (неопределенность I типа), а также неопределенность в реализации мер управляющего воздействия на эти объекты, и условий их существования в перспективе (неопределенность II типа). Неопределенность I типа снимается проведением исследований (социологических, специальных, направленных на выявление параметров поведения объектов и прогнозирование их развития) на различных (типовых) сценариях и выбором варианта, соответствующего наибольшей эффективности управления объектами при различных предположениях о законах распределения параметров, описывающих стохастический характер их поведения. Соответствующие законы распределения выбираются, как правило, на основе использования принципа максимальной энтропии [53].

Неопределенность II типа снимается заданием интервальных оценок, субъективных вероятностей, восстановлением отсутствующих данных, проведением прогнозных расчетов, результатами натурных экспериментов, моделированием, проведением экспертиз. При проведении соответствующих расчетов используются различные методы агрегирования многомерных данных с использованием разных видов средних величин. На этих средних могут быть построены агрегаты, обладающие энтропийными свойствами и, с этой точки зрения, они могут служить мерой неопределенности [10]. Следовательно, для снятия неопределенности II типа целесообразно использовать (выбирать) такие данные, которые минимизируют значение этой меры.

Методы снятия неопределенности при обработке многомерных данных в задачах поддержки принятия решений

Существующие подходы к разработке новых информационных технологий для использования в интересах ППР зачастую предполагают использование методов и критериев эффективности, построенных на основе вероятностных зависимостей. В качестве методов обработки многомерных данных применяются: корреляционный анализ; регрессионный анализ; кластерный анализ; факторный анализ; метод главных компонент; многомерное шкалирование; статистические методы снятия неопределенности. Для получения зависимостей, оценки эффективности функционирования систем при обслуживании заявок, содержание которого соответствует функциональному их назначению, оценки уровня качества объектов и т.п. используются следующие показатели: -процент заявителей, обслуженных системой с определенным уровнем качества (страховой компанией, системой автоматизированного управления); -вероятность соответствия системы предъявляемым требованиям; -вклады отдельных элементов системы и ее подсистем в эффективность системы в целом. время (цикл) обслуживания заявителей, связанный с обработкой информации в системе с различными уровнями качества; затраты на обслуживание заявок (клиентов); полезный эффект (в стоимостном или натуральном выражении), полученный с применением системы. С помощью указанных показателей математические модели обоснования характеристик систем, а также объектов в системе сводятся к решению классическими методами прямой и обратной задач исследования операций: максимизация эффективности при ограничениях на затраты (стоимость) или минимизация затрат при ограничениях на эффективность. Такой подход используется уже несколько десятилетий, фактически с начала разработки формальных методов условной оптимизации и их практического применения в рамках теории исследования операций [13,87]. Опыт применения методов, основанных на оценке указанных показателей, выявил ряд принципиальных и трудно устранимых недостатков при их практическом использовании применительно к обоснованию принятия решений, как на этапах создания информационных систем, так и их применения.

Важнейшим из них является практическая невозможность корректного учета неопределенности в исходных данных, при их обработке, оценке эффективности системы, прогнозировании развития объектов. Кроме этого, при проведении оценки эффективности вариантов развития объектов трудноустранимыми являются следующие недостатки: v - субъективизм в выборе частных показателей и критериев эффективности; сложности решения задач многокритериальной оптимизации; неполное соответствие оценки эффективности процесса обслуживания сложных и многоплановых объектов реальному процессу с помощью набора частных критериев; отсутствие методологии содержательного и формального описания объектов, что приводит к определенному произволу в выборе типа моделей, объему и степени детализации необходимых исходных данных. При этом на всех этапах исследований возникает проблема снятия неопределенностей различного вида: сценариев поведения объектов, условий их жизнедеятельности, факторов внешней среды, полноты и достоверности исходных данных, методов обработки информации и правил принятия решений. [39,40,49]. Неопределенность перечисленных факторов (параметров) имеет различную природу: стохастическую (возникающую из-за случайного характера проявления факторов), вариабельную (возникающую из-за наличия нескольких возможных значений факторов), параметрическую (принципиально не имеющую стохастической природы и возникающую из-за невозможности получить полную совокупность значений параметров).

В рамках существующих подходов снятие неопределенности достигается путем распространения аксиоматики теории вероятностей на формализацию процессов жизнедеятельности объектов. Такое расширительное применение теории вероятностей зачастую осуществляется без доказательств корректности ее использования, которое (в соответствии с методологией теории вероятностей) предполагают [15]: -определение пространства элементарных событий; -построение алгебры элементарных событий; -определение меры событий; -доказательство вероятностного характера принятой меры, т.е. обоснования справедливости системы аксиом, которым подчиняется вероятностная мера (счетная аддитивность, мультипликативность на множестве независимых событий, счетная монотонность меры, ограниченность меры на всем пространстве элементарных событий). Следствием этого является, например, произвол в применении формул теории вероятностей для получения количественных оценок сложных "событий" путем перемножения нескольких "вероятностей более простых событий" без какого-либо обоснования их независимости. Нахождение "вероятностей простых событий", как правило, осуществляется путем необоснованного допущения об их соответствии аксиоматике теории вероятностей (не подвергается сомнению возможность построения алгебры событий, элементом которой является "простое событие"). Из-за отсутствия или даже принципиальной невозможности получения представительной статистики законы распределения случайных величин -параметров моделей - определяются на основе допущения о справедливости предельных теорем теории вероятностей. Известно, что такое допущение может привести к существенному завышению (в 2...3 раза) рассчитываемых параметров только из-за различий принимаемых законов распределения случайных величин при равенстве их первых начальных моментов [32]. Субъективизм в использовании вероятностной меры, в конечном итоге, приводит к расхождению, порой довольно существенному, получаемых на моделях результатов и экспериментальных данных [14,38]. Изложенные выше недостатки вероятностных подходов делают актуальной проблему адекватной формализации моделей прагматических свойств объектов (под прагматическим свойством объекта будем понимать латентную, непосредственно не измеряемую величину, соответствующую целевой установке конкретной функциональной системы, уровень которых собственно и является информацией, необходимой для принятия решения.

Модель оценки и оптимизации хранилища данных СГШР на основе информационной потребности пользователя

Одним из наиболее перспективных направлений в развитии информационных технологий являются системы поддержки принятия решений. Системы поддержки принятия решений базируются на следующих технологических объектах: оперативные базы данных, хранилища данных, системы оперативной аналитической обработки информации и интеллектуальный анализ данных. В тоже время классические методы поддержки принятия решений в большинстве своем хоть и разработаны довольно давно и получили широкое распространение, не имеют под собой четкого математического обоснования. Модели упомянутых групп объектов представляют собой основной объект нашего исследования; в различных интерпретациях или сочетаниях они позволяют получить комплексное описание многих аспектов информационной деятельности. Модель для аналитической обработки информации будет рассмотрена далее. В настоящем разделе будет рассмотрена модель описания хранилища данных с точки зрения обеспечения информационной потребности пользователя. Контур аналитических срезов, рассмотренных в предыдущем разделе главы, включает процессы получения множества аналитических срезов F0 (3.1) и преобразования (индексирования) каждого аналитического среза в образ с созданием массива образов аналитических срезов (ОАС): с созданием массива образов пользовательских запросов (ОПЗ) Qo Заметим, что компоненты dlk,ajm,ajm в выражениях (3.10) - (3.12) имеют ту же интерпретацию, что и компоненты dlk. в выражении (3.2): равны 1 при наличии измерения в аналитическом срезе (ОАС) или запросе (ПОЗ) и 0 при его отсутствии.

Важной характеристикой информационной системы является критерий соответствия информационной потребности, то есть формальная оценка обеспечения информационной потребности пользователей. Критерий соответствия информационной потребности (КСИП) есть пара: где Р есть мера формальной релевантности, или мера близости (способ исчисления близости) образов аналитического среза и образов пользовательского запроса, к - пороговое значение меры близости, при превышении которого аналитический срез признается формально релевантным соответствующему запросу. Данное определение, хотя и не отвечает полностью применяемым в СППР критериям, тем не менее, позволяет описать такие возможности, как сужение или расширение запроса. Это достигается, соответственно, увеличением или уменьшением порога релевантности к . Известны следующие меры формальной релевантности: скалярное произведение qmfk (нормированные меры (3.15), (3.16) изменяются от 0 до 1). Сопоставление информационной потребности пользователя и возможности предоставления аналитической информации в необходимом пользователю виде состоит в построении матрицы соответствия: где р тк определяется по одному из соотношений (3.14) - (3.16) и в последующем составлении множества формально релевантных т-щ запросу аналитических срезов Fm, таких, что для всех т Л с: Fcm о /С = Р(дт,Ук) кс (3.18) В рамках настоящего исследования для расчета меры формальной релевантности используется соотношение 3.14. Таковы основные компоненты процессов в модели СППР на базе хранилища. Далее рассмотрим методы оценки системы. Задание множества F„, мало что говорит о качестве обеспечение информационной потребности qm. Его необходимо рассматривать совместно с множеством истинно релевантных аналитических срезов Fm . Поскольку в общем случае: : к (3.19) где F т - формально релевантные срезы в соответствии с мерой формальной релевантности j3, F т - истинно релевантные срезы в соответствии с информационной потребностью пользователя. Применяются различные способы измерения данного отклонения, в совокупности, именуемые критериями оценки технологической эффективности СППР, или способности системы выдавать релевантные и задерживать нерелевантные т-му потребителю аналитические срезы. Опишем эти критерии и соответствующие им понятия хранилищ данных, опуская далее индекс запроса (информационной потребности) «т» (т.е. соотношение (2.13) рассматривается в виде: ИФ Fc). Прежде всего, рассмотрим координаты описания выхода СППР с точки зрения потребителя информации: -диаграмма F или диаграмма Эйлера-Венна (рис. 3.5); -таблица сопряженности или диаграмма а, Ъ, с, d (рис. 3.6); -диаграмма п, х (рис. 3.7). Относительно координат п, х необходимо заметить, что допустимые представления (имеющие смысл сочетания числа выданных релевантных - х и всего представленных аналитических срезов - п) находятся в незаштрихованной области О И р0 Д, ограниченной прямыми линиями: О И: х Проиллюстрируем вышесказанное в понятиях хранилища данных -представление данных в виде «куба», состоящего из образов аналитических срезов. На рисунке 3.8 выделено два образа (А и В) аналитических срезов, оба они формально релевантные информационной потребности пользователя (ОПЗ), однако истинно релевантным является только запрос А. Эти два ОАС имеют общую грань (0,0 ,1,1) - (0,1,1,1) -(1,1,1,1)-(1,0,1,1).

Функции и алгоритм работы интеллектуальной системы управления

Функции тесно связаны с определением и структурой ИСУ, а также с логикой работы конструируемой системы. Опишем их.

Объектно - ориентированная база данных содержит в себе временную логику изменения объектов и их атрибутов. Значения этих объектов, рассмотренные на временном лаге, поступают в базу знаний 1-го класса (на рис. 39 поступление знаний представлено в виде стрелок). На основании этого можно выделить первую функцию: ИСУ рассматривает на временном отрезке все конкретные значения объектов и представляет эти данные для других элементов системы.

Далее, БЗ 1 с помощью логических фильтров (триггеров событий) производит распознавание текущего состояния системы. Причем БЗ 1 начинает свою работу только при поступлении из объектно-ориентированной базы данных информации об отклонениях в запланированной работе фирмы.

Из этого вытекает вторая функция: ИСУ посредством базы знаний 1-го класса и имеющихся знаний производит идентификацию проблемы с помощью триггеров событий и на выход БЗ 1 поступает распознанная ситуация.

После выделения события, эти знания поступают в базу знаний 2-го класса, которая анализирует текущую ситуацию. Затем БЗ 2 вырабатывает конкретные альтернативные действия и осуществляет конечный расчет по использованию того или иного объекта. Следовательно, третья функция заключается в следующем: ИСУ на основании имеющихся в БЗ 2 знаний и знаний, поступающих из ООБД производит диагностику ситуации, генерирует возможные альтернативные действия, производит их оценку и вырабатывает конкретное решение.

После этого, ЛПР вводит действие. В ООБД начнет отслеживаться информация, связанная с реакцией системы на введенное действие. Параллельно этому, знание о введенном действии поступает в базу знаний 3-го класса. После этого в БЗ 3 от ООБД начинает поступать информация о реакции системы. БЗ 3 начинает накапливать полученные знания и затем передавать эти знания во все остальные элементы активной системы (на рис. 39 показано пунктирными стрелками). Таким образом, четвертая функция заключается в следующем: ИСУ через БЗ 3 отслеживает реакцию предприятия на принятое решение. После этого она фиксирует полученные знания, запоминает их и передает в БЗ 1, БЗ 2 и ООБД. Тем самым активная система управления является саморазвивающейся системой, которая накапливает опыт и вырабатывает новые знания.

На всех этапах функционирования ИСУ работает диалог управления, посредством которого происходит передача знаний ЛПР. Таким образом, пятую функцию можно сформулировать так: ИСУ посредством диалога производит отображение знаний, необходимых ЛПР при работе.

В соответствии с разработанным теоретическим инструментарием и концептуальными основами проектирования ИСУ, предложенными в разделе 1 можно предложить агрегированный алгоритм функционирования ИСУ (см. рис. 4.4).

В результате разработанной целевой направленности деятельности предприятия перейдем к логически связанной с этим процессом задачей формирования объектно-ориентированной базы данных (ООБД). ООБД является одним из самых насыщенных блоков и его формирование должно соответствовать основам объектно-ориентированного проектирования, который включает в себя этапы, представленные на рис. 4.5. вверх. Его можно скорее всего назвать "возвратным проектированием", что подразумевает ступенчатый и итеративный процесс разработки системы с постепенной модификацией различных, но тем не менее согласованных между собой логических и физических представлений о системе в целом. Первой составляющей ООБД является словарь объектов (объекты ЛПР) и их атрибутов. Организация этого словаря представлена на рис. 4.6.

Этот словарь представляет собой классификационную таблицу, структура которой соответствует фреймовому представлению знаний и использует основное преимущество такого представления: фрейм, как структура описывает одну из единиц обработки, обладающую до некоторой степени независимостью, и может предоставлять средства, связывающие между собой эти структурные элементы. Этап конструирования словаря объектов и атрибутов отражает два первых этапа объектно-ориентированного проектирования.

Второй составляющей ООБД является словарь глаголов ЛПР. Конструкция этого словаря очень похожа на предыдущую. Структура словаря глаголов по наличию различных иерархических связей гораздо проще, чем словарь объектов и атрибутов. Однако по семантическому содержанию словарь глаголов представляет собой довольно насыщенную структуру, занимающую достаточно большой объем дискового пространства.

Конструирование словаря объектов ЛПР отражает только частично третий этап объектно-ориентированного проектирования. Поэтому перейдем к рассмотрению третьей составляющей ООБД, - семантической сети. Семантическая сеть осуществляет в полной мере третий этап объектно-ориентированного проектирования и производит простое, быстрое, эффективное и наглядное представление взаимодействия объектов, атрибутов и глаголов между собой. Семантическая сеть позволяет описать практически все знания ЛПР, необходимые для дальнейшего анализа фирмы. Таким образом можно сделать вывод, что ООБД представляет собой определенным образом организованную и поддерживаемую языковыми и программными средствами совокупность взаимосвязанных между собой объектов, хранимых на технических носителях и описывающих, в нашем случае, предметную область менеджмента.

Моделирование информационной системы управления предприятием на основе интеллектуального анализа данных Родионов Константин Владимирович

Методы обработки многомерных данных, используемые при интеллектуальном анализе в интересах поддержки принятия решений

Методы снятия неопределенности при обработке многомерных данных в задачах поддержки принятия решений

Модель оценки и оптимизации хранилища данных СГШР на основе информационной потребности пользователя

Функции и алгоритм работы интеллектуальной системы управления

Похожие диссертации на Моделирование информационной системы управления предприятием на основе интеллектуального анализа данных