Электронная библиотека диссертаций и авторефератов России
dslib.net
Библиотека диссертаций
Навигация
Каталог диссертаций России
Англоязычные диссертации
Диссертации бесплатно
Предстоящие защиты
Рецензии на автореферат
Отчисления авторам
Мой кабинет
Заказы: забрать, оплатить
Мой личный счет
Мой профиль
Мой авторский профиль
Подписки на рассылки



расширенный поиск

Разработка средств информационного мониторинга многомерных объектов на основе технологии оперативного анализа данных Холод Илона Сергеевна

Разработка средств информационного мониторинга многомерных объектов на основе технологии оперативного анализа данных
<
Разработка средств информационного мониторинга многомерных объектов на основе технологии оперативного анализа данных Разработка средств информационного мониторинга многомерных объектов на основе технологии оперативного анализа данных Разработка средств информационного мониторинга многомерных объектов на основе технологии оперативного анализа данных Разработка средств информационного мониторинга многомерных объектов на основе технологии оперативного анализа данных Разработка средств информационного мониторинга многомерных объектов на основе технологии оперативного анализа данных Разработка средств информационного мониторинга многомерных объектов на основе технологии оперативного анализа данных Разработка средств информационного мониторинга многомерных объектов на основе технологии оперативного анализа данных Разработка средств информационного мониторинга многомерных объектов на основе технологии оперативного анализа данных Разработка средств информационного мониторинга многомерных объектов на основе технологии оперативного анализа данных
>

Диссертация - 480 руб., доставка 10 минут, круглосуточно, без выходных и праздников

Автореферат - бесплатно, доставка 10 минут, круглосуточно, без выходных и праздников

Холод Илона Сергеевна. Разработка средств информационного мониторинга многомерных объектов на основе технологии оперативного анализа данных : Дис. ... канд. техн. наук : 05.13.01 Москва, 2005 216 с. РГБ ОД, 61:06-5/368

Содержание к диссертации

Введение

Глава 1. Обзор современного состояния методов и средств хранения, организации и анализа многомерных данных для информационного мониторинга 18

1.1. Системы поддержки принятия решений как средства хранения, организации и анализа данных 18

1.2. Способы аналитической обработки данных 26

1.3. Интеграция технологии аналитической обработки данных и интеллектуального анализа данных 35

1.4. Подходы к классификации мониторинговых информационных систем 36

1.5. Постановка задачи диссертации 40

Выводы по главе 1 42

Глава 2. Теоретические подходы к организации мониторинга Моделирование системы информационного мониторинга на основе технологии оперативного анализа данных - OLAP-техиологии 44

2.1. Концептуальные основы оперативного анализа данных 44

2.2. Технические аспекты многомерного хранения данных 50

2.3. Математическая модель системы информационного мониторинга многомерных объектов 54

2.4. Многомерная модель агрегирования данных OLAP-куба 58

Выводы по главе 2 61

Глава 3. Анализ и разработка механизма агрегирования многомерных объектов 63

3.1. Способы агрегации OLAP-куба 63

3.3. Организация процедуры формирования агрегатов. Разработка алгоритма агрегации многомерных данных 74

3.3.1. Процедура предварительного формирования агрегатов 75

3.3.2. Процедура оперативного формирования агрегатов 77

3.3.3. Разработка алгоритма агрегации первичных данных 78

3.3.4. Разработка методики проведения информационного мониторинга 83

Выводы по главе 3 86

Глава 4. Реализация методики информационного мониторинга многомерного объекта на примере анализа кадрового потенциала 88

4.1. Современное состояние использования методов оперативного и интеллектуального анализа данных в кадровой сфере для целей мониторинга 88

4.2. Место систем кадрового мониторинга в классификации мониторинговых информационных систем 95

4.3. Формализованное представление кадрового потенциала как системы многомерных объектов 98

4.4. Разработка математической модели оценки эффективности использования технологии оперативного анализа данных для мониторинга кадрового потенциала 100

4.5. Разработка структурно-функциональной схемы мониторинговой системы 105

4.6. Процессный подход при работе с профаммными средствами реализации информационного мониторинга 111

4.7. Создание многомерной базы данных мониторинга кадрового потенциала холдинговой структуры 124

4.8. Клиентская часть системы мониторинга кадрового потенциала холдинговой структуры 130

Выводы по главе 4 135

Заключение 136

Список литературы 138

Введение к работе

Актуальность работы. В современных условиях развития общества в ряде холдинговых структур страны, особенно с высокой долей государственной собственности, происходят такие негативные явления, как сокращение численности и старение работников в целом по всему холдингу. Средний возраст руководящего состава варьирует в промежутке 50-56 лет, квалифицированных кадров — 40-50 лет по входящим в состав холдинга отраслям, в среднем же по России данные показатели составляют 43 и 40 лет соответственно. Средняя по предприятиям интегрированной структуры доля работающих пенсионеров в общей численности работников составляет 15-20%, в то время как выпускников учебных заведений — менее 2%. Отток молодежи, снижение качества подготовки в учебных заведениях по отдельным техническим специальностям, смещение общественных приоритетов из сферы производства в сферу обращения (работать на предприятиях не только экономически невыгодно, но и непрестижно; в вузах по-прежнему высокий конкурс на экономические, юридических и т.п. специальности) говорят о широкомас-штабности возникшей проблемы, которая охватывает различные аспекты жизни страны: политический — в части правового регулирования, экономический — в области бюджетного финансирования, образовательный, культурный и т.д.

Проблема носит комплексный характер, ее решение требует наиболее точной диагностики текущего состояния и формирования прогноза, которые выполнялись бы на регулярной основе, то есть необходим мониторинг всей структуры в части кадрового обеспечения. Своевременный и адресный мониторинг позволит идентифицировать проблему, ее причины и последствия на более раннем этапе появления, принять ответные меры и спрогнозировать дальнейший ход событий. Таким образом, эффективность управления холдинговой структуры значительно возрастет.

В холдинговой структуре отсутствует целостная информационная база о текущем состоянии основных кадровых показателей. Существуют лишь разрознен- ные локальные информационные источники по отдельным отраслям структуры. Аналитические отчеты выполняются вручную и охватывают лишь определенные аспекты проблемы. Таким образом, можно утверждать, что в сегодняшних условиях полноценный мониторинг всей холдинговой структуры невозможен, требуются идентификация и организация данных в единый информационный ресурс, а также разработка инструментария, в частности методики, схемы, алгоритма для проведения мониторинговых исследований.

Мониторинг должен охватывать многие аспекты кадрового потенциала, а для этого необходим сбор, обработка и хранение огромного массива разнородной информации. Кадровый потенциал в своей совокупности представляет многомерный сложный объект, поэтому использование современных компьютерных технологий и новейших разработок в области информационных систем целесообразны.

Изучение проблемы кадрового обеспечения ведется уже многие годы. Результаты исследований, направленных на создание эффективных методов и моделей изложены в работах отечественных ученых А.М.Омарова, В.А.Шахова, В.А.Дятлова, В.В.Травкина В.Г.Игнатова А.В.Понеделькова, М.В.Глазырина, С.ВАндреева, Е.В.Охотского и зарубежных специалистов Дж. Иванцевича, М.Х.Мескона, М.Альберта, Ф.Хедоури и др. [20, 21, 24, 25, 43, 52, 71, 91, 118]. К сожалению, все они связаны с изучением отдельных аспектов, в то время как управление кадровым потенциалом носит междисциплинарный характер. К тому же вопросы применения информационных технологий, в частности по работе с многомерными объетами, в кадровой сфере в масштабах крупной интегрированной структуры в настоящий момент не нашли отражения в научных исследованиях.

Одной из наиболее перспективных современных разработок в области организации аналитичесокой работы с многомерными объетами являются технологии оперативного анализа данных - OLAP-технологии. Они позволяют работать с огромными массивами разнородной информации, организовывать ее сбор, хранение, обработку, создавать гибкий аналитический инструментарий. В настоящее время OLAP-технологии еще только начинают внедрять крупные предприятия, при этом сфера применения достаточно узка: сбытовая, финансовая и др.

В настоящее время OLAP-технологии в сфере работы с кадровой информацией не применяются [100, 82, 89,106].

Следует заметить, что интеграция технологий-OLAP и интеллектуального анализа данных является одним из перспективных направлений в сфере информационных технологий в настоящий момент.

Целью диссертации является разработка средств информационного мониторинга многомерных объектов на основе технологии оперативного анализа данных - OLAP-технологий (on-line analytical process).

Объекты и задачи исследования. Согласно цели были выделены следующие объекты и задачи диссертационного исследования:

1. Методы и средства хранения, организации и анализа многомерных данных для информационного мониторинга

Исследование систем поддержки принятия решений как средств хранения, организации и анализа данных.

Анализ и классификация способов аналитической обработки данных.

Исследование методов интеллектуального анализа данных для целей интеграции с технологиями оперативного анализа данных.

2. Методы и средства информационного мониторинга

Определение функциональности и научных основ мониторинга. Подходы к классификации информационных систем и позиционирование мониторинговых информационных систем.

3. Моделирование системы информационного мониторинга на основе технологии оперативного анализа данных

Определение технических аспектов оперативного анализа данных, определение технических аспектов многомерного хранения данных.

Разработка математической модели информационного мониторинга.

4. Анализ и разработка механизма агрегирования

Определение способа агрегации данных.

Разработка алгоритма агрегации данных.

Определение и анализ вычислительных ресурсов механизма агрегирования.

Организация процедуры формирования агрегатов.

Разработка методики информационного мониторинга. 5. Реализация методики информационного мониторинга многомерных объектов в кадровой сфере.

Исследование структуры кадрового потенциала, выделение основных сущностей и характеристик кадрового потенциала.

Формализация представления кадрового потенциала как системы взаимосвязанных измерений.

Разработка математической модели оценки эффективности использования технологии оперативного анализа данных.

Определение состава и иерархических структур многомерного объекта.

Разработка структурно-функциональной схемы мониторинговой информационной системы.

Разработка программных средств реализации информационного мониторинга кадрового потенциала на основе технологии оперативного анализа данных. Методы исследования. В диссертационном исследовании были использованы методы системного анализа, дискретной математики, теории графов, комбинаторного анализа, социальной статистики, теории управления, теории реляционных баз данных.

Научная новизна. В диссертационной работе осуществлено решение научная проблема разработки средств информационного мониторинга многомерных объектов на основе технологии оперативного анализа данных - OLAP-технологий (on-line analytical process). В процессе исследований и разработок получены следующие новые научные результаты, а именно:

1. Исследованы методы и средства хранения, организации и анализа многомерных, а также методы интеллектуального анализа данных для целей интеграции с технологиями оперативного анализа данных.

В классификации информационных систем мониторинговые информационные системы выделены как подкласс экспертных советующих систем.,

Разработана математическая модель информационного мониторинга,

Разработан алгоритм агрегации первичных данных.

Создана методика информационного мониторинга.

Исследованы структура кадрового потенциала, выделены основные сущности и характеристики КП. Создано формализованное представление кадрового потенциала как системы взаимосвязанных измерений.

Разработана структурно-функциональная схема мониторинговой информационной системы.

Использование технологии оперативного анализа данных позволило повысить производительность мониторинга в 6 раз и увеличить возможное число агрегатов для информационного мониторинга.

По результатам работы получено свидетельство об официальной регистрации программ для ЭВМ № 200311776 Российское агентство по патентам и товарным знакам (Роспатент).

Результаты диссертационного исследования внедрены в учебный процесс для преподавания учебных дисциплин «Информационные системы», «Автоматизированные информационные системы в экономике», «Информационные технологии управления», «Информационные технологии в государственном и муниципальном управлении», «Проектирование, модернизация и эксплуатация экономических информационных систем».

Достоверность полученных результатов подтверждается соответствием результатов теоретического анализа реальному функционированию системы, а также использованием классического аппарата дискретной математики.

Практическая ценность работы. По результатам диссертационных исследований разработана структурно-функциональная схема мониторинговой информационной системы для холдинговых структур разнообразных форм собствен- поста и специфик деятельности. Математическая модель информационного мониторинга позволяет строить системы заданных глубины и широты охвата. Для мониторинговой системы кадрового потенциала данные показатели составили 3 уровня и 7 измерений соответственно. Представленные в работе алгоритм агрегации первичных данных и процедура формирования агрегатов направлены на решение задач оптимизации занимаемого пространства и времени выполнения запроса пользователя. Полученные результаты доведены до уровня практического использования и внедрены, в частности, для решения задачи разработки автоматизированного рабочего места аналитика в электронной промышленности оборонно-промышленного комплекса.

Практическая значимость подтверждена актом внедрения Закрытого акционерного общества «Территориальное агентство по развитшо предпринимательства Зеленоградского административного округа» - ЗАО «ТАРП-Зеленоград».

Результаты диссертационного исследования внедрены в учебный процесс для преподавания учебных дисциплин, «Информационные технологии», «Информационные технологии управления», «Автоматизированные информационные системы», «Проектирование, эксплуатация и модернизация информационных систем».

Личный вклад автора

На основе аналитического обзора методов и средств хранения, организации и анализа многомерных объектов, а также методов интеллектуального анализа данных сделан вывод об актуальности создания средств информационного мониторинга многомерных объектов. Предложено использование технологий оперативного анализа данных для решения задач мониторинга, а также их интеграция с технологиями интеллектуального анализа данных.

Создано формализованное представления кадрового потенциала как системы взаимосвязанных измерений.

Разработана математическая модель кадрового потенциала.

Разработан алгоритм агрегации многомерных данных.

Разработана методика информационного мониторинга кадрового потенциала.

6. Создана структурно-функциональная схема мониторинговой информационной системы.

Реализация полученных результатов. Исследования, изложенные в диссертации проводились в рамках следующих проектов:

НИР «Комплексные аналитические исследования кадрового потенциала ОПК, системы планирования, подготовки (переподготовки) и закрепления управляющих, научных, инженерных и рабочих кадров с разработкой предложений по обучению руководящего звена ОПК основам внедрения ИПИ-технологий и взаимоувязанному планированию развития и сохранения кадрового потенциала ОПК в условиях его реформирования» (Шифр «Кадровый потенциал»);

НИОКР «Разработка на основе информационных технологий системы планирования, подготовки, подбора и закрепления кадров предприятий научно-промышленного комплекса электронной промышленности Зеленограда».

НИР «Разработка автоматизированной информационно-аналитической системы поддержки принятия кадровых решений с использованием новейших информационных технологий», №576-ГБ-53-Гр.асп. - ИПОВС.

Все работы по реализации и внедрению проводились под руководством или при непосредственном участии автора. Результаты диссертационной работы используются в учебном процессе на кафедре ИПОВС в МИЭТ.

В результате проведенных исследований получены и выносятся на защиту следующие основные научные результаты:

Позиционирование мониторинговых информационных систем как подкласса экспертных советующих систем (ЭСС).

Математическая модель информационного мониторинга кадрового потенциала.

Алгоритм агрегации многомерных данных на основе технологии оперативного анализ данных.

Методика информационного мониторинга многомерных объектов.

Структурно-функциональная схема мониторинговой информационной системы,

Формализованное представление кадрового потенциала как многомерного объ- екта.

Апробация работы и публикации. Основные положения диссертационной работы докладывались и обсуждались на следующих конференциях:

Десятая юбилейная Международная студенческая школа-семинар «Новые информационные технологии» (Москва, МГИЭМ, 2002).

Десятая всероссийская межвузовская научно-техническая конференция студентов и аспирантов «Микроэлектроника и информатика» (Москва, МИЭТ, 2003).

Девятая Международная научно-практическая конференция студентов, аспирантов и молодых ученых «Современные техника и технологии» (Томск, Томский политехнический университет, 2003).

Одиннадцатая Международной студенческой школы-семинара «Новые информационные технологии» (Москва, МГИЭМ, 2003). V Всероссийская молодежная научно-практическая конференция «Антикризисное управление в России в современных условиях» (Москва, МГТУ им. Н.Э. Баумана, 2003).

Одиннадцатая Всероссийская межвузовская научно-техническая конференция студентов и аспирантов «Микроэлектроника и информатика» (Москва, МИЭТ, 2004).

Шестой международный симпозиум «Техномат&Инфотел 2004» Болгария, Бургас 2004

Двенадцатая Всероссийская межвузовская научно-техническая конференция студентов и аспирантов «Микроэлектроника и информатика» (Москва, МИЭТ, 2005).

По результатам работы сделано 17 публикация из них 11 статей.

Основные результаты диссертационной работы опубликованы в следующих изданиях:

Гагарина Л.Г., Холод И.С. Некоторые аспекты выбора стратегии управления оборотным капиталом малого предприятия .//Оборонный комплекс - научно- техническому прогрессу России: Межотр. научн.-техн. журнал М.: ВИМИ, 2002. Вып. 3, с.90-96 7 с.

Холод И.С. Моделирование бизнес-процессов малого предприятия для управленческого учета на основе IDEF-технологии// Микроэлектроника и информатика - 2002. Девятая всероссийская межвузовская научно-техническая конференция студентов и аспирантов: Тезисы докладов. М.: МИЭТ, 2002-С.93.

Холод И.С. IDEF-технологии как средство моделирования бизнес-процессов малого предприятия// Новые информационные технологии. Тезисы докладов X Юбилейной Международной студенческой школы-семинара, -М.:МГИЭМ, 2002 -, с.263.

Гагарина Л .Г., Холод И.С. Без профессионалов ВПК не выжить// Служба кадров. - М.: №12, 2002 С.17-21

Нестеров А.Э., Гагарина Л.Г., Холод И.С. Анализ действующего законодательства в области кадрового обеспечения ОШС// Компас промышленной реструктуризации. Периодический информационный журнал для практиков №2 (3), М: Компас, 2003 г., С.19-20.

Нестеров А.Э., Лисов О.И, Гагарина Л.Г., Холод И.С. Учебно-методические центры по обучению руководящего звена оборонно-промышленного комплекса основам внедрения ИПИ-технологий Компас промышленной реструктуризации. Периодический информационный журнал для практиков №2 (3), М: Компас, 2003 г., С.38-39.

Холод И.С. Мониторинг кадрового потенциала оборонно-промышленного комплекса как система управления качеством образования// Современные техника и технологии. IX Международной научно-практическая конференция студентов, аспирантов и молодых ученых, Томский политехнический университет, 2003, с. 98-99.

Холод И.С. Разработка автоматизированной информационной системы мониторинга кадрового потенциала оборонно-промышленного комплекса// Микроэлектроника и информатика - 2003. Десятая всероссийская межвузовская научно- техническая конференция студентов и аспирантов: Тезисы докладов. М.: МИЭТ, 2003, -с 285

Холод И.С. Разработка информационной технологии проведения комплексных аналитических исследований кадрового потенциала приоритетных отраслей промышленности// Новые информационные технологии. Тезисы докладов XI Юбилейной Международной студенческой школы-семинара, - М.:МГИЭМ,

2003 - с.300.

Гагарина Л.Г., Холод И.С. Новые знания - по новому принципу// Служба кадров М. 2003, Я 5, с 88-92

Гагарина Л.Г., Бондаренко СВ., Холод ИС. Модель процесса управления микроволновым нагревом// Известия вузов. Электроника. М.: МИЭТ, 2003, № 4с 11-13

Гагарина Л.Г., Холод И.С. Новые знания - новые технологии Служба кадров М. 2003, № 12

Холод И.С. Концептуальные основы построения системы аналитической обработки кадровой информации крупного промышленного комплекса на основе современных информационных технологий// Антикризисное управление в России в современных условиях. V Всероссийская молодежная научно-практическая конференция. Тезисы докладов т-М.: МГТУ им. Н.Э. Баумана, 2003 -с.355-356.

Холод И.С. Особенности построения автоматизированной системы мониторинга кадрового потенциала крупного промышленного комплекса// Микроэлектроника и информатика - 2004. 11-я Всероссийская межвузовская научно-техническая конференция студентов и аспирантов: Тезисы докладов - М.: МИЭТ,

2004 - с 296 Larisa G. Gagarina, Попа S.Kholod. Conceptual bases of information analytical system engineering of human resources monitoring// «Техномат&Инфотел 2004» - Шестой международный симпозиум. Сборник научных статей. Электронный журнал ()- Болгария, Бургас 2004 Larisa G. Gagarina, Попа S.Kholod. Organisation of case-technology education by distance technologies// «Техномат&Инфотел 2004» - Шестой международный симпозиум. Сборник научных статей. Электронный журнал (, Бургас 2004.

Холод И.С. Использование OLAP-технологий для проектирования мониторинговых систем//// Микроэлектроника и информатика - 2005. 12-я Всероссийская межвузовская научно-техническая конференция студентов и аспирантов: Тезисы докладов - М: МИЭТ, 2005.

Холод И.С. Модель мониторинга кадрового потенциала холдинговой структуры на основе технологии оперативного анализа данных - OLAP// Вопросы экономических наук, М., Изд. «Компания Спутник+», №6 2005.

Холод И.С. Методика и алгоритм мониторинга кадрового потенциала холдинговой структуры// Вопросы экономических наук, М., Изд. «Компания Спутник», №6 2005.

Структура и объем диссертации. Диссертация состоит из введения, четырех глав, заключения, библиографического списка из 120 наименований и приложения с актами внедрения научных разработок на практике. Работа изложена на 148 страницах (120 страниц основного текста), содержит 8 таблиц и 36 рисунков.

Во введении обосновывается актуальность темы диссертации, формулируются общие проблемы, цели и задачи исследования, рассматривается структура диссертации и взаимосвязь отдельных глав.

В первой главе проведены анализ современного состояния методов и средств хранения, организации и анализа данных. Определены основные задачи анализа, выполняемые системами поддержки принятия решений. Рассмотрены способы и классификация методов аналитической обработки данных, а также анализ современного состояния методов и средств мониторинга, определены принципы и научные основы мониторинга. Мониторинговые информационные системы были позиционированы как подкласс экспертных советующих систем. В главе приводит- ся обоснование выбора технологии оперативного анализа данных для построения мониторинговой информационной системы.

Во второй главе рассмотрена концепция оперативного анализа данных. Созданы математическая модель системы мониторинга и многомерная модель агрегирования данных OLAP-куба.

В третьей главе приводится анализ и разработка механизма агрегирования, оценка его эффективности и организация.

Для этого были описаны способы агрегации OLAP-куба, проведен анализ вычислительных ресурсов механизма агрегирования. Предложено использование методов теории графов, в частности методов линейного программирования для нахождения кратчайшего пути на графе, для организации процедуры формирования агрегатов и минимизации вычислительных ресурсов. В главе разработаны алгоритм агрегации первичных данных и методика мониторинга кадрового потенциала холдинговой структуры.

В четвертой главе представлена реализация методики мониторинга кадрового потенциала холдинговой структуры. Описана структура кадрового потенциала, основные сущности и характеристики КП. Дано формализованное представление кадрового потенциала как системы взаимосвязанных измерений-Разработана математическая модель оценки эффективности технологии оперативного анализ данных для ИМ КП, и произведены соответствующие расчеты. Создана структурно-функциональная схема мониторинговой информационной системы.

В заключении диссертации сформулированы основные выводы и полученные результаты.

В приложениях представлены таблицы сбора первичной информации, копии документов: свидетельство об официальной регастрации программ для ЭВМ и акт внедрения результатов диссертации.

Системы поддержки принятия решений как средства хранения, организации и анализа данных

С появлением ЭВМ наступил этап информатизации разных сторон человеческой деятельности. Большой объем информации, с одной стороны, позволяет получить более точные расчеты и анализ, с другой - превращает поиск решений в сложную задачу. В результате появился целый класс программных систем, призванных облегчить работу лиц, принимающих решение (ЛПР), - системы поддержки принятия решения - СППР (DSS, Decision Support System).

Основными задачами СППР являются: ввод данных, хранение данных, анализ данных.

Таким образом, СППР - это системы, обладающие средствами ввода, хранения и анализ данных, относящихся к определенной предметной области, с целью поиска решений.

Постоянное накопление данных приводит к непрерывному росту их объема. В связи с этом на СППР ложится задача обеспечить надежное храпение больших объемов данных. Тем не менее основная задача СППР заключается в том, чтобы предоставить ЛПР инструмент для выполнения анализа данных. При этом система не генерирует правильные решения, а только предоставляет ЛПР данные для изучения и анализа. С одной стороны, качество приятых решений зависит от квалификации ЛПР, с другой - рост объемов анализируемых данных, высокая скорость обработки и анализа, а также сложность использования машинной формы представления данных стимулируют исследования и разработку интеллектуальных СППР. По степени «интеллектуальности» обработки данных при анализе выделяют три класса задач анализа:

Информационно-поисковые - СППР осуществляет поиск необходимых данных. Характерной чертой такого анализа является выполнение заранее определенных запросов;

Оперативно-аналитические - СППР производят группирование и обобщение данных в любом виде, необходимом аналитику. В отличие от информационно-поискового анализа в данном случае невозможно заранее предсказать необходимые ЛПР запросы;

Интеллектуальные - СППР осуществляет поиск функциональных и логических закономерностей в накопленных данных, построение моделей и правил, которые объясняют найденных закономерности и/или (с определенной вероятностью) прогнозируют развитие исследуемых процессов.

Обобщенная архитектура СППР представлена ниже (Рис. 1). Подсистема ввода данных. В таких системах, называемых OLTP (On line transaction processing), реализуется операционная (транзакционная) обработка данных. Для их реализации используются обычные системы управления базами данных (СУБД). Подсистема хранения. Для реализации данной подсистемы используют современные СУБД и концепцию хранилищ данных. Подсистема анализа. Данная подсистема может строиться на основе подсистемы информационно-поскового анализа на базе реляционных СУБД и статических запросов с использованием языка SQL (Structures Query Language); подсистемы оперативного анализа. Для реализации таких подсистем применяется технология оперативного анализа данных - OLAP (On-line analytical processing), использующая концепцию многомерного представления данных; подсистема интеллектуального анализа. Данная подсистема реализует методы и алгоритмы «добычи данных» (Data mining). Подсистема хранения информации (СУБД и/или Хранилище данных).

Исторически OLTP - системы были одним из первых гражданских применений вычислительной техники. С их помощью автоматизировались наиболее массовые задачи, с хорошо формализованными алгоритмами и устойчивыми структурами данных. Целевыми показателями при проектировании и заработке OLTP - систем являлись реактивность (время ответа системы при различных операциях), эффективность (неизбыточность) хранения данных и их целостность (соответствие содержания хранимых данных наложенным на них ограничениям). Для обеспечения требуемого уровня целевых показателей были предложены такие методы как реляционная алгебра и концепция транзакции, на основе которых разработаны реляционные клиент-серверные системы управления базами данных (РСУБД), являющиеся в настоящее время основным инструментов для построения OLTP - систем.

Теория построения реляционных OLTP - систем разрабатывалась такими зарубежными учеными и специалистами как В. Армстронг, Э.Бойс, Н.Вирт, К. Дейл, Д.Кнут, Э.Кодд, Дж. Ульман, Р.Фейджин, ПЛен и многими другими. В Советском Союзе и в России данную область разрабатывали А.В. Замулин, Л.А. Калиниченко, М.Р.Когаловский, С.Д.Кузнецов, В.М.Савинков, М.Щ.Цаленко и др.

В 1990-2000 гг. К OLTP - системам все чаще предъявляются требования модифицируемости - возможности быстрого изменения состава и структуры обрабатываемой OLTP - системой информации и выполняемых ею функций. Возникновение данного требования обуславливается переводом на автоматизированное выполнение все менее формализованных сфер человеческой деятельности, для которых характерно частое изменение структур обрабатываемой информации и методов ее обработки и процессами интеграции отдельных OLTP - систем в комплексные информационные системы предприятий и организаций. Все возрастающие требования к модифицируемости OLTP - систем предъявляет концепция электронного бизнеса, предусматривающая возможность взаимодействия информационных систем через глобальную сеть. Таким образом, возникла задача разработки принципов построения OLTP - систем, явно рассчитанных на дальнейшую модификацию при изменении структур обрабатываемый данных и выполняемых функций. В 1990 г. Б. Инмоном была выдвинута концепция хранилища данных (Data Ware-House), предназначенного для интеграции данных из различных OLTP - систем. Хранилища данных должны были работать в заранее известными структурами данных, поэтому для их реализации были предложены новые концепции, опирающиеся на метаданных - дополнительную информацию о структуре данных, не вытекающую из их физической организации. Концепция является продуктивной для работы с базами данных изменяющейся структуры, однако уступает OLTP - системам по времени реакции на запросы.

Концептуальные основы оперативного анализа данных

В основе концепции оперативного анализа данных - OLAP лежит принцип многомерного представления данных. В 1993 году Е. F. Codd [6] рассмотрел недостатки реляционной модели, в первую очередь указав на невозможность «объединять, просматривать и анализировать данные с точки зрения множественности измерений, то есть самым понятным для корпоративных аналитиков способом», и определил общие требования к системам OLAP, расширяющим функциональность реляционных СУБД и включающим многомерный анализ как одну из своих характеристик.

В большом числе публикаций аббревиатурой OLAP обозначается не только многомерный взгляд па данные, но и хранение самих данных в многомерной БД. Однако Кодд отмечает, что «Реляционные БД были, есть и будут наиболее подходящей технологией для хранения корпоративных данных. Необходимость существует не в новой технологии БД, а в средствах анализа, дополняющих функции существующих СУБД и достаточно гибких, чтобы предусмотреть и автоматизировать разные виды интеллектуального анализа, присущие OLAP».

Многомерное концептуальное представление представляет собой множественную перспективу, состоящую из нескольких независимых измерений, вдоль которых могут быть проанализированы определенные совокупности данных. Одновременный анализ по нескольким измерениям определяется как многомерный анализ. Каждое измерение включает направления консолидации данных, состоящие из серии последовательных уровней обобщения, где каждый вышестоящий уровень соответствует большей степени агрегации данных по соответствующему измерению. В этом случае становится возможным произвольный выбор желаемого уровня детализации информации по каждому из измерений. Операция спуска соответствует движению от высших ступеней консолидации к низшим; напротив, операция подъема означает движение от низших уровней к высшим.

Таким образом, OLAP предоставляет удобные быстродействующие средства доступа, просмотра и анализа экономической информации. ЛПР получает естественную, интуитивно понятную модель данных, организуя их в виде многомерных кубов. Осями многомерной системы координат служат основные атрибуты анализируемого бизнес-процесса. В качестве одного из измерений используется время. На пересечениях осей - измерений находятся данные, количественно характеризующие процесс - меры. ЛПР, анализирующий информацию, может «разрезать» куб по разным направлениям, получать сводные (например, по годам) или, наоборот, детальные (по неделям) сведения и осуществлять прочие манипуляции.

Термин «OLAP» как многомерное представление данных неразрывно связан с термином «хранилище данных» [8].

Согласно определению, данному основателем хранилищ данных Биллом Инмоном: «Хранилище данных - это предметно-ориентированное, привязанное ко времени и неизменяемое собрание данных для поддержки процесса принятия управляющих решений» [8].

Данные в хранилище попадают из оперативных систем (OLTP-систем), которые предназначены для автоматизации бизнес-процессов. Кроме того, хранилище пополняет за счет внешних источников, например статистических отчетов.

Если анализировать данные оперативных систем напрямую невозможно или очень затруднительно в виду следующих причин: Разрозненность данных,

Хранение их в форматах различных СУБД и в различных местах на сети. Создание же хранилища позволяет решить указанные недостатки, предоставить аналитику необходимую информацию в ответ на сложные аналитические запросы [12].

Помимо эффективного структурирования данных технология хранилища данных предоставляет гибкие средства просмотра, визуализации информации с помощью OLAP-технологии.

Традиционные отчеты, даже построенные на основе единого хранилища без OLAP-технологии, лишены гибкости. Их нельзя «покрутить», «развернуть» или «свернуть», чтобы получить желаемое представление данных. Любые новые потребности пользователя требуют вмешательства В отличие от традиционных методов инструмент OLAP позволяет разворачивать и сворачивать данные и необходимый для аналитика вид.

Оперативные данные собираются из различных источников, очищаются, интегрируются и попадают в реляционное хранилище. Попав в реляционное хранилище данные становятся доступны для анализа при помощи различных средств построения отчетов. Далее следует формирование OLAP пространства, для проведения дальнейшего анализа. Данные могут быть загружены в специальную базу данных OLAP или оставлены в реляционном хранилище. Следует отметить особую роль хранилища метаданных, содержащем информацию о структуре, размещении и трансформации данных. Благодаря ему обеспечивается эффективное взаимодействие различных компонентов хранилища [7, 11, 13, 15, 89, 97, 100].

Архитектура приложений оперативного анализ данных -OLAP - приложений. Многомерность в OLAP-приложениях может быть разделена на три уровня:

Многомерное представление данных - средства конечного пользователя, обеспечивающие многомерную визуализацию и мапипулирование данными; слой многомерного представления абстрагирован от физической структуры данных и воспринимает данные как многомерные.

Многомерная обработка - средство (язык) формулирования многомерных запросов (традиционный реляционный язык SQL здесь оказывается непригодным) и процессор, умеющий обработать и выполнить такой запрос.

Многомерное хранение - средства физической организации данных, обеспечивающие эффективное выполнение многомерных запросов.

Первые два уровня в обязательном порядке присутствуют во всех OLAP-средствах. Третий уровень, хотя и является широко распространенным, не обязателен, так как данные для многомерного представления могут извлекаться и из обычных реляционных структур; процессор многомерных запросов в этом случае транслирует многомерные запросы в SQL-запросы, которые выполняются реляционной СУБД.

Способы агрегации OLAP-куба

Распределение агрегатов между множествами одного уровня детализации. Рассмотрим совокупность множеств агрегации Xі, соответствующих уровню детализации 1 (1=1...! ). Допустим, к настоящему моменту все множества большей степени детализации, чем 1, сформированы и общее их количество равно . Обозначим множество всех агрегатов уровня 1 как х1. В зависимости от заданной для текущего куба степени агрегации возможны следующие варианты дальнейшего поведения.

Оцениваемое суммарное количество агрегатов, соответствующих уровню детализации большей или равной 1, не превышает разрешённого количества агрегатов а, определяемого заданной степенью детализации, то есть х + х1 = х. В этом случае полностью формируются все множества агрегатов Xh_h_t , соответствующих уровню детализации 1.

Оцениваемое суммарное количество агрегатов, соответствующих уровню детализации большей или равной 1, превышает разрешённое количество агрегатов а, определяемое заданной степенью детализации, то есть х + х1 х. Поскольку нет оснований для определения приоритетов и предпочтений среди множеств агрегатов 1-го уровня, логично равноценно распределить остаточное количество агрегатов по этим множествам. Равноценность предполагает распределение остаточного количества агрегатов среди множеств 1-го уровня детализации в прямой пропорции максимально возможному количеству их элементов х, _[ _, , так что реальное количество агрегатов множества Xt _, _, вычисляется как Правило, по которому определяется, какие из агрегатов в каждом множестве ,-/,./я формируются, а какие нет, не регламентируется, так что формируемые агрегаты выбираются случайным образом.

Описанная процедура, возможно, и обеспечивает минимальные вычислительные затраты на её выполнение, но она далеко не оптимальна по отношению к множествам формируемых агрегатов. Для пояснения этого факта рассмотрим процедуру оперативного формирования агрегатов.

Под процедурой оперативного формирования агрегатов следует понимать процедуру получения результирующего набора агрегатов при выполнении пользовательского запроса. При расчёте результирующего набора агрегатов следует использовать подходящие предварительно сформированные агрегированные значения показателей. Если результирующий набор агрегатов предварительно сформирован, то затраты на оперативное формирование агрегатов равны 0.

Очевидно, что для получения множества агрегатов определённого уровня, необходимо вначале получить множества агрегатов большего уровня детализации. Однако в отличие от процедуры предварительного формирования агрегатов при получении результирующего набора нет необходимости формировать всевозможные агрегаты определённого уровня детализации. Достаточно формировать по одному множеству определённого уровня на основе множества более детального уровня.

Пусть в результате процедуры предварительно формирования агрегатов получили всевозможные множества минимального уровня детализации 1. Пусть в результате необходимо сформировать множество агрегатов Xlt-Ji -(, уровня детализации Г, Г I. Необходимо на основании одного из множеств X, ц л /-го уровня по 78 лучить результирующее множество. При этом: Исходное множество агрегатов должно удовлетворять условию утверждения 2. Исходное множество агрегатов должно обеспечивать минимальные затраты на формирование результирующего множества, то есть необходимо определить кратчайший путь в сетевом графе к результирующему множеству (Рис. 15).

Таким образом, процедура оперативного формирования обеспечит минимальное время выполнения пользовательских запросов. С другой стороны многое зависит и от множества предварительно сформированных агрегатов. Ясно, что они должны быть сформированы так, чтобы вычислительные затраты на оперативное формирование всевозможных множеств были минимальны. В этом и заключается упомянутая выше оптимальность процедуры предварительного формирования агрегатов.

Для оптимизации процедуры формирования агрегата согласно запросу пользователя, необходимо найти кратчайший путь от множества исходных значений (предварительных агрегатов) до искомой вершины.

Ввиду особенности построения графа данная задача решается методом линейного динамического программирования. При чем сложность задачи прямо пропорциональна произведению максимальной степени вершины графа на количество вершин.

Так для реализации пространства для анализа кадрового потенциала, состоящего из 7 измерений, сложность задачи поиска оптимального пути на графе агрегатов растет с добавлением нового измерения (см. Таблица 3,Рис. 16).

Задача о кратчайшем пути решается следующим образом. Пусть задана сеть из (л + /) вершины, то есть ориентированный граф, в котором выделены две вершины - вход (нулевая вершина) и выход (вершина с номером п). Для каждой дуги заданы числа, называемые длинами дуг. Длиной пути (контура) называется сумма длин входящих в него дуг (если длины дуг не заданы, то длина пути (контура) определяется как число входящих в него дуг). Задача заключается в поиске кратчайшего пути (пути минимальной длины) от входа до выхода сети.

Современное состояние использования методов оперативного и интеллектуального анализа данных в кадровой сфере для целей мониторинга

Проблема управления кадровым потенциалом носит междисциплинарный характер, что обуславливает необходимость применения комплексных подходов, с учетом экономических, юридических, социологических, психологических и других факторов. Она не обойдена вниманием науки, сложились научные школы, обоснованы разнообразные концепции, издается литература, налажена подготовка специалистов.

В работах А.М.Омарова, В.А.Шахова, В.А.Дятлова, В.В.Травкина исследованы вопросы формирования и воспроизводства кадрового потенциала. В.Г.Игнатов, А.В.Понедельков, М.В.Глазырин, С.В.Андреев, Е.В.Охотский основное внимание уделили специфике процессов управления кадровым обеспечением региональных органов власти [28,43, 87, 112, 114, 116].

Опыт развития кадрового потенциала зарубежных организаций рассматривается в трудах зарубежных ученых Дж. Иванцевича, М.Х.Мескона, М.Альберта, Ф.Хедоури и др [43, 61, 69, 79, 117].

Вместе с тем комплексный анализ соответствующей научной литературы показал, что проблемам управления кадровым потенциалом, как отдельного региона, так и отрасли, концепции, практике и перспективам его развития, создания внебюджетных источников финансирования кадрового обеспечения системе поиска и отбора руководящих кадров уделяется недостаточное внимание. Практически отсутствует методология разработки и создания эффективной системы управления кадровым потенциалом региона. Количество и качество имеющихся публикаций не соответствует остроте и актуальности решения соответствующих проблем.

Структура, основные характеристики и сущности кадрового потенциала, как многомерного объекта. Обзор существующей терминологии показал, что понятия «мониторинг кадрового потенциала» в настоящее время как такового не существует. В различных словарях можно найти определения лишь отдельных слов «мониторинг», «кадры», «потенциал», а также словосочетания «трудовой потенциал» и др. [20,25, 34,35,43,44,46].

Понятие, сущность, основные характеристики. Термин «потенциал» происходит от латинского слова potentia, что означает скрытые возможность, мощность, силу. Широкая трактовка смыслового содержания понятия "потенциал" состоит в его рассмотрении как «источника возможностей, средств, запаса, которые могут быть приведены в действие, использованы для решения какой-либо задачи или достижения определенной цели; возможности отдельного лица, общества, государства в определенной области»

Словом «потенциал» обычно обозначают средства, запасы, источники, которые могут быть использованы, а также возможности отдельного лица, группы лиц, общества в конкретной обстановке [119].

Исторически термин «потенциал» был введен в научный оборот 10-15 лет назад. Трактовка данного термина означает наличие у объекта (отдельно взятого человека, первичного трудового коллектива, общества в целом) скрытых, еще не проявивших себя возможностей или способностей в соответствующих сферах жизнедеятельности. Определяя данную экономическую категорию, следует иметь в виду, что потенциал (экономический, производственный, трудовой) представляет собой обобщенную, собирательную характеристику ресурсов, привязашгую к месту и времени [119].

Понятия «потенциал» и «ресурсы» не следует противопоставлять. Потенциал (экономический, военный, трудовой, научный, финансовый, духовный, кадровый) представляет собой «обобщенную, собирательную характеристику ресурсов, привязанную к месту и времени».3

Понятие «кадровый потенциал» отражает ресурсный аспект социально-экономического развития. Кадровый потенциал можно определить как совокупность способностей всех людей, которые заняты в данной организации, отрасль, региона и решают определенные задачи.

Понятие «кадры» в повседневной жизни зачастую отождествляют с понятием «трудовые ресурсы». Тем не менее их необходимо четко различать. БЭС дает следующие определения.

Трудовые ресурсы — часть населения страны (в России мужчины 16-59, женщины — 16-54 лет), обладающая необходимым физическим развитием, знаниями и практическим опытом для работы в народном хозяйстве.

Кадры - основной (штатный) состав квалифицированных работников предприятий, государственных учреждений, общественных организаций [89].

Таким образом, говоря о кадрах, подразумевают не потенциально пригодное для работы население, а фактически работающий состав работников, которые к тому же должны обладать соответствующим квалификационным уровнем.

Исходной структурообразующей единицей трудового потенциала является трудовой потенциал работника (личности), который в свой совокупности составляющих формирует трудового потенциал предприятия, а тот в свою очередь трудовой потенциал общества

Структура трудового потенциала предприятия представляет собой соотношение различных демографических, социальных, функциональных, профессиональных и других характеристик групп работников и отношений между ними.

В трудовом потенциале предприятия выделяют следующие компоненты: кадровый, профессиональный, квалификационных и организационный.

Кадровая составляющая включает: квалификационный (профессиональные знания, умения и навыки) и образовательный (познавательные способности) потенциал.

Профессиональная структура коллектива связана с изменениями в содержании труда под влиянием НТП, который обусловливает появление новых и отмирание старых профессий, усложнение трудовых операций.

Квалификационная структура определяется качественными изменениями в трудовом потенциале (рост умений, знаний, навыков) и отражает прежде всего изменения в его личностной составляющей.

Похожие диссертации на Разработка средств информационного мониторинга многомерных объектов на основе технологии оперативного анализа данных