Электронная библиотека диссертаций и авторефератов России
dslib.net
Библиотека диссертаций
Навигация
Каталог диссертаций России
Англоязычные диссертации
Диссертации бесплатно
Предстоящие защиты
Рецензии на автореферат
Отчисления авторам
Мой кабинет
Заказы: забрать, оплатить
Мой личный счет
Мой профиль
Мой авторский профиль
Подписки на рассылки



расширенный поиск

Модели и алгоритмы проблемно-ориентированной информационно-аналитической системы Попова, Наталия Александровна

Диссертация, - 480 руб., доставка 1-3 часа, с 10-19 (Московское время), кроме воскресенья

Автореферат - бесплатно, доставка 10 минут, круглосуточно, без выходных и праздников

Попова, Наталия Александровна. Модели и алгоритмы проблемно-ориентированной информационно-аналитической системы : диссертация ... кандидата технических наук : 05.13.17 / Попова Наталия Александровна; [Место защиты: Пенз. гос. ун-т].- Пенза, 2013.- 171 с.: ил. РГБ ОД, 61 14-5/1493

Введение к работе

Актуальность темы. Информационно-аналитические системы (ИАС) представляют особый класс информационных систем, предназначенных для хранения, обработки и анализа данных. Эффективное хранение данных обеспечивается наличием в составе ИАС множества источников данных. Обработка и объединение данных выполняются инструментальными средствами извлечения, преобразования и загрузки данных. Анализ данных осуществляется с использованием инструментальных средств оперативного и интеллектуального анализа.

ИАС, как правило, реализуются в виде надстройки над функционирующей информационной системой предприятия или организации и размещаются на различных уровнях управления. Создание ИАС предполагает большую детализацию и более сложную аналитическую обработку данных по сравнению с OLTP-системами, ориентированными на фиксацию повседневной деятельности. В связи с этим архитектура современных ИАС содержит следующие уровни: сбор и первичная обработка данных; извлечение, преобразование и загрузка данных; складирование данных; оперативное представление данных, оперативный и интеллектуальный анализ данных в процессе принятия управленческих решений.

Существует два подхода к реализации ИАС. Первый подход основан на платформенно-базированных решениях, предложенных ведущими компаниями Oracle, Microsoft, СА, SAP, SAS и др. Второй подход предполагает реализацию ИАС на основе смешанного решения, при котором инструменты анализа и СУБД выбираются из числа программных продуктов различных компаний (Cognos, Business Objects и BaseGroup Labs). Преимущество второго подхода состоит в возможности обеспечения более высокой функциональной эффективности системы. Однако применение программных продуктов различных производителей затрудняет решение задач, связанных с формированием структуры транзакционной базы данных и хранилища данных, извлечением, преобразованием и загрузкой данных, разработкой моделей и алгоритмов оперативного, интеллектуального анализа данных.

Как правило, большинство ИАС реализуется на основе многомерного представления данных в OLTP-(on-line transaction processing) и OLAP-(on-line analytical processing) системах. Это обусловлено требованиями сокращения временных затрат на реализацию доступа, обеспечения целостности данных. Существенный вклад в развитие модельных представлений баз и хранилищ данных для ИАС внесли: У. Г. Инмон, Э. Ф. Код, К. Дж. Дейт, Б. А. Кулик, С. Д. Кузнецов, В. И. Мунерман и др. Известны модельные представления структур данных на основе различных интерпретаций: логики классов и отношений, теоретико-множественных представлений, одноместных и многоместных предикатов, алгебры кортежей и тензорной алгебры.

Впервые тензорные методы как средство формализованного описания данных были упомянуты в работе А. Е. Петрова (1976), посвященной разработке матричного представления реляционного языка баз данных. Тензорный подход применялся для проектирования банков данных и систем управления базами данных разработки информационных систем, методов анализа программ (А. Е. Армейский, 1986,1989).

Существенный вклад в развитие методов оперативного и интеллектуального анализа данных внесли: Г. Пятецкий-Шапиро, А. И. Арастумов, О. И. Ларичев, И. Д. Мандель, В. А. Дюк и др.

Несмотря на значительные успехи в области создания ИАС, имеет место проблема модельных представлений данных при разработке структур хранения, процедур первичной обработки, оперативного и интеллектуального анализа данных. Первый аспект проблемы связан с недостаточной развитостью средств формализованного описания структур и процедур обработки данных на основе заданных классов объектов, отношений и измерений многомерного предметного пространства. Второй аспект проблемы связан с теоретическим обоснованием моделей анализа накопленных данных, принятия решений с учетом свойств объектов и шкал измерений многомерного пространства, третий аспект - с установлением соответствий между модельными представлениями хранения и анализа данных с функциями аналитической платформы, используемой при создании ИАС.

Цель диссертационной работы - разработка и исследование модельных представлений данных на основе тензорной методологии, моделей и алгоритмов вербального анализа данных; обоснование выбора технологической платформы и системы управления базами данных.

Задачи, решаемые в работе:

теоретическое обоснование модельных представлений структур баз и хранилищ данных на основе построения математических моделей классов объектов и отношений между классами в предметной области с применением тензорной методологии;

разработка математических моделей и алгоритмов оперативного и интеллектуального анализа данных для оценки состояний объектов в процессе деятельности с использованием средств информационно-аналитической системы;

обоснование выбора технологической платформы для создания информационно-аналитической системы и разработка концептуальных моделей предметной области, отражающих ее проблемную ориентацию;

разработка пилотного проекта информационно-аналитической системы на основе выбранных технологической платформы, системы управления базами данных и проведение экспериментов по оценке состояний объектов.

Объектом исследования являются процессы сбора, накопления, предварительной обработки, загрузки и анализа данных при создании информационно-аналитической системы.

Предметом исследования являются математические модели классов, объектов и компонент (сущностей); модели и алгоритмы обработки и анализа данных информационно-аналитической системы.

Соответствие паспорту научной специальности. Область исследования соответствует п. 3 «Исследование методов и разработка средств кодирования информации в виде данных. Принципы создания языков описания данных, языков манипулирования данными, языков запросов. Разработка и исследование моделей данных и новых принципов их проектирования» и п. 5 «Разработка и исследование моделей и алгоритмов анализа данных, обнаружения закономерностей в данных и их извлечениях, разработка и исследование методов и алгоритмов анализа текста, устной речи и изображений».

Методы исследования основаны на алгебре индексных объектов, теории вербального анализа решений, методах оперативного и интеллектуального анализа данных, методах концептуального моделирования в методологии ARIS, реляционном и объектно-реляционном подходах к описанию данных.

Научная новизна работы:

  1. Разработаны математические модели баз и хранилищ данных информационно-аналитической системы, отличающиеся заданием классов, объектов, компонентов (сущностей), базисов многомерных пространств данных в виде индексных объектов (тензоров) первой и второй валентности, что обеспечивает формализованное описание процедур преобразования, количественной оценки структур данных, операций извлечения, трансформации и загрузки данных.

  2. Разработаны модель и алгоритм классификации состояний объектов управления, отличающиеся реализацией механизма цепных покрытий множества векторных оценок, предъявляемых эксперту в процессе вербального анализа данных, что позволяет строить полную и непротиворечивую классификацию средствами информационно-аналитической системы.

  3. Предложена модель оценки состояния объектов управления методом сравнения с заданным экспертом эталоном, отличающаяся представлением показателей состояния в виде вектора многомерного метрического пространства, что позволяет формировать отклонения состояния по каждому показателю и интегральную оценку состояния объекта средствами информационно-аналитической системы.

  4. Предложена динамическая модель изменений в распределении объектов управления по классам в виде системы дифференциальных уравнений, отличающаяся заданием параметров модели с учетом значений показателей текущего состояния объектов, что позволяет прогнозировать рас-

пределение объектов по состояниям в заданном интервале времени с использованием метода последовательных приближений.

Практическая значимость исследований. Разработан пилотный проект ИАС на базе аналитической платформы Deductor, обеспечивающей сбор, предварительную обработку и анализ данных о деятельности аспирантуры вуза и информационную поддержку принятия решений по управлению процессом подготовки специалистов высшей квалификации.

Тензорная интерпретация базисов многомерных пространств данных, классов и объектов, операций и отношений, процедуры классификации состояний объектов управления методом вербального анализа может быть использована при проектировании ИАС с применением концептуального и математического моделирования.

Достоверность и обоснованность. Обоснованность и достоверность результатов работы определяются корректным использованием строгих и апробированных методов исследования и подтверждаются практическим применением полученных результатов при разработке ИАС на основе программных продуктов различных производителей: Deductor, Firebird и SQL Manger for InterBase and Firebird. Создание ИАС на основе базисных решений подтверждается актами внедрения и апробацией на всероссийских и международных научно-технических конференциях.

Основные результаты, выносимые на защиту:

  1. Математические модели баз и хранилищ данных информационно-аналитической системы на основе представления классов, объектов, компонентов (сущностей), базисов многомерных пространств данных в виде тензоров (индексных объектов) первой и второй валентности для формализованного описания процедур преобразования, количественной оценки структур данных, операций извлечения, трансформации и загрузки данных.

  2. Модель и алгоритм классификации состояний объектов управления на основе механизма цепных покрытий множества векторных оценок для реализации полной и непротиворечивой классификации методом вербального анализа.

  3. Модель интегральной оценки состояния и оценки отклонений состояния по каждому показателю объекта управления на основе сравнений с эталоном и представлением показателей состояния в виде вектора многомерного метрического пространства.

  4. Динамическая модель, задаваемая в виде системы дифференциальных уравнений, для прогнозирования распределений объектов управления по состояниям в заданном интервале времени с использованием метода последовательных приближений.

Реализация и внедрение результатов работы. Результаты диссертационного исследования использованы при разработке ИАС поддержки процесса подготовки специалистов высшей квалификации на базе аналитической платформы Deductor. Разработанная ИАС внедрена в Пензен-

ском государственном университете, Пензенском государственном технологическом университете, Саранском филиале Российского университета кооперации, ООО «Научно-производственное предприятие "Пульс"», что подтверждается актами внедрения.

Апробация работы. Основные результаты диссертации докладывались и обсуждались на следующих конференциях: «Университетское образование» (г. Пенза, 2007, 2008, 2011, 2013); «Новые информационные технологии в научных исследованиях и образовании» (г. Рязань, 2008); «Компьютерное моделирование естественно-научных и социальных проблем» (г. Пенза, 2008); «Информационные системы и технологии в образовании и социально-экономической сфере» (г. Королев, 2008, 2009); «Системный анализ в проектировании и управлении» (г. Санкт-Петербург, 2008, 2009); «Новые информационные технологии в образовании» (г. Екатеринбург, 2009).

Публикации. По теме диссертационного исследования опубликовано 16 печатных работ: 4 статьи - в издании из перечня ВАК, 12 - в материалах российских и международных конференций.

Личный вклад. Автором выполнен основной объем исследований: проведен анализ, сформулированы и решены задачи создания моделей данных, моделей и алгоритмов анализа данных, решение которых обеспечивает достижение цели и составляет новизну, практическую значимость полученных результатов.

Структура и объем работы. Диссертация состоит из введения, четырех глав, заключения, списка литературы из 121 наименования и пяти приложений. Объем работы - 141 страница основного текста, включая 42 рисунка и 6 таблиц.

Похожие диссертации на Модели и алгоритмы проблемно-ориентированной информационно-аналитической системы