Содержание к диссертации
Введение
1 Анализ системных связей и закономерностей развития промышленной инфраструктуры в регионе 10
1.1 Анализ системных связей регионального развития промышленных объектов 10
1.2 Критерии и методы оценки инвестиционных проектов в развитие промышленных предприятий 14
1.3 Методы и средства моделирования процессов жизненного цикла инвестиционных проектов в строительстве промышленных объектов 26
1.4 Системная характеристика принятия решений в инвестиционном проектировании 30
Выводы 37
2 Системный анализ и формирование комплексной оценки эффективности развития промышленной инфраструктуры региона 40
2.1 Системная модель комплексной оценки региональной системы развития промышленной инфраструктуры 40
2.2 Модели формирования базы знаний инвестиционного проекта 45
2.3 Комплексная оценка и формирование схемы реализации инвестиционного
проекта 54
Выводы 62
3. Алгоритмы функционирования и Структурный анализ системы комплексной оценки развития региональной промышленной инфраструктуры 65
3.1 Алгоритмы формирования базы знаний инвестиционного проекта на основе методов иерархической таксономии 65
3.2 Алгоритм формирования модели инвестиционного проекта 76
3.3 Структурный анализ системы комплексной оценки развития региональной промышленной инфраструктуры 81
Выводы 94
4. Архитектура и практическая реализация системы комплексной оценки развития региональной промышленной инфраструктуры 96
4.1 Архитектура системы комплексной оценки развития региональной промышленной инфраструктуры 96
4.2 Выбор системы информативных признаков для проектирования многомерного хранилища данных 106
4.3 Критерии и методы оценки качества функционирования системы комплексной оценки развития региональной промышленной инфраструктуры 112
Выводы 118
Заключение 120
Список сокращений 123
Библиографический список
- Анализ системных связей регионального развития промышленных объектов
- Системная модель комплексной оценки региональной системы развития промышленной инфраструктуры
- Алгоритмы формирования базы знаний инвестиционного проекта на основе методов иерархической таксономии
- Архитектура системы комплексной оценки развития региональной промышленной инфраструктуры
Введение к работе
Актуальность работы
Условием устойчивого развития региональной промышленной инфраструктуры являются высокие требования к реализации сложных технических проектов. Технические проекты, характеризующиеся сложной структурой жизненного цикла, привлечением ресурсов различного рода -материальных, информационных, людских ресурсов, а также многокритериальностью результатов имеют системную природу и являются, по сути, системными задачами развития промышленного предприятия. Автоматизация поддержки технических проектов на всём протяжении их жизненного цикла требует интеграции аналитических систем, систем поддержки принятия решений, а также формирования необходимых информационных ресурсов.
Важным классом технических проектов являются инвестиционные проекты (ИП), в частности, инвестиции в строительство промышленных объектов. Спецификой проектов данного класса является интеграция проекта в общую политику промышленного развития региона с целью поддержки инвестиционного проекта региональными властями. Поэтому в регионах сложилась система экспертизы строительных инвестиций региональными властями.
Принятие властями региона решения о поддержке ИП сопряжено с большой степенью неопределенности при его анализе. Она обусловлена сложностью построения системной модели ИП вследствие большого количества трудно идентифицируемых параметров и необходимости учета интересов и поведения субъектов ИП. Этим объясняется высокая стоимость анализа ИП экспертами.
В то же время накоплены большие информационные ресурсы уже освоенных ИП. Разработаны алгоритмы автоматического формирования и обработки знаний из данных, механизмы интерпретации результатов анализа и
построения моделей по прецедентам, которым посвящены работы С.А. Айвазяна, Н.Г. Загоруйко, Д.В. Райзина и других учёных. Эти подходы основаны на технологиях анализа данных и знаний, на методах вычислительной математики, теории игр, искусственного интеллекта, а также на прикладных подходах решения подобных задач типа Data mining.
Региональный ИП в промышленном строительстве имеет сложную системную природу, являясь следствием взаимодействия системы управления промышленностью региона, производственных предприятий и других субъектов рынка. Этот системный подход к разработке ИП должен быть согласован с общей программой развития региона. Одной из ключевых причин существующих неудачных инвестиционных решений является игнорирование системной природы проблемы при решении задач инвестиционного проектирования.
Таким образом, задача анализа и поддержки принятия управленческих решений развития промышленной инфраструктуры в регионе, основанная на системном подходе к построению ИП, является актуальной задачей диссертационной работы.
Целью работы является системный анализ промышленной инфраструктуры в регионе и построение системы комплексной оценки её развития, с целью повышения эффективности принятия управленческих решений.
Основными задачами и направлениями исследования являются: Исследование системных связей и закономерностей развития промышленной инфраструктуры в регионе.
Анализ методов и критериев оценки эффективности развития промышленной инфраструктуры в регионе, учитывающих как коммерческую, так и его общественную значимость.
Исследование и разработка методов формирования знаний инвестиционных проектов, с учётом его структурной составляющей.
6 Создание алгоритмов формирования базы знаний и параметров моделей инвестиционных проектов.
Построение информационной системы комплексной оценки инвестиционных проектов в строительстве промышленных объектов, включающей в себя систему формирования модели инвестиционного проекта, систему оценки эффективности ИП и систему принятия решения поддержки ИП регионом.
Методы исследования базируются на применении теории и методов системного анализа, моделей представления знаний, основанных на фреймах и продукциях, теории игр, а также теории и методов анализа данных, в частности методах автоматической классификации (таксономии) и методах распознавания образов.
Научная новизна диссертационной работы заключается в том что: Дано системное описание структуры развития промышленной инфраструктуры в регионе, позволяющее, в отличие от аналогов, формализовать комплексный процесс поддержки инвестиционного проекта, включающий в себя системное взаимодействие регионального управления развития промышленности, промышленного предприятия и финансово - промышленной инфраструктуры региона, с целью оценки эффективности проекта и формирования схемы его реализации.
Впервые предложена модель базы знаний системы развития промышленных объектов в регионе, основанная на синтезе продукционных и фреймовых моделей, позволяющая выявлять системные закономерности на основе структурной классификации инвестиционных проектов.
Предложен новый метод формирования модели инвестиционного проекта, основанный на построении правила принадлежности к определённому классу инвестиционных проектов.
На основе общей концепции оценки эффективности инвестиционных проектов впервые построена модель, объединяющая оценку направления развития инвестиционного проекта, его коммерческой эффективности и формирования схемы его реализации.
5. Создан новый алгоритм формирования классов инвестиционных проектов на основе их структурной близости, используя показатель изменения локальной плотности, осуществляющий процедуры предварительной классификации, иерархической классификации, распознавания и оценки степени детализации кластеров, а также формирования признакового пространства
Практическая ценность работы
Практически ценными являются следующие результаты диссертационной работы:
Алгоритм классификации, позволяющий формировать классы объектов, на основе их структурной близости.
База знаний инвестиционных проектов, позволяет проводить различные виды анализа ИП, визуализировать некоторые зависимости и является источником информации для имитационного моделирования.
Игровая модель, позволяющая вычислять равновесные состояния между бюджетными источниками и инвестиционными институтами, при формировании схем реализации инвестиционных проектов.
CASE - диаграммы потоков и моделей данных системы, являющиеся исходной информацией для систем автоматического проектирования.
Метод формирования размерности многомерной модели данных на основе генетического алгоритма формирования признакового пространства.
Основные положения, выносимые на защиту:
Системное описание развития промышленной инфраструктуры в регионе для оценки эффективности инвестиционных проектов и формирования схемы их реализации.
Модель базы знаний системы развития промышленной инфраструктуры в регионе, основанная на синтезе продукционных и фреймовых моделей
Метод формирования модели инвестиционного проекта, основанный на построении правила принадлежности к определённому классу инвестиционных проектов.
Модель, комплексной оценки эффективности и формирования схемы
реализации инвестиционного проекта.
Алгоритм формирования классов инвестиционных проектов на основе их
структурной близости.
Архитектура системы развития промышленных объектов и алгоритм
формирования многомерной модели хранилища данных.
Реализация результатов работы
Результаты диссертационной работы были использованы в виде моделей и алгоритмов, при внедрении системы автоматизации процессов анализа и оценки развития промышленных объектов в ЗАО СК "Град", с целью повышения достоверности и надёжности оценки проектов. А также алгоритмы и программное обеспечение системы комплексной оценки развития промышленных объектов были использованы в системе автоматизации производственной деятельности Муниципального предприятия города Самары "Архитектурно - планировочное бюро".
Разработанные в диссертационной работе методы и алгоритмы применяются в учебном процессе на кафедре информационных технологий Самарского Государственного Технического Университета.
Апробация работы
Основные положения работы и результаты исследований обсуждались на межвузовской научно- практической конференции "Компьютерные технологии в науке, практике и образовании" (Самара 2005), на научно-практической конференции "Наука и инновации - 2005" (Днепропетровск 2005), на Международном форуме по проблемам науки техники и образования (Москва 2005), на Третьей Всероссийской конференции "Математическое моделирование-2006" (Самара, 2006г.)
Публикации
По теме диссертации опубликовано 12 печатных работ, в их числе 2 статьи и ряд материалов международных и всероссийских конференций.
Структура и объём работы
Диссертация состоит из введения, четырех разделов, основных результатов, списка использованных источников и приложений. Основная часть содержит 127 страниц машинописного текста, 25 рисунков, 1 таблицу. Список использованных источников состоит из 94 наименований и выполнен на 10 страницах. В работе содержится 6 приложений, выполненных на 10 страницах.
Анализ системных связей регионального развития промышленных объектов
Рассмотрена специфика инвестиционной деятельности в строительстве промышленных объектов. Проведена классификация субъектов инвестирования, определены подходы к методам оценки инвестиционных ресурсов и рассмотрены условия их привлечения в инвестиционный проект.
Основой развития промышленных объектов, являются инвестиционные проекты в строительстве. Инвестиционное проектирование в строительную сферу на региональном уровне имеет ряд существенных отличий. Если финансирование инвестиций со стороны коммерческих инвестиционных институтов направленно, в первую очередь, на получение прибыли в денежном выражении, то цель управления инвестициями региональных властей имеет сложную структуру и характеризуется, зачастую некоммерческими предпочтениями [40,94].
В ряде работ даётся оценка инвестиционной деятельности на региональном уровне, отмечается ряд ошибок, допускаемых органами власти на местах [19,23,29,33,40,45,78,89], в частности, крупномасштабная утечка финансовых ресурсов из регионов, вследствие острой нехватки коммерчески эффективных инвестиционных проектов. Проведённый сравнительный анализ инвестиционной деятельности в Самарской области [17,43,69,73,76,77,81,92], в частности, городах Самара и Тольятти [5,21,22,] (см приложения 1-5),а также анализ инвестиционной деятельности в целом по РФ показывает [3,13,20,26,30,39,61,91,93] что, несмотря на наличие богатых природных ресурсов, большого числа научно-технических разработок, квалифицированной рабочей силы и других положительных факторов существует ряд проблем, которые значительно снижают финансовую привлекательность большинства проектов. Это неразвитость институтов, связанных с инвестиционным процессом. Не хватает структур, способных квалифицированно осуществлять поиск, подготовку, отбор и экспертизу инвестиционных проектов, а также управление рычагами, оживляющими инвестиционную деятельность -кредитование, лизинговые схемы, страхование инвестиционных рисков [15,25,52].
Слабая финансовая экспертиза ИП приводит к финансированию из региональных бюджетов неэффективных проектов. В этой связи актуальна задача создания системы поддержки инвестиционного проектирования на региональном уровне [10].
Для этой цели необходимо описать предметную область системы, определить общую концепцию управления инвестиционными проектами, входные и выходные потоки ресурсов, а также классифицировать внешние (по отношению к системе) сущности.
В общем случае процесс инвестирования осуществляется двумя схемами: непосредственно из бюджетных средств или привлечением ресурсов инвесторов (рисунок 1.1).
В этой связи полезно провести анализ сложившихся инвестиционных ресурсов, а также существующих, на современном российском рынке, инвестиционных институтов.
Рассмотрены различные источники инвестиционных ресурсов [14, 31], приведены методики оценки их ресурсоёмкости, лёгкости привлечения и другие характеристики. С точки зрения интересующей нас предметной области, можно разделить все внебюджетные инвестиционные ресурсы на два основных класса: средства коммерческих инвестиционных институтов и частные накопления граждан. В первом случае процесс привлечения инвестиционного капитала представляет собой взаимодействие двух участников ИП городских властей и инвестиционного института. Рассмотрены условия, на которых они взаимодействуют [52,54,64,67,68,74], это: - сложившаяся рентабельность капиталовложений в регионе по интересующему инвестора направлению; - сложившийся уровень рисков в регионе, связанный с данной инвестиционной деятельностью; - сложившийся уровень общественной значимости данной инвестиционной деятельностью для региона.
При проведении инвестиционной деятельности на региональном уровне наиболее дорогим ресурсом является привлекаемый для этого капитал. Учитывая общую ограниченность свободного (частного) капитала, направляемого для инвестирования в регионы, им придется вступить в некоторое соревнование для привлечения капитала. Регионы, включаясь в соревнование за привлечение инвестиционного капитала, могут воздействовать на этот процесс, оперируя следующими факторами [48, 53, 55] - единовременные финансовые сборы с инвестора; - строительство инвестором объектов соцкультбыта; - безвозмездная передача части своих паев администрации региона.
Системная модель комплексной оценки региональной системы развития промышленной инфраструктуры
Предложена системная модель экспертизы развития региональной промышленной инфраструктуры, в частности, строительных инвестиционных проектов, с целью их поддержки региональными властями. Данная модель позволяет описать взаимодействие регионального управления, рассматриваемый инвестиционный проект и сложившиеся социально -экономические условия в регионе.
Воспользовавшись общесистемным подходом, систему оценки РІП представим в виде структуры, состоящей из системы управления СУ, объекта управления ОУ и среды. В нашем случае, с учётом специфики предметной области, данная формализация представится в следующем виде [61,62]: S= G,P,L , (2.1) где G - система управления представлена городскими властями, осуществляющими поддержку инвестиционной программы региона Pinv, Pinv _ f „inv inv „inv\ _ I MV \r"") = \P\ Рг, ---Pn )=\JPi f inv где множество инвестиционных проектов Pi . Для определённости будем считать, что инвестиционная программа региона направлена на достижение глобальной цели - перспективного развития промышленного комплекса региона, которую будем считать оптимальной. Система управления характеризуется совокупностью целей С и управляющих воздействий U,
Согласно алгоритму (п. 1.4), оценка эффективности ИП осуществляется в два этапа. На первом этапе оценивается эффективность проекта в целом, при допущении, что финансирование идёт только за счёт бюджетных средств, результаты первого этапа являются основой для формирования схемы финансирования с привлечением частных инвесторов. На первом этапе осуществляется последовательное решение задач: оценки общественной значимости, оценки общественной эффективности и оценка коммерческой эффективности.
Управляющие воздействия проявляются принятием решений по заданному инвестиционному проекту на различных этапах оценки эффективности U= (Uo3, Иоэ, Цкэ), где Цоз - принятие решения на этапе оценки общественной значимости проекта, 1/оэ - решения на этапе оценки общественной эффективности проекта; Цкэ - решения на этапе оценки коммерческой эффективности проекта.
Среда характеризует рынок и включает в себя следующие субъекты ИП: подрядные организации, инвестиционные институты, транспорт, энергетиков, осуществляющих поддержку и реализацию строительных ИП на всех этапах жизненного цикла. Данные субъекты, на основании рыночных условий, сложившихся в данном регионе, формируют величины затратных и доходных статей ИП.
Идентификация состояния и характера среды классифицируется, в соответствии с этапом принятия решения: - на первом этапе, когда осуществляется оценка эффективности ИП в целом, среда является пассивной и нецеленаправленной подсистемой; - на этапе формирования схемы финансирования среда проявляется как активная и целенаправленная подсистема и наравне с управляющей подсистемой, вырабатывает управляющие воздействия.
Объектом управления является непосредственно сам инвестиционный проект Р (2.2). Комплексной характеристикой ИП является описание его жизненного цикла (ЖЦ). Жизненный цикл описывает наименование и стоимостные характеристики параметров ИП, в период времени, начинающийся с момента принятия решения об необходимости инвестировании средств до завершения ЖЦ объекта. Весь жизненный цикл обычно разбивают на три фазы: ИП = [ппред,Пит,Пжст), где Ппред параметры ИП прединвестиционной фазы, Пшв параметры ИП инвестиционной фазы, Пэкт1 параметры ИП эксплуатационной фазы.
Алгоритмы формирования базы знаний инвестиционного проекта на основе методов иерархической таксономии
Рассмотрено применение алгоритмов иерархической таксономии в компактном пространстве и процедура формирования классов инвестиционных проектов, с целью формирования базы знаний. Рассмотрено представление инвестиционного проекта как структурного объекта. Даны алгоритмы расчёта мер структурной близости инвестиционных проектов.
При формировании базы знаний инвестиционного проекта необходимо провести процедуру нахождения определенных закономерностей и систематических взаимосвязей между переменными, которые затем можно применить к новым данным. Существует ряд методов анализа подобного типа, основанных на процедуре таксономии. В нашем случае, следует учесть, что инвестиционный проект (ИП) является структурным объектом. Параметры ИП описываются не только стоимостными, но и временными характеристиками, описывающими взаимосвязь между параметрами и согласующимися с прединвестиционным, инвестиционным и эксплуатационным этапами жизненного цикла (ЖЦ) ИП [7,63].
Согласно предметной области исследования важно учитывать не только содержательную часть параметров ИП, но и их структурную близость. Данные и знания ИП можно рассматривать как символьные объекты. В частности, символьным объектом является обнаруженная в базе данных закономерность продукционного типа [27]. В этой связи, применим методологию иерархической таксономии, которая позволит проводить анализ структурных объектов иерархического характера.
В частности, результаты иерархической таксономии выявляют структуру множества ИП, которую можно наглядно представить в виде иерархического дерева, начальные вершины которого отображают все ИП исходного множества, промежуточные вершины (ветви) описывают все более крупные (концепты), а конечная вершина (корень) представляет собой объединение всего исходного множества ИП в один таксон. При формировании знаний инвестиционного проекта из данных необходимо сравнение между собой их внутренних структур, что приводит к необходимости измерять степень близости, между иерархическими структурами.
Опираясь на определение понятия иерархии, рассмотрим структуру инвестиционного проекта. Иерархическая структура ИП Я множества D называется множество, где \/{ )є єЯ- (терминальные вершины); DeH (наибольший таксон содержит все элементы Я); для любых вершин h,h eH ( Лп/г )п(Лс/г )п(/г сй). Таким образом, иерархия — это многоуровневая структура, в которой объекты, находящиеся в одном таксоне на некотором (j-м) уровне, остаются в одном таксоне на (j + 1)-м и всех других более высоких уровнях [27]. Каждая z-ая вершина j-ro уровня Я, характеризуется структурным индексом aljt, равным числу примыкающих к ней ребер и весовым индексом vlJt.
Весовой индекс нетерминальных вершин уровня j равен сумме индексов вершин, входящих в эту вершину из предыдущего уровня j — 1. Пример иерархической структуры инвестиционного проекта приведён на рисунке 3.1.
Измерение расстояний между иерархиями с ИП произвольной структуры базируется на подходе оценки расстояния между иерархиями через сложность превращения одной иерархии в другую, добавляя или убирая вершины и связи между ними, где это необходимо, т. е. применяя набор так называемых редакционных операций. Каждая операция имеет свою стоимость (с). Оптимальному переводу соответствует последовательность элементарных операций с минимальной суммарной стоимостью, которая носит название редакционного расстояния [28,36,37]. Соответственно необходимо определение двух видов близости: характеристики расстояния во внешнем виде двух иерархических структур и характеристики различия по весу таксонов. Расстояние по виду структуры заключается в расчёте стоимости редакционной операции замены вершины одного ИП на вершину другого, требуемую в процессе превращения структуры одного ИП в другой.
Для оценки стоимости замен всех вершин заданного уровня первого ИП на все вершины заданного уровня второго ИП используем определение суммарного расстояния между наиболее похожими парами. Проведя сравнение всех уровней первого ИП со всеми уровнями второго ИП, получим матрицу величин редакционного расстояния между уровнями сравниваемых иерархий
Редакционным расстоянием между структурами ИП является стоимость оптимального перевода уровней структуры первого ИП в соответствующие уровни структуры второго ИП. Данную задачу решим с помощью метода динамического программирования [28,36]. Суть данной задачи состоит в преобразовании всех уровней одного ИП в соответствующие уровни другого ИП. Для этого вычисляется суммарное расстояние весов между наиболее похожими парами. После формируется матрица редакционных расстояний и на ней строится оптимальный путь перевода одного ИП в другой.
В процессе формирования базы знаний инвестиционного проекта необходимо вычислить расстояния между всеми парами структурных объектов, затем применить процедуру таксономии. В качестве типичных структур, представляющих к таксонов, можно для каждого таксона использовать по одной структуре, наиболее близкой к его центру. Сумма расстояний от этой структуры до остальных структур таксона будет минимальной [28,36,37].
Архитектура системы комплексной оценки развития региональной промышленной инфраструктуры
Рассмотрены вопросы построения архитектуры системы, на основе подхода к построению систем поддержки принятия решений и систем оперативного анализа данных.
Этапы внедрения и эксплуатации являются важными этапами жизненного цикла информационных систем. На данных этапах осуществляется формирование общей архитектуры системы интеграция информационных баз, определение пользовательских интерфейсов и прочих условий эффективного функционирования системы. Специфика функционирования системы комплексной оценки развития региональной промышленной инфраструктуры, предполагает отнести данную систему к классу систем поддержки принятия решений (О И IP) [2,50]. Современная архитектура систем данного класса предполагает наличие хранилища данных, механизмов сбора данных из внешних источников, применение гибких интерфейсов. Данная архитектура обусловлена необходимостью постоянного сбора, интеграции, хранения и многомерного анализа большого объёма данных, а также удобной визуализации сложных выборок и результатов анализа данных для аналитика- пользователя системой. На рисунке 4.1 представлена общая архитектура системы, которая содержит многомерное хранилище данных, ETL- механизмы интеграции данных, поступающих от OLTP-систем, представленных базами данных внешней среды. Обработка информации осуществляются соответствующими серверами, и результаты передаются на рабочие станции конечным пользователям. Хранилища данных (Datawarehouse) и оперативный анализ данных (Оп-LineAnalyticalProcessing, OLAP) -информационные технологии, которые обеспечивают аналитикам, управленцам и руководителям высшего звена возможность изучать большие объемы взаимосвязанных данных при помощи быстрого интерактивного отображения информации на разных уровнях детализации с различных точек зрения в соответствии с представлениями пользователя о предметном пространстве.
При перенесении данных из оперативной системы в хранилище перед загрузкой они преобразуются. Различного рода несоответствия в кодировании, типах данных, присущих исходной системе, устраняются. В то время как оперативная система выполняет над хранимыми данными операции обновления, удаления и вставки, в хранилище помещается большой объем данных. Характерной особенностью хранилища данных является то, что два разных корпоративных пользователя, выполняющие один и тот же запрос к хранилищу данных в разное время, получат один и тот же результат. Это исключает ситуации, при которых незапланированное извлечение данных и генерация отчетов приводят к различным результатам. Важная особенность хранилища данных - независимость от времени [4,18,59]. Если оперативная система содержит только текущие данные, то системы хранилищ данных содержат как исторические данные, так и данные, которые имели статус текущих при последней загрузке хранилища. Временные рамки данных, содержащихся в хранилище, изменяются в широких пределах в зависимости от типа системы. Однако обычно временные рамки данных, находящихся в хранилище, лежат в пределах от 15 месяцев до 5 лет. Системы оперативных данных и информационные системы на основе хранилищ данных обладают рядом противоположных характеристик, которые лучше всего сравнивать непосредственно одну с другой. В настоящее время хранилища данных построены для большого числа предметных областей. Масштабы и способ использования этих хранилищ данных изменяются в широких пределах в зависимости от типа организации и вида деловой информации, для поддержки которых они разрабатывались. Хранилище данных создается с целью-интеграции в одном месте, согласования и, возможно, агрегации ранее разъединенных детализированных данных: - исторических архивов; - данных из оперативных систем; - данных из внешних источников; - разделения наборов данных, используемых для оперативной обработки, и наборов данных, используемых для решения задач поддержки принятия решений; - обеспечения всесторонней информационной поддержки максимальному кругу пользователей.
Хранилище данных играет в первую очередь роль интегратора и аккумулятора исторических данных. Структура организации хранилища ориентированна на предметные области. Предметно-ориентированное хранилище содержит данные, поступающие из различных оперативных БД и внешних источников. Хранилище представляет собой совокупность данных, отвечающую следующим характеристикам: - ориентированность на предметную область или ряд предметных областей; - интегрированность; - зависимость от времени (поддержка хронологии); - постоянство.
Первая особенность хранилища данных заключается в его ориентированности на предметный аспект. Предметная направленность контрастирует с классической ориентированностью прикладных приложений на функциональность и процессы.
Наиболее важная характеристика хранилища данных состоит в том, что данные, находящиеся в хранилище, интегрированы.
Интегрированность проявляется во многих аспектах, в частности, [18]: - в согласованности имен; - в согласованности единиц измерения переменных; - в согласованности структур данных; - в согласованности физических атрибутов данных и др.
Интеграция данных по единицам измерения атрибутов состоит в следующем. Разработчики приложений к вопросу о способе задания размеров продукции могут подходить несколькими путями. Размеры могут задаваться в сантиметрах, дюймах, ярдах и т. д. Каков бы ни был источник данных, если информация поступит в хранилище, она должна быть приведена к одним и тем же единицам измерения, принятым в качестве стандарта в хранилище.