Электронная библиотека диссертаций и авторефератов России
dslib.net
Библиотека диссертаций
Навигация
Каталог диссертаций России
Англоязычные диссертации
Диссертации бесплатно
Предстоящие защиты
Рецензии на автореферат
Отчисления авторам
Мой кабинет
Заказы: забрать, оплатить
Мой личный счет
Мой профиль
Мой авторский профиль
Подписки на рассылки



расширенный поиск

Исследование и разработка моделей распределенных баз данных информационных систем корпоративного типа Силин Андрей Владимирович

Исследование и разработка моделей распределенных баз данных информационных систем корпоративного типа
<
Исследование и разработка моделей распределенных баз данных информационных систем корпоративного типа Исследование и разработка моделей распределенных баз данных информационных систем корпоративного типа Исследование и разработка моделей распределенных баз данных информационных систем корпоративного типа Исследование и разработка моделей распределенных баз данных информационных систем корпоративного типа Исследование и разработка моделей распределенных баз данных информационных систем корпоративного типа Исследование и разработка моделей распределенных баз данных информационных систем корпоративного типа Исследование и разработка моделей распределенных баз данных информационных систем корпоративного типа Исследование и разработка моделей распределенных баз данных информационных систем корпоративного типа Исследование и разработка моделей распределенных баз данных информационных систем корпоративного типа
>

Данный автореферат диссертации должен поступить в библиотеки в ближайшее время
Уведомить о поступлении

Диссертация - 480 руб., доставка 10 минут, круглосуточно, без выходных и праздников

Автореферат - 240 руб., доставка 1-3 часа, с 10-19 (Московское время), кроме воскресенья

Силин Андрей Владимирович. Исследование и разработка моделей распределенных баз данных информационных систем корпоративного типа : Дис. ... канд. техн. наук : 05.13.11 Москва, 2002 134 с. РГБ ОД, 61:03-5/919-5

Содержание к диссертации

Введение

Глава 1. Анализ проблем создания АСУ производствами корпоративного типа 14

1.1. Особенности функционирования АСУ крупным промышленным предприятием в современных условиях 14

1.2. Обзор возможностей современных пакетов построения АСУ промышленным предприятием 22

1.3. Анализ методов проектирования и управления распределёнными базами данных 25

1.4. Выводы 32

Глава 2. Предприятия корпоративного типа как сложный объект управления ..34

2.1. Структура и состав потокообразующих производств 34

2.2. Задачи, подлежащие решению по уровням управления. Модели информационных связей 39

2.3. Проблема синтеза информационной структуры территориально распределённых БД 50

2.4. Выбор критерия синтеза оптимальной информационной структуры 51

2.5. Выводы 58

Глава 3. Методы и модели проектирования информационных структур БД 60

3.1. Методы анализа исходных информационных структур проектируемой базы данных 60

3.2. Модель синтеза оптимальной информационной структуры базы данных 72

3.3. Метод разбиения структуры на минимально связанные блоки 77

3.4. Выводы 81

Глава 4. Методы и модели проектирования структур РБД 83

4.1. Определение понятия зона. Модель оптимального размещения информационных массивов БД в зоне 83

4.2. Модель оптимального размещения серверов и баз данных в зоне 91

4.3. Модель прикрепления пользователя к серверу зоны 96

4.4. Метод синтеза структуры сети передачи данных 99

4.5. Пакет программных средств для автоматизированного проектирования структур БД 102

4.6. Построение интегрированной информационной системы на примере крупного химического предприятия 106

4.7. Выводы 121

Заключение 122

Список литературы

Введение к работе

Актуальность темы. Проблемы совершенствования планирования и управления промышленным предприятиями тесно связаны с ускорением научно-технического прогресса, с повышением научного уровня планирования и прогнозирования, улучшением организационно-технической структуры управления. Внедрение вычислительной техники и разработка на ее основе автоматизированных систем управления (АСУ) представляет большую и важную задачу. Получили широкое распространение АСУ, обслуживающие различные уровни организации производства.

Одним из главных направлений совершенствования системы управления крупными промышленными предприятиями в настоящее время является разработка и внедрение интегрированных автоматизированных систем управления (ИАСУ), информационных и управляющих систем. Массовое внедрение АСУ технологическими процессами (АСУТП) и предприятиями (АСУП) весьма остро ставит проблемы повышения эффективности использования ЭВМ и систем передачи информации. Специфика этих систем заключается в том, что вычислительные, информационные ресурсы и средства передачи данных размещаются на территории некоторого региона. При этом возникает необоснованное дублирование информации, затрудняется доступ пользователей к накопленной информации. Непрерывное развитие рыночных экономических отношений требует решения все более сложных и трудоемких задач управления. При отсутствии развитой информационной системы невозможно обеспечить адекватные управленческие технологии, соответствующие динамике сегодняшнего дня.

В последние годы появились объективные предпосылки для создания на предприятиях систем, позволяющих интегрировать разнородные технологические подсистемы с целью построения автоматизированной системы оперативного диспетчерского управления (АСОДУ), а также интегрировать системы автоматизации технологических процессов с системами автоматизации админи

стративно-хозяйственной деятельности. Вышесказанное характерно практически для всех крупных корпоративных предприятий химической промышленности.

Создание автоматизированных систем управления и информационных систем связано с широким внедрением сетей ЭВМ, распределенных баз данных (РБД) и систем передачи информации. РБД отличает функциональная и структурная сложность [1], процесс их проектирования характеризуется большой длительностью, высокой трудоемкостью и значительными финансовыми затратами.

Имеющийся в настоящее время аппарат для разработки логических и физических структур РБД недостаточно формализован и базируется в основном на использовании опыта и интуиции разработчиков, что не позволяет оптимизировать процессы проектирования и функционирования РБД. Более того, при проектировании никак не учитываются ни особенности химической технологии, ни, тем более, особенности работы цепочки взаимосвязанных и размещенных на значительной территории производств.

Вопросы формирования методики синтеза эффективных структур распределенных баз данных для создания интегрированных АСУ предприятиями химической технологии в настоящее время разработаны недостаточно, решены только отдельные вопросы проектирования структур РБД, не содержащие общих подходов к созданию такого рода систем.

Одной из важных компонент распределенных систем являются системы, которые обладают развитым аппаратом обработки больших объёмов информации, структурированной в базы данных. В настоящее время применение концепции баз данных в распределенных системах является общепринятым. По мере развития таких систем постоянно возрастают сложность решаемых ими задач и объёмы обрабатываемой информации [2]. При этом распределенные системы должны обладать средствами оперативной обработки больших объёмов информации.

Современные тенденции развития информационной системы состоят в переходе от централизованных вычислительных систем к распределённым. Стратегии распределения данных по узлам сети диктуются как управленческими, так и производственными задачами конкретных химических производств.

Можно рассмотреть несколько альтернативных стратегий распределения данных [3, 4, 5], каждая из которых имеет как преимущества, так и недостатки. Основным преимуществом централизованной базы данных является простота. Все операции выполняются под контролем единственного узла. Все запросы на выборку и обновление данных направляются в центральный узел. Недостатком данной стратеги является то, что размер базы данных ограничивается объемом внешней памяти в центральном узле. Кроме того, центральный узел может стать узким местом всей системы с точки зрения надежности, поскольку база данных становится недоступной при появлении ошибки в системе связи и полностью выходит из строя при выходе из строя центрального узла. Это является недопустимым для экологически опасных химических производств.

Стратегия расчленения, при которой единственная копия базы данных в виде непересекающихся подмножеств распределяется по многим узлам сети, не допускает существования копий отдельных частей базы данных. При этом на первый план выдвигается процесс проектирования расчлененных данных с целью получения преимуществ за счет распределения запросов на выборку и обновления по тем узлам, где расположены.запрашиваемые данные. В этом случае стоимость связи может быть снижена за счет того, что большая часть запросов к базе данных будет осуществляться в локальных узлах. С другой стороны, запрос может потребовать доступа ко всем узлам сети, и это приведет к большой стоимости связи и к большему времени задержки [6, 7, 8], чем в случае централизованной базы данных, что для ряда производств химической технологии может быть недопустимо, поскольку сопряжено с риском появления аварийных ситуаций. Однако, надежность может быть повышена по сравнению с централизованным подходом, поскольку в случае выхода из строя системы

база данных все же может оказаться частично работоспособной.

При распределении данных с использованием стратегии дублирования в каждом узле сети размещается полная копия базы данных. Основное преимущество этой стратегии относится к области надежности и эффективности выборки, что требует, однако, значительных затрат памяти. Кроме того, с целью согласования множественных копий базы данных необходимо поддерживать их изменения, что является трудно выполнимой задачей, отвлекающей значительные ресурсы системы.

Смешанная стратегия распределения данных объединяет подходы, связанные с расчленением и дублированием данных, и приобретает как все их преимущества, так и недостатки. При этом подходе любая часть базы данных может быть дублирована произвольное число раз, и в каждом узле может содержаться желаемая часть базы данных. Недостатком такого подхода является сложность обработки и оптимизации запросов.

В связи с вышеизложенным, сокращение сроков и стоимости создания РБД, необходимость эффективного использования ресурсов РБД определяют целесообразность разработки формализованных моделей и методов, позволяющих автоматизировать наиболее трудоемкие этапы проектирования РБД, выбрать решения, оптимизирующие их состав и структуру.

Объектом исследования диссертационной работы являются модели и методы проектирования распределенных баз данных для цепочки технологически связанных химических производств.

Цель работы.

Обобщить и развить методику применения имеющегося в настоящее время аппарата для разработки логических и физических структур распределенных баз данных с целью построения интегрированной автоматизированной системы управления для цепочки взаимодействующих непрерывных химических производств.

Автоматизировать и оптимизировать наиболее трудоемкие этапы проекти

рования РБД для сокращения сроков и стоимости их создания.

Применить предложенные подходы к решению задач создания комплекса взаимосвязанных формализованных моделей и методов анализа предметных областей пользователей, синтеза оптимальных логических и физических структур распределенных баз данных.

Разработать и исследовать модели и методы построения оптимальной структуры РБД.

Разработать алгоритмы получения оптимального решения согласно предложенным моделям.

Выбрать решения, оптимизирующие состав и структуру проектируемой РБД.

Применить научно обоснованные рекомендации по оптимизации структуры РБД при проектировании элементов АСУ ряда предприятий Новомосковской акционерной компании (НАК) «Азот».

Научная новизна работы состоит в следующем:

- обобщена и развита методика разработки поэтапного построения распределенных структур баз данных для построения интегрированной автоматизированной системы управления цепочкой взаимодействующих непрерывных химических производств;

- создан комплекс взаимосвязанных формализованных моделей и методов анализа предметных областей пользователей, синтеза оптимальных логических и физических структур распределенных баз данных;

- предложена совокупность процедур последовательного преобразования матричных и графовых моделей предметных областей пользователей в процессе многоэтапного проектирования распределенных баз данных с учетом специфики целей и ограничений;

- обоснован выбор вида экономической целевой функции синтеза оптимальной информационной структуры базы данных;

- предложены соотношения и алгоритмы, позволяющие снизить размер

ность исходных структур данных;

- введено понятие свертки и предложен алгоритм декомпозиции структуры исходных данных, что обеспечивает уменьшение размерности задачи и сокращение времени её решения;

- разработан быстродействующий алгоритм нахождения всех замкнутых контуров для исключения некорректных запросов в результате ошибок при анализе исходных структур;

- предложены модели размещения баз данных по зонам;

- предложена модель размещения серверов и баз данных в зоне;

- решена задача оптимального размещения баз данных по узлам хранения информации;

- поставлена и решена задача оптимизации структуры сети передачи информации, при условии минимизации затрат при наличии штрафа за отсутствие канала связи между узлами.

Практическая ценность и реализация результатов работы.

Предложенные в диссертации методы, модели и алгоритмы вошли в состав разработанного пакета программных средств автоматизированного проектирования структур данных распределённой БД и были использованы при разработке и практической реализации интегрированной распределённой системы управления для основных производств корпоративного предприятия НАК «АЗОТ».

Апробация работы.

Основные результаты работы докладывались:

- на международной конференции «Математические методы в химии и химической технологии» (ММХ-10) (г.Тула, 1998);

- на заседаниях кафедры «Системы обработки информации и управления» МГТУ им. Н.Э. Баумана (г. Москва, 1998 и 2001);

- на научных конференциях Российского химико-технологического университета (г. Москва, 1999 и 2000) и Новомосковского института РХТУ (г. Новомосковск, 1998 и 1999).

Публикации. Результаты, отражающие основное содержание диссертационной работы, изложены в 8 публикациях.

В первой главе показано, что непрерывное развитие рыночных экономических отношений требует решения все более сложных и трудоёмких задач управления, которые невозможно получить при отсутствии развитой информационной системы, позволяющей обеспечить адекватные управленческие технологии, соответствующие динамике сегодняшнего дня. Одним из возможных направлений совершенствования системы планирования и управления крупными химическими предприятиями в настоящее время является разработка и внедрение интегрированных автоматизированных систем управления, информационных и управляющих систем.

Рассмотрены возможности современных пакетов построения АСУ промышленным предприятием, произведён их анализ с точки зрения применимости для построения интегрированных АСУ. Показано, что им всем присущи типовые недостатки, ограничивающие их применение для предприятий химической промышленности.

Проведён обзор отечественных и зарубежных исследований и разработок, посвященных методам, моделям и системам проектирования и управления территориально распределенными базами данных. Показано, что вопросы формирования общей методики синтеза эффективных структур распределенных баз данных для построения интегрированных АСУ разработаны недостаточно. Рассмотренные в работах задачи решают только отдельные вопросы проектирования структур распределенных баз данных. Они не учитывают динамику и взаимосвязи работы комплекса предприятий химических производств, не содержат общей методики проектирования структур распределенных баз данных, отражающей задачи всех этапов создания такого рода систем.

Во второй главе проведён анализ химического предприятия как сложного объекта управления и рассмотрен типовой состав его производств. Анализ показал, что объекты, между которыми существуют наиболее значимые материальные и информационные связи, территориально распределены и образуют структуру, типичную для большинства химических предприятий.

Определен характер информации, циркулирующей на различных уровнях управления группой химических предприятий, и выделены интервалы периодичности решения характерных задач. Это позволяет учесть динамику движения информации и предложить новые подходы к получению более эффективных решений задачи синтеза структуры данных.

Предложена методика поэтапного построения распределённых структур баз данных, уточняющая этапы проектирования и направленная на уменьшение стоимости передачи, хранения и обновления информации. Включены этапы, направленные на уменьшение размерности и учёт особенностей химической технологии. При этом для упрощения решаемых задач в методику не включены этапы оптимизации времени выполнения запроса в узле хранения информации, а также выбора конкретной СУБД.

Проведен сравнительный анализ ряда критериев применительно к созданию РБД по их влиянию на параметры, характеризующие эффективность функционирования системы.

Обоснован выбор комплексного критерия экономического характера как наиболее рационального для синтеза оптимальной информационной структуры распределённых баз данных.

В третьей главе предложен метод анализа исходных информационных структур проектируемой базы данных, учитывающий периодичность решения задач в проектируемой системе.

Предложен метод, позволяющий снизить размерности исходных структур путем представления их в виде сверток и основанный на выделении однотипных элементов, для которых структуры связей элементов, принадлежащих од

ному классу, одинаковы в пределах принятых допущений.

Разработан эффективный алгоритм определения всех элементарных контуров для исключения некорректных запросов в результате ошибок при анализе исходных структур.

Предложен алгоритм поиска вариантов реализации элементарных запросов при решении задачи синтеза оптимальной структуры для определения множества возможных реализаций заданных запросов пользователей.

Разработана математическая модель и алгоритм синтеза оптимальной информационной структуры базы данных в соответствии с критерием, согласующимся с выбранным ранее глобальным критерием.

Предложены соотношения и алгоритмы, позволяющие выбрать систему отношений между элементами информации, включаемыми в проектируемую базу данных, разбить исходные структуры с целью удобства анализа на несвязные подструктуры.

В четвертой главе разработаны модели и алгоритмы размещения баз данных и прикрепления пользователей с точностью до зоны с учётом оптимальных масштабов дублирования информации.

Сформирована модель и предложен алгоритм оптимального размещения баз данных и прикрепления пользователей к узлам хранения и обработки информации.

Поставлена и решена задача оптимизации структуры сети передачи данных, включающая этапы построения избыточной структуры сети и её локальной оптимизации, при условии минимизации затрат при наличии штрафа за отсутствие канала связи между узлами.

Разработан комплекс программ для автоматизированного проектирования структур баз данных.

Разработанные методы и средства применены для решения задачи проектирования распределенных баз данных информационной системы ряда производств НАК «Азот».

Объём работы. Диссертационная работа состоит из введения, четырех глав, выводов и списка использованной литературы. Работа изложена на 133 страницах текста, включает 22 рисунка, 13 таблиц и приложений.

Обзор возможностей современных пакетов построения АСУ промышленным предприятием

Большинство предлагаемых на российском рынке систем управления ресурсами предприятия ERP классифицируются как универсальные, то есть предлагается одна система и для производства по сборке автомобилей, и для химического предприятия. За такую универсальность приходится расплачиваться тем, что для каждого конкретного типа производства готовая система подходит меньше, чем специально спроектированная, учитывающая его специфику.

Ядром полноценных ERP систем является модуль, обеспечивающий взаимоувязанное планирование (а при необходимости - оперативное перепланирование) всех ресурсов предприятия - финансовых, материальных, кадровых (в том числе загрузку оборудования). Основой математических моделей, заложенных в основу таких систем, является конструкторская спецификация Bill Of Materials (BOM) или иерархическая структура.

Однако для многих типов производств не существует конструкторской спецификации, в частности, для большинства сложных производств химической технологии. Конструкторская спецификация не требуется для производств, где «готовое изделие» содержится в исходном продукте изначально, и надо просто убрать все лишние компоненты. Здесь ВОМ не даёт никакой информации, основой является технологический цикл, или модель производства.

Структуру производства, в котором на входе имеется один продукт, а на выходе сотни продуктов, можно представить в виде дерева (рис. 1.2).

Выпуск продуктов, технологический цикл которых включает рециклы [21] (рис. 1.3), когда «выход» с какой-то стадии повторно подаётся «на вход», также практически невозможно представить при помощи стандартных моделей. Расчёт потребности в материалах для таких типов производств с помощью математических моделей, основанных на ROM, заставляет прибегать к различным математическим трюкам, типа отрицательных времён производства и отрицательных величин потребления.

Кроме того, каждое предприятие обладает собственным, в той или иной степени, уникальным набором бизнес-процессов, следуя своим стратегическим установкам и задачам. Между тем, любая готовая ИСУП ориентирована на вполне определённую модель организации бизнес-процессов и допускает корректировку настроек лишь в некоторых пределах.

Еще меньше возможностей существующие ERP-системы предоставляют для построения АСУТП, поскольку не предоставляют достаточно средств как для анализа и синтеза систем управления, так и для обработки технологической информации. Для этих целей служат SCADA-пакеты - одно из наиболее популярных средств для программирования систем автоматизации технологических процессов. Среди зарубежных лидеров в мире производителей SCADA-пакетов выделяются FixDMAX, Intouch и Genesis, а также российский производитель AdAstra. Они предназначены в первую очередь для создания человеко-машинных интерфейсов, регистрирования, отображения и архивирования данных АСУТП. За последние годы в различных изданиях появилось много публикаций на эту тему. Как правило, их авторы или превозносят достоинства какого-либо одного пакета, или предлагая обзор рынка SCADA описывают непревзойдённые качества своего продукта на фоне остальных.

Однако анализ существующих систем показывает, что им всем присущи типовые недостатки. Практически все производители заявляют, что их SCADA система позволяет вести сквозное проектирование всех уровней АСУТП. Однако на практике это возможно только для определённых типов контроллеров, которые необязательно могут использоваться на предприятии. Теоретически возможно создание АСУТП любой сложности, однако для этого можно использовать не любой пакет, что практически недопустимо в условиях большого разнообразия технологических процессов. Практика показывает, что в 99% проектов на основе SCADA необходимо программировать достаточно серьёзные алгоритмы на встроенных языках, представляющих собой обычно сложный язык скриптов.

Все это приводит к необходимости для сложных технологических производств разрабатывать такие системы управления, которые учитывали бы особенности и специфику работы предприятия, отвечали бы требованиям управления, а также не являлись бы сложными с точки зрения их эксплуатации и модернизации в связи с изменяющимися условиями производства. В результате появилась потребность не в конкретных продуктах, а в законченных решениях.

В последние годы стали очевидными тенденции использования сетей Ethernet на любом уровне систем автоматизации, в том числе и на контроллерном уровне, а также применение информационных технологий на уровне автоматизации технологических процессов. Это стало объективным условием для внедрения на предприятиях систем различной степени сложности и позволило интегрировать разнородные технологические подсистемы с целью создания автоматизированной системы оперативного диспетчерского управления (АСОДУ) или общих диспетчерских мест, а также интегрировать системы автоматизации технологических процессов с системами автоматизации административно-хозяйственной деятельности.

Если судить по результатам Hannover MESSE, Interkama и ISA Show, то каких-то революционных продуктов или событий в области промышленной автоматизации, радикально меняющих сложившиеся технологии решения задач АСУТП, в последний год не появилось;

Разработка и развитие концепций распределенных баз данных (РБД) определяют в настоящее время основные направления исследований и разработок в области повышения эффективности проектирования и обеспечения функционирования информационной базы АСУ и информационных систем различных классов.

Задачи, подлежащие решению по уровням управления. Модели информационных связей

Наличие широких и сложных технико-экономических и административно-управленческих связей для данного объекта предопределяет огромные размеры массивов плановой, оперативной, отчетной и технологической информации, необходимой для реализации функций управления предприятием [44]. Специфика решаемых задач, их различная сложность позволяют отнести информационную систему рассматриваемого объекта к классу корпоративных информационных систем [45], характерными признаками которой является: масштабность и сложность решаемых задач; пересечение множества различных предметных областей; ориентация на аналитическую обработку данных; большая территориальная распределенность; длительный жизненный цикл; разнообразие используемого аппаратного обеспечения, жизненный цикл которого меньше, чем у создаваемой системы; разнообразие используемого программного обеспечения.

Для характеристики информации в существующей системе управления предприятием необходим тщательный анализ ее временных и объемных характеристик [46]. Обмен информацией, в зависимости от её типа, может осуществляться в системе с периодичностью от нескольких минут до часов и смен, а также по мере необходимости.

Величины, получаемые в результате обработки первичной информации, необходимы для решения разнообразных задач, наиболее распространенными среди которых являются расчеты показателей и учет производства.

При создании АСУ число входящих и выходящих переменных исчисляется сотнями. По мере увеличения числа рассчитываемых показателей возрастает объём операций по контролю их достоверности и анализу, усложняются спосо 40 бы предоставления выходной информации.

Множество входных переменных образуют такие параметры технологических процессов как расход, давление, температура, уровень, расход энергии. Информация об этих параметрах поступает автоматически от датчиков. К входным показателям относятся также показатели, характеризующие выработку, загрузку, отгрузку, расходы и реализацию продукции. Ещё есть условно-постоянная информация. В её состав входят плановые нормативы выработки и отгрузки продукции, цены, плановые значения расходных коэффициентов.

Выходные переменные, характеризующие работу производственных подразделений, делятся на две группы: оперативные технико-экономические показатели рассчитываются один раз в час; неоперативные технико-экономические показатели рассчитываются один раз в смену, сутки.

Оперативные ТЭП, в частности, это часовые расходы основных материальных и энергетических потоков. К ним относятся: выработка продукции за смену, за сутки, с нарастающим итогом за месяц; отклонение фактического значения выработки продуктов за смену, за сутки от планового; остатки готовой продукции за сутки; запасы сырья; расходные коэффициенты сырья и энергоресурсов; отклонение фактических значений расходных коэффициентов от плановых; потребление сырья и энергоресурсов; технологическая составляющая себестоимости.

Количественные характеристики входных переменных и рассчитываемых показателей по цехам приведены в табл. 1.

Алгоритмы позволяют осуществлять преобразование сигналов, полученных от датчиков технологических параметров, в технические единицы измерения, фильтрацию, усреднение и интегрирование, коррекцию измерений при отклонении параметров сред от расчётных, вычисление косвенных показателей, вычисление технологических и технико-экономических показателей.

Обработка аналоговой и число-импульсной информации включает в себя: предварительный контроль достоверности технологических параметров (ТП); первичную обработку информации; расчет показателей (РП); прогнозирование РП; контроль отклонений ТП и РП от заданных границ.

Формируемая названными алгоритмами информация позволяет в любой момент осуществлять контроль хода технологических процессов, количества и качества сырья и продуктов, запасов сырья, полупродуктов и товарной продукции, а также оценивать возможные результаты производственной деятельности на конец смены.

Контроль состояния оборудования включает в себя: анализ сигналов об изменении состояния оборудования, а также инициализацию других алгоритмов при возникновении событий, требующих реакции системы; формирование информации о состоянии оборудования для представления оперативному персоналу и для системы учета (длительность простоя, моменты переключения оборудования в течение смены, состояние основного оборудования на начало и конец смены).

Полученная информация дает возможность оперативному персоналу системы анализировать состояние производства и своевременно принимать меры предупреждения аварийных ситуаций.

Для представления информации пользователям формируются запросы к системе управления базой данных на поиск нужной информации, организуются расчеты недостающих данных, формируются графические зоны индикации отклонений параметров и изменений состояния оборудования, обеспечивается вывод различных групп данных на мониторы и печатающие устройства. При этом можно выделить следующие составляющие: текущие значения и графическое изображение параметров; значения расходов сырья и продуктов, усредненные на скользящем интервале, интегрированные (с начала смены) и прогнозируемые на конец смены; оперативные балансы энергоресурсов; текущие значения запасов сырья полупродуктов и продуктов на складах, прогнозируемые значения запасов на конец смены; количество отгруженной продукции с начала смены; значения расходных коэффициентов и коэффициентов выполнения плана по основным продуктам;

Модель синтеза оптимальной информационной структуры базы данных

Формирование структуры базы данных в локальных и распределенных банках данных является центральной задачей разработки концептуальной модели базы данных [72]. Эта задача достаточно сложна, так как необходимо учитывать множество факторов, таких как активность запросов пользователей, методы поиска данных в логической структуре, множество элементов и отношений, включаемых в базу и т.д. В то же время проектируемая структура должна быть, в достаточной степени, инвариантной по отношению к СУБД, в среде которой она будет реализована.

В главе 2 были рассмотрены некоторые постановки задач формирования логической структуры базы данных [73]. Однако, как это уже отмечалось, в этих работах, как правило, не приводятся критерии и модели синтеза логических структур базы данных, а сам процесс проектирования в недостаточной степени формализован. В общей постановке задача синтеза оптимальной логической структуры базы данных формулируется следующим образом: определить оптимальную в смысле принятого критерия логическую структуру, обеспечивающую реализацию совокупности запросов всех пользователей системы. В качестве глобального критерия синтеза структуры базы данных примем суммарную стоимость хранения, обновления, поиска и передачи информации за рассматриваемый период времени [74]. На этом этапе еще неизвестны размещение узлов хранения информации, размещение массивов по узлам, размеры памяти, прикрепление пользователей к узлам. В связи с этим предполагается, что синтезируемая логическая структура реализуется в условиях со следующими характеристиками: объем памяти не ограничен; стоимость хранения единицы информации постоянна для всей системы памяти; число пользователей, подключаемых к узлам, не ограничено; дублирование полезной информации отсутствует; дублирование структурной информации не ограничено; поиск информации осуществляется по ранее принятой стратегии; стоимость передачи единицы информации между узлами и пользователями, а также между узлами и источниками информации постоянна; стоимость обмена единицей информации между центральным процессором и системой накопителей несоизмеримо мала по сравнению со стоимостью хранения и поиска единицы информации в узлах (для одного и того же периода времени).

В качестве критериальной функции, согласующейся с глобальным критерием, на этапе логической структуризации принимается суммарная стоимость поиска информации с целью обновления, использования и хранения структурной информации (указателей связи). Синтез оптимальной логической структуры позволяет получить логическую структуру, являющуюся нормативной схемой, к которой следует стремиться при дальнейшей ее физической реализации. Последующие преобразования синтезированной логической структуры и физическая структуризация преследуют цель удовлетворить реальные ограничения при минимальном искажении логической структуры.

На этапе анализа и синтеза общей логической структуры преждевременно говорить о выборе определенного метода организации информации и метода доступа к ней, так как логическая структура это структура, которая не может быть физически реализована точно в таком же виде. Это связано, прежде всего, с большими размерностями логических структур. В то же время синтез логической структуры предполагает, что общая стратегия поиска информации в логической структуре известна. На этапе логической структуризации нецелесообразно накладывать ограничения на логическую структуру, исходя из требований какой-либо существующей системы управления базами данных. Поэтому далее предполагаем, что логическая структура базы данных отражает объектив но существующие связи между элементами информации [75].

Общая стратегия поиска в логической структуре зависит в значительной степени от методов физической реализации элементов информации, указателей типов связи и самих связей [76].

Модель синтеза оптимальной информационной структуры базы данных описывается следующими соотношениями [77]: Определить множество дуг {xk,J = 1}, Vk к при С= С - min, k=l M і. і. ,. Vllm XI XIJVIJ где:Ск=Ск+Ск, Ck=Cnep RK, Ck = 0,11 mk=l I Cnep - средняя стоимость обработки одного указателя связи; Rk - условная трудоёмкость реализации т-го запроса в k-ом типе отношений; р{ - число элементарных запросов m-го типа в к-ом типе отношений; Сх - средняя стоимость хранения одного байта; LJJ - длина указателя связи элемента класса I к элементу класса J (байт); Vk - вес дуги в структуре-свертке; xf - мощность множества элементов класса І в k-м типе отношения; к Ґ1, дуга I, J входит в оптимальное решение " (О, в противном случае

В описываемой модели синтеза оптимальной логической структуры базы данных приняты следующие допущения: стоимости хранения и обработки единицы информации постоянны в течение рассматриваемого периода Т; рассматриваются независимые по времени запросы; в противном случае можно переопределить запросы и привести их к системе независимых запросов; синтез структуры проводится для условно независимой системы отношений; классы множеств v=l,...,vmax определяются независимо для каждого типа отношения к.

Модель прикрепления пользователя к серверу зоны

Следующей задачей формирования структуры РБД в данной зоне является задача прикрепления пользователей (источников информации) к определенному узлу. Под прикреплением мы подразумеваем организацию взаимодействия пользователей с узлами хранения информации [90, 91]. Рассмотрим два основных варианта такой организации;

1. Каждый пользователь (источник информации) взаимодействует со всеми узлами зоны, в которых находятся требуемые ему массивы. Преимуществом этой организации является возможность быстрого получения информации из соответствующих узлов, если существует эффективно функционирующая система обмена информацией. Однако этот вариант требует хранения у каждого пользователя структурной информации о размещении массивов в узлах, что не всегда возможно из-за отсутствия у пользователя, например, соответствующих периферийных устройств. При этом из-за динамического перераспределения массивов структурная информация непрерывно меняется, поэтому следить за ее изменениями самому пользователю очень трудно. Система будет перегружаться запросной информацией. Организация связи пользователей с каждым узлом требует больших затрат на каналы связи и приводит к неэффективности их использования.

2. Каждый пользователь (источник информации) взаимодействует только с одним локальным узлом, например, узлом, с которым интенсивность его информационного взаимодействия максимальна. Данный вариант не требует хранения у пользователей структурной информации о размещении массивов по узлам и удобен для пользователей. Организация связи пользователей с узлами хранения информации резко упрощается. Загрузка магистральных каналов становится более равномерной. Оптимальное динамическое переразмещение массивов в узлах не влияет на организацию взаимодействия пользователей с локальным узлом, к которым они прикреплены. Возможна организация оптимального информационного взаимодействия между узлами с целью удовлетворения совокупности запросов всех пользователей. Остановимся именно на этом варианте прикрепления пользователей к узлам хранения информации.

Сформулируем задачу прикрепления пользователей (источников информации) к узлу в данной зоне. В качестве критерия оптимизации принимаем максимум суммарных информационных потоков между совокупностью пользователей и узлами хранения информации. Смысл этого критерия заключается в том, чтобы каждый пользователь (источник информации) получал информацию преимущественно из узла, к которому он прикреплен. Этот критерий минимизирует также информационные потоки между узлами. Задача оптимального прикрепления пользователей (источников информации) к узлам в данной зоне формулируется следующим образом:

Определить размещение {Xik} при известном множестве {xki = l} размещения серверов по пользователям и известном множестве х;к = 1 размещения баз данных по серверам при 6 n m _ 5 maxC(n)= I2 jiXjkXjk, Ixjk=l, i = l,.-,n, k=li=lj=l k=l где: к - номер сервера, j - номер базы данных; Djj - интенсивность использования и обновления базы данных пользователем і, байт/в ед. времени; Ґ1, если база данных j размещена на сервере к; J (0 в противном случае; Xik 1, если пользователь і прикреплен к серверу к; О в противном случае; не существует ограничений на число пользователей, прикрепляемых к одному серверу; не существует ограничений на объемы потоков информации, замыкающихся на один сервер; не делается различий между потоками обновления и использования информации из-за отсутствия дублирования в зоне.

Задано множество узлов сети Х=1,...,п и объемы информации а», передаваемой в единицу времени между узлами i,jeX. Пусть: V - пропускная способность канала связи [92], су - стоимость аренды канала между узлами і и j.

Необходимо из множества пригодных для реализации структуры ветвей D = {(i, j) выбрать такое подмножество N = {(k,l)}cr D, которое минимизирует затраты при наличии штрафа за отсутствие канала связи между киї. F = Z (Укі Скі+ Fki)» гДе Уki" число каналов между узлами киї. (k,!)eN

1. Для передачи информации между узлами і и j при отсутствии отказавших каналов используется один и только один, оптимальный, в частности, это путь минимальной стоимости.

2. Число каналов на ветви (к, і) є D не ограничено.

3. Количество каналов связи ук,на каждой реализуемой ветви (k,l) однозначно определяется полной нагрузкой ветви kl = aki + Zaij3 где суммирование выполняется по всем парам узлов i,j, таким образом, что путь передачи Sn потока а у включает в себя ветвь (k,l).

4. Значения ук] должны удовлетворять условию целочисленностиук1 = рк1 /V[, где ]Ь[ обозначает наименьшее целое число, такое что ]b[ b.

5. Надежность сети должна обеспечивать связность графа при удалении любо го из ребер (параметр щ 2).

Случайным образом выбирается начальный план (некоторая избыточная структура сети). Множество ветвей остова обозначим Ni Q D. Затем получен ный остов дополняется случайным образом до некоторого избыточного графа. Предоставляется целесообразным включать в избыточную структуру не более 50% (параметр R) и не менее 30% (параметр М) общего числа дуг полного графа. Поскольку значение функционала зависит от Ь и ау то вероятность р.. включения ветви (i,j) в случайный граф (X,N0) имеет смысл установить согласно соотношению р = р У—У—} ПрИ J Ф j} где р _ константа. 1-і Z-i йіі lij

Далее из множества Dflyr полного графа исключается подмножество ветвей Nj Для каждой ветви (і, ])е D\N, генератором равномерно распределенных на отрезке [0;1] случайных чисел генерируется число Ру. Если рг р.., то ветвь (i,j) включается в искомое множество дугДГ, случайного графа. В противном случае рассматривается следующая ветвь полного графа. Процесс заканчивается после того, как в случайный граф войдет заданное число ветвей. Для исключения возможности получения структуры с висячими вершинами алгоритм получения начальной структуры дополняется блоком, который обеспечивает включение в 7У0 для висячей вершины к є X инцидентной ветви (к,1) и еще одной ветви (k,s), такой, что p. = max р..

Похожие диссертации на Исследование и разработка моделей распределенных баз данных информационных систем корпоративного типа