Содержание к диссертации
Введение
1 Общая характеристика проблемы и обзор методов ее решения 13
1 Общая характеристика проблемы и обзор методов ее решения 13
1.1 Принципы функционирования и обобщенная схема информационных потоков в системах распределенного технологического мониторинга 13
1.2 Современные технологии проектирования и анализ подходов к моделированию функционирования систем распределенного технологического/мониторинга 20
1.3 Обзор существующих средств имитационного моделирования функционирования систем распределенного технологического мониторинга..27
1.3.1 SCADA система ZETView 30
1.3.2 Интеграция SCADA-системы Trace Mode и математического пакета MATLAB 31
1.3.3 Эмулятор TOSSIM 32
1.3.4 Система для автоматизированного создания проектов локальных вычислительных сетей Net Wizard 34
1.3.5 Семейство OPNET средств для проектирования и моделирования
локальных и глобальных сетей, компьютерных систем, приложений и
распределенных систем 35
1.3.6 Среда графического программирования Lab View 37
1.3.7 Обзор разработок в области имитационного моделирования систем распределенного технологического мониторинга 39
1.4 Цели и задачи исследований 46
1.5 Выводы по первой главе 48
2 Разработка и программная реализация имитационной модели взаимодействия информационных процессов в СРТМ 49
2.1 Построение имитационной модели функционирования системы распределенного технологического мониторинга 49
2.2 Инфраструктура подсистемы управления потоками заявок в имитационной модели 62
2.3 Моделирование физического уровня обмена данными 70
2.4 Моделирование алгоритмического уровня сбора и обработки информации
2.5 Программная реализация предложенной имитационной модели 77
2.5.1 Реализация ядра программной системы 78
2.5.2 Структура базы данных 86
2.6 Выводы по второй главе 102
3 Исследование разработанной имитационной модели 104
3.1 Зависимость надежности функционирования модели СРТМ от параметров конфигурации подсистемы управления потоками заявок 104
3.2 Анализ работы главного диспетчера программной системы ПО
3.3 Исследование поведения программной системы при планировании и обработке нештатных ситуаций моделируемой СРТМ 115
3.4 Выводы по третьей главе 123
4 Применение программной системы для исследования надежности и закономерностей функционирования системы распределенного технологического мониторинга 124
4.1 Проверка адекватности моделирования информационных процессов на примере работы с моделью СРТМ по учету тепла и расхода теплоносителя на ТЭЦ Кемеровской области 124
4.2 Исследование характеристик работы системы распределенного технологического мониторинга в зависимости от ее топологии 133
4.3 Влияние порядка сложности алгоритмов обработки данных на характеристики системы распределенного технологического мониторинга ... 137
4.4 Исследование работоспособности системы распределенного технологического мониторинга при возникновении программно-аппаратных сбоев 141
4.5 Применение построенной программной системы для проектирования системы сбора и обработки данных по потреблению энергоресурсов университетского кампуса 147
4.6 Выводы по четвертой главе 155
Заключение 157
Список использованных источников 158
- Современные технологии проектирования и анализ подходов к моделированию функционирования систем распределенного технологического/мониторинга
- Инфраструктура подсистемы управления потоками заявок в имитационной модели
- Исследование поведения программной системы при планировании и обработке нештатных ситуаций моделируемой СРТМ
- Влияние порядка сложности алгоритмов обработки данных на характеристики системы распределенного технологического мониторинга
Введение к работе
Актуальность темы. Перспективным направлением в области разработки систем распределенного технологического мониторинга (СРТМ) является предварительное моделирование их функционирования с целью проведения экспериментов с СРТМ без ее физической реализации, что особенно важно при создании сложных быстродействующих информационных систем в областях, где тестирование затруднено или невозможно из соображений высокой стоимости или безопасности.
Анализ узкоспециализированных программных продуктов для моделирования работы вычислительных сетей, используемых в СРТМ (ZetView, Tossim, NetWizard, Opnet Modeler и др.), выявил ряд недостатков: высокую стоимость (1,500$-70,000$); отсутствие средств прогнозирования и обработки нештатных ситуаций (НС); ориентацию на оборудование конкретного производителя; отсутствие средств оценки характеристик работоспособности системы в зависимости от характеристик алгоритмов обработки данных, выполняющихся на ее узлах. Описание же модели взаимодействия информационных процессов в СРТМ с использованием существующих программных продуктов для моделирования работы динамических систем (MATHLAB, Lab View) требует значительных временных затрат и не позволяет получить данные для сравнительного анализа показателей работоспособности системы при различной конфигурации связей и разных характеристиках оборудования.
В связи с этим актуальным является разработка имитационной модели взаимодействия информационных процессов в СРТМ, и реализация ее в виде программной системы, позволяющей задавать структуру системы; описывать логику взаимодействия функционирующих в ней информационных процессов; исследовать применимость для обработки данных алгоритмов, обладающих различной вычислительной сложностью; прогнозировать поведение системы при НС; оценивать характеристики производительности и надежности СРТМ при использовании различного оборудования и архитектуры.
Целью диссертационной работы является разработка и программная реализация имитационной модели взаимодействия информационных процессов в СРТМ, позволяющей учитывать вычислительную сложность используемых алгоритмов обработки данных и исследовать характеристики работоспособности проектируемой СРТМ.
Для достижения поставленной цели ставятся следующие задачи:
Разработка имитационной модели взаимодействия информационных процессов в СРТМ с позиций теории массового обслуживания, методов имитационного моделирования и комплексного подхода к описанию поведения системы.
Разработка архитектуры имитационной системы для построения, отображения, тестирования и анализа процессов сбора, обработки и передачи данных в СРТМ и создание реализующего ее программного обеспечения.
Разработка методики тестирования и оценки эффективности применения вычислительных технологий обработки данных в СРТМ, основанной на использовании внутреннего языка имитационной системы.
Комплексное исследование на основе имитационного эксперимента характеристик работы СРТМ в штатном режиме и в случае программно-аппаратных сбоев в зависимости от ее топологии, параметров конфигурации оборудования и выполняющейся на узлах сети обработки данных.
Методы исследования. Для решения поставленных задач и достижения намеченной цели проводились теоретические и экспериментальные исследования, основанные на использовании методов теории массового обслуживания, теории формальных языков, теории математического моделирования, теории параллельного программирования, вычислительной математики, а также прикладное и системное программирование и средства машинной графики для отображения результатов моделирования.
Научная новизна:
Предложена имитационная модель взаимодействия информационных процессов в СРТМ, основанная на представлении СРТМ в виде графа, каждой вершине которого сопоставлена система массового обслуживания (СМО), взаимодействующая со СМО других его вершин и учитывающая характеристики оборудования, выполняющиеся на узле алгоритмы обработки данных и поведение СРТМ в случае возникновения программно-аппаратных сбоев.
Для разработанной модели предложены алгоритмы и программное обеспечение, реализующие комплексный подход к описанию взаимодействия информационных процессов СРТМ, основанный на синтезе объектно-, про-цессно-, событийно- и функционально-ориентированных подходов.
Предложено применять для оценки временных характеристик используемых на узлах СРТМ алгоритмов обработки данных синтаксически-ориентированный метод их описания.
Реализация результатов работы. На основе результатов исследования разработан программный комплекс для моделирования обработки данных в гетерогенных распределенных системах «DS Simulator», некоторые элементы которого были апробированы при создании сети учета энергоресурсов АлтГТУ и в специализированных приложениях. Получено свидетельство Роспатента об официальной регистрации программы для ЭВМ № 2010613965.
Практическая значимость. Созданная на основе построенной имитационной модели программная система позволяет при проектировании СРТМ учитывать вычислительную сложность используемых на ее узлах алгоритмов обработки данных и исследовать влияние на параметры работоспособности СРМТ ее архитектуры. Полученные результаты исследований могут быть использованы при разработке систем распределенного технологического мониторинга для контроля производственных процессов и функционирования техногенных объектов в областях, критичных к надежности, своевременности и скорости доставки и обработки данных.
Практическая значимость работы подтверждается отзывом организации Grid Dynamics (Fremont, СА, USA), профилем работы которой являются высоконагруженные отказоустойчивые системы.
Разработанное программное обеспечение используется в учебном процессе при преподавании курса «Моделирование» для специальности «Вычислительные машины, комплексы, системы и сети».
Апробация научных результатов. Основные результаты работы апробированы на 12 конференциях: VII Всероссийской научно-практической конференции с международным участием «Информационные технологии и математическое моделирование» (Томск, 2008); XII Региональной конференции по математике «МАК» (Барнаул, 2009); X-XI Международных научно-практических конференциях «Измерение, контроль, информатизация» - ИКИ (Барнаул, 2009-2010); IV Научно-практической конференции «Компьютерная интеграция производства и ИПИ-технологии» (Оренбург, 2009); XXVI Всероссийской научно-технической конференции «Информационные технологии в науке, проектировании и производстве» (Нижний Новгород, 2009); XVII Дистанционной Международной научной конференции «Методы и алгоритмы принятия эффективных решений» (Таганрог, 2009); VII Всероссийской научно-технической конференции «Приоритетные направления развития науки и технологий» (Тула, 2010); VII Всероссийской научно-практической конференции «Технологии Microsoft в теории и практике программирования» (Томск, 2010); Международной научно-практической конференции «Молодежь Сибири - Науке России» (Красноярск, 2010); 5-6 Всероссийских научно-технических конференциях студентов, аспирантов и молодых ученых «Наука и молодежь» (Барнаул, 2009-2010). По материалам диссертационных исследований получен грант по программе «Участник молодежного научно-инновационного конкурса» («У.М.Н.И.К.») для проведения дальнейшей работы по теме «Модули сбора, обработки и архивирования данных в робастных SCADA-системах с элементами CASE-технологий».
Публикации. Основные положения диссертационной работы отражены в 19 опубликованных научных работах, в том числе 3 статьи в журналах из списка ведущих рецензируемых журналов, рекомендованных ВАК Министерства образования и науки РФ, 1 свидетельство Роспатента об официальной регистрации программы для ЭВМ, 4 статьи в научных журналах и сборниках работ конференций, 12 тезисов докладов на конференциях. Общий объем публикаций - 36 авторских листов.
На защиту выносятся:
Имитационная модель, представляющая СРТМ в виде совокупности взаимодействующих СМО и основанная на сочетании объектно-, процессно-событийно- и функционально-ориентированных подходов к описанию поведения системы.
Архитектура и алгоритмы программной системы, реализующей предложенную имитационную модель взаимодействия информационных процессов в СРТМ.
Использование синтаксически-ориентированного метода описания и оценки вычислительной сложности алгоритмов обработки данных, выполняющихся на узлах СРТМ.
4. Результаты проведенных с использованием предложенной модели имитационных экспериментов по исследованию параметров работоспособности СРТМ.
Структура и объем работы.
Современные технологии проектирования и анализ подходов к моделированию функционирования систем распределенного технологического/мониторинга
Системы распределенного- технологического мониторинга являются? перспективным методом автоматизированного управления- сложными? динат мическими системами в жизненно важных и критичных с точки зрения безо- ; пасности и надежности областях: в промышленности, энергетике, на:транспорте, в космической, военной области и т.п.; их эффективность достигается за счет автоматизации в решении: задач сбора; обработки; передачи;, хранения, отображения и анализа информации: Диспетчер многоуровневой; автоматизированной; системы, управления получает информацию о состоянии технологического объекта или процесса и воздействует на. объекты,, находящиеся от него на; значительном расстоянии, с помощью телекоммуникационных систем, контроллеров и исполнительных механизмов. .
Говоря о диспетчерском; управлении,., нельзя не. затронуть проблему технологического риска: технологические процессы в энергетике, нефтегазовой;, транспортной и других отраслях промышленности являются потенциально опасными и при возникновении нештатных ситуаций;приводят к:человеческим жертвам, а также к значительному материальному и экологическому ущербу. За период с 1901 по 2007 год в мире произошло 1,125 индустриальных катастроф. Вї их результате пocтpaдaлo около 4.5 млш человек; примерно 49;000 погибли. Общий ущерб от этого типа техногенных катастроф оценивается в $225 млрд. За тот же период в мире были зафиксированы А, 102 транспортные катастрофы. Они затронули жизни около 110,000 человек. Совокупный прямой ущерб оценивается в $58 млрд.[1]. Примером технологической катастрофы может служить авария космического аппарата Mariner 1, произошедшая из-за сбоя в программном обеспечении, привела к тельному экологическому и материальному ущербу. Напомним, что Mariner 1 направлялся к Венере, но был уничтожен во время аварии на старте 22 июля 1962 года через 293 секунды после старта. Антенна аппарата потеряла связь с наводящей системой на Земле, в результате управление взял на себя бортовой компьютер, программа которого содержала ошибку [2]. Другая катастрофа, произошла 10 июля 1976 года в Италии, на химическом заводе «Икли-за»: произошел взрыв, в результате которого обширная территория была поражена гербицидами: В первые месяцы из-за последствий взрыва погибли 228 человек. Итальянское правительство приняло решение вырубить все деревья и снять верхний слой почвы с площади в 150 га с целью ликвидации последствий этой катастрофы. А 3 декабря 1984 года на химическом заводе в Бхопале (Индия) произошел взрыв, в результате которого в атмосферу было выброшено более 40 тонн токсичных газов — фосгена и метилизоцианата. Погибли более 20 тысяч человек [3].
Применение SCADA-технологий (Supervisory Control And Data Acquisition - диспетчерское управление и сбор данных) позволяет достичь высокого уровня автоматизации, в решении задач разработки СРТМ и позволяет организовать сбор информации с первичных измерительных преобразователей (датчиков) и интеллектуальных программируемых устройств (контроллеров и микроконтроллеров); мониторинг технологического процесса; анализ полученных данных и принятие решений о возникновении нештатных или критических ситуаций; документирование и архивирование данных; удаленное управление объектами и реализацию систем поддержки принятия решений. Современные СРТМ предлагают инструментальные средства,, обеспечивающие наглядный графический интерфейс, представляющий объекты контроля максимально приближенных к реальному виду за счет средств визуализации и разных видов статистических отчетов.
Важнейшей функцией СРТМ является обеспечение тревожной сигнализации о нештатных ситуациях (НС) на управляемом объекте с обязательной фиксацией наступления НС в журнале событий, для чего возможно различное определение условий наступления тревожных ситуаций: выход параметра за технологические границы или его резкое изменение, потеря связи с первичным преобразователем и др. Немаловажное значение имеет возможность классификации тревожных сигналов, а также управление оповещением об их наступлении оператора системы (звуковыми сигналами, отправкой sms-сообщений и т.д.). На основе анализа большого числа существующих СРТМ можно выделить обобщенную схему их реализации, представленную на рисунке Г. Г. . Обобщенная схема GPTM Как правило, при проектировании GPTM сбора и обработки данных можно выделить три уровня их архитектуры:
Нижний уровень включает различные первичные преобразователи и датчики (давления, температуры, напряжения, расходомеры и т.д.) для сбора информации. Датчики поставляют информацию на следующий уровень архитектуры. Обработка данных на устройствах нижнего уровня не производится. Средний уровень включает интеллектуальными устройства. — микроконтроллеры и программируемые логические контроллеры (PLC — Programming Logical Controller), которые выполняют сбор и обработку информации с датчиков и осуществляют управление исполнительными механизмами. Обработка информации на устройствах этого уровня предполагает сбор данных с датчиков нижнего уровня архитектуры, поддержание единого времени в системе, синхронизацию работы подсистем, фильтрацию и архивацию данных, обмен информацией между уровнями системы, проверку полученных данных на достоверность или вероятность возникновения НС.
Промышленные контроллеры (PLC) представляют собой специализированные вычислительные устройства, предназначенные для управления процессами в реальном времени, имеют вычислительное ядро (процессор, оперативную память) и модули ввода-вывода, принимающие информацию с датчиков и осуществляющие управление технологическим процессом или объектом путем выдачи управляющих сигналов на исполнительные устройства. Современные PLC часто объединяются в сеть (RS-485, Ethernet, различные типы индустриальных шин), а программные средства, разрабатываемые для них, позволяют программировать и конфигурировать их через компьютер, находящийся на верхнем уровне архитектуры.
Исследование рынка PLC показало, что отдать предпочтение контроллерам того или иного производителя нельзя — все зависит от архитектуры, задач и ограничений проектируемой СРТМ [4-7]. По итогам 2009 года рейтинг фирм имеющих наибольший объем продаж микроконтроллеров возглавляют корпорации Siemens, ABB, Emerson Process Management, Rockwell Automation, Mitsubishi Electric, Omron.
Инфраструктура подсистемы управления потоками заявок в имитационной модели
Вершинам графа G соответствуют узлы СРТМ (первичные преобразователи, контроллеры, технологические компьютеры и т.д.), а ребрам — каналы связи между ними. Пусть N - множество вершин графа, Е — множество его ребер. Вершины- п, графа содержат описания характеристик узлов- СРТМ, а ребра е{ имеют вес - пропускную способность канала.
Назовем процессом численное отражение последовательного изменения в течение времени состояния некоторого параметра в.системе, например, при температурном контроле каждому датчику температуры соответствует свой процесс. Данные процесса могут быть получены от измерительных устройств, либо вычислены по заданным алгоритмам, поэтому с процессом свя-заны функции обработки данных.
Обработкой данных будем называть фильтрацию данных для выделения полезного сигнала; ведение архивов; анализ полученных или вычисленных данных (проверку на достоверность, на- возникновение критических или нештатных ситуаций); использование алгоритмов обработки данных и- вызов. функций, для вычисления некоторых параметров на основе полученных данных. Анализ существующих информационно-измерительных систем [35-47] и практический опыт в разработке систем распределенного технологического мониторинга [54-55] позволил выделить процессы следующих типов: Тип 1: процессы, генерирующие данные. При помощи таких процессов имитируются датчики, измеряющие некоторый параметр. Тип 2: Процессы, получающие данные от других процессов. Таким способом будем моделировать процессы, функционирующие на технологических компьютерах и контроллерах (PLC) и получающие данные с датчиковч или других PLC через каналы связи. Тип 3: Процессы, вычисляющие и/или анализирующие полученные данные по заданным алгоритмам и, возможно, в зависимости от результатов (обработки, генерирующие некоторые сообщения. При-помощи таких процессов будем имитировать, работу контроллеров и технологических компьютеров; где помимо сбора данных осуществляется также их обработка. На каждом узле nt СРТМЗ могут одновременно функционировать, несколько процессов сбора и обработки данных, что приводит к необходимости хранения в вершинах графа G списка этих процессов и позволяет говорить о процессно-ориентированном подходе к описанию системы. Множество процессов, выполняющихся на узле п1} обозначим Рп,. Так как события, происходящие в СРТМ, могут носить случайный характер, то для их исследования применим математический аппарат теории массового обслуживания. Для моделирования выполнения процессов обработки данных на узле щ графа G, предложено использовать систему массового обслуживания (СМО) типа питРп- питО ! FIFO где numFni " ко личество процессов обработки данных, выполняющихся на узле щ; питО— количество типов обрабатываемых событий, а в качестве заявок выступают события о, є О. [11, 56-57]. Под событием о є О будем понимать изменение состояния СРТМ или некоторого ее компонента. Множество событий запишем в виде (2.3): О = {о о І = ТуреО, StatusO, PlaceO, Scheduler, ProcessedT, DataO }, (2.3) где ТуреО - тип события (например: отправка или получение запроса на данные, отправка или получение данных, остановка работы узла и т.п.); параметр определяет приоритет обработки события, StatusO — статус события (обработано оно или нет), PlaceO — источник возникновения события (процесс и устройство или канал, на котором произошло событие): Scheduler — запланированное-время для обработки (некоторый момент модельного времени по расписанию); RealT - реальное временя обработки (тот момент модельного времени, когда диспетчер закончил обработку события с учетом»задержек); DataO - связанные с произошедшим событием данные (запрос или результат выполнения запроса). События могут инициализироваться как физическими объектами — каналами, датчиками, контроллерами, так и программно — например, в результате работы программы обработки данных обнаружена нештатная ситуация [58]. Под нештатной ситуацией.(НС) будем понимать ситуацию, при которой.значение параметра не принадлежит множеству допустимых значений; что требует при обработке значения дополнительных действий со стороны системы и/или оператора. НС в производственно-технологических системах может привести к аварии или существенному снижению производительности, и поэтому должна являться объектом пристального изучения. Для фиксирования HG либо задаются некоторые пороговые значения, при- выходе контролируемого параметра за которые регистрируетсяшаступление нештатной ситуации, либо используются специальные функции для нестандартной обработки данных и прогнозирования НС [59]. Для каждого компонента СРТМ в имитационной модели определен список типов событий ог, которые могут им инициироваться и обрабатываться, что позволяет говорить об использовании событийного подхода к описанию предметной области [60]. Закон распределения времени поступления заявок определяется для каждого типа событий в начале процесса моделирования. На время обработки заявки влияет ее тип ТуреО и характеристики устройства РІасеО, на котором она выполняется, что позволяет учитывать разную вычислительную сложность используемых алгоритмов обработки данных и время их выполнения на устройствах, обладающих разным быстродействием. Обслуживающшгприбор в каждой1 ЄМО единственный. Будем называть его диспетчером. Очередью назовем список событий, обеспечивающих работу диспетчера. Количество мест в очереди задается перед началом экспериментов; для некоторых узлов СРТМ в модели может использоваться неограниченная очередь. Дисциплина обслуживания строится по принципу FIFO [11, 56] со следующими дополнениями. Постановка событий в очередь происходит в зависимости от типа события ТуреО и привилегий устройства: более приоритетное событие может быть поставлено не в конец очереди, а в ее начало; событие может инициироваться в заданный момент модельного времени или через некоторый промежуток времени от момента возникновения другого события. Выборка события на обслуживание происходит только из головы очереди. Это позволяется событиям типа «Нештатная ситуация» обслуживаться первыми, что соответствует положению дел в реальной СРТМ. Каждый процесс р І є Рщ характеризуется типом ТуреР, законом распределения времени поступления заявок A(t) и методом сбора или обработки данных, который реализован в виде функции /7 є F. Функция f} может записываться в виде суперпозиции функций множества F. Обработка данных в модели организована таким образом, что процесс pj может получать данные от процессов {ph,—Pm} и только после этого вычислять значение параметра, соответствующего процессу.
Исследование поведения программной системы при планировании и обработке нештатных ситуаций моделируемой СРТМ
Поле f_time_scale предназначено, для управления скоростью процесса моделирования, и показывает, сколько раз в одну секунду реального времени происходит вызов функции выбора события из очереди для его последующей обработки.
UojiQfJs_modeling_started показывает, начат ли процесс моделирования. 1. Предложена имитационная модель взаимодействия информационных процессов.в СРТМ, основанная на принципах теории массового обслуживания и позволяющая учесть топологию СРТМ, характеристики оборудования и алгоритмы обработки данных, выполняющиеся на ее узлах. 2. Разработана архитектура программной системы, реализующей предложенную имитационную модель. Для каждого компонента СРТМ в модели и в реализующей ее программной системе определен список типов событий, которые могут им инициализироваться и обрабатываться. Выделены события, связанные с обменом и обработкой данных, и события, связанные с моделированием НС. 3. Предложено использовать для оценки временных характеристик выполняемых на узлах СРТМ алгоритмов обработки данных синтаксически-ориентированный метод их описания. 4. Реализовано моделирование физического уровня обмена данными путем вычисления задержек, возникающих при передаче и обработке данных. 5. Для предложенной имитационной модели предложен алгоритм перехода от реальных значений характеристик устройств к их модельному представлению. 6. Предложены алгоритмы и программная реализация имитационной модели: определены алгоритмы работы ядра программной системы, отвечающего за ход процесса моделирования, управление им и за взаимодействие с пользователем и спроектирована структура базы данных для хранения данных о модели СРТМ и результатов имитационных экспериментов. Имитационная модель взаимодействия информационных процессов в системах распределенного технологического мониторинга, описанная формулами (2.1) — (2.10), КС-грамматикой L и множеством функций F, реализована в виде программного комплекса [75]. Построенная программная система позволят задавать топологию СРТМ; описывать процессы обработки данных, функционирующие на ее узлах; проводить имитационные эксперименты над построенной моделью СРТМ; собирать и анализировать статистическую информацию, характеризующую производительность и работоспособность проектируемой системы. Приложение реализовано на языке программирования С#, с использованием стандартных классов платформы .NET и библиотеки для построения графиков ZedGraph.dll в среде разработки Microsoft Visual Studio 2008; в качестве СУБД выбрана Microsoft SQL Server 2005 [76-78]. Перед использованием построенной программной1 системы для проектирования и анализа функционирования СРТМ, необходимо исследовать предложенную имитационную модель и поведение среды моделирования в различных ситуациях. Программная система реализована в виде совокупности взаимодействующих СМО диспетчеров узлов и главного диспетчера [79]. Будем исследовать поведение модели СРТМ в зависимости от количества мест в очередях диспетчеров узлов разного уровня архитектуры — то есть, в зависимости от того, являются ли системы массового обслуживания, реализующие механизм управления потоками заявок, системами с отказами или системами с ожиданием. Исследование проводилось на примере моделей СРТМ, обладающих различной структурой с точки зрения состава и характеристик оборудования, а также количества и параметров линий связи между узлами разных уровней архитектуры (рис. 3.1). ТК Исследовать работоспособность программной системы, реализующей модель, в зависимости от способа организации подсистемы управления потоками заявок каждого узла, в частности от количества мест в очереди СМО, реализующей эту систему, невозможно. Если варьировать только количество мест в очереди: выбирать СМО с отказами или с ожиданием, то для модели СРТМ из трех узлов, существует 8 вариантов сочетания количества мест в очередях СМО, а для модели СРТМ из пяти узлов - уже 32 варианта. Поэтому исследуем поведение модели в зависимости от параметров конфигурации подсистемы управления потоками заявок узлов разных уровней архитектуры. Коэффициент загрузки узла рассчитывается как отношение суммарного времени, в течение которого узел был занят, к общему времени процесса моделирования; вычисляется для каждого узла СРТМ: Поведение этого показателя при реализации системы управления потоками заявок узлов разных уровней архитектуры СРТМ как СМО с отказами или с ожиданием исследовалось на примере СРТМ, модели которых схематично изображены на рисунке 3.1. Общая динамика изменения среднего коэффициента загрузки приведена на диаграмме:
Влияние порядка сложности алгоритмов обработки данных на характеристики системы распределенного технологического мониторинга
При проектировании и построении систем распределенного технологического мониторинга важно обеспечить их продолжительное бесперебойное функционирование, то есть гарантировать надежность и отказоустойчивость. Надежность - это работа системы без сбоевшри заданных условиях в течение определенного времени, что включает бесперебойную работу аппаратных средств и программного обеспечения для сбора, обработки и анализа данных. Примерами средств повышения надежности являются снижение интенсивности отказов за счет использования более совершенного оборудования, облегчение режимов работы (например; снижение частоты запросов, упрощение алгоритмов обработки данных) и т.д. Единицей измерения надежности является среднее время безотказной работы (среднее время наработки на отказ MTTF — Mean Time То Failure) [88]. Отказоустойчивость — это способность системы продолжать заданные действия при возникновении неисправностей. Повышение отказоустойчивости может достигаться избыточностью аппаратного и программного обеспечения, для чего используют системы, структура которых приспособлена к реконфигурации и обеспечивает возможность продолжения работы после возникновения НС [89-91].
В построенной программной системе предусмотрено моделирование функционирования модели СРТМ при возникновении нештатных ситуаций в работе узлов или каналов связи (раздел 3.3), а также при отказах событиям системы в обслуживании диспетчерами узлов (раздел 3.1). НС на устройствах и каналах связи моделируют аппаратные сбои - разрыв канала связи, выход из строя или выключение питания устройства и т.д. и обрабатываются диспетчером узла или главным диспетчером. Программные сбои имитируются выбором для реализации диспетчера узла СМО с отказами. Для исследования поведения моделшСРТМ при программных сбоях, то есть, для исследования динамики отказов от обслуживания событиям в зависимости от числа мест в4 очередях диспетчеров узлов, рассмотрены модели СРТМ с различной топологией, примеры которых приведены на рисунке 3.1.
В СРТМ с топологией «звезда» на уровне PLC (рис. 3.1, А), наибольшая) нагрузка по обработке и обмену данными ложится на контроллер, что делает необходимым задания числа мест в его очереди большим, чем для ТК. Зависимость» интенсивности отказов от времени при числе мест в очереди контроллера 200, в очереди ТК - 2 приведена на «рисунке 4.7. При количестве мест в очереди, равному 10% от количества всех обработанных диспетчером узла событий, большое число событий (до 446) поступает на обслуживание в моменты времени, когда контроллер занят, и покидает систему без обслуживания, что инициирует программные сбои; тогда как ТК даже при малом количестве мест в очереди справляется с нагрузкой (число отказов не превышает 1 при1 двух местах в очереди). Таким образом, на основе имитационных экспериментов можно сделать вывод, что СРТМ описанной топологии является ненадежной (MTTF=24 усл. мод. ед., что составляет 16% от времени моделирования) и не может использоваться для реализации приложений, критичных к реакции в реальном времени, потерям данных и т.д.
Зависимость интенсивности отказов от времени для СРТМ с топологией «звезда» на уровне PLC. СРТМ с топологией «звезда» на уровне ТК (рис. 3.1,В) обладает лучшей характеристикой MTTF = 50 усл. мод. ед. (33% от времени моделирования) для узлов уровня ТК; узлы уровня контроллеров работают без отказов (рис.4.8). При переполнении очереди число отказов растет быстрее, чем для предыдущей системы, но время безотказной работы выше, что позволяет Для повышения надежности обработки информации часто используются кластерные системы, в основе которых лежит избыточное количество узлов. При возникновении НС отдельные узлы кластера могут быть заменены безостановки работы всей системы, что гарантированно обеспечивает сбор и обработку данных даже при высокой нагрузке. Кластерная конфигурация применяется для резервирования данных и совместного использования ресурсов с целью минимизации потерь при программно-аппаратных сбоях [92-93]. Программное обеспечение кластера сглаживает последствия НС (например, используется для восстановления данных); предоставляет средства для мониторинга данных на уровне узлов системы; обеспечивает контроль наді прохождением задач. В случае выхода из строя устройств или каналов связи доступность данных должны обеспечивать избыточные соединения как между устройствами разных уровней для дублирования связи, так и между устройствами одного уровня для передачи сигналов о состоянии устройств. Ка-тастрофоустойчивые решения создаются на основе разнесения узлов системы на сотни километров и обеспечения механизмов глобальной синхронизации данных между такими узлами [94]. Например, в системах фирмы Hewlett-Packard, в зависимости от нужного уровня отказоустойчивости, серверные узлы кластера могут размещаться централизованно (локальный кластер); по соседним-зданиям (кампусный кластер); по нескольким территориям в пределах города (метро кластер); в разных городах, странах или континентах (континентальный кластер) [95].
Имитационные эксперименты над моделями СРТМ с дублированием узлов разных уровней (рис.3.1 Б, Д) показали, что надежность системы при такой организации процессов сбора и обработки информации достаточно высока (MTTF=75-100 усл. мод. ед., что составляет 50%-80% от времени моделирования) (рис.4.9).
Зависимость интенсивности отказов от времени для СРТМ с дублированием маршрутов передачи данных Описанные топологии используются при организации системы, в которой узлы дублируются вместе с полным набором выполняющихся на них процессов сбора и обработки данных - на разных узлах могут выполняться одни и те же алгоритмы обработки данных, вестись архивы отсчетов датчиков и т. д., при этом можно ремонтировать отказавший компонент, не прерывая работу СРТМ в целом. Например, при НС на контроллере PLC] системы 3.1, Д сбор данных с датчика 1 и их последующую обработку будет выполнять контроллер РЬСг, что позволит сохранить безотказную работу и заменить вышедший из строя узел. Дублирование как на уровне контроллеров, так и на уровне компьютеров позволяет реализовать алгоритм обработки данных даже при одновременном происхождении НС на контроллере и на ТК. Кроме того, СРТМ с дублированием устройств могут быть дополнены горизонтальными связями для синхронизации данных, передачи информации и проверки состояния устройств. Сама по себе избыточность в случае дублирования снижает надежность, увеличивая вероятность выхода из строя оборудования и усложняя алгоритмы передачи и обработки данных, но обеспечивает возможность «горячего» ремонта и замены отказавших модулей.
Для выявления НС могут использоваться методы самоконтроля, эталонного сравнения и другие [96-98]. Средства самоконтроля предполагают, что при выполнении некоторой операции модуль делает дополнительную работу, позволяющую подтвердить правильность полученного состояния (например, использует метод контрольной суммы при передаче данных), что требует разработки дополнительных алгоритмов. Метод сравнения предполагает выполнение одной и той же операции двумя или большим числом модулей, сопоставление результатов и приостановку работы при обнаружении несовпадения результатов; реализация этого метода не сложна и уменьшает времени разработки, но требует увеличения затрат на оборудование.