Содержание к диссертации
Введение
1 Проблемы обеспечения информационно технологического контроля и диагностирования распределенных систем железнодорожной автоматизации 8
1.1 Алгоритмические особенности контроля технологических процессов и аппаратно-программных средств распределенных систем железнодорожной автоматизации 8
1.2 Анализ информационных потоков и трафиков в распределенных интегрированных системах диспетчерского управления 22
1.3 Современное состояние проблемы обнаружения аномалий, обоснование подхода и постановка задач 35
1.4 Выводы 45
2 Разработка методов информационно технологического контроля систем железнодорожной автоматизации на основе интеллектуальных иммуннологических технологий 47
2.1 Иммунологический подход к выявлению аномалий в трафиках и общая архитектура информационно-диагностической системы 47
2.2 Разработка динамических моделей темпоральных паттернов для иммунологического алгоритма распознавания аномалий 59
2.3 Иммунологический метод выявления аномалий в трафике на основе фазовой модели временного ряда 65
2.4 Упреждающее онлайн-распознавание темпоральных паттернов в сетевых трафиках 72
2.5 Выводы 82
3 Интеллектуальные модели идентификации сетевых трафиков и прогнозирование аномальных процессов в системах железнодорожной автоматизации 84
3.1 Метод интеллектуальной идентификации информационных потоков по временным рядам в автоматизированных системах управления железнодорожным транспортом 87
3.1.1 Предварительный анализ свойств информаъ ионного потока 87
3.1.2 Метод и алгоритм идентификации трафика по временным рядам 90
3.2 Прогнозирование динамики функционирования информационно управляющих систем железнодорожного транспорта на основе
нелинейного анализа телекоммуникационного трафика
3.2.1 Особенности информационного обмена в автоматизированных системах управления железнодорожным транспортом 99
3.2.2 Этапы предлагаемого метода и сбор исходных данных 104
3.2.3 Оценка возможности применения методов нелинейного анализа и прогноза 107
3.2.4 Реконструкция фазового пространства по одномерным временным рядам с вычислением временного лага и размерности вложения 108
3.2.5 Алгоритм локального прогнозирования на основе метода реконструкции фазового пространства 111
3.3 Выводы 111
4 Алгоритмы и программное обеспечение для обнаружения аномалий в сетевых трафиках систем железнодорожной автоматизации 113
4.1 Экспериментальное исследование характеристик телекоммуникационного трафика в подсистемах АСУЖТ 113
4.2 Обработка временных рядов телетрафика численными методами восстановления динамики системы 116
4.3 Определение аномалий в телекоммуникационном трафике средствами нелинейной динамики 129
4.4 Реализация предложенных алгоритмов в виде программ 132
4.5 Выводы 136
Заключение 137
Литература
- Анализ информационных потоков и трафиков в распределенных интегрированных системах диспетчерского управления
- Разработка динамических моделей темпоральных паттернов для иммунологического алгоритма распознавания аномалий
- Метод и алгоритм идентификации трафика по временным рядам
- Обработка временных рядов телетрафика численными методами восстановления динамики системы
Введение к работе
Актуальность. Проблемы повышения уровня контролепригодности и диагностируемости современных систем железнодорожной автоматики и автоматизации в настоящее время затрагивают не только традиционные аспекты диагностирования программно-аппаратных средств, но и распространяются на область информационно-технологического контроля и диагностирования. Особо остро они стоят перед разработчиками интегрированных систем железнодорожной автоматизации (ИСЖА), основанных на компьютерных сетях, обладающих сложной разветвленной архитектурой. Кроме ИСЖА управление технологическими процессами осуществляют различные подсистемы, входящие в интегрированный комплекс автоматизированных систем управления на железнодорожном транспорте (АСУЖТ).
Для обеспечения требуемого уровня надежности функционирования ИСЖА и повышения достоверности их контроля в настоящее время активно разрабатываются новые подходы, базирующиеся на современных информационно-диагностических технологиях. В этом плане перспективными представляются интеллектуальные технологии, основанные на использовании в контрольно-диагностических системах нескольких типов математических моделей, оперирующих различными признаковыми пространствами и использующих различные механизмы выработки решений. В качестве эффективных моделей поддержки процессов контроля и диагностирования ИСЖА могут использоваться математические модели, основанные на анализе сетевых трафиков, описывающих процессы информационного взаимодействия между отдельными сетевыми элементами системы с привлечением статистической и экспертной информации о характере их поведения в различных режимах функционирования системы. Основная идея заключается в том, что поскольку большинство технологических, аппаратных и программных сбоев в конечном итоге приводят к информационным сбоям, то есть к искажениям сетевого трафика, то появляется возможность использовать характеристики трафика в качестве информационных диагностических признаков в подсистемах информационно-технологического контроля ИСЖА.
Для целей выявления отклонений в трафиках информационных потоков от нормальных режимов можно использовать активно разрабатываемые в современной теории принятия решений и искусственного интеллекта методы распознавания аномальных событий и процессов. В этом плане представляются перспективными методы идентификации аномалий в моделях временных рядов, разрабатываемые в рамках теории нелинейных динамических систем и интеллектуальных технологий теории искусственных иммунных систем. Искусственные иммунные системы, обладая рядом замечательных свойств, заимствованных у биологических аналогов, открывают новые возможности диагностирования программных, информационных, технологических и иных типов отказов при неполной априорной информации о возможном характере отказов или даже ее полном отсутствии, что недоступно традиционным методам диагностирования.
Актуальность тематики подтверждается тем фактом, что работа поддержана грантами РФФИ: 11-07-13110-офи-м-2011-РЖД «Методы, модели и алгоритмы оценки качества функционирования и синтеза надежного программного обеспечения информационно-управляющих систем на железнодорожном транспорте» (2011–2012 гг.); 12-08-00798 «Математическое и программное обеспечение интеллектуальной обработки неполных и слабоструктурированных данных в информационно-управляющих системах с повышенными требованиями к надежности и качеству функционирования» (2012–2014 гг.).
Целью диссертации является разработка новых методов информационно-технологического контроля и диагностирования распределенных ИСЖА на основе интеллектуальных моделей анализа и обработки трафиков информационных потоков.
Предметом исследования являются распределенные технологические процессы на железнодорожном транспорте и распределенные ИСЖА.
Объектом исследования являются интеллектуальные и стохастические модели представления, анализа и обработки трафиков информационных потоков в системах железнодорожной автоматизации.
Задачами исследования являются:
1 Анализ особенностей работы распределенных ИСЖА и протекающих в них информационных процессов с целью выявления факторов, нарушающих устойчивое функционирование систем, и разработки нового подхода к диагностированию ИСЖА на основе анализа телекоммуникационных трафиков.
2 Разработка нового подхода к информационно-технологическому диагностированию компьютерных систем на основе анализа сетевых трафиков с использованием современных интеллектуальных технологий и методов нелинейной динамики.
3 Разработка моделей и методов выявления аномальных паттернов в представляющих трафик моделях временных рядов с целью их использования в подсистемах информационно-технологического контроля ИСЖА.
4 Разработка методов и алгоритмов статистического исследования моделей трафиков с целью выявления диагностических признаков для подсистем информационно-технологического контроля ИСЖА.
5 Разработка алгоритмов анализа телекоммуникационных трафиков и их программная реализация в системе Mathworks Matlab R2011a.
Степень разработанности проблемы.
Вопросы автоматизации сложных технологических процессов на транспорте рассматривались в трудах Ю.И. Жаркова, В.Н. Иванченко, Ю.И. Кравцова, В.М. Лисенкова, В.В. и В.Вл. Сапожниковых, Д.В. Шалягина и др.
Новые концепции диагностики и мониторинга распределенных объектов контроля и диагностики разработаны в трудах И.Д. Долгого, П.П. Пархоменко, Д.А. Поспелова, В.В. Сапожникова, Вл.В. Сапожникова, И.Б. Шубинского и др.
Технологии искусственного интеллекта в исследуемой области разрабатывались Л.С. Берштейном, М.А. Бутаковой, А.Н. Гудой, С.М. Ковалевым, Э.А. Мамаевым, С.В. Соколовым, А.О. Таракановым, А.Н. Шабельниковым,
Методы исследования основываются на элементах теории искусственного интеллекта, принятия решений и стохастического анализа.
Объект исследования находятся в рамках паспорта специальности 05.13.06 «Автоматизация и управление технологическими процессами и производствами (на транспорте)», а именно пунктов: «12. Методы контроля, обеспечения достоверности, защиты и резервирования информационного и программного обеспечения АСУТП, АСУП, АСТПП и др. 13. Теоретические основы и прикладные методы анализа и повышения эффективности, надежности и живучести АСУ на этапах их разработки, внедрения и эксплуатации. 15. Теоретические основы, методы и алгоритмы интеллектуализации решения прикладных задач при построении АСУ широкого назначения».
Достоверность и обоснованность результатов диссертации подтверждаются обоснованностью и корректностью постановок задач, имитационным моделированием и публикациями в реферируемых журналах.
Научная новизна диссертации заключается в следующем:
1 На основе комплексного исследования особенностей информационных потоков и информационного обмена в сетевых подсистемах ИСЖА установлена тесная связь между фактами проявления информационно-технологических сбоев в работе системы и вызванными ими изменениями в сетевых трафиках, что позволило предложить новый подход к информационно-технологическому контролю ИСЖА на основе выявления аномалий во временных рядах.
2 Предложен новый подход к выявлению аномалий во временных рядах на основе использования интеллектуальной технологии искусственных иммунных систем, позволяющий в отличие от известных подходов обнаруживать аномалии при отсутствии априорной информации об их характере, что обеспечивает возможность информационно-технологического контроля распределенных ИСЖА в условиях неполноты исходной информации.
3 Разработаны новые модели представления темпоральных паттернов для различных типов трафиков, позволяющие выявлять аномалии во временном ряду с учетом априорных экспертных знаний о характере представляемого им трафика.
4 Разработан новый метод online-детектирования аномальных паттернов в потоковых данных на основе их точечного представления с целью обнаружения информационных сбоев на ранних стадиях их проявления в контролируемом потоке данных.
5 Предложены нелинейно-динамическая модель и разработанный на ее основе комбинированный метод локального прогнозирования временного ряда, обладающий повышенной достоверностью предсказания аномалий на малых интервалах развития сетевого трафика.
Практическая значимость результатов диссертации состоит в разработке программно-математического и алгоритмического обеспечения для подсистемы информационно-технологического контроля информационно-вычислительного центра Северо-Кавказской железной дороги на основе интеллектуальных моделей анализа сетевых трафиков. К практическим результатам исследования относятся:
– общая структура и программно-математическое обеспечение подсистемы сбора характеристик информационных потоков, циркулирующих между подсистемами и региональными узлами информационно-вычислительного центра Северо-Кавказской железной дороги;
– общая структура и алгоритмы функционирования подсистемы обеспечения надежности и информационно-технологической безопасности распределенной информационно-вычислительной сети центра Северо-Кавказской железной дороги.
Апробация и внедрение результатов исследования. Теоретические и практические результаты работы прошли апробацию и докладывались на семинарах кафедр «Автоматика и телемеханика на железнодорожном транспорте» и «Информатика» РГУПС, на международных научно-практических конференциях «Интеллектуальные системы на транспорте» (Санкт-Петербург, 2011 г.), международном конгрессе по интеллектуальным системам и информационным технологиям «AIS-IT» (Дивноморское, 2010 г.), Российской выставке научно-технического творчества молодежи (Москва, НТТМ, 2010 г.), отраслевых выставках ОАО «РЖД» и ОАО «НИИАС» (Москва, Санкт-Петербург), Молодежной научно-технической конференции «Интеллектуальные системы – 2010» («ИС-2010») в рамках Конгресса по интеллектуальным системам и информационным технологиям «AIS-IT'10» (Дивноморское, 2010 г.), Молодежной научно-технической конференции «Интеллектуальные системы – 2011» («ИС-2011») в рамках Конгресса по интеллектуальным системам и информационным технологиям «AIS-IT'11» (Дивноморское, 2011 г.), на 1-м Международном симпозиуме «Гибридные и синергетические интеллектуальные системы: теория и практика» (Калининград, 2012 г.), «Интегрированные модели и мягкие вычисления в искусственном интеллекте» (Коломна, 2013 г.).
Структура и объем работы. Диссертационное исследование последовательно раскрывает цель и задачи исследования и состоит из введения, четырех глав, заключения, списка использованных источников, включающего 118 наименований, и приложения. Общий объем диссертации составляет 137 страниц основного текста.
Анализ информационных потоков и трафиков в распределенных интегрированных системах диспетчерского управления
В предыдущем параграфе был выявлен детерминированный характер потоков информации, генерируемых в распределенных сетях ИСЖА, что обусловливает возможность контролирования технологических процессов и диагностирования аппаратно-программных средств ИСЖА на основе анализа информационных трафиков. Для реализации этого подхода необходимо более детальное исследование свойств информационных потоков, циркулирующих в компьютерных сетях ИСЖА. В настоящем параграфе исследуются свойства информационных процессов, протекающих в ИСЖА, на примере распределенной компьютерной сети ИСДУ [51].
Информационные потоки, генерируемые в ИСДУ, связаны с процессами движения поездов на перегонах и станциях. При этом интенсивность информационного потока зависит от нескольких факторов. В частности, при движении поезда по станции информационный поток интенсивнее, чем при движении по перегону, за счет меньшей длины стрелочно-путевых секций. С другой стороны, объем передаваемой информации зависит от путевого развития конкретной станции, длины и скорости движения подвижных единиц. Максимальный информационный поток возникает при задании маршрута.
Сообщения о результатах контроля подвижного состава представляют собой массив данных, которые имеют определенную структуру. Математически такого рода структуры данных могут быть представлены с использованием формализованных языков, и в частности с использованием языка темпоральной логики, используемого для моделирования подобных систем в [34]. Используя одно темпоральное отношение следования г/ между точечными событиями, можно описать все допустимые и недопустимые последовательности сообщений [27]: {Time rl Noun), (Noun rl Noun), (Noun rl Carriage), (Carriage rl Noun), (Carriage rl Train), (Train rl Time). Недопустимые последовательности сообщений описываются соотношениями: (Time rl Time), (Time rl Carriage), (Time rl Train), (Noun rl Time), (Noun rl Train), (Carriage rl Time) (Carriage rl Carriage), (Train rl Noun), (Train rl Carriage), (Train rl Train). Все допустимые варианты последовательностей сообщений в массиве данных о результатах контроля поезда описываются порождающим графом G.
Граф G, являясь порождающей моделью сообщений в ИСЛУ, одновременно является моделью порождения информационных потоков данных и соответствующих им трафиков. Характеристики информационного трафика могут выступать в качестве информационных признаков диагностической модели. Это обусловлено следующими соображениями [51, 29]. Подавляющее число изменений в состояниях контролируемых объектов системой обусловлено технологическим процессом движения поезда на участке и имеет детерминированный характер с точностью до незначительных флуктуации, вызванных естественными стохастическими процессами. Поэтому общий объем информационного потока (трафика) между отдельными модулями системы зависит, главным образом, от путевого развития конкретной станции, длины и скорости движения поезда. При этом можно с высокой долей вероятности прогнозировать увеличение интенсивности трафика в момент задания маршрута, его спад в момент замыкания маршрута, а также наблюдать ряд характерных шейповых представлений для тренда трафика в процессе перемещения подвижных единиц.
Для выявления конкретных шейпов информационного трафика необходимо провести качественный и количественный анализ информационной модели соответствующего технологического процесса.
Рассмотрим расчет основных темпоральных параметров информационных процессов, необходимых для построения обобщенных шейпов информационного трафика.
Информационная схема передачи сигналов в ДЦ ЮГ с РКП В общем виде информационный процесс можно представить совокупностью следующих операций: сбор и преобразование информации; передача информации; обработка; представление пользователю. Типовая структурная схема организации информационного процесса приведена на рис. 1.7 на примере распределенной системы ДЦ-ЮГ с РКП [12].
Перемещение поезда приводит к изменению в состоянии устройств электрической централизации, которые обнаруживаются блоком ввода сигналов телесигнализации (РКП-ТС) и передаются в блок управления распределенным контролируемым пунктом в форме соответствующих сообщений. Эти сообщения имеют определенную структуру и временные характеристики, которые являются детерминированными для данного типа системы и могут быть определены на основе анализа формализованной схемы информационного процесса [29]. Рассмотрим применение этой схемы при расчете основных темпоральных параметров информационных процессов, необходимых для построения обобщенных шейпов информационного трафика [51].
Так как при вводе данных и передаче в блок РКП-Ц информации о сигналах телесигнализации отсутствуют конфликты из-за ресурсов, используемых при реализации процесса, то для оценки временных характеристик воспользуемся формализованной логической схемой информационного процесса. При передаче сообщений между распределенными блоками РКП-Ц и РКП-ТС на каналы связи воздействуют помехи, которые могут привести к искажению информации. Искажение данных не детерминировано и определяется вероятностными характеристиками.
Разработка динамических моделей темпоральных паттернов для иммунологического алгоритма распознавания аномалий
Как было отмечено, иммунологический подход к распознаванию аномалий во ВР основан на сравнении контролируемого потока данных с эталонными образами ВР, характеризующими нормальное или аномальное течение технологического процесса. Поэтому выбор модели представления для ВР существенно влияет на эффективность разрабатываемого подхода.
Телекоммуникационный трафик в распределенной ИСЖА носит детер-минированно-стохастический характер и порождается цепочками технологических событий, свершающихся на ОА. Одним из способов «быстрого» воспроизведения телетрафика является использование аналитической модели сети, например, в виде модели массового обслуживания. Однако аналитические модели имеют два серьезных недостатка. Во-первых, они работают с относительно небольшим числом простейших потоков данных типа пуассо-новского либо с потоками типа Пальма и Эрланга, обладающих краткосрочной памятью,не позволяющей описывать долговременные зависимости в сообщениях, имеющие место в реальных сетях. Во-вторых, стандартные модели потоков не способны отразить специфический характер трафика отдельных абонентов сети и временные зависимости в данных, которые, как было ранее установлено, носят детерминированный характер. Активно разрабатываемые в настоящее время методы программного моделирования [41] способны воспроизводить общие закономерности самоподобных процессов, однако не приспособлены для воспроизведения нюансов конкретных зависимостей в сообщениях, имеющих место в реальных системах. Для учета таких особенностей необходимо привлекать дополнительную информацию, в качестве которой могут выступать априорные технологические знания о закономерностях в данных, полученные от экспертов или сформированные на основе методов обучения.
В настоящем параграфе разрабатывается метод формирования моделей телекоммуникационных трафиков с использованием технологии нечетко-логического моделирования, позволяющий получать компактные описания трафиков с учетом априорной экспертной информации о его характере [56].
Сопоставим реализации трафика временной ряд5 = (s(tl)/i = 1, 2,...), элементы которого принимают значения из числового множества X и характеризуют интенсивность телетрафика в /-е моменты времени г. Математическую модель временного процесса 5" можно представить в виде нелинейной авторегрессионной модели: S{t) = F(s(t - l),....s(f - к) + e(t\ (2.5) где F - неизвестная функция, E(t) - ошибка предсказания, к - порядок модели. Авторегрессионная модель (2.5) способна отражать кратковременные зависимости между значениями временного ряда S. Для учета долгосрочных зависимостей модель (2.5) следует видоизменить. С этой целью сформируем на основе процесса S несколько агрегированных процессов S (t) таких, что каждый (г+1)-й процесс S"1 получен путем усреднения значений /-го процесса S". Тогда в качестве модели временного процесса S, отражающей долгосрочные зависимости, можно рассмотреть авторегрессионную модель, аналогичную (2.5), аргументами которой,однако,являются не к последних членов ряда S, а первые члены к агрегированных процессов S (t), то есть модель примет вид: S(f) = F{s(t - \),s\t - \),...,sk (t- 1)) + E(t). (2.6) Для реализации нелинейной функции F в (2.6) будем использовать нечеткую модель, а авторегрессионную модель процесса в целом будем представлять в виде нечетко-динамической системы (НДС) с обратными связями. Входы обратной связи получены путем агрегирования задержанных на соответствующее число тактов к временных значений ряда S, а выходом является прогнозируемое значение s(t) в текущий момент времени t. База правил НДС содержит т правилі?,вида: Я, :/Fs(/-l) = cx, ands\t-\) = $,and ...andsk(t-l) = y, THEN s(i:) = ш, где а,,Р;,...,, - значения (нечеткие термы) лингвистической переменной, характеризующей интенсивность телетрафика, определенные на числовой шкале X. Нечеткие термы а,,(3 ,.... являются входными значениями НДС, а нечеткие термы со, - выходными. Для описания функционирования НДС введем в рассмотрение (к+1 )-мерное пространство U = X х Хх...Х , первые к измерений которого соответствуют входным переменным НДС, характеризующим «прошлых» значений процесса S, а (к+])-е измерение соответствует выходу НДС, характеризующему прогнозируемое значение процесса 5 в момент времени t.
Каждое из правил Ri, входящих в БЗ НДС, задает в пространстве U нечеткую область R, определяемую функцией принадлежности цЛ,(х1,х2,...,хА,х 1) = цпДх &црДх,)&...&ц.Дх,)&ц(,и(.гм). (2.7) Для каждого конкретного набора входных значений х = (x"nx\2...x it) функция \xRXx l],x i2,...,x ik,xikM) = \xlii(x x,k ) задает на шкале X нечеткое множество, имеющее смысл выходного нечеткого множества НДС, генерируемого правилом R . То есть для каждого конкретного входного вектора х" и выходного значения х" є X значение функции цЛ;( \-"О характеризует возможность появления х в качестве прогнозируемого значения ряда 5 в
Метод и алгоритм идентификации трафика по временным рядам
Железнодорожный транспорт является одной из системообразующих государственных структур в составе Российской Федерации и в ряде других стран. Непосредственная цель функционирования железнодорожного транспорта - удовлетворение потребностей в перевозках граждан и транспортировке грузов, связана с различными задачами, в первую очередь касающимися обеспечения безопасности таких перевозок, надежности и бесперебойности предоставления транспортных услуг. Не последнюю роль среди таких задач играет задача обеспечения качества функционирования транспортной отрасли, которую, как и ранее, невозможно решать без систем и средств автоматизации управления технологическими процессами на транспорте.
Автоматизация технологических процессов, включающая применение технических и программных средств сбора, обработки, хранения информации с возможностями формирования управляющих воздействий на объекты автоматизации на железнодорожном транспорте, ведется на протяжении более чем четырех последних десятилетий. К настоящему времени можно утверждать, что железнодорожный транспорт полностью оснащен системами низовой автоматики станций, горок, перегонов и большинство объектов железнодорожной инфраструктуры являются в информационно-управляющем смысле подсистемами глобальной в рамках нашей страны автоматизированной системы управления железнодорожным транспортом (АСУЖТ). Вместе с тем АСУЖТ не стала комплексной глобальной системой автоматизации железнодорожной отрасли, а лишь объединила отдельные локальные системы, разработанные, модернизируемые и эксплуатируемые на разнородном оборудовании и с применением различных средств и технологий. Для управления информационными потоками на сети железных дорог появилась автоматизированная система оперативного управления перевозками АСОУП. На крупных сортировочных и грузовых станциях внедрены системы технологического и оперативного контроля и управления в области грузовых перевозок и переформирования поездов. Контроль экономической и финансовой ситуации на железнодорожном транспорте осуществляется с помощью автоматизированной системы управления финансовыми расчетами и статистикой АСУФР. Успешно функционируют автоматизированная управляющая система АСУ продажи билетов «Экспресс» и комплексные системы автоматизированных рабочих мест КСАРМ на железнодорожном транспорте.
На их основе созданы и продолжают развиваться важнейшие информационные технологии на железнодорожном транспорте: единые диспетчерские центры управления движением поездов, система взаиморасчетов за пользование вагонами и другие. Информационная составляющая в перечисленных АСУ велика, поэтому для её обработки создаются специализированные высокопроизводительные комплексы технических средств и программного обеспечения. Эти системы должны обеспечивать автоматизацию учета прибывающих или проходящих через станцию железнодорожных составов, формирование протоколов событий в соответствии с определенной структурой отчетов по заданным параметрам (например, за определенный временной период), долговременное хранение данных и доступ к ним необходимого количества пользователей - и выполнять другие задачи, связанные с обработкой больших массивов информации. Необходимо отметить существенную особенность построения взаимоувязанных и территориально распределенных подсистем АСУЖТ - это их объединение на основе единой магистральной цифровой сети связи федерального значения железнодорожного транспорта России. Эта сеть создана с применением волоконно-оптических технологий и оборудования SDH, а серверное оборудование и рабочие места вычислительных центров и других подразделений железных дорог объединяются в сегменты сети с помощью активного телекоммуникационного оборудования, коммутаторов, маршрутизаторов и шлюзов. Таким образом, процесс управления перевозками на железнодорожном транспорте обеспечивается мощной информационно-вычислительной поддержкой - распределенными сетевыми информационно-управляющими системами, автоматизирующими различные участки сложных технологических процессов бесперебойной и качественной доставки грузов и пассажиров. Вместе с физической транспортировкой грузов и пассажиров территориально распределенные подсистемы АСУЖТ обмениваются между собой значительным объемом управляющей и документирующей информации, создающей интенсивные информационные потоки. Структура этих информационных потоков сложна в связи с существующей многоплатформенностью, разнородностью оборудования и программного обеспечения АСУЖТ.
Тем не менее с точки зрения научных исследований установлено, например в [8], что потоки информации с этих системах, подобно интернет-системам, обладают свойствами, изучаемыми в теории телетрафика [41]: самоподобием и наличием корреляционных зависимостей (кратковременной и долговременной). В работе [8] также установлено, что в связи с существующей временной ритмичностью функционирования АСУЖТ информационные потоки в них проявляют свойство периодичности возникновения пиковых нагрузок. Существующими исследованиями в данной области установлено также, что информационные потоки в АСУЖТ могут обладать перечисленными свойствами не только одновременно, но и в разных их комбинациях. Выбор конкретного математического метода исследования и моделирования информационных потоков в зависимости от наличия предполагаемых свойств телетрафика обычно возлагается на исследователя. Анализ литературы в области изучения свойств информационных потоков показывает, что исследователи обычно не уделяют внимания обоснованию причин выбора той или иной модели телетрафика и действуют по принципу «установлено, что телетрафик обладает свойством...».
В связи с данным обстоятельством в настоящей главе поставлена задача идентификации информационных потоков по измеряемым характеристикам временных рядов объемов трафика в АСУЖТ, приводящая к разработке метода интеллектуального обнаружения (наличия либо отсутствия) свойств самоподобия, корреляционных зависимостей и периодических пиковых нагрузок.
Обработка временных рядов телетрафика численными методами восстановления динамики системы
Дальнейшие методы обработки относятся к методам нелинейной динамики [44], на основе которых в параграфеЗ. 1, а также в работе автора [54] был предложен укрупненный атгоритм идентификации телекоммуникацион 117 ного трафика в АСУЖТ с их использованием. Рассмотрим подробнее шаги указанного алгоритма и необходимые методы вычислений.
Одним из первых шагов в алгоритме [54] является идентификация структуры информационного обмена, то есть определение, каким именно процессом адекватнее всего пользоваться при моделировании трафика: детерминированным, хаотическим либо случайным процессом. В связи с тем что идентификация детерминированных и стохастических процессов телетрафика достаточно хорошо изучена, в данном разделе особое внимание уделено идентификации хаотического процесса.
По сути, хаотический процесс представляет собой нечто среднее между детерминированным и стохастическим процессом. Для того чтобы определить «меру тяготения» его к тому или иному процессу существует несколько характеристик, в ходе вычисления которых выполняется восстановление (реконструкция) фазовой динамики системы. К таким числовым характеристикам [44], вычисление которых обсуждается далее, относятся: величина временного лага і, размерность вложения т, корреляционная размерность dc, спектр показателей Ляпунова X.
Рассмотрим методы вычисления характеристик хаотических процессов на основе реконструкции динамики системы. Получаемый в процессе измерения временной ряд объемов телетрафика является однопараметрическим, но, воспользовавшись методом вложения [109], можно вычислить аттракторы восстановленной -мерной системы, которые по метрическим свойствам аналогичны аттракторам исходной d -мерной динамической системы. В таком случае реконструкция фазового пространства выполняется с помощью вложения временного ряда f — \x{t,)\ в евклидово пространство R "c временной задержкой т , называемой временным лагом: x(t + ix) = f(x{t + (-1)т),х(г + (/-2)т),...,х(г + (/-т)т)Л, i = \,...,N , где N- число измерений, т — размерность вложения.
На рис. 4.3 показана иллюстрация принципа вложения длят = 3 , т - 2. При вложении также используется понятие о корреляционной размерности dc восстановленного аттрактора, являющейся нижней оценкой хаусдорфовой размерности объектов, которая может принимать дробные значения. Значение корреляционной размерности dc, округляемое до целого числа, по своей сути представляет собой количество переменных, необходимых для моделирования динамики системы, и в работе [109] устанавливается соотношение между размерностью вложения т и корреляционной размерностью dc в виде т 2[dc] +1, где \dc\ обозначает целую часть dc.
Вложение временного ряда, т = 3 , т = При обсуждении смысла корреляционной размерности исходят из следующих соображений. Пусть dsZ является целочисленной размерностью динамической системы, тогда V(s) х г", где V - некоторая мера объема объекта, а є - соответствующая ей мера масштаба. Таким образом, d определяется из соотношения d ос log!/(e)/logg. Аналогично этому корреляционная размерность dc восстановленного аттрактора А должна иметь свойство d\ogCm(e) dc ее lim lim корреляционной функцией и определяется как вероятность того, что расстояние между точками, принадлежащими восстановленному аттрактору, не превосходит є 0 - некоторого порогового расстояния с точками исходного аттрактора, то есть Ся,(є) = Рух- уЦ г\х,у є А).
Как указывалось выше, в большинстве случаев имеется конечный временной ряд из ./V измерений, поэтому вычисление корреляционной размерности зависит от размерности вложения т и величины лага т. При надлежащем выборе указанных величин фазовое пространство динамической системы, восстановленное по временному ряду, будет изоморфным фазовому пространству исходной системы. Существуют две методики определения этих параметров: в первой полагается, что величина т независима от величины т, а во второй предполагается, что эти величины коррелированы из-за шумов в данных временного ряда. В первом случае наиболее часто применяются методы подбора параметрах, основанные на вычислении автокорреляционной функции временного ряда х( ),