Электронная библиотека диссертаций и авторефератов России
dslib.net
Библиотека диссертаций
Навигация
Каталог диссертаций России
Англоязычные диссертации
Диссертации бесплатно
Предстоящие защиты
Рецензии на автореферат
Отчисления авторам
Мой кабинет
Заказы: забрать, оплатить
Мой личный счет
Мой профиль
Мой авторский профиль
Подписки на рассылки



расширенный поиск

Исследование трафика ОКС №7 и разработка методики его прогнозирования Лизнева Юлия Сергеевна

Исследование трафика ОКС №7 и разработка методики его прогнозирования
<
Исследование трафика ОКС №7 и разработка методики его прогнозирования Исследование трафика ОКС №7 и разработка методики его прогнозирования Исследование трафика ОКС №7 и разработка методики его прогнозирования Исследование трафика ОКС №7 и разработка методики его прогнозирования Исследование трафика ОКС №7 и разработка методики его прогнозирования Исследование трафика ОКС №7 и разработка методики его прогнозирования Исследование трафика ОКС №7 и разработка методики его прогнозирования Исследование трафика ОКС №7 и разработка методики его прогнозирования Исследование трафика ОКС №7 и разработка методики его прогнозирования Исследование трафика ОКС №7 и разработка методики его прогнозирования Исследование трафика ОКС №7 и разработка методики его прогнозирования Исследование трафика ОКС №7 и разработка методики его прогнозирования
>

Диссертация - 480 руб., доставка 10 минут, круглосуточно, без выходных и праздников

Автореферат - бесплатно, доставка 10 минут, круглосуточно, без выходных и праздников

Лизнева Юлия Сергеевна. Исследование трафика ОКС №7 и разработка методики его прогнозирования : диссертация ... кандидата технических наук : 05.12.13 / Лизнева Юлия Сергеевна; [Место защиты: Сиб. гос. ун-т телекоммуникаций и информатики].- Новосибирск, 2008.- 135 с.: ил. РГБ ОД, 61 08-5/845

Содержание к диссертации

Введение

1 Анализ методов расчета характеристик сетей ОКС №7 10

1.1 Обзор основных теоретических положений, описывающих функционирование сети ОКС №7 10

1.1.1 Прогнозирование сигнальной нагрузки. Общие положения 14

1.1.2 Общие положения, относящиеся к расчет у задержки доставки сигнальных сообщений ОКС №7 26

1.2 Постановка задачи ' 33

1.3 Выводы 36

2 Исследование вероятностных характеристик потоков сигнальных сообщений 37

2.1 Основные предпосылки для анализа характера закона распределения потока сигнальных сообщений 37

2.2 Анализ характера закона распределения промежутков между моментами поступления сигнальных единиц 37

2.2.1 Подбор стандартного распределения вероятнотей для аппроксимации распределения вероятностей интервалов между сообщениями входящего потока звена сигнализации 42

2.2.2 Определение эффекта самоподобия в сигнальном трафике 48

2.3 Расчет вероятностных характеристик звена сигнализации ОКС №7 60

2.4 Моделирование системы G/G/1 в среде GPSS World 71

2.5 Выводы 73

3 Прогнозирование временных рядов с использованием технологии нейровычислений 75

3.1 Общие положения 75

3.2 .Прогноз длины очереди 79

3.2.1 Постановка задачи 79

3.2.2 Анализ и выбор алгоритма обучения нейронной сети для решения задачи прогнозирования времени ожидания сигнальных сообщений в очереди 84

3.3 Выводы 95

4 Краткосрочное прогнозирование величины сигнальной нагрузки 96

4.1 Постановка задачи 96

4.2 Разработка методики для краткосрочного прогнозирования сигнального трафика с использованием многослойного персептрона 97

4.2.1 Анализ представления исходных данных 98

4.2.2 Предобработка исходных данных 99

4.2.3 Выбор начальных весовых коэффициентов 103

4.3 Контроль порога перефузки звена сигнализации с использованием нейронных сетей 110

4.4 Применение радиальной базисной сети для краткосрочного прогнозирования сигнального трафика 118

4.5 Выбор прогнозирующей модели 120

4.6 Выводы 121

Заключение 122

Библиофафия

Введение к работе

Актуальность темы исследования. Эффективность работы телекоммуникационной сети непосредственно зависит от способа построения и функционирования сети передачи сигнальной информации. Таким образом, являясь средством доставки сигнальной информации между элементами телекоммуникационной сети в процессе предоставления услуги, сеть общеканальной сигнализации должна обеспечивать гарантированную доставку сигнальной информации для различных подсистем пользователей, посредством сокращения времени доставки сообщений и защиты от любого типа отказов. Оптимальность сети сигнализации определяется затратами на построение сети, на которые влияют такие показатели качества функционирования как интенсивность сигнальной нагрузки, обслуживаемой звеньями сигнализации, среднее время и дисперсия задержки сообщений в звене сигнализации.

Анализ эффективных классических методов расчета времени ожидания в очереди сигнальных сообщений на основании статистической обработки информации работающего звена сигнализации показывает затрудненность получения адекватной оценки времени ожидания в очереди в звене сигнализации. Кроме того, существующие алгоритмы прогнозирования начала перегрузки, такие как WWG 8620 SS7 Signaling Surveillance System, MasterQuesr, GeoProbe «Inet», Spider [60], не позволяют динамически и в реальном времени оповещать о приближении к заданному порогуперегрузки.

Анализ задач, связанных с необходимостью динамического прогнозирования сетевых характеристик сети сигнализации, показал, что для решения поставленной задачи следует использовать нейросетевые методовы прогнозирования.

Задача построения прогноза типична для нейронных сетей. Но трудность их использования состоит в выборе способа представления входных данных и подходящей архитектуры нейронной сети для прогнозирования временного ряда.

Эти обстоятельства характеризуют противоречие между эффективными методами прогнозирования характеристик сети сигнализации и отсутствием в них динамической подстройки параметров, которая позволяла бы оперативно реагировать на приближение порога перегрузки. Преодоление этих противоречий позволяет в процессе работы звена сигнализации контролировать характеристики сети сигнализации, что приводит к повышению качества обслуживания.

Целью данной диссертационной работы является развитие методов расчета и прогнозирования характеристик сети ОКС №7. Использование методов прогнозирования позволит более эффективно решать задачи обеспечения требуемого качества обслуживания пользователей.

Для достижения поставленной цели необходимо решить следующие задачи:

  1. сравнить результаты расчета характеристик ОКС № 7 при использовании различных моделей с реальными данными действующих сетей с целью адекватного описания процессов, происходящих в звене сигнализации.

  2. Разработать методику и практические рекомендации для кратковременного прогнозирования сигнального трафика с использованием аппарата нейронных сетей.

  3. Определить набор параметров и разработать структуру нейронной сети для эффективного динамического контроля времени ожидания сигнальных сообщений в очереди.

В первой главе диссертации по данным отечественной и зарубежной литературы проводится обзор методов расчета характеристик сети сигнализации. Показано, классически методы расчета характеристик сети, обеспечивающие качество доставки информации, рекомендованное МСЭ-Т, дают оптимистические результаты и приводят к недооценке величины трафика. Кроме того, аналитические модели дают количественную оценку

времени задержки сигнального сообщения и не позволяют динамически отслеживать ее изменения

Вторая глава диссертации посвящена разработке и развитию базовых методов и алгоритмов расчета характеристик сигнальной сети.

При анализе вероятностно-временных характеристик звено
сигнализации представляется как однолинейная система. Важной

характеристикой потока сигнальных сообщений является закон распределения промежутков между соседними вызовами.

Оценка характера закона1 распределения входящего* потока проводится на основании статистических данных работающего звена сигнализации с использованием аппарата математической статистики.

Использование системы массового обслуживания, в которой учитывается характер распределения интервалов времени между поступлениями сообщений, позволяет получить более точные оценки времени доставки сигнальной единицы и область допустимых значений нагрузки, при которых обеспечивается качество обслуживания, чем получаемые при использовании марковских моделей. Для уточнения закона распределения входящего потока сигнальных единиц в работе проводится сравнение результатов экспериментальных исследований и теоретического расчета.

В третьей главе диссертационной работы описана методика прогнозирования времени ожидания в очереди сигнальных единиц, основанная на применении аппарата нейронных сетей.

На величину среднего времени ожидания сигнальной единицы в очереди влияют такие факторы, как степень загрузки звена сигнализации, распределение интервалов между поступлением сигнальных единиц, структурный состав сигнальных единиц в потоке. Кроме этого, классические математические методы требуют от проектировщиков знания множества фактических статистических данных реального трафика и не учитывают динамику их изменения.

Для того, чтобы решить задачу прогнозирования изменения времени ожидания в очереди в диссертации предлагается после обработки статистических данных извлекать из них следующую информацию:

долю длинных сигнальных единиц в потоке;

долю интервалов между поступлением сигнальных сообщений, принимающих значения меньше среднего интервала;

отношение средней длительности интервала между поступлением к средней длительности обслуживания сигнальных сообщений;

интенсивность загрузки звена сигнализации.

Для решения задачи прогнозирования времени ожидания сигнальных сообщений в очереди была построена нейронная сеть, обученная алгоритмом Левенберга-Марквардта. Выбор данного алгоритма обусловлен тем, что он позволяет формальным образом «обучить» нейронную сеть прогнозированию изменения требуемой величины на основе ретроспективных данных о самой величине.

В четвертой главе диссертационной работы описана методика краткосрочного прогнозирования сигнального трафика, основанная на применении аппарата нейронных сетей.

Результаты прогнозирования трафика с использованием нейронных сетей сравниваются с данными работающего звена сигнализации, в котором контролируется начало перегрузки. Использование методов прогнозирования нагрузки в звене сигнализации позволяет администратору сигнальной сети получать оперативные данные о приближении нагрузки к установленному ранее порогу перегрузки и предотвратить нежелательные затраты ресурсов протокола третьего уровня реагирования на начавшуюся перегрузку.

В момент фиксации перегрузки не гарантируется доставка сигнальной информации с заданной задержкой. При этом протокол третьего уровня МТР может реагировать на начавшуюся перегрузку в данном звене путем перераспределения поступающих сигнальных сообщений по другим звеньям

и маршрутам, что приводит к дополнительным накладным расходам, а значит к пониженной пропускной способности сигнальной сети.

Научная новизна результатов диссертационной работы заключается в следующем:

  1. Разработана методика прогнозирования времени ожидания сигнальных сообщений в очереди, использующая аппарат нейронных сетей.

  2. Предложена методика оперативного контроля величины сигнального трафика в процессе работы звена сигнализации на основе концепции нейронных сетей.

  3. Разработана комбинированная нейронная сеть с использование сети Кохонена, позволяющая определить структурный состав обучающей выборки, для исключения ошибочного обучения нейронной сети на некорректных данных.

  1. Показана невозможность использования пуассоновских моделей для расчета среднего времени ожидания сигнальных сообщений в очереди.

Практическая значимость работы заключается в том, что в ней предложены алгоритмы и методы, которые позволяют отследить динамическое изменение параметров сигнального трафика в реальном масштабе времени.

На защиту выносятся:

  1. Результаты статистического анализа сигнального трафика работающего звена сигнализации.

  2. Математическая модель звена сигнализации, учитывающая характер обслуживания сигнальных сообщений.

  3. Методика аналитического расчета среднего времени ожидания в очереди сигнальных единиц и сравнительный анализ с результатами имитационного моделирования.

  1. Методика прогнозирования времени ожидания сигнальных сообщений в очереди, основанная на применении аппарата нейронных сетей.

  2. Результаты краткосрочного прогнозирования величины сигнальной нагрузки на основе комбинированной нейронной сети с использованием сети Кохонена.

Прогнозирование сигнальной нагрузки. Общие положения

Для прогнозирования сигнальной нагрузки ОКС № 7 могут применяться различные методы и приемы, отличающиеся по своему инструментарию. Выбор метода прогнозирования во многом зависит от нескольких условий: наличие формальной модели; отсутствие формальной модели, но наличие статистических данных, на основе которых можно построить модель.

При прогнозировании нагрузки P(D, h), обладающей свойством самоподобия, на h-й час в D-й день учитываются следующие данные: P(D, h-\), P(D, h-2),.. ,P(D, h-g), P(D-1, h), P(D-l, h-1), ..., P(D-l, h-g), ..., P(D-d, h), P(D-d, h-1), ..., P(D-d, h-g). Число d указывает количество предшествующих дней, а число g - количество предшествующих часов, принимаемых во внимание при прогнозировании [73].

Статистические исследования сигнального трафика выполняются по следующему алгоритму: 1. анализ исходных данных и формирование модели прогнозирования. На этом этапе выбирается модель прогнозирования, исходя из возможностей математического аппарата; 2. численное оценивание параметров моделей; 3. определение адекватности и точности моделей; 4. выбор одной из моделей или построение обобщенной модели; 5. получение точечного и интервального прогнозов.

Основой для прогнозирования нагрузки служат статистические данные количества сигнальных единиц в единицу времени, обслуженных звеном сигнализации. Такой способ определения нагрузки соответствует реальной ситуации, возникающей на сетях, так как искомая величина измеряется непосредственно.

В общем виде задача прогнозирования может быть описана следующим образом.

Пусть заданы значения временного ряда X = (х1,х2,...,хп), где х, - значение анализируемого показателя, зарегистрированного в t -м интервале времени (t =1,2,...,п ). Выбранным методом прогнозирования требуется оценить значения будущих значений ряда X = {x„+l,xl)+2,...,x/1+z), где 1 т т - горизонт прогнозирования. Для оценки качества прогноза введем величину У( ) = х(ґ)-Х( ), то есть абсолютную величину отклонения прогнозного значения от наблюдаемого на временном интервале.

Важно отметить, что отличие временного ряда от последовательности наблюдений, образующих случайную выборку заключается в том, что, во-первых, в отличие от элементов случайной выборки члены временного ряда не являются статистически независимыми, а во-вторых, члены временного ряда не являются одинаково распределенными, т.е. Р(х} х) Р(х2 х) при Л:, ФХ2 [23]. С одной стороны, это означает, что распространять свойства и правила статистического анализа случайной выборки на временные ряды нельзя. С другой стороны, взаимозависимость членов временного ряда создает базу для построения прогнозных оценок для неизвестных значений х11+г по наблюденным значениям .г,,х2,...х„.

Для решения задачи прогнозирования сигнального трафика не удается построить детерминированные модели, так как это задача связана с изменением случайных величин. В этом случае для прогнозирования применяется так называемый вероятностный подход. Параметры вероятностных моделей - это распределения случайных величин, их средние значения, дисперсии, асимметрии и т.д. Как правило, эти параметры изначально неизвестны, а для их оценки используются статистические методы, применяемые к выборкам наблюдаемых значений.

Существует большое количество моделей и методов статистического прогнозирования нагрузки. Сезонные модели способны отражать как относительно постоянную сезонную-волну, так и волну, динамически изменяющуюся в зависимости от тренда. Первая форма относится к классу аддитивных, а вторая — к классу мультипликативных моделей. Большинство моделей имеет обе эти формы. Наиболее широко в практике используются модели Хольта, авторегрессии, модели Бокса-Дженкинса [23, 93, 105].

Адаптивные модели и методы имеют механизм автоматической настройки на изменение исследуемого показателя. Инструментом прогноза является модель, первоначальная оценка параметров которой производится по нескольким первым наблюдениям. На ее основе делается прогноз, который сравнивается с фактическими наблюдениями. Далее модель корректируе гея в соответствии с величиной ошибки прогноза и вновь используется для прогнозирования следующего уровня, вплоть до исчерпания всех наблюдений. Таким образом, она постоянно «впитывает» новую информацию, приспосабливается к ней, и к концу периода наблюдения отображает тенденцию, сложившуюся на текущий момент. Прогноз получается как экстраполяция последней тенденции. В различных методах прогнозирования процесс настройки (адаптации) модели осуществляется по-разному.

Метод Хольта относится к схеме скользящего среднего, модель Бокса-Джекинса — к схеме авторегресси. Многочисленные адаптивные методы базируются на этих моделях и различаются между собой числовой оценкой параметров.

Таким образом, задача прогноза состоит в определении вида экстраполирующих функций, сезонной й стохастической компоненты процесса на основе исходных эмпирических данных, а прогнозирующая модель задает множество выходных переменных YT+,

Исследования поведения сигнального трафика в реальных сетях показали [61], что, в зависимости от времени суток, наблюдаются выраженные колебания. Для получения адекватных прогнозных оценок необходимо подобрать не только тренд, но и сезонную компоненту.

Для того, чтобы рассчитать значения прогнозируемой величины, необходимо аппроксимировать ряд трендовой моделью, то есть подобрать функцию неслучайной компоненты процесса (/(0) Тогда математически временной ряд у, может быть представлен в следующем виде: yt=f(t) + S(t) (1.1) где f(t) - неслучайная компонента процесса (тренд); S(t) - сезонная составляющая.

Для выявления основной тенденции (тренда) необходимо найти параметры функции, описывающей эмпирический ряд. Наиболее распространенными методами оценки параметров являются метод наименьших квадратов и его модификации, метод экспоненциального сглаживания, метод вероятностного моделирования и метод адаптивного сглаживания [89, 93]. Использование методов адаптивного сглаживания рядов необходимо для того, чтобы исключить возможности «сглаживания» значимых моментов в поведении системы случайных выбросов и кратковременных изменений параметров.

Метод экспоненциального сглаживания позволяет анализировать временной ряд и получать прогноз без предварительного задания формы тренда.

Основные достоинства метода состоят в возможности учета весов исходной информации, в простоте вычислительных операций, в гибкости описания различных динамик процессов. Метод экспоненциального сглаживания дает возможность получить оценку параметров тренда, характеризующих не средний уровень процесса, а тенденцию, сложившуюся к моменту последнего наблюдения.

Анализ характера закона распределения промежутков между моментами поступления сигнальных единиц

Для оценки характера закона распределения входящего потока необходимо провести измерение длительностей промежутков между поступлениями сигнальных сообщений на звено сигнализации. Для проведения анализа из генеральной совокупности производится выборка по следующему алгоритму: 1. зафиксировать двухчасовой промежуток времени наблюдения, который задает объем выборки и обеспечивает условие, что поступающий поток сигнальных единиц близок к стационарному; 2. зафиксировать пучок звеньев сигнализации; 3. исследовать проводится отдельно для каждого звена сигнализации в течение фиксированного промежутка времени.

Для сформированной выборочной совокупности определены длительности промежутков между поступлениями сигнальных единиц и рассчитаны: среднее значение, несмещенная оценка дисперсии и среднеквадратическое отклонение случайной величины. Кроме того, выполнен расчет коэффициента асимметрии /?, характеризующего скошенность распределения по отношению к математическому ожиданию.

Для доказательства предположения соответствия распределения выборочной совокупности теоретическому распределению воспользуемся критерием согласия % Пирсона [17]. При анализе характера закона распределения промежутков между поступлениями сигнальных сообщений будем использовать статистические данные о работе звена сигнализации в выбранном направлении связи реальной сети.

Изменение сигнальной нагрузки в течение трех дней На рисунках 2.1 и 2.2 приведены графики изменения суточной и трехдневной нагрузки. Анализ рисунков показал, что с 12:00 до 21:00 сигнальная нагрузка изменяется незначительно. Таким образом, для оценки характера закона распределения входящего потока зафиксируем три двухчасовых периода наблюдений: 1. с 12:00 до 14:00, 2. с 14:00 до 16:00, 3. с 16:00 до 18:00.

Для выбранных периодов наблюдений были рассчитаны статистические характеристики, такие как средняя длительность интервалов между поступлениями сообщений, стандартное отклонение и асимметрия (таблица 2.1).

На основании [92, 95] при достаточно близком совпадении среднего значения и среднеквадратического отклонения случайной величины (коэффициент вариации «1) можно говорить о приемлемости гипотезы о показательном законе распределения промежутков между поступлениями сигнальных сообщений. Однако, как отмечено в [94], такие проверки никак не могут доказать соответствия выборки теоретическому закону.

Так как коэффициент вариации отличен от единицы, то можно сделать первоначальное предположение, что поток сигнальных сообщений, поступающих на звено, не является простейшим.

Рассчитанные коэффициенты корреляции, а также корреляционные функции показывают слабую зависимость между поступающими сигнальными сообщениями (при увеличении п коэффициент корреляции не стремится к нулю).

Таким образом, статистический анализ сигнального трафика показал, что поток сигнальных сообщений нельзя считать простейшим.

Использование системы массового обслуживания (СМО), в которой учитывается характер распределения интервалов времени между поступлениями сообщений, позволяет получить более точные оценки таких параметров, как время доставки сигнальной единицы и область допустимых значений нагрузки, при которых обеспечивается требуемое качество обслуживания, чем получаемые при использовании марковских моделей. Сравнение результатов экспериментальных исследований и теоретического расчета позволит уточнить закон распределения входящего потока сигнальных единиц, влияющий на качество обслуживания вызовов.

Длительности промежутков между поступлениями сигнальных сообщений работающего звена сигнализации располагаем в порядке возрастания и группируем в соответствии с интервалом разбиения, что позволяет определить функцию плотности распределения входящего потока.

Анализ и выбор алгоритма обучения нейронной сети для решения задачи прогнозирования времени ожидания сигнальных сообщений в очереди

Чтобы решить задачу прогнозирования времени ожидания сигнальных сообщений в очереди, построим нейронную сеть, обучаемую по алгоритму обратного распространения ошибок. Выбор данного алгоритма обусловлен тем, что он позволяет формальным образом «обучить» нейронную сеть прогнозированию изменения требуемой величины на основе ретроспективных данных о самой величине.

Для прогнозирования времени ожидания в очереди сформируем обучающую выборку, состоящую из набора входных параметров НС и заранее известного результата (выходные параметры НС). Для прогнозирования времени ожидания в качестве входных параметров в данной работе используются р(( t), {11т), (т/Т), dlAKt.

Задача прогнозирования решается с помощью многослойной нейронной сети, которая состоит из 4-х нейронов во входном слое и 1-го нейрона в выходном слое. Число скрытых слоев и количество нейронов в этих слоях определяется экспериментально. Таблица 3.2 - Выборка для прогнозирования среднего времени ожидания в очереди

Для составления задачника были использованы статистические данные о работе звеньев сигнальной сети, собранные в течение двух месяцев. Выборка состоит из 1500 примеров, 70% из которых - обучающая выборка (фрагмент выборки приведен в таблице 3.2).

При выборе архитектуры нейронной сети обычно опробуется несколько конфигураций с различным количеством скрытых слоев. Выбор количества скрытых слоев и числа нейронов в каждом слое является неформализованной задачей и требует индивидуального подхода.

Для приближенной оценки числа скрытых слоев можно воспользоваться теоремой Колмогорова-Арнольда и следствием из нее [31]. В соответствии с этими теоретическими результатами, в негомогенной (нет никаких ограничений на передаточные функции нейронов) двухслойной нейронной сети для реализации произвольного отображения потребуется 2 N нейронов в скрытом слое, где N - размерность выходного сигнала. Для гомогенных сетей, в которых передаточные функции нейронов фиксированы, данная оценка является заниженной. Число 2 N часто рассматривают как нижняя граница необходимого числа нейронов скрытого слоя.

Процесс обучения нейронных сетей связан с настройкой весов и смещений так, чтобы минимизировать функционал, зависящий от ошибок сети (разности между желаемым и реальным значениями на выходе). В качестве таких функционалов могут использоваться: сумма квадратов ошибок, средняя квадратичная ошибка, комбинированная ошибка, средняя абсолютная ошибка. Поскольку соответствие между входами и выходами носит явно выраженный нелинейный характер, то будем использовать нейронную сеть с нелинейными сигмоидальными функциями активации.

Алгоритм обратного распространения эффективен в ситуациях, когда отношения между входом и выходом нелинейны, а количество обучающих данных велико. Недостатком классического алгоритма обратного распространения является большое число итераций для достижения минимума функции ошибки. Время, требующееся для вычисления производных от ошибки по весам на заданном тренировочном примере, пропорционально размерам сети, поскольку объем вычислений пропорционален количеству весов. Однако с увеличением размеров сети требуется большее количество тренировочных примеров, поэтому приходится модифицировать веса большое число раз. Следовательно, время обучения растет значительно быстрее, чем размеры сети. С другой стороны, большая скорость обучения приводит к неустойчивости процесса.

В момент, когда все образы использованы, вычисляется суммарная ошибка по всем образам и сравнивается с допустимым значением. В случае, если ошибка достигает величины меньше заданной, процесс обучения заканчивается, в противном случае процесс обучения повторяется. Для устранения указанных недостатков были предложены многочисленные модификации алгоритма обратного распространения, которые связаны с использованием различных функций ошибки и различных величин шага итераций (в настоящее время известно достаточное количество алгоритмов, ускоряющих процесс обучения. К таким алгоритмам относятся алгоритмы локальной оптимизации с вычислением частных производных первого и второго порядков (например, метод сопряженных градиентов, метод Левенберга-Марквардта, метод секущих плоскостей) Рассмотрим более подробно некоторые методы.

1. Алгоритм Лееенберга-Маркварда - разработан так, чтобы минимизировать среднеквадратичную функцию ошибок с помощью формулы, которая предполагает, что функция, которую моделирует сеть, является» линейной. Вблизи точки минимума это предположение выполняется с большой точностью, так что алгоритм может продвигаться очень быстро. Вдали от минимума это предположение может быть неправильным. Поэтому метод Левенберга-Маркара находит компромисс между линейной моделью и градиентным спуском. Шаг делается только в том случае, если он уменьшает ошибку, и там, где это необходимо, для обеспечения продвижения используется градиентный спуск с достаточно малым шагом.

Разработка методики для краткосрочного прогнозирования сигнального трафика с использованием многослойного персептрона

Для прогнозирования сигнальной нагрузки в качестве входных параметров используются значения почасовых нагрузок предыдущих дней, а заранее известным результатом являются нагрузки прогнозируемого периода.

Анализ представления исходных данных

Как было отмечено выше, рассматриваются три варианта представления ретроспективного периода о режимах поведения нагрузки. 1 вариант представления ретроспективных данных.

Во входном слое сети находится 24 нейрона (количество входных переменных ), в выходном - 1 (прогнозирование на шаг вперед) и весовыми коэффициентами связи Wt , WJk между нейронами соответственно входного, скрытого и выходного слоев. 2 вариант представления ретроспективных данных.

Во входном слое сети находится 48 нейрона (количество входных переменных), в выходном - 1 (прогнозирование на шаг вперед) и весовыми коэффициентами связи W , WJk между нейронами соответственно входного, скрытого и выходного слоев. 3 вариант представления ретроспективных данных.

Во входном слое сети находится 72 нейрона (количество входных переменных), в выходном - 1 (прогнозирование на шаг вперед) и весовыми коэффициентами связи W , WJk между нейронами соответственно входного, скрытого и выходного слоев.

Перед началом обучения входные параметры, определяемые выражением (4.2), с помощью метода «скользящих окон» формируются в блок обучающих выборок [39]. Основную идею метода можно выразить так: выбирается один вектор из всей совокупности данных, а остальные используются для обучения нейронной сети. Когда процесс обучения будет завершен, предъявляется этот выбранный вектор и проверяется, правильно сеть распознала его или нет. После проверки выбранный вектор возвращается в исходную выборку. Затем выбирается другой вектор, на оставшихся сеть вновь обучается, и этот новый вектор тестируется.

После того, как сформирована обучающая выборка, необходимо задать число нейронов в скрытом слое, присвоить весовым коэффициентам некоторые значения, задать допустимую величину ошибки и нормировать значения входного вектора.

Так как нейронные сети в основном работают с данными, представленными числами из интервала [-1, 1], а количество сигнальных единиц в единицу времени может достигать порядка нескольких тысяч, необходимо провести нормировку входных данных. Кроме того, если значения сосредоточены в относительно небольшой области единичного интервала, информационное содержание таких входных данных невелико. В пределе нулевой энтропии, когда все данные совпадают, эти входные данные не несут никакой полезной информации. Напротив, если значения данных распределены в единичном интервале по нормальному закону, информация таких данных максимальна. Следовательно, при нормировке входных данных необходимо, чтобы входные данные изменялись в диапазоне [-1, 1] и были распределены по нормальному закону.

Анализ работ, посвященных нормированию данных, подаваемых на вход НС [58, 73, 96], показал, что однозначно выбрать формулу, при которой погрешность минимальная, сложно. С целью определения оптимального нормирования данных для прогнозирования нагрузки были исследованы варианты, использующие различные формулы прогнозирования.

Похожие диссертации на Исследование трафика ОКС №7 и разработка методики его прогнозирования