Электронная библиотека диссертаций и авторефератов России
dslib.net
Библиотека диссертаций
Навигация
Каталог диссертаций России
Англоязычные диссертации
Диссертации бесплатно
Предстоящие защиты
Рецензии на автореферат
Отчисления авторам
Мой кабинет
Заказы: забрать, оплатить
Мой личный счет
Мой профиль
Мой авторский профиль
Подписки на рассылки



расширенный поиск

Анализ и моделирование трафика в корпоративных компьютерных сетях Репин Дмитрий Сергеевич

Анализ и моделирование трафика в корпоративных компьютерных сетях
<
Анализ и моделирование трафика в корпоративных компьютерных сетях Анализ и моделирование трафика в корпоративных компьютерных сетях Анализ и моделирование трафика в корпоративных компьютерных сетях Анализ и моделирование трафика в корпоративных компьютерных сетях Анализ и моделирование трафика в корпоративных компьютерных сетях Анализ и моделирование трафика в корпоративных компьютерных сетях Анализ и моделирование трафика в корпоративных компьютерных сетях Анализ и моделирование трафика в корпоративных компьютерных сетях Анализ и моделирование трафика в корпоративных компьютерных сетях Анализ и моделирование трафика в корпоративных компьютерных сетях Анализ и моделирование трафика в корпоративных компьютерных сетях Анализ и моделирование трафика в корпоративных компьютерных сетях
>

Диссертация - 480 руб., доставка 10 минут, круглосуточно, без выходных и праздников

Автореферат - бесплатно, доставка 10 минут, круглосуточно, без выходных и праздников

Репин Дмитрий Сергеевич. Анализ и моделирование трафика в корпоративных компьютерных сетях : диссертация ... кандидата технических наук : 05.13.01 / Репин Дмитрий Сергеевич; [Место защиты: Моск. гос. гор. ун-т].- Москва, 2008.- 143 с.: ил. РГБ ОД, 61 09-5/560

Содержание к диссертации

Введение

Глава 1. Общая характеристика состояния проблемы исследования и моделирования трафика в корпоративных компьютерных сетях 13

1.1. Методы и средства экспериментального исследования и анализа трафика 13

1.2. Моделирование трафика в корпоративных компьютерных сетях 19

1.3. Уточнение основных направлений исследования 23

Выводы по главе 1 25

Глава 2. Методика экспериментального исследования трафика в корпоративных компьютерных сетях 26

2.1 Постановка задачи исследования трафика в ККС 26

2.2. Формирование структурного представления исследуемой сети и выбор точек съема информации 29

2.3. Обеспечение подключения измерительных средств к выбранным точкам доступа 34

2.4. Определение формата записи данных при измерении трафика 37

2.5. Планирование и проведение экспериментального исследования трафика 44

2.6. Разработка алгоритмов и прикладного программного обеспечения для сбора и обработки данных о параметрах трафика. 46

Выводы по главе 2 56

Глава 3. Методы и алгоритмы анализа трафика в компьютерных сетях на основе статистики экстремальных значений 57

3.1. Постановка задачи. Общие замечания о возможностях применения статистики экстремальных значений для анализа трафика 57

3.2. Математические основы метода анализа данных с использованием статистики экстремальных значений 61

3.3. Анализ трафика с использованием статистики экстремальных значений 69

3.4. Практический пример анализа трафика с использованием статистики экстремальных значений 80

Выводы по главе 3 82

Глава 4. Анализ и моделирование нестационарного трафика в корпоративных компьютерных сетях 83

4.1. Постановка задачи 83

4.2. Анализ структуры и свойств нестационарного трафика 84

4.3. Формирование модели изменения интенсивности нестационарного трафика 97

4.4. Дополнительные элементы формирования модели изменения интенсивности нестационарного трафика 102

4.5. Имитационное моделирование узла ККС как СМО в условиях 108

нестационарности потока заявок на обслуживание

Выводы по главе 4 111

Глава 5. Применение разработанных средств методического и программно-алгоритмического обеспечения для исследования трафика в ККС ... 112

5.1. Исследование трафика в Центральном сегменте корпоративной сети отрасли образования 112

5.2. Анализ почтового трафика Информационно-вычислительной Сети Московского Энергетического Института (Технического Университета)

Выводы по главе 5 133

Заключение 134

Литература 136

Введение к работе

В современных условиях решение все более сложных задач управления различного рода системами и объектами, задач организационного управления основывается на широком использовании информационных технологий. Технической базой их практического применения являются корпоративные компьютерные сети (ККС). Именно они играют все возрастающую роль для обеспечения эффективности управления и успешного функционирования самых разных организаций. Отсюда то пристальное внимание, которое уделяется сейчас вопросам анализа и синтеза такого рода сетей.

При этом следует иметь ввиду, что практически в каждой такой сети наблюдается общая тенденция увеличения числа пользователей, объемов циркулирующей информации, интенсивности трафика и связанных с этими обстоятельствами ухудшения качества сетевых услуг. Все это требует проведения экспериментальных исследований свойств сети, причем не только в режиме оперативного мониторинга, но и для более глубокого изучения — в частности, с целью прогнозирования их поведения. С этим же связана и задача совершенствования соответствующего научно-методического и программного обеспечения анализа и моделирования трафика.

Работы по данной проблеме велись и ведутся весьма интенсивно как отечественными (Л.И. Абросимов, В.В. Крылов, О.И. Шелухин, А.В. Осин, А.К. Скуратов, Н.А. Олифер, В.Г. Олифер и др.), так и зарубежными учеными (М. Шварц, К. Парк, Дж. Медхи и др.). Тем не менее многие вопросы здесь либо исследованы недостаточно полно, либо ориентированы на решение относительно узких прикладных задач. В частности, отсутствуют комплексные методики организации и проведения экспериментальных исследований трафика, обобщающие накопленный к настоящему времени опыт их проведения. Достаточно ограничен перечень статистических методов, используемых при обработке данных, характеризующих интенсивность трафика. Математические модели трафика, в основном, строятся в предположении его стационарности. Все это свидетельствует о необходимости дальнейшего развития исследований по данной проблематике и в целом определяет актуальность тематики данной работы.

Целью диссертационной работы является развитие методов и алгоритмов исследования трафика в корпоративных компьютерных сетях для анализа качества их функционирования, прогнозирования свойств и моделирования.

В соответствии с указанной целью в рамках диссертационной работы поставлены и решались следующие задачи:

1. Обзор и анализ известных подходов к экспериментальному исследованию трафика в ККС, применяемых методов и программно— аппаратных средств.

2. Разработка комплексной методики экспериментального исследования трафика в ККС и прикладного программного обеспечения для сбора, обработки и оперативного анализа данных о параметрах трафика.

3. Исследование возможностей использования математического аппарата статистики экстремальных значений для анализа и прогнозирования поведения компьютерных сетей.

4. Анализ изменения интенсивности трафика в ККС как нестационарного дискретного случайного процесса.

5. Разработка способа имитационного моделирования кривой изменения интенсивности нестационарного трафика и ряда его модификаций с целью повышения достоверности конечных результатов имитационного эксперимента.

6. Применение полученных методических, математических и программно-алгоритмических результатов при решении практических задач по исследованию интенсивности трафика в ККС отрасли образования.

Полученные результаты исследования базируются на использовании методов и средств системного анализа, элементов теории компьютерных сетей, математической статистики, теории случайных процессов, имитационного моделирования.

На защиту выносятся следующие научные положения, обладающие новизной:

1. Комплексная методика экспериментального исследования трафика в ККС, в основе которой положена совокупность базовых принципов, главными из которых являются системность, универсальность применения, полнота собираемых данных, информационная и техническая безопасность, унификация используемых технических и программно-алгоритмических решений.

2. Доказательство эффективности математического аппарата статистики экстремальных значений для решения ряда важных прикладных задач по анализу и долгосрочному прогнозированию возникновения критических ситуаций в функционировании ККС, связанных с ограниченной пропускной способностью отдельных ее элементов.

3. Выявленная на основе анализа экспериментальных данных структура типичного процесса изменения суточного трафика, включающего в себя детерминированную (трендовую) и стохастическую компоненты и метод формирования общей параметрической модели суточного изменения интенсивности нестационарного трафика.

4. Способ моделирования кривой изменения интенсивности нестационарного трафика и ряд его модификаций, позволяющие повысить достоверность конечных результатов имитационного эксперимента.

Обоснованность и достоверность научных положений, выводов и рекомендаций подтверждаются корректным использованием методов математической статистики, теории случайных процессов, результатами имитационного моделирования и практического использования

разработанных методов, алгоритмов и прикладных программ для исследования трафика в действующих ККС.

Научная значимость работы состоит в разработке научно обоснованной комплексной методики экспериментального исследования трафика в ККС, расширении спектра статистических методов, используемых при анализе и прогнозировании трафика, создании методов формирования параметрических моделей суточного изменения интенсивности нестационарного трафика и их применения в имитационном моделировании компьютерных сетей.

Результаты исследований, выполненных в диссертационной работе, могут быть использованы при проведении экспериментальных исследований трафика ККС в различных организациях и фирмах, для целей прогнозирования возникновения критических ситуаций, связанных с ограниченной пропускной способностью отдельных элементов сети, для повышения достоверности и качества имитационного моделирования ККС как средства принятия эффективных управленческих решений, связанных с их развитием и/или модернизацией.

Результаты работы использованы:

- при проведении экспериментальных исследований и анализе трафика в точке выхода Центрального сегмента корпоративной сети отрасли образования на внешнюю сеть RANNet, через которую осуществляется выход Рособразования и Рособрнадзора к информационным ресурсам отрасли и к сети Internet;

- для анализа почтового трафика в Информационно-вычислительной сети Московского энергетического института (технического университета.

Основные положения и результаты работы докладывались на XXXV Международной конференции «Информационные технологии в науке, образовании, телекоммуникации, бизнесе» — IT+SE 2008 (Ялта-Гурзуф, 2008г.), Четвертой международной научно-практической конференции «Исследование, разработка и применение высоких технологий в промышленности» (Санкт-Петербург, 2008 г.), на Международной научно-технической конференции «Информационные средства и технологии» (Москва, 2008г.), на заседании кафедры «Автоматизированные системы управления» (АСУ) Московского государственного горного университета.

По теме диссертационной работы опубликованы 7 научных работ [64-70], в том числе в 2 изданиях, включенных в Перечень ведущих рецензируемых научных журналов и изданий, в которых должны быть опубликованы основные научные результаты диссертации на соискание ученой степени доктора и кандидата наук (редакция апрель 2008 года) ВАК Минобрнауки РФ, а также в трудах 3 Международных конференций.

Диссертационная работа состоит из введения, пяти глав, заключения и списка литературы.

Во введении отмечена актуальность диссертационной работы, сформулированы цели и задачи исследования, изложены основные положения, выносимые на защиту, научная новизна и практическая значимость работы, представлены сведения о ее апробации, публикациях, а также дана краткая характеристика содержания работы.

В первой главе дается общая характеристика состояния проблемы исследования и моделирования трафика в корпоративных компьютерных сетях. Приводятся данные об используемых при проведении эксперимента по измерению трафика методических подходов, технических и программных средств. Обсуждаются наиболее часто применяемые при анализе трафика методы обработки данных - в частности, методы математической статистики и теории случайных процессов. Рассматриваются различные варианты моделей сетевого трафика.

Результаты анализа рассмотренных материалов выявил, что: - отсутствуют научно-обоснованные комплексные методики проведения экспериментальных исследований трафика, обобщающие накопленный к настоящему времени опыт проведения таких исследований;

- известные аппаратно-программные средства ориентированы в основном на системных администраторов и зачастую очень дороги;

- применение статистических методов обработки информации для анализа интенсивности трафика ограничивается в основном оцениванием одномерных характеристик (средних значений, дисперсий, функций распределения вероятностей) и корреляционно-спектральным анализом;

- модели интенсивности трафика в ККС разнообразны, но в большинстве случаев относятся к категории стационарных.

Все это позволило уточнить тематику работы и выделить для дальнейшего рассмотрения три основные направления, а именно:

- разработка комплексной методики экспериментального следования трафика в корпоративных компьютерных сетях;

- разработка и исследование оригинального алгоритма анализа трафика в корпоративных компьютерных сетях на основе статистики экстремальных значений;

- анализ и моделирование нестационарного трафика в корпоративных компьютерных сетях.

Вторая глава посвящена разработке единой комплексной методики экспериментального исследования трафика в корпоративных компьютерных сетях. Методика включает в себя базовые принципы построения, перечень и анализ основных этапов исследования, рассмотрение вопросов организации и проведения соответствующего эксперимента, создание эффективных программных средств для реализации предлагаемой методики.

К числу базовых принципов, с учетом которых строится методика, относятся системность, универсальность применения, а также полнота собираемых данных, информационная безопасность, техническая безопасность подключения измерительных устройств, мобильность, унификация используемых технических решений, переносимость программного обеспечения.

Детально рассмотрены основные этапы исследования трафика в рамках предложенной методики, их содержание и особенности реализации. Подробно обсуждаются вопросы планирования эксперимента.

Наконец, заключительная часть главы связана с разработкой прикладного программного обеспечения для сбора и обработки данных о параметрах трафика, позволяющего в полной мере реализовать предложенную методику.

В третьей главе предлагается и исследуется алгоритм анализа трафика в корпоративных компьютерных сетях на основе статистики экстремальных значений, один из известных статистических методов, который однако для анализа трафика ранее не применялся. Метод базируется на предварительном получении информации о максимальных значениях наблюдаемой переменной в течение некоторого числа циклов повторяемости (для трафика это, как правило, сутки). Рассмотрен алгоритм анализа, основанный на использовании некоторого шаблона, называемого «вероятностной бумагой». ,

Доказана эффективность предложенного метода для решения ряда важных прикладных задач по анализу и прогнозу трафика, в числе которых:

- анализ интервалов повторяемости и прогнозирование их изменений для событий, связанных с превышением заданного уровня интенсивности трафика;

- прогнозирование последствий увеличения интенсивности трафика и выявление ограничений на такое увеличение;

- анализ перегруженной сети, когда достаточно часто имеет место достижение уровня предельно допустимой пропускной способности некоторого элемента сети, и формирование рекомендаций по исправлению такого положения.

Приведен практический пример анализа трафика с использованием статистики экстремальных значений.

В четвертой главе рассматривается проблема анализа и моделирования нестационарного суточного трафика в корпоративных компьютерных сетях. Рассмотрение ведется на примере типичной реализации изменения суточного трафика.

Проведен анализ структуры нестационарного трафика. Выделены две его структурные составляющие: детерминированная и стохастическая компоненты. Поставлена задача построения их математических моделей в параметрической форме, как наиболее удобной для использования при моделировании сетей.

Рассмотрено два подхода к выделению детерминированной компоненты: на основе предварительной фильтрации с помощью фильтра скользящего среднего и непосредственное получение регрессионной модели тренда по реализации процесса. Установлено, что второй подход дает более точные результаты. Стохастическая компонента определяется как разность исходной кривой и выделенной детерминированной компоненты. Для этой компоненты доказано, что она представляет собой стационарный гауссовский случайный процесс, который может быть адекватно описан моделью авторегрессии не выше 3-го порядка.

Полученные параметрические модели могут быть использованы для моделирования суточного изменения интенсивности трафика с помощью разработанного в работе алгоритма моделирования. Рассмотрены некоторые дополнительные процедуры формирования модели, позволяющие повысить достоверность моделирования. В частности, предложен способ построения модели, дополнительно учитывающей нестационарность суточного трафика по дисперсии стохастической компоненты. В завершение главы обсуждается вопрос о моделировании изменения интенсивности потока заявок. Отмечено, что построение соответствующей модели практически ничем не отличается от построения модели интенсивности. Найденная параметрическая модель интенсивности потока заявок может быть использована при имитационном моделировании системы массового обслуживании в условиях нестационарности входного потока.

Пятая глава посвящена практическому использованию полученных научных результатов для анализа трафика в реально функционирующих ККС, а именно при исследовании трафика в Центральном сегменте корпоративной сети отрасли образования и почтового трафика Информационно-вычислительной сети Московского энергетического института. Результаты исследований планируется использовать при последующей модернизации указанных сетей.

В заключении сформулированы основные результаты, полученные в диссертационной работе.

Методы и средства экспериментального исследования и анализа трафика

Корпоративные компьютерные сети (ККС), как известно, — это сети масштаба предприятия, организации, корпорации. Данные сети используют коммуникационные возможности Интернета и поэтому практически не зависят от территориального размещения серверов и рабочих станций. Корпоративные сети иногда называют сетями Интранет. Зачастую такие сети имеет весьма сложную структуру и большой набор различного коммуникационного оборудования. Кроме того, для большинства из них характерно постепенное расширение круга пользователей и перечня предоставляемых услуг, увеличение объемов циркулирующей по сети информации и, как следствие всего этого — рост интенсивности трафика в элементах сети.

Трафик (или телетрафик) по определению — движение информационных потоков (сообщений, пакетов) [32,34]. Одним из основных характеристик трафика является его объем А, измеряемый в битах или байтах, переданных или прошедших через данный элемент сети за фиксированное время Т. Тогда интенсивностью трафика I будет называться величина, задаваемая соотношением: і=УТ (1-і)

На практике интенсивность трафика изменяется во времени, т.е. является нестационарным процессом. Чтобы учесть это обстоятельство, интервал разбивают на N подинтервалов длиной AT = Т/С-, после чего для каждого из них определяют текущий объем трафика At, i=l,2,...JSf и соответствующую интенсивность трафика /, = lAT, усредненную на интервале AT. Тогда зависимость I(t) = I(AT-i) = It, когда / пробегает все значения от 1 до iV , будет отражать динамику изменения трафика на всем временном интервале Т . При измерении динамики изменения суточного трафика, как правило, выбирают AT = 1 мин и, следовательно, N = 1440. В качестве единицы измерения интенсивности трафика / чаще всего используют бит/с.

Существует и используется, кроме рассмотренного, и иной вариант определения характеристики интенсивности трафика. Он связан с тем, что в компьютерных сетях вся информация передается отдельными порциями -пакетами. Тогда можно характеризовать интенсивность трафика числом пакетов в единицу времени. Пусть за время Т наблюдалось L пакетов. Тогда среднее на интервале Т значение интенсивности трафика в рамках данного подхода, очевидно, равно X = L/L. Как и раньше, для отслеживания динамики изменения трафика вычисляют текущие средние значения Я,, i= 1,2,...Jf на отдельных подинтервалах: Я, = /т длиной АГ. В качестве единицы измерения интенсивности здесь используется условная единица 1/с (число пакетов, приходящееся на 1 секунду).

При рассмотрении компьютерных сетей используются и то, и другое определение. Первое из них целесообразно применять, когда речь идет о пропускной способности отдельных технических средств сети и каналов связи. Второе удобнее, когда такие элементы сети как коммутаторы, маршрутизаторы и т. п. рассматриваются как системы массового обслуживания (СМО). Тогда интенсивность Я - интенсивность потока заявок, поступающих на анализируемую СМО.

Обе приведенные характеристики, естественно, тесно связаны. Различие между ними обусловлено только тем, что пакеты различных типов, циркулирующие в сети, в общем случае могут иметь разную длину. Очень часто этим различием пренебрегают. Если ввести понятие средней длины пакета Nn = 4 за фиксированный интервал Т, то обе характеристики интенсивности оказываются связанными очевидным соотношением:

Интенсивность трафика в различных точках сети является одним из наиболее важных характеристик ее функционирования. Именно поэтому интенсивность I(t) или Я (t) является предметом различного рода исследований. Можно выделить две разновидности подобных исследований.

Первая из них связана с проведением текущего оперативного мониторинга сети с целью обеспечения оптимальных режимов функционирования, минимизации числа сбоев и ошибок. Вторая разновидность ориентирована на решение более сложных задач, близких по своей направленности к категории научных. Это выявление систематических тенденций в изменении интенсивности, прогнозирование возникновения ситуаций, приводящих к нарушению нормальной работы сети, построения математических моделей трафика и т.п.

Подходы и способы проведения исследований, относящихся к первой разновидности, в достаточной мере формализованы, изложены в соответствующих инструкциях и других документах, регламентирующих деятельность администраторов сети. Что касается задач, относящихся ко второй разновидности, то методические аспекты их решения проработаны относительно слабо. Известно достаточно много публикаций, в которых приведены примеры организации и проведения эксперимента по измерению интенсивности трафика применительно к решению некоторой конкретной, обычно достаточно узкой (специальной) задачи. В частности, в [46] обсуждаются различные варианты определения пропускной способности отдельных сетевых участков и сети в целом в режимах полностью ненагруженной сети и в реальных условиях нагруженной сети. Вопросы организации измерений речевого и видеотрафика обсуждаются в [61]. Там же, приводятся сведения об исследовании трафика Ethernet и Интернет. Аналогичные исследования по измерению Интернет-трафика описаны и в [62].

Формирование структурного представления исследуемой сети и выбор точек съема информации

Объектом исследования являются корпоративные компьютерные сети (ККС), имеющие в своем составе рабочие станции, серверы, коммуникационные устройства, аппаратуру передачи данных и каналы связи.

ККС выполняют функции передачи и обработки информации, необходимой для информационного обеспечения сотрудников организации (корпорации), где данная конкретная сеть функционирует. Развитие организации, расширение спектра информационных услуг, предоставляемых ресурсами ККС, может существенно увеличить нагрузку на оборудование сети, привести к различным нарушениям и сбоям в ее работе, а зачастую и потребовать последующую модернизацию функционирующей сети.

Основой обеспечения высокой эффективности работы ККС является согласование требований к качеству информационного обслуживания, которые предъявляют пользователи, с техническими характеристиками устройств, входящих в состав ККС и выполняющих обработку данных. Поток обрабатываемых данных (трафик), характеризует нагрузку ресурсов ККС. Для оценки ее величины, качества предоставляемых услуг, прогнозирования возникновения ситуаций перегрузки сети необходимо знать динамические характеристики трафика — в первую очередь таких, как: - характер изменения трафика для различных временных интервалов (обычно - для суточного интервала, недельного, месячного); - диапазоны интервалов наибольшей нагрузки (ИНН) в рамках суточного трафика; - интенсивности трафика для наиболее загруженных коммутирующих устройств; - интенсивности трафика для наиболее загруженных устройств, обрабатывающих данные; - типы пакетов, составляющих трафик ККС и др.

Получение динамических характеристик трафика требует решения целого комплекса взаимосвязанных задач. Проблема осложняется высокими скоростями сетевой обработки, высокой интенсивностью потоков данных, территориальной распределенностью ККС, спецификой обмена информацией в той или организации [1,30,39,45,54,90,91]. Несмотря на большой интерес к данному вопросу, как в теоретическом, так и в практическом плане, в настоящее время отсутствуют научно обоснованные методики, предлагающие комплексное решение задач определения характеристик трафика ККС.

Данная глава как раз и посвящена разработке такого рода единой методики экспериментального исследования трафика ККС, включающей в себя: - базовые принципы ее построения, - перечень и анализ основных этапов исследования, - рассмотрение вопросов организации и проведения соответствующего эксперимента, - создание эффективных программных средств для реализации предлагаемой методики. К числу базовых принципов построения данной методики отнесены: 1) Системность, т.е. рассмотрение всей проблемы экспериментального получения динамических характеристик трафика как единого целого. 2) Универсальность применения состоит в том, что разработанная методика и средства ее реализации могут применяться для широкого класса ККС, использующих протоколы Internet. 3) Полнота собираемых данных предусматривает фиксацию в ходе измерения всех необходимых параметров по каждой транзакции. 4) Информационная безопасность означает фиксацию только данных заголовков пакетов и недоступность данных прикладного уровня. 5) Гибкость предусматривает возможность настройки измерительных средств на запись требуемого количества заголовков и использования при анализе любого сочетания параметров транзакций. 6) Техническая безопасность подключения измерительных средств к выбранным точкам измерения, гарантирующая отсутствие нарушений нормального режима функционирования ККС. 7) Мобильность используемых измерительных средств означает применение таких технических решений, которые позволяют легко перемещать эти средства и оперативно подключаться к различным точкам доступа даже при их территориальной распределенности. 8) Унификация используемых технических решений означает построение измерительных средств на базе серийных средств вычислительной техники (персонального компьютера) в сочетании со стандартизованными элементами (платами) его подключения к точкам измерения (доступа). 9) Переносимость программного обеспечения предусматривает использование прикладных программ, обеспечивающих выполнение измерений и/или их обработку, с помощью компьютеров стандартной конфигурации со стандартной операционной средой, т.е. по сути тех компьютеров, которые имеет в настоящее время каждый исследователь. Основными этапами исследований трафика в рамках предложенной методики являются: Определение цели исследования. Анализ структуры исследуемой ККС. Выбор точек съема информации (точек доступа). Обеспечение подключения измерительных средств к выбранным точкам доступа. Определение формата записи данных при измерении трафика. Составление плана проведения экспериментальных исследований. Измерение параметров трафика (экспериментальная часть). Анализ результатов измерений трафика (постэкспериментальная часть). Если говорить о возможных вариантах целевого назначения исследования трафика, то можно выделить две разновидности такого исследования: - локальное, когда исследователя интересует трафик в некоторой конкретной точке сети, загрузка определенного оборудования (коммутатора, маршрутизатора и др.); - полномасштабное, когда требуется получить полное представление об информационных потоках во всей сети в целом и зачастую синхронно во всех точках контроля. Хотя и в первом, и втором вариантах основные этапы исследования трафика сохраняются, однако с содержательной точки зрения они могут различаться весьма существенно.

Постановка задачи. Общие замечания о возможностях применения статистики экстремальных значений для анализа трафика

Среди множества задач, возникающих при анализе трафика в корпоративных компьютерных сетях, весьма важной является задача прогнозирования возникновения критических ситуаций в функционировании сети, связанных с ограниченной пропускной способностью отдельных ее элементов. Предлагается для решения указанной задачи прогнозирования - в первую очередь долгосрочного - использовать математический аппарат статистики экстремальных значений.

Как известно, статистика экстремальных значений представляет собой определенную ветвь классической математической статистики, достаточно интенсивно развивавшуюся в 50 — 60 гг. прошлого века. В наиболее законченной форме ее основные теоретические результаты нашли свое отражение в монографии Э. Гумбеля [20]. Там же рассмотрены и примеры их использования при решении важных прикладных задач, связанных с наблюдениями и прогнозированием паводков, других метеорологических параметров (давление, температура воздуха, снегопады, дожди и т.п.), при проведении прочностных расчетов с учетом экстремальных воздействий в авиа- и кораблестроении, исследовании усталостных разрушений и пр.[5,21,26,38,50,72,73, 76,80,81].

Обширнейший список научной литературы, приведенный в [21] и содержащий 647 наименований, наглядно свидетельствует о том большом интересе к рассматриваемой проблематике, который наблюдался в указанной период времени. По сути в чисто математическом плане задача была решена почти исчерпывающим образом, что привело к последующему затуханию этого интереса - прежде всего со стороны математиков - статистиков.

Только сравнительно недавно интерес к статистике экстремальных значений снова возрос - в первую очередь в прикладном плане. Появились интересные публикации отечественных авторов, в которых наглядно демонстрируются ее возможности для получения новых важных результатов в различных предметных областях.

В качестве характерных примеров можно указать такие области как гидрология [43,48], анализ сейсмоопасности и сейсмостойкости [44], в материаловедении и строительстве, экономике [71].

Представляется достаточно перспективной возможность использования данного подхода и для анализа трафика в компьютерных сетях. Данное утверждение основывается в первую очередь на следующих общих соображениях.

Как отмечалось еще Э. Гумбелем, использование статистики экстремальных значений оказывается наиболее продуктивным при выполнении следующих двух условий: - наблюдаемый процесс обладает свойством цикличности, т.е. определенной повторяемостью своего поведения через некоторый фиксированный интервал времени (интервал цикличности); желательно также, чтобы этот интервал задавался естественным путем, определяясь самой природой процесса, а не вводился искусственно. В частности, в гидротехнике, метеорологии этот интервал цикличности, естественно, равен одному году; - наибольший интерес с точки зрения исследователя (пользователя) представляют именно экстремальные значения, имеющие место на каждом цикле, поскольку они могут привести к серьезным последствиям, скачкообразно возрастающим потерям и т.п. (прорыв дамбы или плотины, с последующим катастрофическим наводнением, обрушение зданий, сооружений и др.).

Именно такого рода ситуация и имеет место, если речь идет о трафике, контролируемом в различных точках компьютерной сети. В данном случае интервал естественной цикличности равен одним суткам.

Очевидно, что, несмотря на индивидуальные различия, прослеживается общая повторяемость суточных графиков; кроме того, присутствуют и выбросы (экстремальные значения), которые могут привести к нарушениям в процессе передачи информации.

Метод базируется на предварительном получении информации о значениях наблюдаемой случайно изменяющейся переменной X в течение N циклов повторяемости. Применительно к анализу интенсивности трафика это могут быть, например, ежесуточные наблюдения общей длительностью N суток. Пусть каждая из отдельных реализаций содержит L наблюдений х/и (I = 1,2,...,L; л = 1,2,...,N). Зафиксируем для каждой реализации максимальное значение Хп и образуем новую выборку, содержащую N максимальных (экстремальных) значений. Строго говоря, эта выборка подчиняется некоторому вероятностному распределению, зависящему ОТ NH функции распределения вероятностей наблюдаемой переменной X. Однако, если N не слишком мало, можно использовать некоторые общие асимптотические результаты, которые зависят только от некоторых достаточно слабых ограничительных допущений относительно исходного распределения.

Доказано, что существует всего три типа асимптотических (т.е. при N, стремящемся к бесконечности) распределений экстремальных значений. а). Асимптотическое распределение типа I или распределение Гумбеля. Это асимптотическое распределение является предельной моделью для максимальных значений Хп, имеющих исходное распределение, правый «хвост» функции плотности распределения вероятностей которой неограничен и носит экспоненциальный характер.

Анализ структуры и свойств нестационарного трафика

Имитационное моделирование, как известно, является одним из наиболее часто используемых способов анализа поведения и оптимизации свойств компьютерных сетей [7]. Существенное место в таком моделировании занимает процедура генерации потоков заявок на обслуживание, обладающих заданными вероятностными характеристиками, адекватно отражающих реальные процессы, имеющие место в различных точках функционирующей сети. Чаще всего полагают, что эти потоки относятся к категории Пуассоновских, когда функция распределения вероятностей интервалов между появлениями требований на обслуживание является экспоненциальной. Тогда, в частности, функция плотности распределения вероятностей выражается формулой Д/) = Яехр[-Л/, где Я -параметр интенсивность потока. При этом другим предположением является предположение о стационарности потока, когда Л - const [34]. Однако на практике данное предположение нереалистично, а если и выполняется, то только на интервалах незначительной длины. Кроме того, считается, что соседние значения интервалов статистически независимы, что также во многих случаях не выполняется.

Сказанное можно наглядно продемонстрировать на примере типичного графика суточного изменения средней интенсивности трафика I(t), полученного в результате мониторинга в одной из точек действующей компьютерной сети (рис. 4.1). Каждая точка является результатом усреднения в течение 1 мин, когда действительно интенсивность Я можно считать постоянной.

Даже чисто визуально обнаруживается нестационарность интенсивности, причем эта нестационарность носит достаточно сложный характер.

В этой связи представляется необходимым провести детальный анализ свойств подобного нестационарного трафика и предложить алгоритм его имитации.

Анализ структуры и свойств нестационарного трафика.

Анализ структуры и свойств трафика будем проводить для начала на примере реализации, изображенной на рис. 4.1. Очевидно, что она содержит по крайней мере две компоненты: детерминированную составляющую d(t) типа систематического дрейфа (тренда) и стохастическую компоненту s{t) с некоторыми вероятностными свойствами.

В первую очередь, как обычно [15,16,19], выделяем детерминированную компоненту. Известны два основных способа ее выделения: параметрическая аппроксимация функции d(t) и применение сглаживающего фильтра типа скользящего среднего.

При использовании параметрического подхода предполагается, что вид функции d(t), описывающей трендовую составляющую анализируемого нестационарного процесса I(t), известен с точностью до параметров Go, 9ь ..., др, т.е. что /(0= d{t; 90, 0ь -, %) + s(t) Тогда задача сводится к задаче оценивания неизвестных параметров во, дь , 9Р по N наблюдениям временного ряда l(l),I(2),...,I(N), t — дискретное время, соответствующее номеру отсчета. Данная задача по сути является задачей получения регрессионной зависимости, детально рассмотренной в научной литературе по математической статистике [6,27,31].

Чаще всего используется линейная параметризация функции ф(0, когда она представляется в виде разложения по некоторой системе базисных функций:

Выбор базисных функций \\im(f) достаточно произволен и во многом зависит от априорной информации о характере тренда. Используют, в частности, разложения по экспоненциальным функциям, синусам и косинусам и т.п. Однако наиболее часто тренд аппроксимируют с помощью полинома степени р. При такой аппроксимации d(t; в„0х,...,вр)= 9т-Г . (4.2)

Оценивание параметров в0, в і, ..., вр , как обычно, производится с помощью стандартного метода наименьших квадратов и сводится к решению системы линейных алгебраических уравнений. В матричной форме будем тогда иметь: 0 = (1 ) 11, (4.3) где 0 = #о, 01V.., #11 — вектор-столбец оцениваемых параметров полиномиального дрейфа; т - знак транспонирования вектора (матрицы), I =/(1),7(2),...ДЛГ)

Похожие диссертации на Анализ и моделирование трафика в корпоративных компьютерных сетях