Электронная библиотека диссертаций и авторефератов России
dslib.net
Библиотека диссертаций
Навигация
Каталог диссертаций России
Англоязычные диссертации
Диссертации бесплатно
Предстоящие защиты
Рецензии на автореферат
Отчисления авторам
Мой кабинет
Заказы: забрать, оплатить
Мой личный счет
Мой профиль
Мой авторский профиль
Подписки на рассылки



расширенный поиск

Модели и методы исследования качества Интернет-подключения корпоративной сети Грачев Владимир Геннадьевич

Модели и методы исследования качества Интернет-подключения корпоративной сети
<
Модели и методы исследования качества Интернет-подключения корпоративной сети Модели и методы исследования качества Интернет-подключения корпоративной сети Модели и методы исследования качества Интернет-подключения корпоративной сети Модели и методы исследования качества Интернет-подключения корпоративной сети Модели и методы исследования качества Интернет-подключения корпоративной сети Модели и методы исследования качества Интернет-подключения корпоративной сети Модели и методы исследования качества Интернет-подключения корпоративной сети Модели и методы исследования качества Интернет-подключения корпоративной сети Модели и методы исследования качества Интернет-подключения корпоративной сети
>

Диссертация - 480 руб., доставка 10 минут, круглосуточно, без выходных и праздников

Автореферат - бесплатно, доставка 10 минут, круглосуточно, без выходных и праздников

Грачев Владимир Геннадьевич. Модели и методы исследования качества Интернет-подключения корпоративной сети : дис. ... канд. техн. наук : 05.13.01 Самара, 2006 209 с. РГБ ОД, 61:07-5/138

Содержание к диссертации

Введение

Глава 1. Анализ особенностей Интернет-подключения корпоративной сети 22

1.1. Разработка общих требований к моделям Интернет-подключения корпоративной сети 22

1.2. Анализ структуры Интернет-трафика корпоративной сети 26

1.3. Анализ потока запросов на открытие сессий от пользователей корпоративной сети 28

1.4. Выбор параметров для описания пользовательских сессий 29

1-5- Оценка влияния режима работы Интернет-подключения

корпоративной сети на параметры пользовательских сессий 30

Выводы 34

Глава 2. Математические модели Интернет-подключения корпоративной сети 36

2.1. Общее выражение для моментов скорости передачи данных Интернет-подключения корпоративной сети при отсутствии зависимости между временами обслуживания пользовательских сессии

2.2. Выражение для моментов количества пользовательских сессий, находящихся на оослуживании одновременно

2.3. Математическая модель Интернет-подключения в режиме незагруженной корпоративной сети 41

2-3.1. Выражение для моментов скорости передачи данных Интернет-подключения корпоративной сети через среднее значение квадрата скорости различных типов пользовательских сессий 41

2.3.2. Вывод выражения для среднего значения квадрата скорости UDP сессии 44

2.3.3. Вывод выражения для среднего значения квадрата скорости сессии типа TCP 1 44

2.3.4. Вывод выражения для среднего значения квадрата скорости сессии типа TCP 2 48

23-5. Выражение для моментов скорости передачи данных Интернет-подключения корпоративной сети через параметры пользовательских сессий 53

2.4. Математическая модель Интернет-подключения в режиме перегрузки в сети поставщика услуг Интернет 54

2.5. Математическая модель Интернет-подключения в режиме перегрузки корпоративной сети 55

2.6. Условия качества Интернет-подключения корпоративной сети - 59

Выводы 62

Глава 3. Экспериментальное обоснование математических моделей Интернет-подключения корпоративной сети 64

3.1, Постановка эксперимента 64

3-2. Обработка результатов эксперимента и выводы об адекватности моделей

Выводы 83

Глава 4. Методы исследования качества Интернет-подключения корпоративной сети 84

4-1 Метод текущего контроля качества Интернет-подключения 84

4.2. Метод выбора оптимальной скорости передачи данных Интернет-подключения корпоративной сети 89

4.3. Примеры практического применения методов исследования

качества Интернет-подключения корпоративной сети 109

4.3Л. Выбор скорости передачи данных Интернет-подключения Самарского государственного аэрокосмического

университета 109

4.3.2. Выбор скорости передачи данных Интернет-подключения

межвузовского медиацентра 111

Выводы 117

Заключение 118

Библиографический список 121

Приложения

Введение к работе

Сегодня трудно представить себе крупное образовательное учреждение, научную организацию, фирму и т. д., которые не имели бы подключения к сети Интернет. С одной стороны, сеть Интернет открывает доступ к огромному объему информации, с другой стороны, предоставляет возможность разместить собственные информационные ресурсы. Однако, успешное использование сети Интернет в деятельности организации невозможно при невысоком качестве ее Интернет-подключения, В будущем следует ожидать все более глубокого проникновения сети Интернет во все сферы человеческой деятельности, так что «качество» подключения к сети Интернет выходит на первый план.

Изначально, первыми начали разрабатываться методы и средства контроля качества соединения между двумя точками сети Интернет. Действительно, с точки зрения пользователя, Интернет-подключение сети является качественным, если оно обеспечивает бесперебойный и быстрый доступ к определенным интересующим его сетевым ресурсам. Производилось наблюдение за значениями таких характеристик (сетевых метрик) соединения между двумя точками сети Интернет, как время доставки, коэффициент потерь IP пакетов, доступность, максимальная скорость передачи данных по определенному протоколу и т.д., а также за их флуктуациями во времени.

Однако, за последние 10-15 лет сеть Интернет претерпела значительный рост. Это касается количества подключенных сетей, пользователей, компьютеров, используемых в сети приложений и передаваемого по сети трафика. Например, количество зарегистрированных доменных имен на июль 2005 года, по данным Internet Software Consortium, достигло 353284187 [77]. Все это привело к тому, что среднее число пользователей в сети организации и количество ресурсов, потенциально интересных для пользователей, многократно возросло. С

6 учетом того факта, что все вышеперечисленные простейшие сетевые метрики зависят от времени и, в силу децентрализации управления сетью Интернет (о принципах управления сетью Интернет см. [76]), от множества других независимых подсетей, входящих в глобальную сеть Интернет, контроль качества Интернет-подключения в рамках традиционного подхода становится для системного администратора непростой задачей. Возникает необходимость в аналитическом описании происходящих в сети процессов, причем этот анализ должен проводиться в рамках системного подхода.

Действительно, глобальная компьютерная сеть Интернет представляет собой совокупность отдельных подсетей (рассматривая сеть Интернет с различной степенью детализации, можно выделить сети континентов, стран, поставщиков услуг Интернет, организаций и их подразделений), обменивающихся друг с другом информацией, передаваемой по объединяющих их каналам передачи данных. Таким образом, сеть Интернет можно рассматривать как систему, состоящую из множества тесно взаимодействующих подсистем - отдельных входящих в нее подсетей, объединенных в иерархическую структуру.

Согласно одному из основных принципов системного подхода, всегда существует функция ценности системы в виде зависимости ее эффективности от условий построения и функционирования.

Данная работа посвящена аналитическому описанию процессов, происходящих в Интернет-канале крупной организации или поставщика услуг Интернет, как основной составляющей глобальной компьютерной сети Интернет, и отысканию критерия «качества» Интернет-подключения корпоративной сети с точки зрения интересов всех пользователей сети, в виде некоторой «интегральной» характеристики.

Получив, в рамках математических моделей, аналитические выражения для данной «интегральной» характеристики через основные параметры сети и параметры Интернет-подключения этой сети, становится

возможным решение основных задач, возникающих перед сетевыми администраторами и инженерами, таких как поддержка, прогнозирование развития и оптимизация сетей.

Первая задача возникает в повседневной практике сетевых администраторов и предполагает обнаружение и устранение аномалий в работе сети. Также для обслуживающего персонала сети необходимо иметь возможность предсказывать поведение сети при изменении различных параметров, как-то: количества пользователей, подключенных к сети, характеристик Интернет-подключения, запуске новых сетевых приложений и т.д. Данная информация может быть использована при планировании развития сети для удовлетворения потребностей пользователей в сетевых услугах.

Также, системный администратор должен иметь возможность выбрать поставщика услуг Интернет и оптимальную скорость Интернет-канала при заданных параметрах сети.

Применение математических моделей Интернет-подключения сети не ограничивается вышеприведенными примерами. Можно представить, что вычисление в реальном масштабе времени метрик, характеризующих текущее состояние сети, может быть использовано в сетевых устройствах (коммутаторах, маршрутизаторах) для динамического перераспределения ресурсов или изменения алгоритмов работы для обеспечения заданного качества функционирования сети.

Вообще, математических моделей поможет глубже понять процессы, происходящие в сети, и пути совершенствования существующих протоколов, приложений, сетевых архитектур для достижения максимальной производительности сетей.

Как уже было замечено выше, традиционный подход в обслуживании и поддержке сетевой инфраструктуры состоит в наблюдении за простейшими сетевыми метриками. Международные

стандарты [78,50] описывают и классифицируют данные метрики, а также устанавливают среду для их измерения.

Элементарные метрики можно разделить на 2 большие группы:

метрики, служащие для оценки качества соединения между
двумя удаленными точками;

метрики для мониторинга канала между двумя маршрутизаторами.
Существует множество работ, посвященных использованию

элементарных метрик в эксплуатации каналов связи (например, см. [67,56, 89, 75, 99, 52, 62, 51, 98, 48, 31, 37, 38]), Также разработано множество средств для измерения элементарных и более сложных сетевых метрик [60, 97,91].

Существуют методики, формализующие и автоматизирующие процесс оценки качества Интернет каналов, В [43] измеряют 3 характеристики:

доступность;

максимальную эффективную производительность;

среднее время реакции.

Доступность - показатель, характеризующий надежность работы канала связи, получается в данной методике измерением времени ответа на запросы по протоколу ICMP. Максимальная эффективная производительность измеряется как максимальная скорость передачи данных на уровне протокола TCP, Среднее время реакции, мера того насколько быстро канал связи работает во время его ежедневной эксплуатации, измеряется с помощью программ, установленных в тестируемой сети и автоматически генерирующих запросы на доступ к внешним ресурсам по протоколам TCP (в этом случае необходима установка специального программного обеспечения на площадке тестируемого поставщика услуг Интернет) или HTTP (для тестирования может использоваться любой WWW сервер). Все измерения производятся с помощью общедоступных программ SelfTrend и PageLoadRobot.

Хотя, принципиально, аккуратное наблюдение за сетевой инфраструктурой и анализ элементарных метрик сетевого трафика позволяет сетевым инженерам отслеживать "узкие места" в сети, обнаруживать некоторые проблемы, прежде чем они наступают и предупреждать перегрузку сети, перераспределяя ресурсы и оптимизируя конфигурацию сети, однако, это чрезвычайно трудоемкий процесс, требующий от сетевых инженеров высокой квалификации и большого опыта, и в то же время такой подход позволяет отслеживать только грубые тенденции сетевого трафика и не дает возможности предсказывать поведение сети при изменении ее параметров и/или конфигурации.

Большая часть трафика в сети Интернет передается с помощью протокола TCP [49, 86, 111, 69, 87, 66, 68, 58, 57, 59, 12, 13], поэтому, имея аналитическую модель протокола TCP [104]? можно надеяться, что ее удастся применить к описанию процессов, происходящих в Интернет-канале организации.

На настоящий момент было представлено несколько моделей одного соединения по протоколу TCP, Часть из них дает выражение для пропускной способности TCP соединения в установившемся режиме [82, 95> 85, 96] как функцию времени доставки пакета от источника к пункту назначения и обратно {Round Trip Time, RTT) и коэффициента потерь пакетов. В данных работах рассматривается TCP соединение, передающее большой объем данных в установившемся режиме работы протокола TCP (Congestion avoidance). В работах [82, 95, 85] учитывается влияние на скорость передачи данных TCP соединения только механизма быстрой повторной передачи (fast retransmit), в [96] учитывается также влияние механизма тайм-аута.

В связи с увеличением популярности протоколов прикладного уровня, в которых за время одной TCP сессии передается сравнительно небольшой объем информации (порядка нескольких десятков килобайт, HTTP - наиболее популярный из таких протоколов, см. исследование

трафика в [86, 87, 66, 68, 12, 13]), так что TCP не успевает прийти в установившийся режим, появились работы, ориентированные на описание коротких TCP сессий, которые не могут быть адекватно представлены моделями, предложенными в [82, 95, 85, 96]. В работах [61, 45, 83] представлены модели для коротких TCP соединений при условии (весьма нереалистичном) отсутствия потерь пакетов. В работе [54] дается выражение для длительности короткого TCP соединения, передающего данные в режиме "медленный старт" как функции времени доставки и ответа (RTT), коэффициента потерь пакетов, объема передаваемых данных и времени тайм-аута.

Наряду с моделями, описывающими одно TCP соединение, в работах [73, 34, 79, 80, 64, 70] рассмотрен случай, когда несколько TCP сессий работают одновременно, разделяя одну линии связи, находящуюся в режиме перегрузки- В работе [73] рассматривается случай фиксированного количества источников, попеременно инициирующими TCP сессии и остающимися неактивными в течение случайного интервала времени. В работе [84] предлагается похожая модель, но для случая, когда приход новых сессий образует пуассоновский процесс. В работах [79, 80] изучается процесс передачи нескольких TCP сессий и делается вывод о пригодности модели разделения процессора, если приход новых TCP сессий образует пуассоновский поток событий. Статья [64] посвящена изучению совместной работы нескольких TCP сессий, когда в сети существует не одна, а несколько перегруженных линий связи, В работе [70] суммируются результаты предыдущих исследований и делается вывод о применимости моделей, предложенных в них, в реальных условиях.

Описанные выше модели дают пропускную способность, занимаемую при передаче нескольких TCP сессий. К сожалению, данные модели трудно использовать на практике для управления сетью, так как они не учитывают другие транспортные протоколы, такие как UDP [105],

11 требуют сложных вычислений и основаны на предположении, что время доставки и ответа (RTT) постоянно для всех TCP сессий.

Развитием традиционного метода тестирования

производительности Интернет-подключения с помощью сетевых метрик является метод, описанный в [74]. Предлагаемый метод тестирования включает три шага:

Составить список Интернет ресурсов, к которым пользователи сети обращаются наиболее часто. Количество ресурсов в списке должно быть большим, но ограниченным. Автор утверждает, что список из 1000 ресурсов (IP адресов) покрывает 70% интересов большой группы пользователей.

Для каждого ресурса из списка измерить три сетевые метрики: доступность (connectivity), задержку - интервал времени между посылкой запроса и приемом ответа (Round Trip Time, RTT), коэффициент потерь пакетов. Для измерения этих метрик автор разработал свою собственную программу jping, которая посылает к каждому тестируемому ресурсу UPD запросы на сервис Echo, который является стандартным типом "малых сервисов". В случае если сервис Echo отключен, принимается ICMP ответ "порт недоступен" (port unreachable).

По измеренным метрикам сетевого уровня определить производительность конкретных приложений. Предлагается вычислять верхнюю границу скорости передачи по протоколу TCP, зависящую от задержки и коэффициента потерь пакетов, и возможность функционирования приложений реального времени, таких как передача аудио и видео информации, строя график доступности ресурсов для приложений реального времени в зависимости от времени суток, где критерием доступности являются значения коэффициента потерь пакетов (меньше 5%) и вариации задержки (в пределах 200 мс).

Среди преимуществ данного подхода можно отметить то, что методика учитывает интересы пользователей в сети (наиболее посещаемые ресурсы) и то, что данная методика является формальной, то есть она свободна от субъективного мнения персонала, занимающегося тестированием.

К сожалению, у методики существует несколько серьезных недостатков:

Производится активное тестирование сети, что, во-первых, дополнительно загружает сеть, во-вторых, тестовый трафик искажает картину измерений, причем, тем больше, чем больше ресурсов тестируется (производится более точное тестирование),

Часто, из соображений безопасности, сервис UDP Echo отключается, в результате по протоколу ICMP посылается ответ "порт недоступен". Поскольку ICMP трафик трактуется особым образом (его приоритет обычно ниже, чем приоритет UDP или TCP трафика), в данном случае вносятся дополнительные искажения в измерения.

Оценки, даваемые для производительности конкретных приложений, являются слишком общими и не учитывают особенностей различных приложений и интересов пользователей,

В работах [2,7,22,29,33,34,35,36,41] предложен и развит подход, основанный на статистическом анализе временных рядов, где в качестве значений временного ряда используется объем трафика сети -объем информации в единицу времени, проходящий через каналы связи сети.

Авторы работ [7, 33, 34, 35, 36] исследуют трафик российской национальной научно-образовательной сети Rbnet [39] (предложенный подход является общим и может быть использован для любой сети) и ставят перед собой следующие цели и задачи:

  1. Поддержка детальной базы данных сетевой активности, которая позволит получать информацию о текущей загрузке сети, сбоях, активности отдельных подсетей и т.д.

  2. Разработка методик, алгоритмов и программ обработки собранных данных и построение на их базе объективных прогнозов развития сети,

  3. Агрегация и визуализация информации о текущем состоянии сети в целях оперативного контроля и регулярной подготовки кратких аналитических отчетов.

А, Подготовка рекомендаций для принятия стратегических решений развития сети по результатам накопленной информации.

Авторы делают вывод, что характерной чертой моделей временных рядов, описывающих трафик, является их нестационарность. При этом детерминированная компонента трафика как правило включает тренд (плавный рост/падение, обусловленные долговременными причинами), различные сезонные компоненты (то есть колебание в течение суток, недели, месяца года), циклические компоненты (нерегулярные подъемы и спады с различной периодичностью и интенсивностью), а так же интервенции (то есть резкие изменения в условиях функционирования сети).

Тренд обычно задается в виде достаточно простой аналитической зависимости. Его наличие в трафике связано с процессом развития телекоммуникационных технологий, увеличением скорости доступа к сети, числа пользователей, ресурсов и т.п. На базе этой компоненты трафика авторы предлагают осуществлять долговременный прогноз загрузки канала, причем на разных стадиях развития канала могут быть использованы различные модели тренда: линейные, полиномиальные, экспоненциальные, S-образные (логистические, Гомперца) и др.

Сезонная компонента трафика возникает за счет цикличности присущей человеческой деятельности. Анализ трафика канала в течение суток обычно показывает наличие спада загрузки канала в ночные часы. Иногда может наблюдаться и несколько заметных спадов трафика в различное время суток. Анализ трафика канала в течение недели показывает спад загрузки канала в выходные дни-Авторы предлагают три модели:

1. Модели динамики среднесуточной загрузки магистральных
каналов телекоммуникационных сетей [33? 29].

Авторы показывают, что в загрузке всех исследуемых каналов можно выделить несколько характерных однотипных стадий. При этом каждая стадия описывается и прогнозируется моделью, включающей параболический (на стадии роста) или линейный (на стадии падения загрузки) тренд и авторегрессионую компоненту,

2. Модель роста числа хостов в научно-образовательных сетях
России в 2000 г. [35].

Для описания динамики роста числа хостов как функции времени авторы используют параболическую модель линейной регрессии с отрицательным коэффициентом при квадратичном члене.

3. Модель скорости передачи данных конечным пользователям
сетей на канале RBnet-Teleglobe [34].

Математическая модель в этой задаче представляет множественную линейную регрессию, в которой в качестве предикторов выступают: доля протокола http в совокупном трафике на "входе" канала, доля "request" по протоколу http на "выходе" канала и совокупные времена соединений по протоколу http на "входе" и "выходе" канала, В зависимости от структуры загрузки канала в качестве предикторов могут

выступать и другие характеристики трафика: объем переданной информации, число соединений, общее число переданных пакетов и пр. Главное достоинство описанного выше подхода - это возможность

давать прогнозы развития сети, однако, можно отметить и следующие его

недостатки:

Для разных сетей необходим пересчет параметров моделей, причем возможна такая ситуация, при которой предложенные модели не будут адекватно описывать сеть и будет необходима их корректировка (оставаясь в рамках предложенного подхода).

Для вычисления параметров моделей необходим длительный сбор статистики, причем, модели будут тем точнее, чем дольше производится наблюдение,

Не указано влияние конкретных сетевых параметров на наблюдаемые закономерности- Вообще, можно сделать вывод, что в рамках данного подхода это сделать сложно.

Принципиально, в рамках данного подхода можно давать прогноз, только если характер зависимости значения сетевого параметра от времени остается тем же самым, как на предыдущем интервале наблюдения. Если же изменение наблюдаемого сетевого параметра вызвано другими причинами, чем его изменение в предшествующий период, то данный подход будет не в состоянии дать верный прогноз.

В работах [46, 1, 42] предлагается модель для незагруженного магистрального канала связи, передающего IP трафик. Авторы ставят перед собой задачу создания модели, достаточно простой (чтобы ее могли использовать сетевые администраторы), и, насколько это возможно, независимой от используемых протоколов и приложений.

Сетевой IP трафик рассматривается на уровне потоков данных (flow) - потоком может быть TCP или UDP соединения» описываемые IP

16 адресами источника и назначения (или даже подсетями источника и назначения), номерами портов и т.д.

Модель построена на двух основных предположениях:

  1. Приходы новых потоков данных образуют однородный пуассоновский процесс конечной скорости Л.

  2. Функции скорости потоков независимы друг от друга и одинаково распределены. Из независимости функций скорости потока также следует независимость последовательностей длин {SJ и длительностей {DJ потоков.

Функция скорости потока Хй(і-Тй) - скорость потока п,

определенная на интервале времени [t;,7;+z>J, где тя - момент прихода

потока, Dn - длительность потока.

Общая скорость передачи данных на магистральном канале будет равна сумме отдельных функций скоростей потоков: R(t) = J] Хп (t - Тп).

Далее авторы вычисляют два первых момента (среднее значение и дисперсию) общей скорости передачи данных магистрального канала через преобразование Лапласа и получают для них следующие выражения:

E{R(t)] = M[SM]9 Vr=*e[s2JDk].

Выражение для дисперсии {VR) зависит от формы функции скорости потока. Авторы рассматривали прямоугольную, треугольную и степенные формы функции скорости потока. При экспериментальной проверке своей модели авторы использовали параметризированную по двум коэффициентам степенную функцию скорости потока. Коэффициенты параметризации находились по опытным данным так, чтобы минимизировать ошибку между экспериментально полученными средним значением и дисперсией скорости магистрального канала, и оценками этих величин, вычисляемым по модели.

Основные достоинства предложенного в данной работе подхода: простота и общность. В то же время этот подход является достаточно

мощным и отвечает на многие вопросы, возникающие при эксплуатации магистральных (и не только) IP каналов.

Однако, в данной работе можно отметить серьезные недостатки: в модели не учитываются особенности конкретных протоколов, использующихся на сегодняшний момент в глобальной компьютерной сети Интернет. Рассмотрен только случай незагруженного магистрального канала связи, в то время как для реальных сетей существенно важной задачей является нахождение границы, разделяющей состояния незагруженной и перегруженной сети. Так как коэффициенты параметризации функции скорости потока в модели находятся по экспериментальным данным, можно утверждать, что эти коэффициенты придется пересчитывать отдельно для каждой конкретной сети и возможно для разных ее состояний.

Анализируя достоинства и недостатки каждого из описанных выше подходов применительно к задачам поддержки, прогнозирования развития и оптимизации сетей, можно сделать вывод, что эти задачи не решены полностью как в рамках какого-либо одного подхода, так и объединением различных существующих уже моделей.

Данная работа посвящена созданию математических моделей Интернет-подключения для получения аналитической связи основных параметров сети и параметров Интернет-подключения этой сети со скоростью передачи данных, как с «интегральной» характеристикой, которая описывает «качество» Интернет-подключения с точки зрения интересов всех пользователей сети. Разработке методов исследования качества работы Интернет-подключения корпоративной сети на основе данных моделей.

Результаты, полученные в работе, могут быть использованы сетевыми администраторами и инженерами для поддержки, прогнозирования и оптимизации качества Интернет-подключения корпоративной сети.

Объект и предмет исследования

Объектом исследования являются процессы, происходящие во внешнем канале передачи данных корпоративной сети, работающем на основе стека протоколов TCP/IP.

Предметом исследования являются числовые характеристики (моменты) случайной величины - скорости передачи данных Интернет-подключения корпоративной сети.

Цель диссертационной работы

Анализ процесса передачи данных по протоколам TCP/IP во внешнем Интернет-канале корпоративной сети, с учетом поведения пользователей в сети и особенностей алгоритмов работы протоколов. Получение оценок качества Интернет-подключения корпоративной сети. Разработка методов исследования качества Интернет-подключения корпоративной сети для повышения уровня обслуживания пользователей и оптимизации использования ресурсов предприятия

Задачи исследования

Формулировка требований к математическим моделям, определение факторов, оказывающих влияние на процессы, происходящие в сети и их характеристики.

Создание математических моделей Интернет-подключения корпоративной сети.

Формулировка условий качества Интернет-подключения с точки зрения "коллективного" пользователя.

Экспериментальная проверка созданных математических моделей,

Разработка метода текущего контроля качества Интернет-подключения.

Разработка метода выбора оптимальной скорости передачи данных Интернет-подключения корпоративной сети.

Методы исследования

В диссертационной работе используются методы математического моделирования, теории вероятности и математической статистики, теории массового обслуживания, элементы системного подхода в прикладных исследованиях, методы принятия оптимальных решений в условиях неопределенности, многокритериальной оптимизации, технологии создания программного обеспечения.

Научная новизна

Предложены модели Интернет-подключения корпоративной сети, которые, в отличие от уже существующих моделей, учитывают поведение пользователей в сети и особенности стека протоколов TCP/IP.

Разработан метод текущего контроля качества Интернет-подключения.

Разработан метод выбора оптимальной скорости передачи данных Интернет-подключения корпоративной сети.

Достоверность результатов

Достоверность всех результатов обоснована формальными выводами и заключениями, сопоставлением полученных общих результатов с частными случаями, приведенными другими авторами, экспериментальной проверкой.

Практическая ценность

Практическая ценность работы заключается в разработке методов текущего контроля качества Интернет-подключения и выбора оптимальной скорости передачи данных Интернет-подключения корпоративной сети, которые могут быть использованы, соответственно, при ее эксплуатации и для выбора оптимальной скорости подключении к Интернет.

Реализация работы

Результаты работы внедрены и используются при текущей эксплуатации и обслуживании сети Самарского государственного аэрокосмического университета и ЗАО СамараТелеком, что подтверждено актами внедрения, см. приложение 7.

Сбор внешнего входящего трафика сети производится с помощью пакета nrpobe [93], анализ трафика производится в режиме offline в полуавтоматическом режиме с помощью специально написанных утилит на языке программирования perl [100], Утилиты реализуют расчет сетевых параметров по методам, описанным в данной работе, см, приложение 6.

Апробация работы

Основные положения диссертационной работы, научные и практические результаты докладывались и обсуждались на международном рабочем семинаре "Цифровые сети в Среднем Поволжье" (г. Самара, 1998 год), на международной конференции Телематика (г. Санкт-Петербург, 2001, 2002, 2003 года), на всероссийской научно-технической конференции "Актуальные проблемы радиоэлектроники и телекоммуникаций" (г, Самара, 2005 год).

На защиту выносятся

Модели Интернет-подключения корпоративной сети, учитывающие поведение пользователей в сети и особенности стека протоколов TCP/IP.

Метод текущего контроля качества Интернет-подключения,

Метод выбора оптимальной скорости передачи данных Интернет-подключения корпоративной сети.

Публикации

По теме диссертационной работы опубликовано 8 научных работ.

Структура и объем работы

Диссертация состоит из введения, четырех глав, заключения, библиографического списка (111 наименований), семи приложений. Текст диссертации изложен на 209 страницах, включая 79 страниц приложений, содержит 29 рисунков и 1 таблицу.

Разработка общих требований к моделям Интернет-подключения корпоративной сети

Пользователи корпоративной сети посредством отдельных линий связи или линии связи с разделяемой средой передачи (ethernet) подключены к маршрутизатору, который в свою очередь подключен к поставщику услуг Интернет, Передача данных происходит в обоих направлениях, на что указывает применение двунаправленных стрелок.

Основной целью исследования будем считать создание математических моделей Интернет-подключения корпоративной сети удобных для практического применения, т.е. при использовании сетевыми администраторами или на сетевых устройствах. Отсюда следует, во-первых, что модель должна полагаться на пассивные измерения сетевых характеристик, так как активные измерения потребляют дополнительные ресурсы и нарушают текущую работу сети, во-вторых, модель должна оперировать сетевыми характеристиками, значения которых могут быть легко получены с использованием доступных на сегодняшний момент программных и аппаратных средств, и, в-третьих, модель должна быть простой в математическом плане, то есть не потреблять большие вычислительные ресурсы.

Как известно, протокол IP, лежащий в основе глобальной компьютерной сети Интернет относится к протоколам пакетной коммутации, то есть данные передаются по сети в виде отдельных фрагментов - пакетов, причем пакеты, на которые было разбито сообщение, передаются независимо друг от друга и, соответственно, независимо подвергаются воздействию различных случайных факторов, влияющих, в конечном итоге, на время их доставки (см. [103]). Среди таких случайных факторов можно, в качестве примера, привести изменение маршрута прохождения пакетов по сети, причем каждый такой маршрут характеризуется своим набором линий связи, по которым передается пакет, и каждая из которых имеет различные характеристики (скорость передачи данных, коэффициент потерь пакетов), взаимное влияние пакетов из разных сообщений разных пользователей, перегрузки, возникающие в сети по маршруту прохождения пакета, зависимость параметров от используемого транспортного протокола, конкретного приложения и т.д. Все это усугубляется огромным размером сети Интернет (на 2003 год было зарегистрировано 171000000 хостов, см. [77]) и отсутствием централизованного административного управления, о принципах административного управления сетью Интернет см. [76].

В виду такой "случайной" природы сети Интернет вполне естественно для ее описания привлечь математический аппарат теории вероятности и пытаться найти закономерности происходящих в ней процессов не на уровне отдельных пакетов или сообщений, а в "среднем", выражая числовые характеристики (моменты) исследуемых параметров, такие как среднее значение, дисперсия и т.д.

Качество работы сети с точки зрения пользователя, работающего с сетевым приложением, выражается через объем данных, передаваемых по сети в единицу времени. Отсюда естественно перейти к исследованию скорости передачи данных как основной характеристики сеги (здесь, под скоростью передачи данных мы подразумеваем объем полезной информации передаваемой в единицу времени, которая зависит от множества факторов, в отличие от физической скорости передачи данных канала связи, которая является константой; очевидно, скорость передачи данных не может превышать физической скорости капала связи).

Важный фактор, который необходимо обязательно учитывать при разработке математической модели сети - структура трафика, то есть распределение трафика по протоколам, использующимся в сети. Действительно, во-первых, протоколы сильно различаются по своим алгоритмам работы и параметрам, характерный пример - протоколы транспортного уровня UDP (см. [105]) и TCP (см, [104]), а, во-вторых, по объему трафика, передаваемого с использованием данного протокола. Очевидно, что, если мы хотим получить общую картину сетевого трафика, а не интересуемся особенностями работы конкретного протокола, то нет смысла принимать во внимание протоколы, посредством которых передается малый объем данных, и, наоборот, именно протоколы, несущие наибольший объем данных, формируют закономерности сетевого трафика в Интернет.

Поскольку сетевой трафик генерируется людьми, то, помимо чисто технических аспектов работы сети, необходимо учитывать и "социальный" аспект, то, как этот трафик генерируется и какую информацию запрашивают пользователи» Это можно сделать, если перейти от исследования сети на уровне пакетов к исследованию па уровне сообщений или пользовательских сессий, то есть тех логических блоков информации, из передачи которых и состоит работа пользователя в сети. Вообще, пользовательская сессия - поток данных от одного источника, инициированный пользователем (загрузка файла по протоколу FTP, html странички по протоколу HTTP и т.д.). Причем закономерности в поступлении запросов от пользователей на открытие сессий, покажет нам, как генерируется сетевой трафик, а длительности сессий (по времени и объему передаваемых данных) будут зависеть от того, какая информация запрашивается пользователями.

Общее выражение для моментов скорости передачи данных Интернет-подключения корпоративной сети при отсутствии зависимости между временами обслуживания пользовательских сессии

Как было описано в параграфе 1.5, в состоянии перегрузки скорость передачи данных отдельной пользовательской сессии vn определяется не только ресурсом, к которому обращается данная пользовательская сессия, но и длиной очереди перед сетевым интерфейсом граничного маршрутизатора организации, которая зависит, в том числе, и от количества пользовательских сессий, находящихся на обслуживании в данный момент времени. Случайные величины N и vn оказываются зависимыми, формулы (4) и (5) не применимы для данного состояния сети.

Скорость передачи данных корпоративной сети можно рассматривать как случайную функцию времени. Можно выделить такие промежутки времени, на которых данная функция будет обладать свойствами стационарности и эргодичности, то есть, все ее вероятностные характеристики не будут зависеть от времени, а их значения, рассчитанные по одной реализации, будут равны значениям вероятностных характеристик, рассчитанным по совокупности реализаций.

При перегрузке в корпоративной сети, скорость передачи данных на некоторых интервалах времени ограничена физической скоростью внешнего канала (см. рис. 9, интервалы 2..І3, 5..І6). Данные, которые не были переданы в течение этих интервалов времени, передаются на следующих за ними интервалах (интервалы tyjAitb.j7 на рис. 9). На интервалах t j2t VA скорости передачи данных в обоих режимах работы сети совпадают. В рамках рассматриваемой модели, независимо от режима работы сети, все данные, поступающие в систему, всегда передаются из нее, следовательно, объем данных, переданных процессами v,(0 и v2(0, одинаков, а значит и средняя скорость передачи данных процессов v,(f) и v2 (г), определяемые как отношения объема переданных данных к длительности промежутка времени Т, также имеет одно и то же значение, равное среднему объему данных, поступающих в систему в единицу времени.

Выразим средние значения квадрата скорости сессии одной и той же реализации в незагруженном режиме v,(/) и режиме перегрузки v2(r).

To есть, при одних и тех же значениях сетевых параметров, среднее значение квадрата скорости передачи данных Интернет-канала организации в незагруженном режиме больше, чем в режиме перегрузки. Таким образом, учитывая, что средняя скорость передачи в обоих режимах работы сети одинакова» можно заключить» что и дисперсия скорости передачи данных в незагруженном режиме также превышает дисперсию скорости передачи в режиме перегрузки.

Когда физическая скорость внешнего канала vM стремится к средней скорости передачи данных v, среднее значение квадрата скорости передачи стремится к квадрату среднего значения скорости, следовательно, дисперсия скорости передачи стремится к нулю.

При дальнейшем уменьшении vg/t ниже средней скорости передачи данных, достигаемой сетью в случае отсутствия ограничений, передача данных происходит с потерями, что эквивалентно уменьшению средней длины пользовательской сессии и, соответственно, средней скорости передачи данных, см. формулу (45), Дисперсия скорости передачи данных в этом случае остается по-прежнему равной нулю.

Построим графики изменения среднего значения и среднего квадратического отклонения скорости внешнего канала сети, а также средней скорости пользовательской сессии в зависимости от интенсивности потока поступления заявок на обслуживание пользовательских сессий Л, основываясь на аналитических результатах, полученных в предыдущих параграфах (см. рисунки 10-12).

На каждом из графиков можно выделить три участка, соответствующих незагруженной сети, участок I, режиму перегрузки, участок II, и полностью перегруженному состоянию сети, участок IIL

На рисунке 10 показан график зависимости средней скорости внешнего канала организации, формулы (16) и (45). На участках I и II средняя скорость внешнего канала изменяется линейно в зависимости от интенсивности входного потока запросов с коэффициентом пропорциональности равным I (средняя длина сессии). Для полностью перегруженного состояния сети средняя скорость внешнего канала организации равна физической скорости внешнего канала связи vw.

Средняя скорость пользовательской сессии (рис, 12) постоянна в незагруженном состоянии сети (участок I) и полностью определяется интересами пользователей и точкой подключения (сетью поставщика услуг Интернет), см. (14). В состоянии перегрузки (участок II) скорость пользовательской сессии зависит от общего числа пользовательских сессий, находящихся на обслуживании одновременно, и уменьшается с увеличением интенсивности входного потока запросов на обслуживание пользовательских сессий, В состоянии полной перегрузки, участок Ш, скорость отдельной пользовательской сессии падает до нуля.

Приведенные выше результаты позволяют сформулировать следующие условия качества Интернет-подключения корпоративной сети с точки зрения "коллективного" пользователя:

L Средняя скорость одной пользовательской сессии, вычисляемая по формуле (14), должна быть больше минимального значения, необходимого для успешной деятельности организации. Значение, вычисляемое по формуле (14), учитывает интересы всех пользователей сети, поэтому может использоваться в качестве «интегральной» метрики, определяющей качество работы сети организации в целом. 2, Корпоративная сеть должна находиться в незагруженном состоянии. Выполнение этого условия гарантирует то, что:

Средняя скорость пользовательской сессии достигает максимального значения, которое можно получить при подключении к данному поставщику услуг Интернет.

Средняя скорость пользовательской сессии не зависит от числа пользователей в сети организации или поставщика услуг Интернет, работающих в данный момент времени.

Постановка эксперимента

Эксперимент состоял из следующих шагов; 1. Сбор статистики реального сетевого трафика. Сбор статистики производился с помощью программы nprobe [93]. Регистрировались следующие параметры: скорость передачи входящего трафика внешнего канала, моменты поступления на обслуживание пользовательских сессий, протоколы, длины и длительности пользовательских сессий. Сбор статистики производился в течение одних суток, в период с 20:00 11.11.2003 по 20:00 12.11.2003. Основанием, послужившим для выбора такого интервала наблюдения, был тот факт, что процессы, происходящие в сети, имеют ярко выраженную периодичность с периодом в одни сутки. 2- Расчет числовых характеристик скорости передачи данных по экспериментальным значениям.

3. Расчет числовых характеристик скорости передачи данных через значения сетевых параметров (Л, irf, Wa и т.д.) по формулам, полученным в данной работе.

4. Сравнение результатов, полученных в пунктах 2 ("экспериментальные") и 3 (Теоретические"),

Интервал наблюдения был разбит на подинтервалы, длительность подинтервала зависела от времени суток и варьировалась от 15 минут до одного часа. Во время каждого такого интервала времени интенсивность поступления запросов на открытие сессий от пользователей сети можно считать постоянной, см. [16, 100,44,53].

Экспериментальные и теоретические числовые характеристики скорости передачи данных (пункты 2 и 3) рассчитывались отдельно для каждого интервала времени с помощью специально разработанных утилит, написанных на языке программирования perl [ПО].

Для графического изображения данных, полученных в результате расчетов, использовался пакет GnuPlot [71].

Результаты экспериментов показаны на рисунках 13-25 и рисунках П1.1-П1.32 приложения L

На рисунках 13-16 представлены графики изменения параметров, определяющих применимость предложенной модели на каждом из интервалов наблюдения.

На рисунке 13 показаны значения %г критерия согласия Пирсона для гипотезы показательного распределения интервалов времени мевду последовательными поступлениями запросов на обслуживание пользовательских сессий (пуассоновский поток заявок на обслуживание пользовательских сессий). Число разрядов, на которое разбивался каждый отдельный интервал наблюдения, равно 10, Интенсивность потока заявок полагалась равной статистическому среднему наблюдаемых значений. При данных условиях и уровне значимости 5%, значение критерия большее, чем 15.51 (показано на графике), говорит о том, что гипотеза противоречит опытным данным. При меньшем значении критерия гипотеза принимается (не противоречит опытным данным).

Для определения зависимости в последовательностях значений интервалов времени между поступлениями запросов на обслуживание пользовательских сессий и времен обслуживания пользовательских сессий рассчитывался коэффициент автокорреляции при смещении равном 1 (см. рисунки 14 и 15). Автокорреляция считается значимой на данном интервале наблюдения, если ее значение превосходит zx_aj4n \3bl4n (где z,_a - функция, обратная функции распределения стандартного нормального распределения, а - уровень значимости, п - дойна последовательности данной случайной величины), что соответствует пятипроцентному уровню значимости. В таком случае, значения соответствующей случайной величины на данном интервале являются зависимыми друг от друга, и модель на этом интервале наблюдения не применима.

График коэффициента корреляции, между соответствующими значениями величин L2H и \jWn для каждого протокола передачи данных показан на рисунке 16.

Графики изменения средней скорости передачи данных приведены на рисунках 17-20. По оси абсцисс отложено время суток, по оси ординат -средняя скорость передачи данных в байтах в секунду. Относительная ошибка теоретического среднего значения скорости передачи данных не превышает 5%.

Срсднсквадратическое отклонение скорости внешнего канала, общее и отдельно по каяедому из сетевых протоколов, показано на рисунках 21 -24. Теоретическое среднеквадратическое отклонение рассчитывалось по формуле (40), Для протокола TCP значение коэффициента С было положено равным 3.18, что соответствует следующим параметрам: г = 2, w = \, A/SS = 536, 1 = 8500. Относительная ошибка теоретического значения среднеквадратического отклонения на интервалах наблюдения, на которых модель применима, в незагруженном состоянии сети не превышает 10%,

На рисунке 25 показаны экспериментальные значения скорости внешнего канала и теоретические оценки границы ее изменения, рассчитанных по неравенству Чебышева, см, (6), при условии произвольного вида распределения скорости передачи данных: v = v ± Зст.

На рисунках Ш. 1 -П L32 приведены графики числовых характеристик (среднее значение, дисперсия) различных сегевых параметров.

Рассмотрим соответствие модели и экспериментальных данных в течение всего времени наблюдения.

В ночное время сетевой трафик мал и создается небольшим количеством пользователей, а также различными сетевыми процессами, выполняющимися автоматически. При данных условиях предпосылки, лежащие в основе предложенной модели, в частности: входной пуассоновский поток заявок на открытие сессий, независимость времен обслуживания пользовательских сессий друг от друга и т.д. (см, рисунки 13-15), не выполняются, модель не работает.

Приблизительно с 7.30 пользователи начинают приходить на работу, характер сетевого трафика резко изменяется: интенсивность поступления запросов на обслуживание пользовательских сессий X возрастает, см. рис. П1Л-Ш.4, (за исключением AUDP9 которая остается постоянной в течение практически всего времени наблюдения, что связано с тем, что по протоколу UDP в данной сети передается в основном системный, для системы доменных имен DNS, и игровой трафик, см. приложение 3), средние длина (рис. П1.5-П1.8) и время обслуживания (рис. ШЛ7-Ш.20) пользовательских сессий протоколов HTTP и FTP стабилизируются и приближаются к значениям, наблюдаемым в рабочее время. Средняя скорость передачи данных (рис. 17-20) увеличивается. Основные условия модели (пуассоновский поток запросов на обслуживание пользовательских сессий, независимость времен обслуживания пользовательских сессий друг от друга, см. графики на рисунках 13-15) выполняются. Корреляция между соответствующими значениями L\ и \jwn (рис, 16) для протокола FTP мала, для протокола HTTP ее значение также мало и меняет свой знак, то есть не является значимой. Сеть находится в незагруженном состоянии -среднеквадратическое отклонение скорости передачи данных, рассчитанная по модели, хорошо совпадает (отличается не больше, чем на 10%, см. график на рисунке 21) со среднеквадратическим отклонением, рассчитанным непосредственно по выборке.

Метод текущего контроля качества Интернет-подключения

Текущий контроль качества Интернет-подключения корпоративной сети предполагает получение ответов на следующие вопросы во время повседневной эксплуатации Интернет-канала:

Является ли недостаточная пропускная способность (скорость) Интернет-подключения фактором, ухудшающим качество обслуживания пользователей сети?

Если скорость Интернет-канала слишком мала для потребностей организации, то насколько необходимо увеличить его скорость, чтобы обеспечить наилучшее качество обслуживания пользователей сети, доступное при подключении к данному поставщику услуг Интернет?

Как отразится на качестве обслуживания пользователей изменение сетевых параметров, в частности, количество и/или активность пользователей в сети, используемые протоколы передачи данных, изменения в конфигурации сети и/или сетевом оборудовании, смена поставщика услуг Интернет и т.д.? Опишем метод текущего контроля качества Интернет-подключения корпоративной сети, основанный на предложенных моделях внешнего канала. Схема метода показана на рисунке 26. Метод позволяет получать ответы на поставленные выше вопросы.

Предполагается, что с граничного маршрутизатора организации можно получать статистические данные об обслуживаемых им пользовательских сессиях и текущих значениях скорости внешнего канала. Для каяедой сессии необходимо иметь следующую информацию; время начала обслуживания сессии, длина (байт), длительность (секунды), протокол транспортного уровня (UDP, TCP), номер порта, который определяет протокол прикладного уровня (HTTP, FTP и т.д.)- Эти данные могут быть получены с аппаратных маршрутизаторов по протоколу Cisco NetFlow [55] и sflow [106]. С серверов под управлением Unix-подобных операционных систем данные могут быть получены с помощью программных пакетов nprobe [93], ntop [94], tcpdump/tcprcduce/tcptrace [107, 108,109].

Приведем метод в виде пошаговой инструкции. 1. Определить интервал наблюдения. Длительность интервала наблюдения должна быть такой, чтобы на каждом интервале поток поступления заявок па обслуживание пользовательских сессий можно было считать стационарным пуассоновским.

В случае перегрузки в корпоративной сети рассчитать скорость внешнего капала, необходимую для обеспечения наилучшего качества обслуживания пользователей сети, доступного при подключении к данному поставщику услуг Интернет, по одному из критериев (наиболее вероятного события, предельного уровня, комбинации ожидаемого значения и дисперсии), описанных в параграфе 4.2.

В качестве значений величин W, м\і)п jWn ] должны использоваться значения, соответствующие незагруженной сети, в качестве значения X - наибольшая возможная интенсивность входного потока запросов.

6. Оценить влияние изменения сетевых параметров. Оценка влияния изменения сетевых параметров на среднее значение и дисперсию скорости внешнего канала Интернет-подключения может быть получена по формулам для незагруженного состояния сети (16), (40), (42), когда значения я ,1, W, A/[Lj/Wff J и др. меняются в зависимости от активности пользователей сети, конфигурации сети, используемых протоколов и т.д. 4.2. Метод выбора оптимальной скорости передачи данных Интернет-подключения корпоративной сети

Задача оценки скорости передачи данных внешнего канала возникает, когда организация подключается к сети Интернет и необходимо выбрать поставщика услуг Интернет (ПУИ) и оценить скорость внешнего канала, которую необходимо у него закупить. При этом качество Интернет подключения должно соответствовать требованиям данной организации, а затраты на подключение не должны превосходить сумм, заложенных на эти цели в бюджете организации.

Ошибки в выборе скорости Интернет-подключения корпоративной сети могут привести к значительному повышению затрат на Интернет-подключение. Действительно, оценка скорости подключения к сети Интернет самым прямым образом влияет на выбор:

« Типа линии связи: проводная линия связи, радиоканал, оптическая линия связи (многомодовая или одномодовая). Разные типы линии связи имеют жесткие ограничения на достигаемую скорость передачи данных и дальность связи. Качество связи (коэффициент потерь, зависимость от внешних условий, ремонтопригодность) также зависит от типа линии связи, С повышением скорости передачи данных, дальности и качества связи стоимость линии связи увеличивается.

Канального оборудования: модемы, конверторы. Выбор канального оборудования диктуется выбором линии связи, скоростью передачи данных и дальностью связи. Эти же параметры определяют стоимость канального оборудования,

Сетевого оборудования: коммутаторы, маршрутизаторы. С повышением скорости передачи данных повышаются требования к производительности сетевого оборудования, что напрямую влияет на его стоимость. На стоимость сетевого оборудования также влияет тип интерфейса связи с канальным оборудованием.

Если в процессе эксплуатации корпоративной сети выясняется, что скорость передачи данных внешнего канала выбрана неверно» то может оказаться, что для повышения скорости необходимо сменить и тип канала связи, и канальное, и сетевое оборудование. Затраты на это могут многократно превысить суммы, изначально заложенные при проектировании сети.

Если же скорость внешнего капала слишком велика по сравнению с потребностями организации, то можно сделать вывод, что затраты организации на первоначальное подключение к сети Интернет (закупка линии связи, канального и сетевого оборудования) и абонентская плата за подключение не оправдано высоки.

Таким образом, правильный выбор скорости передачи данных Интернет-подключения корпоративной сети позволяет достигать требуемого качества подключения к сети Интернет при минимуме финансовых вложений.

Похожие диссертации на Модели и методы исследования качества Интернет-подключения корпоративной сети