Электронная библиотека диссертаций и авторефератов России
dslib.net
Библиотека диссертаций
Навигация
Каталог диссертаций России
Англоязычные диссертации
Диссертации бесплатно
Предстоящие защиты
Рецензии на автореферат
Отчисления авторам
Мой кабинет
Заказы: забрать, оплатить
Мой личный счет
Мой профиль
Мой авторский профиль
Подписки на рассылки



расширенный поиск

Метод и имитационная модель прогнозирования характеристик региональных информационно-коммуникационных систем Датьев, Игорь Олегович

Метод и имитационная модель прогнозирования характеристик региональных информационно-коммуникационных систем
<
Метод и имитационная модель прогнозирования характеристик региональных информационно-коммуникационных систем Метод и имитационная модель прогнозирования характеристик региональных информационно-коммуникационных систем Метод и имитационная модель прогнозирования характеристик региональных информационно-коммуникационных систем Метод и имитационная модель прогнозирования характеристик региональных информационно-коммуникационных систем Метод и имитационная модель прогнозирования характеристик региональных информационно-коммуникационных систем Метод и имитационная модель прогнозирования характеристик региональных информационно-коммуникационных систем Метод и имитационная модель прогнозирования характеристик региональных информационно-коммуникационных систем Метод и имитационная модель прогнозирования характеристик региональных информационно-коммуникационных систем Метод и имитационная модель прогнозирования характеристик региональных информационно-коммуникационных систем Метод и имитационная модель прогнозирования характеристик региональных информационно-коммуникационных систем Метод и имитационная модель прогнозирования характеристик региональных информационно-коммуникационных систем Метод и имитационная модель прогнозирования характеристик региональных информационно-коммуникационных систем Метод и имитационная модель прогнозирования характеристик региональных информационно-коммуникационных систем Метод и имитационная модель прогнозирования характеристик региональных информационно-коммуникационных систем Метод и имитационная модель прогнозирования характеристик региональных информационно-коммуникационных систем
>

Диссертация - 480 руб., доставка 10 минут, круглосуточно, без выходных и праздников

Автореферат - бесплатно, доставка 10 минут, круглосуточно, без выходных и праздников

Датьев, Игорь Олегович. Метод и имитационная модель прогнозирования характеристик региональных информационно-коммуникационных систем : диссертация ... кандидата технических наук : 05.13.18 / Датьев Игорь Олегович; [Место защиты: Ин-т систем. анализа РАН].- Москва, 2011.- 190 с.: ил. РГБ ОД, 61 12-5/1635

Содержание к диссертации

Введение

1. Методы и средства моделирования информационно коммуникационных систем 14

1.1 Моделирование веб-трафика 15

1.2 Модели систем массового обслуживания

1.2.1 Модели восстановления 19

1.2.2 Модели Маркова

1.3 Модели уровня tcp-соединения 22

1.4 Модели уровня приложения 24

1.5 Метод расчета нагрузки на основе коэффициентов удельной информативности 29

1.6 Анализ веб-трафика 33

1.7 Классификация пользователей сети интернет 35

1.8 Анализ клиентских сред 39

1.9 Методы прогнозирования

1.9.1 Метод среднесрочного прогнозирования (регрессионный анализ) 41

1.9.2 Макросистемный подход 44

1.9.3 Метод системной динамики

1.10 Специализированные средства имитационного моделирования информационно-коммуникационных систем 59

1.11 Сравнительный анализ существующих методов и средств моделирования информационно-коммуникационных систем 62

1.12 Требования к разработке 64

2. Технология автоматизированной постановки задач прогнозирования характеристик региональных икс с учетом социально-экономических параметров 67

2.1 Декларативное представление компонентов региональных икс 67

2.2 Атрибуты декларативного представления компонентов региональных ИКС

2.2.1 Атрибуты пользователей 73

2.2.2 Атрибуты поставщиков информационно-коммуникационныхуслуг 78

2.2.3 Атрибуты классов информационных ресурсов 80

2.2.4 Атрибуты отношений 80

2.2.5 Механизм задания сценариев

2.3 Расчетные формулы характеристик трафика 82

2.4 Видоизменения отношения «трафик» и расчетных формул 83

2.5 Примеры постановок задач в терминах декларативного представления 87

2.6 Алгоритмы постановки задач

2.6 Оценка текущего состояния компонентов икс 96

2.7 Файл спецификации задачи 99

2.8 Модуль конфигурирования задачи 101

2.9 Выводы 102

3. Шаблоны системно-динамических моделей типовых компонентов региональных информационно коммуникационных систем 104

3.1 Понятие шаблона 104

3.2 Этапы разработки шаблона 105

3.3 Шаблон «демографический сектор» 107

3.4 Шаблон «социально-экономическая группа» 112

3.5 Шаблон «тип пользователя» 116

3.6 Шаблон «класс ресурсов» 118

3.7 Шаблон «провайдер» 120

3.8 Блок расчета «характеристики трафика» 127

3.9 Исследование информационных ресурсов различных классов

3.9.1 Пользователи икс как потребители информационно-коммуникационных ресурсов 129

3.9.2 гипотеза о зависимости трафика, генерируемого в процессе использования информационного ресурса от класса ресурса 131

3.9.3 исходные данные 131

3.9.4 характеристики ресурсов различных классов 132

3.9.5 размеры файлов различных форматов 133

3.10 выводы 135

4. Технология синтеза системно-динамических моделей региональных информационно коммуникационных систем 136

4.1 региональные особенности, влияющие на информационно-коммуникационные системы 136

4.2 системно-динамическая модель региональных информационно-коммуникационных систем

4.2.1 Общая структура формируемой системно-динамической модели 138

4.2.2 Схема имитационной модели 140

4.2.3 Формирование структуры начального и первого уровней имитационной модели 142

4.2.4 Создание переменных для обмена информацией между подмоделями различных уровней 145

4.2.5 Формирование связей между объектами имитационной модели 150

4.2.6 Инициализация имитационной модели 156

4.2.7 Преобразование сценариев в элементы СД-модели

4.3 Инструментальная среда имитационного моделирования региональных информационно-коммуникационных систем 162

4.4 Исследование сформированных имитационных моделей

4.4.1 Региональная система компании-поставщика информационно-коммуникационных услуг 165

4.4.2 Региональная информационно-коммуникационная система КНЦ РАН

4.5 Варианты практического использования моделей региональных информационно-коммуникационных систем 172

4.6 Выводы 176

Заключение 177

Список источников 179

Введение к работе

Актуальность работы связана с возрастанием требований к качеству прогнозирования и обоснования решений в области развития региональных информационно-коммуникационных систем.

Под информационно-коммуникационной системой (ИКС) в работе понимается система взаимодействия поставщиков информационно-коммуникационных услуг, пользователей, информационных ресурсов. К особенностям региональных ИКС относится зависимость от социальной и экономической структуры пользовательской среды региона.

Моделирование нагрузки на различные элементы информационно-коммуникационной системы служит основным средством при разработке рекомендаций по техническим мероприятиям, направленным на улучшение функционирования этой системы. Знания об изменениях нагрузки, генерируемой пользователями, необходимы для эффективного развития информационно-коммуникационных услуг. В этом контексте особенно важным является получение перспективных оценок, способствующих формированию наилучших стратегий развития компаний, предоставляющих информационно-коммуникационные услуги. Кроме того, в современных условиях такие оценки необходимы и для эффективного решения задач прогнозирования и выработки стратегий информационно-коммуникационного развития регионов в целом, анализа существующего состояния информационно-коммуникационных услуг, разработки и внедрения новых услуг и информационно-коммуникационных технологий.

Меры, направленные на развитие информационно-коммуникационной системы, могут носить как оперативный характер (быстрая модификация для решения существующих проблем), так и стратегический (некоторые превентивные меры для сведения к минимуму затрат на модификацию системы в будущем). При принятии решений по выбору и обоснованию технических мероприятий, носящих стратегический характер, необходимо прогнозировать поведение различных показателей, влияющих на принятие решений и зависящих от этих решений.

В случае, когда накоплено достаточное количество статистических данных за некоторый промежуток времени, для прогнозирования могут использоваться методы математической статистики. Главной проблемой при этом является необходимость оперирования большими объемами статистических данных за длительный период времени (рекомендуемый в методиках экономического анализа период – не менее 10 лет). Зачастую в регионах таких объемов статистических данных не существует.

Однако даже наличие необходимого объема статистических данных не является решением проблемы прогнозирования нагрузки на компоненты систем. Это связано с периодическим обновлением технологий передачи и обработки данных, существенно влияющих на производительность систем и на статистические характеристики информационно-коммуникационного трафика. Таким образом, с внедрением новых технологий накопленные статистические данные становятся неактуальными для прогнозирования нагрузки на ИКС. Как правило, длительность периодов до очередной смены технологий передачи данных в информационно-коммуникационных системах не превышает 5-7 лет.

Поэтому представляется целесообразным использовать другие виды моделирования с целью среднесрочного (5-7 лет) прогнозирования развития региональных информационно-коммуникационных систем.

Нагрузка на информационно-коммуникационные системы зависит от показателей пользовательской среды. Основным показателем пользовательской среды в системах моделирования на сегодняшний день является количество пользователей. Однако каждый пользователь генерирует некоторую нагрузку на систему в зависимости от различных факторов. Одним из этих факторов является социально-экономическое положение пользователя: разный уровень дохода, различные цели использования системы и, соответственно, различные информационные ресурсы порождают различный сетевой трафик. Поэтому для решения задач прогнозирования нагрузки необходимо также прогнозировать число пользователей систем различных социально-экономических групп, то есть прогнозировать значения параметров социально-экономической среды региона в целом. Проблемы проектирования информационно-вычислительных систем с учетом влияния социально-экономических параметров, рассматривались в работах Братухина П.И., Жимерина Д.Г., Максименко В.И., Квасницкого В.Н., Лисицына В.Г., Балыбердина В.А. Базисом представленных в диссертации исследований также являются работы следующих отечественных и зарубежных авторов: Вишневский В.М., Лексин В. А., Воронцов К. В, F. D. Smith, F. H. Campos, B. Mah, J. Cao, W. S. Cleveland, S. Floyd, V. Paxson, K. Lan, J. Heidemann, P. Barford and M. Crovella.

Одним из эффективных методов изучения сложных динамических систем в настоящее время, успешно развивающимся во многих странах, является предложенный в 1960-х годах Джеем Форрестером специализированный метод имитационного моделирования – метод системной динамики. Системная динамика не требует построения математической модели исследуемого объекта в традиционной форме, а дает исследователю инструментарий для моделирования в виде реализованных на компьютере аналитических описаний системных элементов и связей между ними.

Таким образом, в условиях ограниченной доступности достоверных статистических данных о региональных информационно-коммуникационных системах, необходимости учета разнородных факторов, а также высоких требований к оперативности получения результатов, наиболее приемлемым способом прогнозирования параметров нагрузки на подобные системы представляется построение системно-динамической модели региональной информационно-коммуникационной системы, основанной на легкодоступных (в смысле времени получения и стоимости) данных.

Приведенная выше аргументация обосновывает следующую формулировку цели выполненных в диссертационной работе исследований и разработок.

Цель работы повышение эффективности информационного обеспечения прогнозирования развития региональных информационно-коммуникационных систем.

Для достижения поставленной цели решались следующие основные задачи:

  1. Разработка технологии автоматизированной постановки задач прогнозирования характеристик региональных ИКС с учетом влияния социально-экономических параметров.

  2. Разработка технологии синтеза системно-динамических моделей региональных информационно-коммуникационных систем на основе непараметризованных модельных фрагментов (шаблонов).

  3. Разработка шаблонов системно-динамических моделей компонентов региональных информационно-коммуникационных систем.

  4. Разработка инструментальной среды постановки задач и реализации имитационного моделирования, обеспечивающей комплексное исследование динамики развития региональных информационно-коммуникационных систем с учетом социально-экономических параметров.

Используемые методы. Для решения поставленных в работе задач используются элементы системного анализа, теории вероятностей, математической статистики и теории множеств, метод системной динамики.

Научная новизна работы заключается в том, что для повышения эффективности информационного обеспечения прогнозирования развития региональных информационно-коммуникационных систем разработан метод комплексного исследования динамики развития региональных информационно-коммуникационных систем с учетом параметров социально-экономической среды. Метод обеспечивает среднесрочное (5-7 лет) прогнозирование нагрузки на компоненты региональных ИКС. Отличительными особенностями разработанного метода являются: учет информационных потребностей пользователей различных групп; возможность учета динамики параметров социально-экономической среды и технических параметров информационно-коммуникационных систем; автоматизированное формирование проблемно-ориентированных имитационных моделей.

Основные аспекты научной новизны метода следующие:

  1. Разработана технология автоматизированной постановки задач прогнозирования характеристик региональных информационно-коммуникационных систем с учетом социально-экономических параметров. Технология основана на использовании предложенного декларативного представления компонентов региональных ИКС в виде теоретико-множественных отношений. Алгоритмы, реализующие технологию обеспечивают интерактивное формирование формализованного описания задач и анализ его целостности.

  2. Создана технология синтеза системно-динамических моделей региональных информационно-коммуникационных систем. Технология обеспечивает снижение трудоемкости формирования проблемно-ориентированных имитационных моделей за счет повторного использования типовых модельных компонентов и автоматизации процесса синтеза модели на основе декларативных описаний задач предметной области.

  3. Разработаны модельные шаблоны компонентов ИКС, представляющие собой непараметризованные фрагменты системно-динамических моделей, определяющие структуру внутренних причинно-следственных взаимосвязей социально-экономических и технических компонентов. Шаблоны служат основой синтезируемых проблемно-ориентированных имитационных моделей региональных информационно-коммуникационных систем.

Положения, выносимые на защиту:

  1. Технология автоматизированной постановки задач прогнозирования характеристик региональных ИКС с учетом влияния социально-экономических параметров.

  2. Технология синтеза системно-динамических моделей региональных информационно-коммуникационных систем.

  3. Шаблоны системно-динамических моделей компонентов региональных информационно-коммуникационных систем.

Практическая значимость

Предложенный метод комплексного исследования динамики развития региональных информационно-коммуникационных систем является основой для создания инструментальных сред имитационного моделирования, обеспечивающих эффективное применение современных средств математического моделирования и вычислительного эксперимента для решения прикладных проблем прогнозирования и планирования развития региональных информационно-коммуникационных систем.

Учет в процессе моделирования влияния социально-экономических факторов обеспечивает повышение эффективности решения задач планирования развития региональных информационно-коммуникационных систем за счет возможности реализации перспективных программно-технических решений в наибольшей мере адекватных ожидаемому состоянию социально-экономической среды, в которой функционирует региональная информационно-коммуникационная система.

На базе результатов диссертации построены имитационные модели региональных информационно-коммуникационных систем с целью оценки и анализа перспективных стратегий их развития.

В основу диссертационной работы положены результаты, полученные автором в ходе исследований, проводимых по планам научно-исследовательских работ Института информатики и математического моделирования технологических процессов Кольского научного центра РАН в период с 2005 по 2010 годы.

Актуальность и научная новизна работы подтверждены включением результатов работы в перечень важнейших результатов Российской Академии Наук за 2005 год в области естественных, технических, гуманитарных и общественных наук.

Реализация и внедрение результатов

Исследования проводились в Институте информатики и математического моделирования технологических процессов Кольского научного центра РАН в рамках госбюджетной темы 2320 «Информационные технологии региональных макросистем», № государственной регистрации: 01.20.05.0661, 2005-2007гг.

Материалы диссертации использованы при выполнении работ по следующим проектам:

грант РФФИ № 05-07-90050, тема «Инструментальная система формирования распределенной вычислительной среды междисциплинарных исследований»;

программа фундаментальных исследований Отделения информационных технологий и вычислительных систем РАН, проект №2.6 «Разработка теоретических основ проектирования региональных информационных сетей», 2005-2007г.;

научная школа НШ-8249.2006.9 «Разработка и развитие информационных технологий поддержки управления региональным развитием», 2006-2007гг.

программа фундаментальных исследований ОНИТ РАН, Проект №2.4 «Модели и методы управления развитием информационно-коммуникационной инфраструктуры проблемно-ориентированных региональных информационных систем», 2009-2010 гг.

Полученные в диссертации результаты использованы при планировании развития информационно-коммуникационных систем Кольского НЦ РАН и Интернет-провайдера компании «Релант». Кроме того, полученные результаты внедрены в учебный процесс в рамках дисциплины «Сетевые технологии». Соответствующие документы прилагаются.

Публикации и апробация работы

Основные положения работы докладывались и обсуждались на следующих международных и всероссийских конференциях:

  1. I-я международная конференция «Системный анализ и информационные технологии» (САИТ-2005). Переславль-Залесский, 2005г.

  2. ХVI-й международный симпозиум DАAAM «Intelligent manufacturing&automation: focus on young researches and scientists», 2005, Опатия, Хорватия.

  3. VI-я Всероссийская школа-семинар «Прикладные проблемы управления макросистемами». Апатиты, 2006г.

  4. II-я Всероссийская конференция «Проблемы информатизации регионального управления», Нальчик, 2006г.

  5. II-я Всероссийская научная конференция «Теория и практика системной динамики». Апатиты, 2007г.

  6. I-я Всероссийская научно-практическая интернет-конференция «Информационные системы и технологии в социально-экономических и правовых процессах», Ставрополь, 2007г.

  7. VII-я Всероссийская школа-семинар с международным участием «Прикладные проблемы управления макросистемами», Апатиты, 2008г.

  8. III-я Всероссийская молодежная конференция по проблемам управления (ВМКПУ’ 2008), Москва, 2008г.

  9. V-я Всероссийская школа–семинар молодых ученых «Управление большими системами», Липецк, 2008г.

  10. III-я Всероссийская научная конференция «Теория и практика системной динамики». Апатиты, 2009г.

  11. VIII-я Всероссийская школа-семинар с международным участием «Прикладные проблемы управления макросистемами», Апатиты, 2010г.

Доклады по работе заслушивались на научных семинарах Института информатики и математического моделирования технологических процессов Кольского НЦ РАН, Института системного анализа РАН.

По теме опубликовано 19 печатных работ, в том числе 6 – из списка, рекомендованного ВАК РФ.

Структура и объем работы

Модели уровня приложения

В настоящее время можно выделить два основных направления моделирования веб-трафика непосредственно связанных с целями моделирования: модели веб-трафика, используемые для веб-майнинга, модели, используемые в симуляторах сетей для генерации синтетического сетевого трафика.

В моделях, используемых для веб-майнинга, основное внимание фокусируется на моделировании контента веб-сайтов и поведения пользователей, а параметры трафика, лежащие в основе моделей, - это типовые цепочки навигации, абсолютные и относительные временные характеристики использования веб-сайтов и отдельных страниц [7]. Более подробно технология веб-майнинг будет рассмотрена ниже.

В основе современных систем генерирования синтетического сетевого трафика лежит моделирование сетей и нагрузки на них.

Можно выделить два основных технологических подхода к моделированию компьютерных сетей [19]:

Создание сетевого испытательного стенда и проведение экспериментов с реальным аппаратным и программным обеспечением.

Моделирование аппаратного и сетевого программного обеспечения посредством использования соответствующего программного обеспечения и проведение экспериментов с полученной моделью сети.

Кроме того, можно выделить различные уровни моделирования. Моделирование, так или иначе, производится с целью поддержки принятия каких-либо решений (реструктуризация сайта, реструктуризация коммуникационной сети, «расширение» коммуникационных каналов, и т.д. и т.п.). Принятие решений бывает разное: оперативные решения (здесь и сейчас), тактические решения (практическая реализация и эффект - в ближайшее время) стратегические решения (эффект - в отдаленной перспективе). Для различных уровней моделирования нужны разные модели.

Так для принятия оперативных решений обычно используются генераторы трафика, позволяющие оценить текущее состояние сети в зависимости от количества пользователей. Такие генераторы, как правило, используют реальную сеть для проведения экспериментов. Наиболее типичная архитектура подобных генераторов изображена на рисунке 1. Современный генератор трафика в большинстве случаев представляет собой программную систему, состоящую из клиентской и серверной части. Клиентская часть может располагаться на различных узлах сети (обычно используется сразу несколько клиентских частей) и генерирует запросы к серверу. Серверная часть располагается на одном из сетевых серверных узлов. Основная функция серверной части заключается в выборе соответствующих запросам файлов, хранящихся на сервере и пересылка этих файлов клиенту. Некоторые генераторы трафика предоставляют программные средства для измерения различных сетевых параметров и сохранение таких замеров. В других случаях используются системы мониторинга сети сторонних производителей. клиент сервер

В то время как новые приложения потребляют значительные части сетевых ресурсов, в любой из величин - в байтах, в пакетах, потоках, - Веб остается основным приложением сети. Поэтому, генераторы искусственного веб-трафика стали важным компонентом модели любой информационно коммуникационной сети.

Модели генерации синтетического сетевого трафика прежде всего предназначены для тестирования компонентов компьютерных сетей на специальных испытательных стендах, имитирующих работу реальной сети, а также эксперименты с реальными компьютерными сетями. Можно выделить следующие основные группы моделей трафика:

Модели сетей массового обслуживания. Трафик представляется как случайный (стохастический) - Марковский или самоподобный - процесс поступления в сеть МО заявок на обслуживание. В моделях такого типа внимание ограничивается уровнем сетевых пакетов и не учитываются поведенческие модели источников трафика [24, 26].

Модели уровня TCP-соединения. Данные модели, в отличие от предыдущих, базируются на имитации источников сетевых пакетов и позволяют учитывать активный характер протокола - реакцию на перегрузки в сети и управление потоком [4, 7, 8]. От моделей уровня приложения отличаются набором параметров трафика, составляющих модель. В данном случае это статистические характеристики ТСР-сессий. Преимущество по сравнению с моделями уровня прикладных протоколов - возможность моделирования трафика, представляющего собой смесь данных от нескольких прикладных протоколов. 3. Модели уровня приложения. Имеют целью моделирование трафика прикладных протоколов, прежде всего - HTTP. Моделируемые параметры - размеры HTTP-запросов и откликов, временные задержки, связанные с ментальной деятельностью пользователя или с обработкой запроса сервером [6]. При генерировании искусственного сетевого трафика потоки запросов могут возникать на нескольких различных уровнях описания. Обычно, поток запросов представляется совокупностью наблюдений:

В то же время, эти наблюдения можно описать промежутками времени между последовательными командами пользователя на т.н, «поведенческом» уровне; промежутками времени между появлениями пакетов или размерами пакетов данных на сетевом уровне или уровне приложения. Обычно, " моделируется семейством случайных переменных, для которых известны функции распределения, и индексом времени t. Если множество возможных значений (пространство состояний) конечное или счетное, то процесс называют дискретным по состояниям (discrete-state), в противном случае - непрерывным по состояниям (continuous-state). Индекс времени t может быть конечным или счетным, порождая дискретный по времени процесс S = {Xn}=0, а может принимать любое значение на множестве конечных или бесконечных интервалов, порождая непрерывный по времени процесс S = {XtJ=0. Если процесс описывается возникновением единичных дискретных сущностей (пакетов, ячеек, команд), он называется точечным процессом и состоит из последовательности моментов возникновения, начиная с нуля: То=0, Ть

Атрибуты декларативного представления компонентов региональных ИКС

Атрибуты отношений CAHname, si, s2, s3}, где name - название отношения, si - множество, s2 - множество, s3 - множество (необязательный атрибут).

В свою очередь, для каждого элемента отношения - пары (el, е2) или тройки (el, е2, еЗ), где el, е2, еЗ принадлежат соответственно множествам si, s2, s3 может быть поставлен в соответствие так называемый «вес» из множества действительных чисел, определяющий в каждом конкретной случае «силу» связи.

Так, например, для отношения ассоциации на множествах демографических секторов и социально-экономических групп ABG DSxSG = {(dsq,sgm) dsq е DS,sgm e SG}, ABG соответствует атрибуту name, DS соответствует атрибуту si, SG соответствует атрибуту s2. В данном случае, вес пары (dsq, sgm) задается параметром pdds социально-экономической группы sgm И фактически является долей пользователей социально-экономической группы Sgm, относящихся К демографическому сектору dsд.

В декларативном представлении заложен механизм задания сценариев развития событий, позволяющий исследовать влияние изменений значений различных параметров на поведение модели в целом.

Конкретный исследуемый сценарий изменения структуры и параметров информационно-коммуникационной системы задается множеством упорядоченных во времени изменений параметров. Каждое изменение параметра представляет собой кортеж, содержащий: идентификатор объекта модели, параметры которого будут изменяться; идентификатор модифицируемого параметра; момент модельного времени, в который активизируется функция модификации; собственно функция - модификатор, задающая правила изменения данного параметра. Sen - множество сценариев, Scn={scnz}, где z = l,NScn , NScn - количество сценариев. сценарий scnz={ objn, parn, Mod } , где і = Щ, Nt - количество изменений. Сценарное изменение параметра представляется тройкой objn, parn, Mod i, где objn - имя объекта, objn е {ds , sgm, uth, prij,rck}, parn - имя параметра, принадлежащего объекту, содержащееся во множестве атрибутов; Mod - множество модификаторов Mod={modp}, где р = Щ , NMod количество модификаторов; modp = time, val , где time - момент модельного времени, представленный в формате dd.mm.yyyy; val - значение параметра.

Предложенный механизм задания сценариев позволяет учесть при моделировании явления, которые влияют на функционирование информационно-коммуникационных сетей, но не могут быть аналитически заданы при определении начальных параметров моделирования.

Используя формальное описание сценариев можно предложить готовые стандартные варианты развития событий такие, как появление нового провайдера, реализующего демпинговую ценовую политику, ухудшение демографической обстановки, изменение численности социально-экономических групп и т.д.

Таким образом, некоторые из объектов будут изменяться в соответствии с заданными значениями - не по законам, заложенным в системно-динамическую модель изначально.

Далее представлены формулы, с помощью которых производится вычисление характеристик трафика: FT - формулы вычисления характеристик трафика за период на протяжении временного интервала mtime, FT = fvl,fpr , где fvl - формула вычисления объема; fpr - формула вычисления стоимости трафика. Г1 (tijk, mtime) = 2прм(и,-) msf (prij) psm(гск) pdrcf (и,) ГД j,k,mteJxKxMT прм(и() - количество страниц, запрошенных пользователем і за временной интервал с индексом mt (соответствующий шагу моделирования). msf(prij) - определяет принадлежность пользователя / провайдеру у на Ґ1, если и І пользуется услугами prij интервале с индексом mt, msf (pn,) = n , 0, если и{ не пользуется услугами рп, psmt(rck) - размер страниц класса ресурса к, запрошенных пользователем на интервале с индексом mt, u pdrcf) - доля страниц информационных ресурсов класса к пользователя і на интервале с индексом mt. Формула вычисления стоимости трафика: fPr(t. . k, mtime) = npmt(и,) msf (jmj) psM (rck) pdrcf (и,) apmt(prij) ГДЄ j,k,mteJxKxW aPmt(pnj) - цена объемной единицы трафика для абонента на интервале с индексом mt, а остальные обозначения соответствуют использовавшимся в расчетной формуле объема трафика; Приведенные выше формулы принимают различный вид в зависимости от постановки задачи. Примеры таких видоизменений приведены в следующем подразделе.

Видоизменения отношения «трафик» и расчетных формул При использовании целевого разбиения пользователей, отношение «трафик» выглядит следующим образом; TGD ={t M}, где tfJk =(gda,prij,rck), где gda - блок разбиения целевого множества пользователей, рп} - провайдер], т.е. рассматривается отношение между блоком разбиения целевого множества пользователей, провайдером и классом ресурса.

Шаблон «социально-экономическая группа»

Реализация данного блока является многослойной. Каждая переменная, представленная на рисунке 18, является двумерным массивом. Вследствие многомерности, данная конструкция заменяет количество одномерных шаблонов, равное количеству элементов двумерного массива, размерность которого соответствует произведению количества групп пользователей на количество провайдеров.

Инициализация шаблона и тестирование полученных экземпляров моделей производились с использованием данных, полученных в региональных ИКс Мурманской области и предоставленных территориальным органом Федеральной службы государственной статистики по Мурманской области.

Модели поставщиков информационных услуг, построенные на основе разработанного системно-динамического шаблона, позволяют получать прогнозные оценки количества пользователей различных типов, демографических секторов, социально-экономических групп для каждого провайдера с учетом технико-экономических характеристик предоставляемых информационных услуг.

Блок «характеристики трафика» реализует расчетную математическую модель, представленную в третьем подразделе главы 2, и, в сущности, является таким же шаблоном системно-динамической модели, что и представленные выше шаблоны. На рисунке 21 изображена общая схема расчета характеристик трафика. Стрелками обозначены потоки данных. модель «типы пользователей» количество страниц класса и, посещенных за месяц пользователями типа] модель «классы информационных ресурсов» размеры страниц информационных ресурсов различных классов остальные модели количество и состав пользователей целевой группы объемы трафика, сгенерированного за период пользователями j -того типа, относящиеся к классу ресурсов и объемы трафика, сгенерированного пользователями целевой группы в течение заданного временного промежутка

В данном подразделе рассматриваются особенности использования различных информационных ресурсов пользователями. Приводятся примеры группирования пользователей в соответствии с их социально-экономическими характеристиками. Выдвигается и подтверждается гипотеза о различиях трафика, генерируемого при использовании информационных ресурсов разных классов.

Формирование информационных ресурсов идет в интересах определенных групп потребителей (пользователей), отличающихся сравнительно одинаковым поведением [83]. Это могут быть федеральные органы власти, подразделения территориального органа власти, общественные движения, международный рынок (например, государственных ценных бумаг), а также различные группы населения.

Одним из способов для выделения групп пользователей и групп предпочитаемых ими ресурсов на сегодняшний день является технология анализа клиентских сред (Глава 1.7).

С другой стороны, пользователи могут быть рассмотрены как покупатели информационных услуг. Тогда группы пользователей могут быть выделены на основе критериев сегментации рынка, примерный перечень которых приведен в таблице 4 [84].

Табл, 4. Основные критерии сегментации рынка Критерии сегментации Примеры разбиения I. Географические: - континент Австралия, Америка, Азия, Европа, Скандинавия - страна Россия, Соединенные штаты Америки, Германия, Япония и т.д. - регион Северо-западный, Центрально-Черноземный, Центральный, Уральский, Западно-Сибирский, Северо-Кавказский, Поволжский и 129 др. - город, ареал Санкт-Петербург, Москва, Екатеринбург, Калининград, Московская область. Новгородская область - плотность населения Рассчитывается как отношение численности населения, к площади на которой это население проживает (чел./км ) - климат Континентальный, континентально-морской, арктический, резкоконтинентальный, тропический II. Демографические: -возраст потребителя От 3 до 6 лет, 6-11 лет, 12-19 лет, 20-34 года, 35-49 лет, 50-64 года, старше 65 лет -пол Мужчины, женщины - размер семьи 1-2 чел., 3-4 чел., 5 чел. и более - этап жизненного цикла семьи Молодая семья без детей, молодая семья с детьми школьного возраста, пожилые супруги без детей, одинокие III. Социоэкономические: - род занятий Работники умственного труда, специалисты, рабочие, служащие, предприниматели, бизнесмены и т.д. - образование Среднее, средне-техническое, высшее, незаконченное высшее - отношение к религии Христиане, католики, протестанты, иудеи, мусульмане и др. - национальность Русские, немцы, поляки, чехи, венгры и т.д. - уровень доходов До 8000 руб., от 8000 до 12000 руб., от 12000 до 18000 руб., от 18000 до 35000 руб., более 35000 руб. - численность работников на фирме-потребителе До 20 чел., от 21 до 50 чел., от 51-100 чел., от 101-250 чел., от 251-700 чел., от 701 до 1000 чел., свыше 1000 чел. -годовой товарооборот фирмы-потребителя До 3 млн. руб., от 3 млн. руб. до 10 млн. руб., от 10 млн. руб. До 50 млн. руб., более 50 млн. руб. - уровень цен потребляемых товаров Низкий, средний, высокий - стремление к сотрудничеству Поиск сотрудничества на стадии сбыта, производства, коммерции и т.д. - финансовый потенциал фирмы-потребителя Высокий, средний стабильный, средний нестабильный, нестабильный IV. Психографические: - образ жизни Традиционалисты, жизнелюбы, эстеты - тип личности Авторитарный, увлекающийся, придерживающийся принципа "как все", честолюбивый, флегматичный и т.д. - черты характера Целеустремленность, доверчивость, любознательность, требовательность, амбициозность, расчетливость и др. - жизненная позиция Твердая, гибкая, неустойчивая У. Поведенческие: - мотивы совершения покупки Обыденные, особые причины - искомые выгоды Экономия, качество, сервис, снижение затрат в процессе использования и др. - тип покупателя Постоянный, новый, неординарный - степень готовности покупателя к восприятию товара Неосведомленный, осведомленный, информированный, заинтересованный, желающий, намеревающийся купить - интенсивность потребления Покупает мало, но часть, покупает мало и часто, покупает мало - приверженность к марке Покупает товар только одной марки, не ориентируется на марку - отношение к фирме Энтузиаст, нигилист, нейтральное, безразличное 130 в данной работе группы пользователей выделялись на основе демографических (возраст, пол) и социально-экономических критериев (сфера занятости, принадлежность некоторой социальной группе). Принадлежащий какой-либо социально-экономической группе пользователь обладает определенными предпочтениями относительно характеристик предоставляемых информационно-коммуникационных услуг и информационных ресурсов. Это обусловлено решением относительно устойчивого по составу комплекса задач и, соответственно, использования определенных классов информационных ресурсов, тематика которых связана с решаемыми задачами.

На сегодняшний день существует множество рззнородных информационных ресурсов [40]. Основным отличием информационных ресурсов, изучаемым в рамках данного исследования, является разнообразие размеров объектов составляющих информационные страницы ресурсов. При передаче информационной страницы по сети к пользователю, из-за различия размеров будет различаться и трафик, ассоциированный с определенным классом ресурсов.

Выдвигаемая гипотеза, заключается в следующем. Информационные ресурсы определенных классов обладают специфическими особенностями, заключающимися в наличии объектов определенного размера, составляющих информационные страницы этих ресурсов.

Формирование связей между объектами имитационной модели

Совокупность изложенных в работе результатов - технология автоматизированной постановки задач прогнозирования характеристик региональных информационно-коммуникационных систем, шаблоны системно-динамических моделей, технология формирования системно-динамических моделей - может быть определена как метод комплексного исследования динамики развития региональных информационно-коммуникационных систем.

Инструментальная среда имитационного моделирования региональных ИКС является программной реализацией метода комплексного исследования динамики развития региональных информационно-коммуникационных систем.

При создании инструментальной среды имитационного моделирования региональных информационно-коммуникационных систем были проанализированы достоинства и недостатки следующих вариантов практической реализации предлагаемого метода комплексного исследования региональных информационно-коммуникационных систем:

1. Программная система, с помощью которой пользователь задает начальные условия решаемой задачи, генерирует непосредственно файл xml, способный выполняться средой anylogic.

2. Сервер-ориентированный подход: отличается от (1) использованием anylogic, находящегося на сервере для создания независимого ява-апплета, который выполняется в интернет-браузере.

3. Программная система, с помощью которой пользователь задает начальные условия решаемой задачи, генерирует файл спецификации (текстовый формат). Ява-апплет считывает файл спецификации и генерирует модель необходимой структуры, которая выполняется в интернет-браузере (независимый ява-апплет создается единожды в anylogic). среды моделирования ИКС № варианта достоинства недостатки 1 использование общепринятого стандарта xml - необходимость наличия системы anylogic на пользовательской станциинеобходимость дешифровки формата файла anylogic для реализации подхода 2 конечному пользователю anylogic не требуется необходимость наличия anylogic на сервере 3 anylogic не нужен конечному пользователю, необходим только интернет-браузер. Модуль конфигурирования задачи (ява-апплет)разрабатывается единожды посредством системы AnyLogic. Не выявлено В результате анализа возможных вариантов практической реализации инструментальной среды имитационного моделирования региональных ИКС (таблица 9) был выбран третий из них.

Общая схема, иллюстрирующая взаимодействие с пользователем, компонентный состав и работу инструментальной среды моделирования региональных ИКС представлена на рисунке 25. Основные функциональные возможности инструментальной среды имитационного моделирования региональных информационно коммуникационных систем; S автоматизированная постановка задачи прогнозирования: задание необходимых начальных условий и значений исходных данных, сценариев развития, (генерирование и редактирование файла спецификации задачи, содержащего эти данные); S на основе разработанных шаблонов и файла спецификации задачи автоматическое формирование имитационной модели; S имитационное моделирование («прогон» модели);

Результатом имитационного моделирования является информация о характеристиках целевых объектов в табличном и графическом виде в течение модельного времени за определенный период. Примерами такой информации могут служить: количество пользователей определенного провайдера определенной группы, объем и стоимость трафика, сгенерированного за период этими пользователями.

В качестве среды программирования при создании модуля для конфигурирования задачи и генерирования соответствующего файла спецификации модели (задачи) использовалась Borland Delphi 7.0 по причине наличия развитых средств создания оконных форм.

На основе среды моделирования Anylogic создан java-applet, позволяющий генерировать на базе разработанных шаблонов и файла спецификации модели СД-модель для решения поставленной задачи.

С помощью разработанной инструментальной среды имитационного моделирования построены модели региональных информационно-коммуникационных систем: Интернет-провайдера города Апатиты Мурманской области и Кольского научного центра РАН. Созданные модели предназначались для исследования характеристик (нагрузка на систему, количество абонентов и т.д.) информационно-коммуникационных систем с целью разработки планов развития этих систем.

С помощью разработанной инструментальной среды имитационного моделирования построена модель региональной информационно-коммуникационной системы для Интернет-провайдера города Апатиты Мурманской области. Эта модель ориентирована на исследование характеристик (нагрузка на систему, количество абонентов и т.д.) информационно-коммуникационной системы провайдера при различных вариантах развития событий. В качестве целевых групп выделены студенты, школьники, рабочие, ученые, составляющие подавляющее большинство абонентов провайдера и позиционируемые его руководством, как основа целевой аудитории в настоящем и ближайшем будущем. Сценарии развития событий были сформированы на основе реальных изменений, произошедших в ценовой политике и технических характеристиках поставщиков информационно-коммуникационных услуг (таблица 10). С целью проверки адекватности построенных моделей производился расчет средней абсолютной относительной ошибки: Y--Y МАРЕ = п Yt хЮО, где Y- - модельное значение, Y{ - значение реальной системы, п - количество значений. Поскольку в случае с обычной средней ошибкой отрицательные и положительные относительные ошибки будут подавлять друг друга, для оценки качества подгонки в целом (для всего ряда) лучше использовать среднюю абсолютную относительную ошибку. Часто эта мера более выразительная, чем среднеквадратическая ошибка. Например, знание того, что точность прогноза ±5%, полезно само по себе, в то время как значение 30.8 для средней квадратической ошибки не может быть так просто проинтерпретировано.

Похожие диссертации на Метод и имитационная модель прогнозирования характеристик региональных информационно-коммуникационных систем