Содержание к диссертации
Введение
1. Объект, цель и задачи исследования 15
1.1. Описание объекта исследований 15
1.2. Требования к оперативности функционирования ИС 18
1.3. Обоснование показателей и критериев оперативности функционирования ИС 20
1.4. Анализ моделей ИС для расчета показателей оперативности 24
1.5. Анализ возможностей исследования показателей оперативности ИС методами теории массового обслуживания 28
1.6. Постановка задачи исследования 33
Выводы по разделу 35
2. Комплекс моделей многоканальных немарковских СМО с «разогревом» 37
2.1. Классификация СМО 37
2.2. Современные методы анализа СМО 40
2.3. Учет влияния «разогрева» на показатели оперативности 42
2.4. Аппроксимация немарковских распределений с помощью распределений фазового типа 45
2.5. Модели многоканальных немарковских СМО с «разогревом» на основе гиперэкспоненциального распределения 52
2.6. Расчет вероятностно-временных характеристик оперативности для СМО с «разогревом» 66
Выводы по разделу 72
3. Программная реализация моделей СМО «с разогревом» для расчета показателей оперативности и ее тестирование 75
3.1. Описание программной реализации 75
3.2. Задание исходных данных для тестирования комплекса 77
3.3. Подход к тестированию программной реализации комплекса 79
3.4. Оценка погрешностей 84
Выводы по разделу 87
4. Практическое применение результатов исследований 89
4.1. Моделирование системы управления финансами 89
4.2. Моделирование системы управления программой лояльности 94
4.3. Методические рекомендации по внедрению 98
Выводы по разделу 99
Заключение 101
Список использованных источников
- Обоснование показателей и критериев оперативности функционирования ИС
- Учет влияния «разогрева» на показатели оперативности
- Модели многоканальных немарковских СМО с «разогревом» на основе гиперэкспоненциального распределения
- Подход к тестированию программной реализации комплекса
Обоснование показателей и критериев оперативности функционирования ИС
Укажем теперь на конкретные показатели уі для распределенных информационных систем. Работу распределенной системы характеризуют время ожидания начала обслуживания заявки, среднее время обслуживания, среднее время пребывания заявки в системе, длина очереди заявок, возможность получения отказа в обслуживании, возможность простоя каналов обслуживания, стоимость обслуживания каждой заявки, интенсивность входного потока заявок и в конечном итоге удовлетворение качеством обслуживания.
Чтобы оценить оперативность функционирования распределенной системы, необходимо определить, каким образом распределяются поступающие заявки между каналами обслуживания (узлами системы), какое количество каналов обслуживания необходимо иметь для улучшения показателей. Для решения перечисленных задач существует эффективный метод моделирования, в качестве математического аппарата для построения оценок оперативности функционирования распределенных информационных систем уместно выбрать теорию массового обслуживания.
Перечисленные задачи можно успешно решать с помощью ее методов и моделей. Заявки в силу массовости поступления на обслуживание образуют потоки, которые до выполнения операций обслуживания называются входящими, а после возможного ожидания начала обслуживания, т.е. простоя в очереди, образуют потоки обслуживания в каналах, а после завершения обслуживания заявки покидают систему - формируется выходящий поток заявок. В целом совокупность элементов входящего потока заявок, очереди, каналов обслуживания и выходящего потока заявок образует систему массового обслуживания (СМО), для которых вводятся вероятностно-временные характеристики оперативности.
Чаще всего оптимизация оперативности и эффективности функционирования распределенных систем – это задача многокритериальной оптимизации, где единственного лучшего решения, как правило, не существует (за исключением частных случаев). Применением «свёртки» критериев в один комплексный критерий, называемый целевой функцией, указывается компромисс между различными критериями.
При использовании теории массового обслуживания в качестве показателей оперативности функционирования моделируемых распределенных ИС целесообразно применять следующие показатели: функции распределения времени ожидания / пребывания заявок в системе, среднее время ожидания / пребывания в системе. Расчет данных показателей рассматривается в подразделе 2.6.
В качестве критерия пригодности по показателю оперативности функционирования для системы с неограниченной очередью и отсутствием отказов в обслуживании можно выбрать условие о том, что случайное значение времени ожидания заявки в очереди не превышает заранее заданной величины с заданой вероятностью. Например, требование Р(t) 0,05 означает, что не менее чем в 95% случаев система должна справляться с обслуживанием очереди заявок за время t при заданной интенсивности . Можно ограничивать среднее время пребывания заявки в системе или задать граничное значение для вероятности образования очереди определенной длины. 1.4. Анализ моделей ИС для расчета показателей оперативности
При разработке моделей распределенных ИС точность в описании компонентов и их взаимосвязей является едва ли не решающим условием достижения успеха, поэтому для обеспечения надлежащей степени точности применяется строгий аппарат формальной математики, что составляет суть метода математического моделирования. Построение математической модели требует значительных теоретических усилий, но при наличии времени и необходимого аппарата позволяет получить хорошие и универсальные результаты. К настоящему времени разработан широкий спектр различных математических моделей для расчета показателей оперативности, которые могут использоваться при решении задач анализа и управления работой ИС.
При составлении моделей, как правило, распределенные системы, рассматриваются как набор связанных между собой, но взаимодействующих независимо узлов. Для расчета показателей оперативности принимают во внимание, что вычислительный узел характеризуется количеством процессоров и ядер, размером памяти, размером свободного хранилища и ценой вычислений. Узлы объединяются в вычислительный кластер – совокупность каких-либо вычислительных узлов.
Прямые математические модели распределенных ИС строятся на теории графов, при этом отдельно описываются структура системы, алгоритмы ее функционирования и передаваемая информация. Структура системы отражает распределение и связи между ее компонентами. Описание структуры основывается на теоретико-графовых положениях. Описание алгоритмов функционирования, в свою очередь, не содержит описания связей между узлами, но задается для каждого узла отдельно.
Учет влияния «разогрева» на показатели оперативности
При исследовании характеристик оперативности функционирования современных информационно-вычислительных систем для повышения точности моделирования в модели СМО вводится понятие «разогрева». Под «разогревом» понимается некоторая дополнительная работа, выполняемая системой переходящей из свободного состояния в рабочий режим, но не характерная для обслуживания заявки, поступившей в уже работающую систему. В транспортной отрасли примером является распределенная компьютерная система, работающая в режиме разделения времени, где при первом подключении после неактивности происходит кеширование данных в области оперативного доступа.
В каждом конкретном случае периоду «разогрева» в модели придается свой физический смысл и математическая формализация, которые соответствуют времени передвижения обслуживающего узла от одной заявки к другой по некоторому пути. Существенно то, что после обслуживания одного объекта затрачивается время на переключение к следующему.
Для исследования моделей СМО с «разогревом» полезно при классификации СМО ввести дополнительное обозначение W, указывающее, какой вид имеет распределение длительности «разогрева». Соответственно, СМО с «разогревом» характеризуются набором A/W/S/n, где А-характеристика входного потока, W- характеристика длительности разогрева, S - характеристика длительности обсуживания, п - число каналов в СМО.
Изучены свойства одноканальных систем с «разогревом». В работе Ю. И. Рыжикова [67] предлагается метод расчета стационарных вероятностей состояний системы массового обслуживания типа M/G/1, в которой при поступающей в свободную систему первой заявке выполняется «разогрев» сервера. Крейнин в работе [20] указал характеристическую функцию стационарного времени ожидания для систем GI/G/1 и Ek/G/І с «разогревом». Среди многоканальных систем с «разогревом» рассматриваются в основном только марковские системы. Так, В. Грассман в работе [11] для системы M/M/n с «разогревом» изучил вопрос оценки средних показателей оперативности для стационарного случая, такие как средние длины очередей. С помощью экспериментов на основе численных методов показано, что влияние «разогрева» на характеристики оперативности необходимо учитывать, как только система переходит в состояние с достаточно высокой вероятностью.
В статье С.В. Калиниченко [60] предложена расчетная схема для получения вероятностных характеристик в многоканальной Марковской СМО с «разогревом» каналов.
С. Колахи в статье [19], использует многоканальные Марковские модели M/M/n для изучения системы сотовой связи методами имитационного моделирования. Обсуждаются детали построения имитационной модели, получаемые характеристики длительностей «разогрева» и обслуживания. Показано, что «разогрев» влияет на точность результатов в моделировании систем связи. Во время «разогрева», результаты системы изменяются очень быстро. Например, в рассмотренном случае из-за влияния «разогрева» появилась вероятность блокирования порядка 0,04.
Механизм обслуживания при рассмотрении систем с «разогревом» также усложняется. В задачах, решаемых теорией массового обслуживания, в основном предполагается, что СМО после обслуживания (или прерывания обслуживания) одного требования сразу приступает к обслуживанию очередного, хотя на практике встречается немало систем, в которых это предположение не выполняется. Например, распределенная компьютерная система, работающая в режиме использования области swap-памяти. В таком случае после прерывания одной программы происходит чтение из swap 45 памяти данных очередной программы. Подобные процессы также уместно исследовать, применяя модели класса СМО с «разогревом».
Отметим, что актуальность исследований многоканальных немарковских СМО с «разогревом» возросла в связи с массовым внедрением распределенных и облачных систем различного масштаба – от локальных служб предприятия до глобальных услуг, публично доступных в сети Интернет.
Анализ существующих исследований показывает, что «разогрев» оказывает значительное влияние на характеристики оперативности системы. С другой стороны, моделирование многоканальных систем с «разогревом» проводится преимущественно на основе марковских систем, что свидетельствует о том, что явление «разогрева» не исследовано в деталях. Недостаточная изученность систем массового обслуживания с «разогревом» с помощью современных средств и методов ТМО, в особенности их управления, требует дальнейшей разработки механизмов моделирования для нахождения наиболее гибких режимов обслуживания.
При исследовании характеристик оперативности функционирования современных информационно-вычислительных систем для повышения точности моделирования целесообразно использовать немарковские многоканальные СМО с аппроксимирующими распределениями фазового типа, неограниченной емкостью очереди и «разогревом».
Модели многоканальных немарковских СМО с «разогревом» на основе гиперэкспоненциального распределения
Для моделирования функционирования СМО необходимо собрать соответствующие статистические исходные данные о длительности выполнения основных операций в моделируемой системе. Процесс сбора таких данных и их статистической обработки является чрезвычайно важной и зачастую непростой инженерной задачей, на которую следует обращать пристальное внимание при моделировании, выполнять ее ответственно. Желательно включить периодический сбор необходимых данных в процессы разработки и мониторинга функционирования распределенных ИС.
Когда данные собраны, выполняется процедура подбора вида закона распределения, заключающаяся в следующем. По совокупности численных значений параметров строится гистограмма относительных частот -эмпирическая плотность распределения. Гистограмма аппроксимируется плавной кривой. По эмпирическим значениям вычисляют параметры полученного распределения.
Далее с помощью метода моментов исходное распределение заменяется эквивалентным распределением фазового типа (в рассматриваемых моделях – гиперэкспоненциальным распределением). Затем выполняется количественная оценка степени совпадения эмпирического и теоретического распределения по тому или другому критерию согласия. Тем самым достигается повышение точности расчета вероятностно-временных характеристик на модели. Для указания изменяющихся границ показателей задаются также помимо моментов распределения такие производные статистические характеристики, как стандартное отклонение и коэффициент вариации. Многоканальные немарковские СМО при моделировании удобно представлять в виде совокупности микросостояний, в которых находится система (см. подраздел 2.5). Программная реализация оперирует с графом микросостояний модели информационной системы, поэтому входные данные для программы – это свойства рассматриваемой модели.
Матрицы переходов задаются в программе непосредственно, для этого необходимо предварительно построить их по диаграмме переходов между микросостояниями системы. Такой подход, с одной стороны, накладывает некоторые требования на пользователей: для работы с комплексом требуется минимальное знание основ языка программирования Java. С другой стороны, при наличии соответствующей подготовки и опыта программирования возникают выгодные преимущества: простота интеграции с аналитическими программами и другими внешними системами – как поставщиками данных, так и с их потребителями.
Комплекс обеспечивает расчет показателей оперативности моделей распределенных ИС, он ориентирован, в первую очередь, на инженерно-технических специалистов и научных сотрудников, поэтому предполагается, что целевая аудитория комплекса обладает указанными навыками.
Тестирование программных продуктов является на сегодняшний день отдельной областью знаний и даже отдельной профессией, в которой наработаны многочисленные и достаточно универсальные средства, технологии и инструменты. Лучшие практики тестирования основаны на постоянной проверке определенного набора тестовых сценариев в условиях постоянно развивающихся программных изменений.
Тем не менее, для тестирования функциональной корректности определенного заданного программного комплекса имеет право на применение более простая техника тестирования, которая является не менее информативной и покрывает набор типовых тестовых сценариев.
В основу подхода к тестированию положен принцип взаимности, описанный в работе [69] – теоретический подбор исходных данных моделей таким образом, чтобы получаемые для них показатели давали одинаковые или близкие результаты. Отдельно проверяются граничные условия для входных параметров и особые случаи, если они имеют место в модели.
В подразделе 2.4 указывалось, что между различными типами аппроксимирующих распределений фазового типа существует возможность эквивалентных преобразований. Это обстоятельство используется для взаимного тестирования комплекса на основе моделей с H2- и E2-распределениями.
Схема выполнения взаимной проверки результатов с использованием различных типов распределений иллюстрируется на рис. 3.3.1, где реализованные для тестирования комплекса модели показаны по степени общности от базовой экспоненциальной слева до наиболее общей с использованием двухэтапного распределения Кокса (не рассматривается в данной работе). Рисунок 3.3.1 – Схема взаимной проверки результатов вычислений
Модели, расположенные на рисунке левее, являются более частными случаями для моделей, расположенных на рисунке, соответственно, правее. Для совместной проверки вычислений, получаемых с распределениями Нk и Ek, сопоставляются наборы результатов в обоих классах при заранее подобранных значениях параметров, при которых характеристики сравниваемых моделей сходны.
В ходе тестирования комплекса на всем диапазоне задания параметров аппроксимирующих распределений параллельно выполнялись совместные расчеты показателей оперативности на моделях, перечисленных на рис. 3.3.1, использующих Н2- и E2-аппроксимирующие распределения.
Подход к тестированию программной реализации комплекса
Исходя из распределения времени между техническими составляющими рассмотренных операций, время «разогрева» оценено в диапазоне 10-20 мс. Поток обрабатываемых системой требований смоделирован трехканальной немарковской СМО с «разогревом» Я2/МУМУЗ рассмотрен при различных значения коэффициента вариации входящего потока.
Результаты моделирования в части стационарного распределения числа заявок в системе в зависимости от коэффициента вариации показаны на рис. 4.2.3. В частности получено, что возрастание коэффициента вариации до значения иА = 1.5 и выше приводит к заметному увеличению вероятности наличия большего числа заявок, ожидающих обслуживания в системе. Приведенные зависимости позволяют судить о том, на сколько оперативно идет обработка информационных запросов в рассматриваемой системе с учетом затрат на кеширование необходимых данных. Рис. 4.2.3 – Стационарное распределения числа заявок в системе в зависимости от коэффициента вариации
Сделанные выводы были учтены при анализе работы компонентов системы, взаимодействующих с СУБД и оптимизации выполняемых запросов. Внесенные изменения в работу с СУДБ позволили достичь повышения оперативности на 16%.
Очевидно, что при проведении приемочных испытаний системы, когда в системе выполняется обработка информации в соответствии заданными алгоритмами для решения прикладных задач, времена выполнения запросов и частоты их поступления будут отличаться. Но сам подход к определению исходных данных и параметров моделирования остается прежним.
Рассмотренные преимущества от использования моделирования и оценивания характеристик оперативности нашли применение в ФГБОУ ВПО ПГУПС в учебном процессе кафедры «ИВС» при проведении лекционных занятий и практических работ по дисциплине «Корпоративные информационные системы». В рамках курса, в частности, показывается, что применение разработанных подходов к моделированию для анализа оперативности корпоративных информационных систем позволяет повысить точность расчета характеристик оперативности ИС, и на их основе оптимизировать использование вычислительных ресурсов ИС, тем самым снижая сроки и стоимость внедрения проектов.
Выводы по разделу
Результаты исследований были внедрены при проектировании и тестировании ряда распределенных ИС (программных проектов предприятий ООО «Опенвэй Сервис», ООО «Ф-Лайн Софтвер»). Результаты также внедрены в учебный процесс ФГБОУ ВПО ПГУПС, нашли отражение в учебном процессе кафедры «ИВС» при проведении лекционных занятий и практических работ по дисциплине «Корпоративные информационные системы».
Разработанные модели функционирования распределенных ИС на основе распределений фазового типа с учетом затрат на актуализацию контекста и комплекс программ по расчету вероятностно-временных характеристик их оперативности были использованы для расчетов оперативности по исходным статистическим данным о длительности характерных бизнес-процессов распределенных ИС, собранных на предприятиях ООО «Опенвэй Сервис», ООО «Ф-Лайн Софтвер». Построены модели упомянутых систем, для них выполнен расчет показателей оперативности ИС, представлены графики их зависимости от параметров процесса актуализации контекста, показывающие повышение точности оценивания характеристик оперативности функционирования систем за счет учета затрат на актуализацию контекста.
Данная информация может быть использована инженерами для контроля прогнозных расчетов, повышения точности оценки требуемых вычислительных ресурсов.
Результаты исследований имеют следующий практический эффект, подтвержденный соответствующими актами о внедрении: повышение точности оценивания характеристик оперативности функционирования ИС до 15% (за счет использования разработанных более точных и обобщенных моделей); повышение точности планирования необходимых вычислительных ресурсов ПС до 10%.