Содержание к диссертации
Введение
ГЛАВА 1. Задачи системотехнического проектирования отказоустойчивых компьютерных систем реального времени 14
1.1. Задачи проектирования функционально и структурно надежных вычислительных систем 14
1.2. Организация компьютерных систем кластерной архитектуры. Кластеры с непосредственным подключением серверов и устройств хранения 18
1.3. Модели компьютерных систем с резервированным обслуживанием запросов. Задачи проектирования кластеров реального времени 22
1.4. Оптимизация структуры и процесса перераспределения запросов между кластерами вычислительной системы 26
1.5. Построение автоматизированной системы поддержки оптимального проектирования кластерных систем 29
Выводы по главе 32
ГЛАВА 2. Модели и методы поддержки оптимального проектирования отказоустойчивых кластерных систем реального времени с резервированным обслуживанием запросов 35
2.1. Показатели функциональной надежности кластеров реального времени 35
2.2. Модель анализа функциональной надежность кластера реального времени с резервированным обслуживанием запросов 46
2.3. Модели кластера реального времени с резервированным обслуживанием запросов при уничтожении в очереди просроченных запросов 66
2.4. Модели оптимального проектирования кластера реального времени с резервированным обслуживанием запросов 80
2.5. Эффективность вычислительных систем предоставления услуг в реальном времени 91 2.6. Последовательность выбора проектных решений по резервированному обслуживанию запросов в кластерах реального времени 97
Выводы по главе 101
ГЛАВА 3. Модели поддержки оптимального проектирования отказоустойчивых компьютерных систем кластерной архитектуры с непосредственным подключением серверов и устройств хранения 103
3.1. Надежность кластерных вычислительных систем с дублированными связями серверов и устройств хранения 103
3.2 Функциональная надежность вариантов отказоустойчивых кластеров реального времени с непосредственным подключением устройств хранения 116
3.3. Оценка своевременности выполнения критических запросов в кластерах с учетом задержек в очередях узлов двух уровней 122
Выводы по главе 125
ГЛАВА 4. Модели поддержки оптимального проектирования отказоустойчивых мультикластерных компьютерных систем с динамическим перераспределением запросов 127
4.1. Перераспределение запросов между кластерами при их деградации 129
4.2. Надежность мультикластерной системы с перераспределением запросов 136
4.3 Оптимизация перераспределения запросов в кластерах при изменяющейся активности источников запросов 138
4.4. Функциональная надежность вычислительных систем с перераспределением запросов 143
4.5 Последовательность выбора проектных решений по перераспределению запросов в мультикластерных системах 150
Выводы по главе 152
Заключение 154
Список литературы 155
- Модели компьютерных систем с резервированным обслуживанием запросов. Задачи проектирования кластеров реального времени
- Модели кластера реального времени с резервированным обслуживанием запросов при уничтожении в очереди просроченных запросов
- Функциональная надежность вариантов отказоустойчивых кластеров реального времени с непосредственным подключением устройств хранения
- Оптимизация перераспределения запросов в кластерах при изменяющейся активности источников запросов
Введение к работе
Актуальность темы исследования.
Повышение эффективности распределенных вычислительных систем реального времени, в том числе систем кластерной архитектуры, связано с совершенствованием процессов проектирования и управления качеством проектных работ при создании автоматизированных комплексов анализа и синтеза проектных решений на основе современных методов моделирования и инженерного анализа.
При проектировании распределенных компьютерных систем, функционирующих в реальном времени, требуется обеспечение высокой отказоустойчивости и функциональной надежности при гарантированной безошибочности и своевременности обслуживания критичных запросов, к которым в ряде случаев предъявляются жесткие ограничения по выдаче достоверных результатов к заданным моментам времени.
Обеспечение указанных требований к распределенным компьютерным системам реального времени совместно с требованиями экономической эффективности их создания и эксплуатации связано с разрешением ряда технических противоречий, и требует разработки моделей, методов и алгоритмов их оптимального автоматизированного проектирования.
Значительный вклад в теорию проектирования вычислительных систем, в том числе их оптимального надежностного проектирования, внесли Б. В.Гнеденко, А.М. Половко, И.А. Рябинин, И.А. Ушаков, Г.Н. Черкесов, С.В. Гуров, Л.В.Уткин, И.В. Панфилов, С.А. Майоров, Г.И.Новиков, Т.И.Алиев, И.Б. Шубинский Л. Клейнрок, A. Tanenbaum, M. Shooman, P. Jalote, P. Verissimo, M. Abd-El-Barr и др.
Достижения этих ученых в значительной мере способствовали созданию научных основ и методологии автоматизированного проектирования высоконадежных отказоустойчивых систем, в том числе методов оптимального проектирования распределенных вычислительных систем и сетей.
При создании САПР распределенных компьютерных систем реального времени необходим комплекс моделей анализа и методов проектирования, позволяющий на основе целенаправленного формирования возможных рациональных проектных решений, оценки их эффективности по различным критериям и структурно-параметрической оптимизации синтезировать эффективное проектное решение. К эффективным проектным решениям относятся рациональные и по возможности оптимальные решения соответствующие требованиям по надежности, отказоустойчивости, безошибочности и своевременности вычислений с учетом конструктивных ограничений и ограничений ресурсов, выделяемых на построение системы.
Таким образом, развитие методологии автоматизированного проектирования в части постановки задачи оптимального проектирования кластерных систем реального времени, формализации и типизации проектных решений, разработки моделей, методов и алгоритмов анализа и обоснования вы-
бора проектных решений и их структурно-параметрической оптимизации представляется актуальным.
Объект исследования – высоконадежные отказоустойчивые кластерные системы, для которых критичны своевременность и безошибочность вычислений.
Предмет исследования – модели, алгоритмы и методы поддержки автоматизированного оптимального проектирования компьютерных систем кластерной архитектуры, в том числе реального времени.
Цель и задачи исследования-Цель исследований - повышение эффективности систем автоматизированного проектирования отказоустойчивых компьютерных систем кластерной архитектуры, функционирующих в реальном времени.
Для достижения поставленной цели в диссертации решаются следующие задачи:
-
Определение системы показателей эффективности отказоустойчивости и надежности проектных решений построения компьютерных кластеров реального времени.
-
Разработка вариантов проектных решений построения кластерных систем реального времени, включая варианты организации резервированного обслуживания копий запросов в нескольких узлах кластера.
-
Разработка моделей функциональной наджности и оценки вероятности своевременности и безошибочности резервированного обслуживания запросов реального времени в отказоустойчивых резервированных кластерах.
-
Постановка и решение задачи формирования и выбора проектных решений построения структуры одно и многоуровневых кластерных систем, включая структуры с непосредственным резервированным подключением серверов и устройств хранения, в том числе функционирующих в реальном времени.
-
Постановка и решение задачи проектирования кластерных систем, при оптимизации структуры и процесса распределения запросов, в том числе реального времени.
-
Разработка моделей функциональной надежности распределенных мультикластерных систем с перераспределением запросов между кластерами, позволяющих оценить надежность, вероятность своевременности и безошибочности обслуживания запросов, а также среднее время ожидания запросов, с учетом отказов и временных отключений узлов в процессе их функционирования в реальном времени.
-
Постановка и решение задачи оптимального проектирования структуры мультикластерных систем и процесса взаимного перераспределения запросов между кластерами, с целью минимизации среднего времени ожидания, а для систем реального времени с целью максимизации вероятности своевременного и безошибочного обслуживания
запросов, в условиях адаптации к отказам, ошибкам и временным отключениям узлов.
Научная новизна. Получены следующие результаты, характеризующиеся научной новизной:
-
Методы поддержки оптимального проектирования кластерных компьютерных систем реального времени с возможностью резервированного обслуживания запросов в условиях ошибок вычислений, сбоев и отказов узлов, при организации управления очередями с уничтожением и без уничтожения резервных копий, срок нахождения которых в очередях превысил допустимое время ожидания.
-
Модели функциональной наджности кластерных вычислительных систем реального времени с возможностью резервированного обслуживания запросов, позволяющие оценить среднее время ожидания запросов, вероятности своевременности и безошибочности резервированного обслуживания запросов, при организации управления очередями с уничтожением и без уничтожения резервных копий запросов, срок нахождения которых в очередях превысил допустимый порог ожидания.
-
Модели анализа надежности, отказоустойчивости и своевременности обслуживания запросов для выбора вариантов проектных решений кластерных компьютерных систем с непосредственным резервированным подключением серверов и устройств хранения, в том числе функционирующих в реальном времени.
-
Модели анализа и методы поддержки оптимального проектирования структуры мультикластерных систем и процесса взаимного перераспределения запросов между кластерами, с целью минимизации среднего времени ожидания, а для систем реального времени с целью максимизации вероятности своевременного и безошибочного обслуживания запросов, при адаптации к отказам, ошибкам и временным отключениям узлов.
Практическая значимость работы. Предложен комплекс моделей и вариантов проектных решений поддержки автоматизированного проектирования кластерных систем, в том числе реального времени, включающий:
-
Варианты проектных решений по организации резервированного обслуживания запросов реального времени при их распределении в очереди разных узлов при диспетчеризации очередей с и без уничтожения копий запросов, время ожидания которых превысило допустимый порог.
-
Варианты проектных решений по построению структуры одно и многоуровневых кластерных систем, включая структуры с непосредственным резервированным подключением серверов и устройств хранения, в том числе функционирующих в реальном времени.
-
Модели оценки эффективности и области целесообразности проектных решений с резервированным обслуживанием запросов реального времени, при определении рациональной кратности резервирования запросов
в зависимости от интенсивности их поступления и допустимого времени задержки в очередях.
4. Модели оценки функциональной надежности, отказоустойчивости, своевременности и безошибочности обслуживания запросов реального времени, в том числе при их резервированном обслуживании в разных узлах.
Методология и методы исследования. Предлагаемые исследования основываются на методах системотехнического проектирования и аналитического моделирования, с использованием аппарата теории вероятностей, комбинаторного анализа Марковских цепей, теории наджности, теории принятия решений, теории оптимизации и теории массового обслуживания.
Положения, выносимые на защиту:
-
Модели функциональной наджности резервированных кластерных систем с возможностью резервированного обслуживания запросов, в том числе реального времени.
-
Постановка и решение задачи оптимального проектирования структуры и организации резервированного обслуживания запросов компьютерных кластеров, в том числе функционирующих в реальном времени при требовании безошибочности и своевременности вычислений.
-
Постановка и решение задачи формирования и выбора проектных решений по построению структуры резервированных кластерных систем с непосредственным резервированным подключением серверов и устройств хранения, в том числе функционирующих в реальном времени.
-
Модели функциональной надежности и методы оптимального проектирования распределенных мультикластерных систем с адаптивным взаимным перераспределением запросов между кластерами, в том числе в реальном времени.
Диссертационная работа соответствует требованиям и п.п. 1, 2, 3 Паспорта специальностей ВАК (технические науки) по специальности 05.13.12 - Системы автоматизации проектирования (приборостроение).
Степень достоверности. Достоверность результатов обусловлена корректностью использования математического аппарата, а также подтверждена результатами внедрения, апробации и публикации. Полученные результаты согласованны с данными других исследований, опубликованных в отечественной и зарубежной литературе.
Апробация результатов. Основные результаты диссертационного исследования были представлены на международных и всероссийских научных конференциях, в том числе: VII Международной конференции «Стратегия качества в промышленности и образовании», (г. Варна, Болгария – 2011); VIII-й Международной конференции «Стратегия качества в промышленности и образовании» (2012., г. Варна, Болгария); XXI Всероссийской научно-методической конференции «Телематика -2014» (Санкт-Петербург); Международных конференциях: «Региональная информатика» РИ-2014; РИ-2012; РИ -2008; «Информационная безопасность регионов России» (ИБРР-2013);
Международной Научной Школе «Моделирование и Анализ Безопасности и Риска в Сложных Системах» МА БР - 2011 (Санкт-Петербург, 2011 г.); межвузовской конференция «Актуальные проблемы организации и технологии защиты информации» (Санкт-Петербург. 30.11.2011), III Международной научно-практической конференции "Инновационные технологии в сервисе» – 2012; межвузовской конференции Современные проблемы экономики и менеджмента предприятий лесного комплекса – 2012; II Всероссийской молодежной научно-практической конференции «Исследования молодежи – экономике, производству, образованию» (Санкт-Петербург 2011); международной научно-практической конференции «XXXIX Неделя науки СПбГПУ», 2010; Научно-технической конференции "Проблема комплексного обеспечения информационной безопасности и совершенствование образовательных технологий подготовки специалистов силовых структур" – 2010 г.; международной научно-методологической конференции «Актуальные проблемы развития высшей школы» (Санкт-Петербург,2010); на VII международной конференции «Найновите постижения на европейската наука» - (София 2011 Болгария); второй международной научно-практической интернет-конференции «ЛЕСА РОССИИ В XXI ВЕКЕ»- 2010; конференции «Актуальные проблемы технико-технологического и социально-экономического обеспечения сферы сервиса» Санкт-Петербург, конгрессе молодых ученых (Университет ИТМО 2014, 2015 г.) и научно-методической конференции Университета ИТМО.
Публикации. По теме диссертации опубликовано 47 научных работ, в том числе 17 статей в журналах, включнных в Перечень ВАК, и в том числе 1 статья в журнале, индексируемом базой Scopus.
Внедрения результатов. Исследования выполнены в рамках НИР Методы и модели обеспечения интегрированной безопасности и устойчивости функционирования компьютерных систем (НИР 414650) № госрегистрации 114050540015 и НИР 610481: Разработка методов и средств системотехнического проектирования информационных и управляющих вычислительных систем с распределенной архитектурой. Внедрение подтверждено соответствующими актами.
Модели компьютерных систем с резервированным обслуживанием запросов. Задачи проектирования кластеров реального времени
Современные высоконадежные компьютерные системы, как правило, строятся на основе сетевых технологий и включают в свой состав резервированные серверы различного функционального назначения (Web-серверы, почтовые серверы, серверы баз данных, FTP-серверы и т. п.), объединяемые в кластеры. Кластер - группа компьютеров, объединённых высокоскоростными каналами связи, представляющая с точки зрения пользователя единый вычислительный ресурс [74].
Кластер представляет собой объединение компьютеров, управляемых и используемых как единое целое. В качестве узлов кластера могут выступать серверы, рабочие станции, персональные компьютеры и системы хранения. Преимущество кластеризации заключается в потенциальной возможности обеспечения высокой отказоустойчивости, которая проявляется в случае сбоя или отказа какого-либо узла и перераспределения его нагрузки на справные узлы возможно без прерывания вычислительного процесса.
Компьютеры, образующие кластер (узлы кластера), обычно допускают остановку или выключение любого из них для проведения профилактических работ, установки дополнительного оборудования или ремонта без остановки функционирования всего кластера.
Высокая доступность (High Availability) кластеров (cluster) достигается в результате, консолидации устройствам хранения (Storage), при которой каждый вычислительный узел – сервер (Server) кластера имеет доступ ко всем информационным ресурсам [74,75]. В крупномасштабных системах консолидация устройств хранения достигается на основе технологии сетей хранения данных Storage Area Network (SAN)- сетей, предназначенных для обеспечения подключения вычислительных узлов (серверов) к устройствам хранения (к дискам, RAID-массивам -Redundant Array of Independent Disks - и ленточным библиотекам) и обмена данными между ними. [74].
Сети хранения выдвигают жесткие требования к надежности и производительности коммутаторов и маршрутизаторов. Узлы, подключенные к SAN, предназначены для прямой связи с устройствами хранения, поэтому доставка с нарушением порядка пакетов или их потери должны быть исключены [74]. Коммутационные узлы, обеспечивающие требования сетей хранения, характеризуются высокой стоимостью и сложностью, что может в ряде случаев отрицательно влиять на эффективность и надежность кластерных систем. В связи с этим при построении не больших кластерных систем в ряде случаев целесообразно прямое подключение устройств хранения к серверным (вычислительным) узлам (архитектура DAS- Directly Attached Storage) [74].
Типовой вариант построения кластера с дублированием устройств хранения и их прямым подключением к дублированным серверам (архитектуры DAS), описанный в работе [74] представлен на рисунке 1. В конфигурации по рисунку 1.1 выделяются группы, содержащие пару серверов и пару устройств хранения при их полной связанности между собой.
Представляет определенный интерес исследование вариантов построения кластеров с прямым подключением серверов к устройствам хранения [76]. Цель таких исследований - обосновать выбор конфигураций, обеспечивающих при одинаковых затратах на реализацию системы ее большую отказоустойчивость надежность и доступность.
Сложность таких исследований обусловлена тем, что в общем случае модели надежности рассматриваемых конфигураций, не сводятся к параллельно-последовательным или иным известным моделям надежности [1-7,39], позволяющим учесть комбинаторное влияния расположения отказов узлов на отказоустойчивость системы при различных вариантах прямой связанности серверов и устройств хранения.
В рамках означенного направления исследования в работе [76]: рассмотрены некоторые варианты кластеров с непосредственным резервированным подключением серверов и устройств хранения (рисунок 1.2); проанализирована отказоустойчивость конфигураций кластеров с прямым подключением устройств хранения к дублированным серверам приложений m типов, в которых каждый сервер имеет два порта (входа) для подключения устройств хранения, а каждое устройство хранения два входа для подключения серверов; показана существенная зависимость отказоустойчивости рассматриваемых конфигураций кластеров от порядка подключения устройств хранения к серверам приложений.
Модели кластера реального времени с резервированным обслуживанием запросов при уничтожении в очереди просроченных запросов
Современные высоконадежные компьютерные системы, как правило, строятся на основе сетевых технологий и включают в свой состав резервированные серверы различного функционального назначения (Web-серверы, почтовые серверы, серверы баз данных, FTP-серверы и т. п.), объединяемые в кластеры. Кластер - группа компьютеров, объединённых высокоскоростными каналами связи, представляющая с точки зрения пользователя единый вычислительный ресурс [74].
Кластер представляет собой объединение компьютеров, управляемых и используемых как единое целое. В качестве узлов кластера могут выступать серверы, рабочие станции, персональные компьютеры и системы хранения. Преимущество кластеризации заключается в потенциальной возможности обеспечения высокой отказоустойчивости, которая проявляется в случае сбоя или отказа какого-либо узла и перераспределения его нагрузки на справные узлы возможно без прерывания вычислительного процесса.
Компьютеры, образующие кластер (узлы кластера), обычно допускают остановку или выключение любого из них для проведения профилактических работ, установки дополнительного оборудования или ремонта без остановки функционирования всего кластера.
Высокая доступность (High Availability) кластеров (cluster) достигается в результате, консолидации устройствам хранения (Storage), при которой каждый вычислительный узел – сервер (Server) кластера имеет доступ ко всем информационным ресурсам [74,75]. В крупномасштабных системах консолидация устройств хранения достигается на основе технологии сетей хранения данных Storage Area Network (SAN)- сетей, предназначенных для обеспечения подключения вычислительных узлов (серверов) к устройствам хранения (к дискам, RAID-массивам -Redundant Array of Independent Disks - и ленточным библиотекам) и обмена данными между ними. [74].
Сети хранения выдвигают жесткие требования к надежности и производительности коммутаторов и маршрутизаторов. Узлы, подключенные к SAN, предназначены для прямой связи с устройствами хранения, поэтому доставка с нарушением порядка пакетов или их потери должны быть исключены [74]. Коммутационные узлы, обеспечивающие требования сетей хранения, характеризуются высокой стоимостью и сложностью, что может в ряде случаев отрицательно влиять на эффективность и надежность кластерных систем. В связи с этим при построении не больших кластерных систем в ряде случаев целесообразно прямое подключение устройств хранения к серверным (вычислительным) узлам (архитектура DAS- Directly Attached Storage) [74].
Типовой вариант построения кластера с дублированием устройств хранения и их прямым подключением к дублированным серверам (архитектуры DAS), описанный в работе [74] представлен на рисунке 1. В конфигурации по рисунку 1.1 выделяются группы, содержащие пару серверов и пару устройств хранения при их полной связанности между собой.
Представляет определенный интерес исследование вариантов построения кластеров с прямым подключением серверов к устройствам хранения [76]. Цель таких исследований - обосновать выбор конфигураций, обеспечивающих при одинаковых затратах на реализацию системы ее большую отказоустойчивость надежность и доступность.
Сложность таких исследований обусловлена тем, что в общем случае модели надежности рассматриваемых конфигураций, не сводятся к параллельно-последовательным или иным известным моделям надежности [1-7,39], позволяющим учесть комбинаторное влияния расположения отказов узлов на отказоустойчивость системы при различных вариантах прямой связанности серверов и устройств хранения.
В рамках означенного направления исследования в работе [76]: рассмотрены некоторые варианты кластеров с непосредственным резервированным подключением серверов и устройств хранения (рисунок 1.2); проанализирована отказоустойчивость конфигураций кластеров с прямым подключением устройств хранения к дублированным серверам приложений m типов, в которых каждый сервер имеет два порта (входа) для подключения устройств хранения, а каждое устройство хранения два входа для подключения серверов; показана существенная зависимость отказоустойчивости рассматриваемых конфигураций кластеров от порядка подключения устройств хранения к серверам приложений.
Варианты В2- В3 потенциально направлены на повышение надежности вычислений в условиях ошибок и отказов, вариант В2 -на повышение своевременности вычислений, а варианты В3 - В5 - на повышение как своевременности, так и достоверности вычислительного процесса (относительно базового варианта В1).
Проводимые исследования включают оценку:
своевременности обслуживания запросов в предположении отсутствия отказов, сбоев и ошибок во время пребывания запроса;
функциональной надежности вычислительного процесса при требовании своевременности выдачи результатов с учетом возможности отказов, сбоев и ошибок во время пребывания запросов в системе.
Разрабатываемые модели надежности резервированного вычислительного процесса должны отражать влияние резервированного выполнения запросов в разных узлах, содержащих очереди, на своевременность выдачи результатов, с учетом увеличения загрузки узлов и вероятности безошибочной и безотказной работы, хотя бы одного из выполняющих резервированный запрос узлов.
Оценка своевременности результатов при резервированном обслуживании запросов. Рассмотрим модель надежности резервированного вычислительного процесса при абсолютной надежности узлов и идеальном контроле, когда к моменту выполнения запроса без дополнительных задержек вырабатывается информация о правильности (достоверности) вычислений.
Задержками на организацию взаимосвязи узлов по обеспечению выдачи результатов только с узла первым их получившим будем пренебрегать. Уменьшение загрузки узлов в результате потенциальной возможности удаления резервированных запросов из очередей после получения результатов вычислений хотя бы в одном узле кластера учитывать не будем.
Функциональная надежность вариантов отказоустойчивых кластеров реального времени с непосредственным подключением устройств хранения
Для вычислительной системы кластерной архитектуры реального времени предложены постановка и решение задачи нахождения оптимальной кратности резервирования вычислительного процесса, при которой достигается максимум вероятности безошибочного обслуживания запроса, при времени его нахождения в очереди меньше предельно допустимой величины t0 хотя бы в одном из k узлов, принимающих запрос к резервированному выполнению.
Показана высокая эффективность резервированного выполнения запросов в реальном времени, при снижении оптимальной кратности резервирования в случае роста интенсивности запросов в результате влияния увеличения кратности резервирования на возрастание загрузки узлов, приводящей к существованию границы интенсивности, выше которой резервирование обслуживания становится не целесообразным.
Показана эффективность адаптивного изменения кратности резервирования в зависимости от значения интенсивности входного потока запросов, с учетом существования границы интенсивности запросов, выше которой резервированное выполнение запросов нецелесообразно.
Эффективность использования резервированных ресурсов, в том числе по возможности, управления энергопотреблением, достигается при их консолидации в результате объединения компьютерных узлов в кластеры. Консолидация ресурсов хранения и обработки данных в кластерах позволяет реализовать динамическое распределение поступающего потока запросов [74-78] при адаптивной реконфигурации системы к накоплению отказов и изменениям входной нагрузки [28-34]. Для кластерных систем при адаптивной реконфигурации с целью повышения экономической эффективности предоставления информационных услуг реального времени, когда стоимость услуги зависит от задержки ее предоставления, должны учитывать требования своевременности обслуживания запросов при минимизации энергосбережения кластера.
Для обеспечения своевременности предоставления информационных услуг в зависимости от интенсивности потока запросов может потребоваться различное число активных компьютерных узлов, что позволяет реализовать режим энергосбережения на основе адаптивной реконфигурации системы, при которой часть узлов, сверх минимально необходимого числа для качественного обслуживания запросов, может отключаться (переключаться в холодный резерв). При обнаружении увеличения потока запросов происходит адаптивное подключение необходимого числа узлов, находящихся в холодном резерве. Для рассматриваемой организации кластерных систем большей гибкости и соответственно больших возможностей по адаптивной реконфигурации потенциально можно достичь при объединении в кластер большего числа более простых и дешевых компьютерных узлов, в том числе на основе технологии Blade-серверов, которые имеют собственные системы управления охлаждением и электропитанием [102].
Таким образом, представляется актуальным исследование возможностей адаптивной энергосберегающей реконфигурации кластерных систем, которая потенциально может привести к повышению экономической эффективность предоставления информационных услуг в реальном времени, когда стоимость услуги зависит от задержки ее предоставления. Рассмотрим вычислительную систему кластерной архитектуры, предназначенную для предоставления информационных услуг в реальном времени в условиях сбоев, отказов и ошибок. Кластерная система объединяет п одинаковых серверов, представимых одноканальными системами массового обслуживания с бесконечной очередью. В кластер с интенсивностью поступает общий поток запросов, каждый из которых может быть распределен на обслуживание в любой узел. Среднее время обслуживания запросов во всех узлах будем считать одинаковым и равным v .
Будем считать, что при предоставлении информационных услуг в реальном времени, прибыль от безошибочного выполнения каждого запроса, если время его ожидания была меньше t0 равна ах, а если больше t0 или результат ошибочный, то налагается штраф равный а2, при этом расходы на электропитание каждого узла в единицу времени равны a3. Будем считать, что имеется возможность отключения узлов (серверов) и отказов от предоставления услуг без наложения каких либо санкций.
Проанализируем возможности повышения экономической эффективности предоставления информационных услуг в реальном времени в результате адаптивной энергосберегающей реконфигурации системы, сопровождающейся отключением компьютерных узлов, избыточных для обеспечения требуемого качества услуг.
Достижение поставленной цели сопряжено с: построением модели кластера, позволяющей оценить эффективность предоставления информационных услуг реального времени в зависимости от интенсивности входного потока запросов и числа активных узлов кластера; постановкой и решением задачи поиска оптимального числа отключаемых узлов (переключаемых в холодный резерв), позволяющего максимизировать эффект от предоставления услуг в реальном времени с учетом затрат на энергопотребление.
Оптимизация перераспределения запросов в кластерах при изменяющейся активности источников запросов
Оптимизацию проводим по аддитивному критерию А при условии: (( +(1-4)AMV0// 1)A(((1- ) + (1-4)A)2M// 1)A(((1- ) + A4) 0/7 1) (4.3) Примеры оптимизации. Для случая перераспределения запросов только от первого кластера определим оптимальную долю перераспределяемых через сеть запросов в зависимости от числа /, сохраненных после отказов узлов первого кластера и исправности j=m=10 узлов второго кластера. Оптимизацию проведем по аддитивному критерию А при условии (4.3). Для оптимизации в системы компьютерной математики Mathcad 15 воспользуемся блоком «Given -Minimaze(T,g)». При расчетах предположим, что п=10 шт., т=10 шт., v0 =0,15 =0,01 с, р = 0,6, Л = 15 сх а = 0,6 с. Результаты расчетов для варианта перераспределения запросов только от первого кластера представлены на рисунке 4.2, на котором кривая 1 соответствует оптимальной доли запросов, выполняемых первым кластером без их перераспределения через сеть, при j=10. Кривая 2 соответствует среднему времени пребывания запросов, поступающих в первый кластер и перераспределяемых на обслуживание во второй кластер с вероятностью (1-gy). Кривые 3 и 4 соответствуют средним временам пребывания запросов, поступающих в первый кластер, при их перераспределении во второй кластер с вероятностью (1-g)=0,2 и (1-g)=0 без учета реального числа отказавших узлов. Кривая 5 соответствуют среднему времени пребывания Т2 запросов во втором кластере при оптимальной доле (1-g перераспределяемых запросов, кривые 6 и 7 соответствуют средним временам пребывания Т2 при (1-g)=0,2 и (1-gj=0.
Для случая перераспределения запросов от обоих кластеров определим оптимальные доли перераспределяемых через сеть запросов в зависимости от числа /, сохраненных после отказов узлов первого кластера. Результаты расчетов для =0,15 =0,01 с, /? = 0,5, Д = 15с"1а = 0,5 с. представлены на рисунке 4.3.
Кривые 1 и 2 соответствуют оптимальным долям запросов, выполняемых первым и вторым кластерами без их перераспределения через сеть, при работоспособности j=5 узлов второго кластера. Установлено, что при j=10, =0,5 перераспределение от второго кластера нецелесообразно, а оптимальной доли запросов, выполняемых первым кластером без их перераспределения через сеть, соответствует кривая 3. Зависимости от / средних времен пребывания запросов, поступающих при формировании в первый и второй кластеры, при j=10 соответствуют кривые 4, 5, а при j=5 - кривые 6, 7.
Проведенные расчеты подтверждают эффективность использования межкластерного перераспределения запросов с целью снижения отрицательного влияния накопления отказов на увеличение задержек обслуживания запросов в системе кластеров.
Приведенные расчеты показывают существование оптимальной доли запросов, перераспределяемых через сеть при ее зависимости от соотношения отказавших узлов различных кластеров.
Установлено, что при изменении соотношения числа отказавших узлов различных кластеров требуется соответствующее адаптивное изменение долей перераспределяемых запросов от различных кластеров, причем отклонение этих долей от оптимальных приводит к росту задержек обслуживания запросов в системе кластеров.
Таким образом, предложена модель многокластерной системы с перераспределением запросов между кластерами через сеть, учитывающая процесс деградации системы при накоплении отказов.
Определены оптимальные доли запросов, перераспределяемых через сеть запросов различных кластеров в процессе их деградации при различной организации перераспределения запросов с целью минимизации средних времен пребывания запросов.
Определим вероятность работоспособности системы для локального кластера из n серверов с учетом возможности использования в качестве резерва ресурсов m серверов общедоступного кластера, связь с которым обеспечивается через N коммутационных узлов [35].
Предположим, что пропускная способность каждого коммутационного узла достаточна, чтобы не ограничивать возможности перераспределения запросов, то есть если исправен хотя бы один коммутационный узел, то запросы могут перераспределяться в общедоступный кластер, но для реализации такого перераспределения в локальном кластере должен быть исправен хотя бы один вычислительный узел. С учетом этих условий вероятность работоспособности системы: