Электронная библиотека диссертаций и авторефератов России
dslib.net
Библиотека диссертаций
Навигация
Каталог диссертаций России
Англоязычные диссертации
Диссертации бесплатно
Предстоящие защиты
Рецензии на автореферат
Отчисления авторам
Мой кабинет
Заказы: забрать, оплатить
Мой личный счет
Мой профиль
Мой авторский профиль
Подписки на рассылки



расширенный поиск

Метод повышения надежности и совершенствование архитектуры информационно-телекоммуникационных систем Савельев Иван Андреевич

Метод повышения надежности и совершенствование архитектуры информационно-телекоммуникационных систем
<
Метод повышения надежности и совершенствование архитектуры информационно-телекоммуникационных систем Метод повышения надежности и совершенствование архитектуры информационно-телекоммуникационных систем Метод повышения надежности и совершенствование архитектуры информационно-телекоммуникационных систем Метод повышения надежности и совершенствование архитектуры информационно-телекоммуникационных систем Метод повышения надежности и совершенствование архитектуры информационно-телекоммуникационных систем Метод повышения надежности и совершенствование архитектуры информационно-телекоммуникационных систем Метод повышения надежности и совершенствование архитектуры информационно-телекоммуникационных систем Метод повышения надежности и совершенствование архитектуры информационно-телекоммуникационных систем Метод повышения надежности и совершенствование архитектуры информационно-телекоммуникационных систем Метод повышения надежности и совершенствование архитектуры информационно-телекоммуникационных систем Метод повышения надежности и совершенствование архитектуры информационно-телекоммуникационных систем Метод повышения надежности и совершенствование архитектуры информационно-телекоммуникационных систем
>

Диссертация - 480 руб., доставка 10 минут, круглосуточно, без выходных и праздников

Автореферат - бесплатно, доставка 10 минут, круглосуточно, без выходных и праздников

Савельев Иван Андреевич. Метод повышения надежности и совершенствование архитектуры информационно-телекоммуникационных систем : диссертация ... кандидата технических наук : 05.12.13 / Савельев Иван Андреевич; [Место защиты: Моск. гос. ин-т электроники и математики].- Москва, 2010.- 172 с.: ил. РГБ ОД, 61 10-5/1976

Содержание к диссертации

Введение

Глава 1 Состояние проблемы надежностного синтеза информационно-телекоммуникационных систем 15

1.1. Системный подход к надежностному проектированию информационно-телекоммуникационных систем 15

1.2. Методы обеспечения надежности 27

1.3. Методы повышения надежности 32

1.4. Катастрофоустойчивые системотехнические решения 39

Глава 2. Методология надежностного синтеза информационно-телекоммуникационных систем 51

2.1. Концептуально-методологические положения надежностного синтеза информационно-телекоммуникационных систем 51

2.1.1. Отправные методологические положения 52

2.1.2. Формально-математические условия 56

2.2. Логическая организация этапов и задач формализованной технологии надежностного синтеза информационно-телекоммуникационных систем 59

2.3. Принципы построения исходной модели структурно-функциональной целостности 62

2.3.1. Выбор формального способа задания критерия структурно- функциональной целостности 62

2.3.2. Принципы формирования морфологии дерева целей 64

2.4. Определение аналитических объектов надежностного синтеза информационно-телекоммуникационных систем 73

2.4.1. Определение исходных конструктивных объектов 73

2.4.2. Определение аналитических конструктивных объектов 76

2.5. Математический аппарат формирования структурно-функциональной целостности 90

2.5.1. Классы эквивалентности отображений на уровнях дерева целей 90

2.5.2. Определение критерия структурно-функциональной целостности 101

Глава 3. Методы и модели надежностного синтеза информационно- телекоммуникационных систем 109

3.1. Методы и модели оценки надежности информационно-телекоммуникационных систем 109

3.2. Методы повышения аппаратной надежности на этапе развития катастрофоустойчивой структуры 125

3.3. Сценарии отказов кластерной инфраструктуры 132

3.4. Управление развитием кластерного информационного пространства... 137

3.5. Пример формирования оптимального плана развития кластерной ИТС 142

Глава 4. Анализ эффективности реализации методов обеспечения и повышения надежности 147

4.1. Аппаратное и программное обеспечение 147

4.2. Формирования вариантов информационно-телекоммуникационной системы по критерию надежности 152

4.3. Анализ экономического эффекта от увеличения надежности ИТС 161

Заключение 166

Литература 167

Введение к работе

I. Актуальность темы. В 90-х годах в стране появился новый вид информационно-телекоммуникационных систем (ИТС), так называемые «корпоративные сети». Анализ ряда известных действующих и проектируемых сетей, которые в полной мере могут быть отнесены к разряду корпоративных (ИТКБС ЦБ РФ, сеть ОАО «Газпром», ОАО «Транснефть» и др.) показывает, что такие сети:

проектируются и строятся с жесткой ориентацией на решение функциональных задач, выполняемых компанией (например, ИТКБС ЦБ РФ - оперативный и надежный банковский оборот);

ориентируются преимущественно на собственные системы связи и телекоммуникаций;

ресурс сетей связи общего пользования используют главным образом для информационного обмена объектов корпоративной сети с объектами других сетей;

реализуются на базе оборудования, воплощающего в себе самые современные технологии;

создаются с учетом обеспечения самых высоких требований по надежности ИТС.

Однако, практика проектирования таких сетей в настоящее время сталкивается с рядом трудностей, обусловленных многими факторами, основными из которых являются:

жесткие требования к надежности и структурной целостности таких систем, при которых определяющие формы устойчивости носят в основном структурный характер и требуют разработки специальных мер. При этом важна взаимосвязь и согласованность всех составных частей: эффективности функционирования, надежности и структурной целостности, выразившаяся в понятии структурно-функциональной целостности ИТС;

необходимость быстрой адаптации и коррекции структуры системы в условиях резкого изменения спроса и ресурсов в отдельных звеньях, что приводит к необходимости получения более эффективной, однозначной взаимосвязи иерархий целей ИТС и ее архитектуры. Предлагаемые методы поддержки высокой эффективности и надежности функционирования ИТС опираются на серьезную дополнительную алгоритмическую поддержку, которая предполагает сначала определение места дефекта, а

потом соответствующее программно-аппаратное решение. Однако, в ответственных системах, работающих в реальном масштабе времени, необходимо сохранение практически 100% работоспособности при наличии одного и более отказов. В таких системах нет времени на устранение неисправности, т.е. система должна иметь необходимую избыточность и как бы не замечать этих отказов;

- быстрое моральное старение технической базы ИТС, приводящее к серьезным доработкам и соответствующим затратам.

Поэтому одной из основных задач становится создание ИТС, которые обеспечивали бы устойчивость системы к программным и аппаратным сбоям, а также обеспечивали катастрофоустойчивое решение, главная задача которого - сохранение данных и продолжение работы в условиях массовых и, возможно, последовательных отказов систем и связанных между собой подсистем корпоративной информационной структуры. Технология отработки отказов в этом случае требует учета взаимосвязанности структурных компонент и способности систем специфически реагировать на каждый вариант последовательности развития событий, так называемый, сценарий катастрофы с целью обеспечения максимально возможной сохранности информации.

Все вышесказанное позволяет сформулировать задачу, на решение которой направлена настоящая работа, а именно, формирование оптимального плана развития и повышение надежности информационно-телекоммуникационных систем на основе теории структурно-функциональной целостности, позволяющих сократить сроки и затраты на создание ИТС.

Поэтому разработка методов повышения надежности ИТС на всех этапах развития системы является важной и актуальной задачей, имеющей большое практическое значение.

Целью диссертационной работы является разработка эффективных путей развития и повышение надежности информационно-телекоммуникационных систем на основе теории структурно-функциональной целостности, позволяющих сократить сроки и затраты на создание ИТС.

Для достижения поставленной цели решались следующие основные задачи исследования:

1) анализ существующих моделей и методов оценки показателей надежности ИТС;

  1. разработка и исследование методов определения объектов проектируемых подсистем, реализующих функцию «носителей» свойства структурно-функциональной целостности на всех этапах синтеза ИТС;

  2. формализация задач оптимального формирования эффективных путей развития надежных структур ИТС;

  3. разработка методики совершенствования архитектуры сети, обеспечивающей минимум дефицита надежности на всем интервале времени, выделенном на развитие ИТС.

Методы исследований. Решение сформулированных в диссертации задач выполнено на основе теории систем и системного анализа, теории факторного и кластерного анализа, методов исследования операций, программно-целевого планирования и управления, теории графов, некоторых разделов математической логики и теории больших систем.

Достоверность научных результатов, выводов и рекомендаций подтверждается математическими доказательствами сформулированных положений, расчетами и примерами, подтверждающими повышение надежности ИТС при минимальной стоимости, сопряжением с существующими методами и результатами.

Научная новизна работы заключается в разработке метода формирования и управления развитием архитектуры ИТС, обеспечивающего катастрофоустойчивость при обработке и передаче информации и обоснованность выбора рациональных вариантов развития структуры системы с учетом категории катастрофоустойчивости на всем жизненном цикле. Создан комплекс решений слабо структурированных задач синтеза надежных ИТС, использование которого дает возможность значительно повысить обоснованность выработки эффективных проектных решений, снизить затраты на проектирование и адекватно разрешить актуальные требования практики, направленные на обеспечение надежности.

В плане последовательного достижения цели работы получены следующие основные научные результаты:

1. Разработан метод определения объектов проектируемых подсистем, реализующих функцию «носителей» свойства структурно-функциональной целостности на всех этапах синтеза ИТС, отражающий взаимосвязь и согласованность требований

по обеспечению эффективности функционирования, надежности и структурной целостности.

  1. Разработан метод надежностного синтеза ИТС на основе теории структурно-функциональной целостности, позволяющий на более ранних стадиях проектирования получить оценки надежности разрабатываемой структуры, реально достижимой эффективности и требуемых затрат, а также, быстрой коррекции информационной инфраструктуры в процессе эксплуатации или при модификации отдельных подсистем.

  2. Разработана оптимизационная модель формирования эффективных путей развития надежных структур ИТС, обеспечивающая последовательное поэтапное повышение уровня надежности ИТС, позволяющая реализовать на промышленных предприятиях новую технологию проектирования, сократить сроки проектирования и суммарные затраты на создание информационно-телекоммуникационной системы.

  3. Разработана методика совершенствования архитектуры сети, обеспечивающая минимум дефицита надежности на всем интервале времени, выделенном на развитие ИТС, позволяющая решать практические задачи по качественной оценке уровня катастрофоустойчивости и оптимальному развитию структуры системы при избыточности элементов.

Основные научные результаты диссертационной работы, выносимые на защиту:

  1. Метод определения объектов проектируемых подсистем, реализующих функцию «носителей» свойства структурно-функциональной целостности на всех этапах синтеза ИТС, отражающий взаимосвязь и согласованность требований по обеспечению эффективности функционирования, надежности и структурной целостности.

  2. Метод надежностного синтеза информационно-телекоммуникационных систем на основе теории структурно-функциональной целостности, отражающий взаимосвязь и согласованность требований по обеспечению эффективности функционирования, надежности и структурной целостности.

  3. Оптимизационная модель формирования эффективных путей развития инфраструктуры, обеспечивающая последовательное поэтапное повышение уровня надежности ИТС, позволяющая реализовать на промышленных предприятиях новую

технологию проектирования, сократить сроки проектирования и суммарные затраты на создание информационно-телекоммуникационной системы.

4. Методика совершенствования архитектуры катастрофоустойчивых ИТС, обеспечивающая минимум дефицита надежности на всем интервале времени, выделенном на развитие ИТС, позволяющая решать практические задачи по качественной оценке уровня катастрофоустойчивости и оптимальному развитию структуры системы при избыточности элементов.

Практическая ценность результатов.

Итогами диссертационной работы являются разработанные и переданные в эксплуатацию в ряд организаций программно-алгоритмические комплексы поддержки и автоматизации формирования высоконадежных кластерных структур ИТС, методики и рекомендации по построению информационно-телекоммуникационных систем с учетом обеспечения катастрофоустойчивости, которые дают возможность:

использовать на этапе проектирования модели и методы синтеза ИТС более адекватно, чем существующие, отражающие актуальные требования практики и перспективы развития технологии синтеза систем, в частности, взаимосвязь и согласованность требований по обеспечению эффективности функционирования, надежности и структурной целостности, сокращения сроков всех стадий проектирования, интеграции и эволюционности на модульной основе, разработки требований к системам отдельных видов обеспечения;

на более ранних стадиях проектирования получить оценки показателей надежности разрабатываемой структуры, реально достижимой эффективности и требуемых затрат - для сравнения их с ожидаемой эффективностью, используя для этого аппарат быстрой коррекции информационной инфраструктуры при необходимости в этом в процессе эксплуатации или при модификации отдельных подсистем;

решать новые задачи по качественной оценке уровня катастрофоустойчивости (экспресс-анализ кластер-кворума) и оптимальному развитию структуры системы при адекватной избыточности элементов.

При этом за счет автоматизации, сокращения сроков разработки и повышения качества проектных решений получен значительный технико-экономический, организационный и социальный эффект.

Отдельные результаты диссертационной работы находят применение в учебном процессе в МИЭМ и ВГНА Минфина России. Научные результаты использованы при написании учебных пособий по соответствующим курсам.

Отдельные результаты диссертационной работы нашли применение при создании систем связи специального назначения («Ладья», «Динамика» и др.) в ФГУП «МНИРТИ» и ООО «НИИСТ» и при выполнении гранта Российского фонда фундаментальных исследований на тему «Теория оптимизации кластерных структур ката-строфоустойчивых информационно-управляющих систем».

Апробация результатов работы. Основные положения диссертационной работы докладывались и обсуждались на 6 всероссийских и международных симпозиумах и конференциях. В том числе на VII Международном симпозиуме «Интеллектуальные системы» INTELS'2006 (Краснодар, 2006), Всероссийской научно-практической конференции «Инженерные системы - 2008» (Москва, 2008), Научно-технической конференции «Современные инженерные технологии- 2008» (Москва, 2008), 3-й Международной научно-практической конференции «Наука и устойчивое развитие общества. Наследие В.И. Вернадского» (Тамбов, 2008), 10-й Международной научно-практической конференции «Проблемы модернизации экономики в России в XXI веке» (Москва, 2008), II Всероссийская научно-практическая конференция «Информационные технологии в науке, бизнесе и образовании» (Москва, 2009).

Кроме того, результаты диссертации докладывались и обсуждались на конференциях, совещаниях и семинарах подразделений МИЭМ и ВГНА Минфина России и в ряде организаций различных ведомств.

Публикации результатов работы. Основные результаты работы опубликованы в 2 монографиях, 3 статьях, 2 из которых в рецензируемых журналах, рекомендованных ВАК для публикаций результатов диссертаций, и 4 трудах конференций.

Структура и объем диссертации. Диссертация состоит из введения, четырех глав, заключения, списка литературы из 81 наименования, приложения. Всего 172 страницы текста с иллюстрациями и таблицами.

Катастрофоустойчивые системотехнические решения

Отказоустойчивости сегодня посвящено много публикаций [1-8, 15, 17, 18, 27, 29, 41 - 49, 60 - 66], однако присутствуют некоторые терминологические несоответствия, особенно в переводе англоязычных терминов. Это вызывает определенные трудности в понимании деталей, поэтому в начале имеет смысл определится с терминологией, на которой будет базироваться дальнейшее изложение материала.

Под «отказоустойчивостью» будем понимать свойство системы сохранять работоспособность в случае случайного выхода из строя или сбоя отдельных компонентов. Под это определение попадают привычные англоязычные термины «High Availability» (НА), «Fault Resilient» (FR), «Fault Tolerance» (FT) и т.п., фактический смысл которых по существу заключается в количестве девяток после запятой в показателе надежности. Традиционно считается, что для обычнойсистемы достаточна надежность 99%, для НА - 99.9%, для FR - 99.99%», для FT -99.999% и т.д. [8].

Под «катастрофоустойчивостъю» будем понимать способность информационного комплекса, состоящего из нескольких систем, сохранять критически важные данные и продолжать выполнять свои функции после массового (возможно, целенаправленного) уничтожения его компонентов в результате различных катаклизмов как природного характера, так и инспирированных человеком. Этому определению точно соответствует англоязычный термин «Disaster Tolerance» (DT), однако в общем случае термин «Disaster Recovery» (DR) (дословно -«восстановление после катастрофы») можно также переводить как «катастрофо-устойчивость».

Отличие DR от DT состоит в том, что DR концентрирует внимание на сохранности данных (при строго контролируемых потерях, если они неизбежны), а средства для продолжения полноценной работы во многих случаях предполагаются внешними по отношению к собственно катастрофоустойчивой части комплекса.

В приведенных выше определениях показана разница в подходах к формированию отказоустойчивых и катастрофоустойчивых решений. В понятии «отказоустойчивость» акцент делается на восстановление работоспособности после единичных, случайных, не связанных между собой отказов компонентов. Технология отработки таких отказов предполагает, как правило, что в работу вводятся резервные компоненты каждой подсистемы, либо оставшиеся компоненты многократно дублированной подсистемы перераспределяют между собой работу независимо от того, что происходит в это время в других подсистемах информационно-телекоммуникационных систем.

В понятии «катастрофоустойчивость» главное - сохранение данных и продолжение работы в условиях массовых и, возможно, последовательных отказов систем и связанных между собой подсистем ИТС. Технология отработки отказов в этом случае требует учета взаимосвязанности подсистем и способности систем специфически реагировать на каждый вариант последовательности развития событий, так называемый, сценарий катастрофы с целью обеспечения максимально возможной сохранности защищаемых данных.

Второе различие заключается в распределении вероятностей отказов по подсистемам: в отказоустойчивых системах предполагается (хотя в большинстве случаев и неявно), что каналы связи между активными компонентами (например, медные или оптические кабели) гораздо надежнее самих активных компонентов, поскольку протяженность этих каналов ограничена и вероятность их повреждения в большинстве случаев относительно невелика. В территориально распределенных катастрофоустойчивых системах вероятность потери связи для каждого отдельного канала сравнима с вероятностью выхода из строя одного из активных компонентов. Именно это обстоятельство при проектировании и эксплуатации катастрофоустойчивой системы требует уделять повышенное внимание каналам связи и проблеме восстановления работоспособности после потери связи. При этом сценарии отработки отказов и настройка всегда формируются «по месту» - с учетом конкретных требований, как к комплексу в целом, так и к каждой площадке, принимая во внимание различные вероятности ожидаемых катастрофических событий. Таким образом, просто «распределенная» в пространстве (территориально) традиционная отказоустойчивая система без принятия дополнительных мер все же не может быть по-настоящему катастрофоустойчивой и в большинстве случаев не способна автоматически восстановить полную функциональность.

Катастрофоустойчивость структур кластерной информационно-телекоммуникационной системы предполагает в первую очередь обеспечение сохранности данных, а также возможность восстановить работу после крупной локальной аварии или глобального катаклизма, причем теми же средствами обеспечивается и должная степень надежности (а именно, традиционная или «локальная», отказоустойчивость [4]) всех или только критически важных подсистем. Так. как структурные компоненты распределены, то в случае массовых отказов на одной площадке основную работу можно перенести на другую площадку.

Логическая организация этапов и задач формализованной технологии надежностного синтеза информационно-телекоммуникационных систем

Определим характер этапов формализованной технологии надежностного синтеза ИТС и решаемых на каждом из них задач. Логическая организация взаимосвязанной последовательности этапов структурного синтеза и решаемых задач производится: 1) по определяемой далее иерархической схеме уровней предлагаемой концепции; 2) по сопоставлению задач отдельных этапов с фазами получения структурно-функциональной целостности.

Отправные методологические положения подхода, условия и требования, налагаемые формально-математическим характером реализации концепции обеспечения надежности (ФУОН), дают представление о том, что должно быть получено (и частично как может быть получено) в рамках концепции надежностного синтеза информационно-телекоммуникационных систем, отражая различные аспекты и степень детализации комплекса вопросов, взаимосвязанных и требующих своего разрешения. В определенной мере в них проявились и следующие представления: 1) о макрообъектах проектирования (системообразующая модель - дерево целей) и их элементах; 2) о характере фаз технологии формализованного синтеза ИТС; 3) о макроэтапах синтеза.

На основе этих представлений можно уже выделять отдельные направления концентрации усилий на их решение. Но, очевидно, это требует предварительного согласования различных степеней детализации элементов, условий и их взаимосвязи в рамках равномерности уровня огрубления абстракций и логической целостности концепции надежностного синтеза, т.е. необходимо логически организовать их решение в виде взаимосвязанной последовательности этапов формализованной технологии надежностного синтеза и соответствующих задач, решаемых на данных этапах. Различные авторы предлагают свои уровни представлений об этом, отражающие специфику решаемых ими задач.

Несмотря на их различия, содержательная общность схем всех подходов может быть проиллюстрирована первыми тремя уровнями иерархии концепции (из общих четырех уровней) по схеме подхода В.М. Глушкова: 1-й уровень - постановка задачи (определение объекта исследования, целей и критериев); 2-й уровень - очерчивание границ системы и ее первичной структуризации (разбиение на систему и внешнюю среду, определение замкнутости или открытости); 3-й уровень - составление математической модели системы (параметризация, выделение больших систем, иерархичности и т.д.).

Сопоставление содержательной сущности задач каждого из трех приведенных уровней концепции с содержательной сущностью трех фаз-этапов формализации технологии надежностного синтеза (п. 2.1.1) убеждает в возможности и целесообразности принятия данных фаз в качестве определителей соответствующих им уровней иерархии технологии надежностного синтеза информационно-телекоммуникационных систем. В силу ее важности для последующих разработок (и ссылок на нее) представим данную схему уровней в виде табл. 2.1.

Так, 2-й уровень иерархии соотносится с моделированием процесса передачи свойства структурно-функциональной целостности на множестве подкатегорий целей, а 3-й уровень иерархии связан с объектами подобных подкатегорий в плане частных задач и методов получения как их самих, так и свойств их структур. Каждому из уровней иерархии должно соответствовать свое множество задач, детализирующих и конкретизирующих в традиционных терминах объектов макрофункции (и макрозадачи) уровня при решении задачи первого этапа надежностного синтеза информационно-телекоммуникационных систем. Необходимость учета исходного различия задаваемых и формируемых, но определяемых до начала собственно процесса синтеза объектов (исходно-неанатипических и исходно-аналитических), порождает относительно автономный характер задачи формирования структурированной цепи «носителей» свойства структурно-функциональной целостности и задачи формирования слоев подсистем и входящих в них функциональных модулей.

Сопоставление перечня задач не только по уровням иерархии концепции надежностного синтеза ИТС, но и по фазам технологии реализации данных задач при рассмотрении их взаимосвязи между собой как подзадач основных задач, реализующих отдельные макрообъекты и макроэтапы проектирования требует сначала определить методологическую базу синтеза, т.е. вход - системообразующую модель (дерево целей) S\ и принципы ее построения, а также процесс передачи свойства структурно-функциональной целостности, т.е. цепь структурированных объектов-«носителей» S((zj), принципы и правила их формирования и упорядочения, соответствующие требованиям пп. 2.1.1 и 2.1.2 (ОМП и ФУОН).

Построение исходной модели структурно-функциональной целостности связано с выбором формального способа задания критерия структурно-функциональной целостности, в п. 2.3.1 связываемого с использованием аппарата полугрупп с единицей (моноидов) и с ориентацией дуг вверх на дереве целей. Принципы формирования адекватной морфологической структуры дерева целей и задание ее элементов целей при ориентации дуг вверх, на основе которых возможно определить характер формальной системообразующей модели надежностного синтеза, будут рассматриваться в п. 2.3.2. Цели как элементы дерева целей рассматриваются в обобщенной категории функций передачи, обработки информации и обеспечения надежности, живучести.

На данном этапе анализа типов деревьев целей отвлечемся от вопросов призначно-морфологической адекватности их как системообразующей модели, связанных с отражением структуры информационно-телекоммуникационных систем, а также от вопросов информационной и функциональной полноты показателей и параметров целей, связанных с применением экономико-математических методов их определения. Для этого, как правило, используются различные известные модификации методов многофакторного анализа и корреляционно-регрессионного анализа.

Методы повышения аппаратной надежности на этапе развития катастрофоустойчивой структуры

Большое значение в настоящие время в связи с повсеместной автоматизацией рабочих процессов придается совершенствованию структуры информационно-телекоммуникационных систем [8, 15]. Информационные системы корпораций хранят сегодня основную информацию о работе предприятий и фирм, и выход их из строя способен остановить работу корпорации. Очевидно, что такие жизненно важные системы (ВСС - Business Critical Computing) должны обладать адекватным уровнем отказоустойчивости в рамках отведенных бюджетов [26, 29].

Будем понимать под «отказоустойчивостью» количество одновременных отказов компонентов системы, которые приводят к прекращению работы - чем больше узлов системы нужно вывести из строя для прекращения ее работы, тем более отказоустойчива такая система. Отказоустойчивость повышает общую надёжность системы, собранной из недостаточно надежных компонентов. Требования по отказоустойчивости определяются по разности между требуемым уровнем надёжности и реальной надежностью существующих компонентов. Надёжность в свою очередь - это доля времени непрерывной работы вычислительной системы - чем больше эта величина, тем меньше система простаивает. Для критически важных приложений нужно добиваться минимум 99,9% надежности. Общим требованием сегодня стало «пять девяток» - 5 мин простоя в год. Однако такие же требования, нужно предъявлять и к сетевому оборудованию, каналам подключения и электропитанию. Естественно, что надежность серверов должна быть выше надежности рабочих станций и мобильных устройств [15].

Простое дублирование элементов системы зачастую не является эффективным решением проблем отказоустойчивости информационных технологий [3]. Существует ряд кластерных решений, но опять же возникает проблема развития системы в целом [15]. Усложнение структуры системы предъявляет повышенные требования к эффективности и качеству принимаемых решений на этапах развития систем.

В данной главе рассматривается проблема повышения устойчивости кластерных информационных технологий к сбоям в работе, на примере системы кластеров, путём управления развитием их инфраструктуры. Рассматривается формализация задачи планирования очередности и этапности создания сложных кластерных информационно-телекоммуникационных систем, модели и методы, позволяющие определить моменты начала и окончания разработки взаимосвязанных объектов кластерных структур, распределение ресурсов между ними на этапе планирования. Разрабатываемый подход, модели и методы основаны на теории надежностного синтеза ИТС и могут быть использованы для решения задач инвестиционного планирования создания крупномасштабных катастрофо-устойчивых кластерных информационно-телекоммуникационных систем.

Как указано в работах [15, 26], возможны два способа повышения доступности ресурсов программно-информационных технологий ИТС: увеличение индивидуальной надежности серверов и улучшение общесистемной отказоустойчивости. В первом случае увеличивается надежность каждого элемента системы, что позволяет строить конфигурации высокой доступности из небольшого количества компонентов. Для построения надежной распределенной системы в рамках корпорации обычно используется большое количество не очень надежных компонентов, а высокая надежность всей системы достигается многократным дублированием. Известны методы увеличения аппаратной надежности [15].

Используя резервирование, увеличивают отказоустойчивость компьютеров по отношению к сбоям внутренних компонентов: блоков питания, дисков, процессоров и т.п. При использовании резервирования главное вовремя заметить сбой и перевести систему на работу с резервным аналогом выходящего из строя компонента. При этом для резервирования, например, блоков питания не требуется программной поддержки, в то время как для устройств хранения информации и процессора часто приходится менять и программное обеспечение (ПО). В результате решение становится не универсальным, и его нельзя применить для других серверов.

Вместе с дублированием горячая замена позволяет выполнять ремонт серверов без прекращения их работы, что увеличивает доступность, но уменьшает отказоустойчивость и надежность компьютера во время смены блока. Наиболее сложно обеспечить горячую замену процессоров, памяти и жестких дисков, поскольку для этого нужно реализовать динамическую перестройку операционной системы. Кроме того, необходимо правильно спроектировать корпус сервера, который позволял бы менять внутренние элементы, не вынимая весь сервер из монтажной стойки.

Формирования вариантов информационно-телекоммуникационной системы по критерию надежности

Сегодня на рынке предлагаются всевозможные виды серверов, в той или иной степени обеспечивающих надежность информационной системы. Наряду с серверами применяются дисковые массивы (RAID), так же позволяющие увеличить надежность системы в целом. Более подробно методы обеспечения и повышения надежности рассмотрены в предыдущих главах. Первая подсистема может быть реализована с использованием 5 типов элементов, для второй - 4, для третьей - 3. Необходимо выбрать вариант системы, обладающей максимальной надежностью, применяя резервирование элементов подсистем. При этом не должны нарушаться ограничения (g ) на систему в целом, наложенные финансовыми возможностями: по стоимости - 15000 у.е.; по суммарной емкости винчестеров - 1000 Гб; по габаритам - 250000 см3 (в силу наличия стойки соответствующих размеров). Для начала необходимо провести отсев элементов по типам, не применяя резервирования. Для этого необходимо упорядочить элементы по строкам по возрастанию (три первые строки таблиц 4.3 - 4.5). Сумма элементов первого столбца в табл. 4.3 меньше ограничения на емкость и, таким образом, необходимые условия существования допустимых решений выполняются. Далее вычисляем допуск для элементов первой подсистемы и замечаем, что в допуск не попадают элементы 1.3 и 1.4. (так как их значения емкости выше допустимого). Результаты расчетов сведены в табл. 4.7. При выполнении данного ограничения условия существования допустимых решений в полученной таблице не выполняются по стоимости, поэтому в ней не будет допустимых элементов. В этом случае рассмотрим все оставшиеся комбинации проектирования системы и рассчитаем все значения параметров для системы в целом. Комбинации 6 и 8 отсеиваются по ограничению стоимости, по ограниче нию емкости и габаритов отсева не произошло. Комбинацией, удовлетворяющей условиям с наибольшей надежностью, является вариант 5. Рассчитанный показатель надежности системы в целом составляет 99.901. Характеристика полученной надежной ИТС приведена в табл. 4.11. Полученный вариант ИТС неулучшаем по надежности и, следовательно, является оптимальным. Дисковая система, установленная в техническом отделе, является наиболее надежной и высокопроизводительной из всех серверов в системе. Это обеспечивается путем зеркалирования, что приводит к созданию избыточности системы и возможности в любой момент произвести переключение на резервную дисковую систему в случае отказа оборудования или ПО. Это позволяет снизить время простоя ИТС и обеспечить постоянный доступ пользователям к ресурсам системы. Зеркалирование информации осуществляется по выделенному соединению между дисковыми системами при помощи двух дополнительных сетевых карт. Поддержание идентичности данных дисковых систем основано не на копировании файлов, а на зеркальной обработке транзакций. Помимо прочего сама дисковая системы на RAID первого уровня, использует зеркалирование, то есть, контроллер дублирует содержимое одного винчестера на другой, чтобы в случае выхода из строя одного из носителей, на втором осталась точная копия содержимого первого. RAID 1 увеличивает ресурс дисковой подсистемы, её время наработки на отказ. Вероятность того, что все жесткие диски системы выйдут из строя одновременно удовлетворяет требованиям, предъявляемым к системам повышенной надежности, а если сломается один из них, то его стоит просто заменить на новый и RAID контроллер восстановит функционирование массива. Данная необходимость объясняется тем фактом, что в техническом отделе накапливается и дополняется первичная информация, являющаяся основой для остальных подсистем и загруженность процессов в несколько раз превышает загруженность в других отделах. В отделе управления бухгалтерского учета и финансового контроля надежность обеспечивается за счет серверного кластера ProLiant CL1850R Cluster Информация крайне важна на жёстком диске, а динамическое её изменение делает невозможным постоянное резервное копирование. Под экономическим эффектом подразумевается получение реальной экономической отдачи от использования всей системы или ее отдельных функциональных блоков. Но определение экономической эффективности на этапе внедрения системы не реализуемо: на предприятии до внедрения отсутствует система контроллинга, которая подразумевает обязательное наличие ИТС, современной системы экономического анализа и учета [35]. Создание ИТС — не обычная экономическая задача, а скорее проект, который является процессом уникальным, ограниченным во времени и направленным на достижение строго определенных целей [7]. С другой стороны ИТС, срок жизни которой измеряется десятилетиями, нельзя рассматривать в отрыве от услуг, предлагаемых ее разработчиками для поддержки жизненного цикла: обследование предприятия и реорганизация бизнес-процессов; ввод в эксплуатацию (настройка и доработка системы); обучение персонала; сопровождение, модернизация и адаптация. Как показывает опыт [39], обоснование столь дорогостоящего проекта не поддается известным методам оценки экономической эффективности [8]. Невозможно подсчитать ни полный дисконтированный доход, ни внутреннюю норму доходности, ни даже срок окупаемости — нет данных о снижении затрат или о получении прибыли, связанной с принятием оптимальных управленческих решений. В то же время для оценки воздействия подобных решений на экономическую жизнь предприятия необходим большой массив информации, его сравнительный анализ и обобщение результатов. Эффектом от увеличения надежности ИТС является сокращение времени простоев, что является немаловажным в деятельности предприятия. Цена любой ошибки или сбоя в корпоративной сети очень высока и достигает десятков и сотен тысяч долларов. Для этого существует специальная методика подсчета времени простоя (методика, базирующаяся на ИТСО Advisor Client&Server Model) [25].

Похожие диссертации на Метод повышения надежности и совершенствование архитектуры информационно-телекоммуникационных систем