Содержание к диссертации
Введение
1. Современные подходы к построению сетей, их диагностике, анализу возможных организационно-технических мероприятий над сетью и основных подходов к их оперативному применению 13
1.1. Анализ технических средств передачи информации в современных вычислительных сетях 14
1.1.1. Особенности, виды и топологии сетей 14
1.1.2. Особенности и виды сетевых технологий 15
1.1.3. Физическая структура сети и сетевое оборудование 16
1.2. Особенности процесса модернизации и обеспечения работоспособности вычислительной сети 17
1.2.1 Обусловливающие факторы и сущность процесса модернизации. 17
1.2.2. Сущность процесса обеспечения работоспособности вычислительной сети 19
1.3. Основные подходы к построению сетей, их диагностике, возможные организационно-технические мероприятия над сетью 24
1.3.1. Требования, предъявляемые к современным сетям передачи данных 24
1.3.2. Специфика построения и обеспечения работоспособности локальных сетей 32
1.3.3. Анализ построения и обеспечения работоспособности корпоративных сетей 35
1.3.4. Особенности диагностики сетей 42
1.3.5. Подходы к моделированию сетей 45
1.4. Постановка цели и задач исследования 46
1.5. Выводы по первой главе 50
2. Разработка и исследование методик и формальных правил для автоматизации поддержки процесса обеспечения работоспособности вычислительной сети предприятия 53
2.1. Построение формализованной модели представления сети 53
2.1.1. Структурная декомпозиция сети 53
2.1.2. Формализация описания структурных элементов сети 56
2.2. Методика поиска нарушений функционирования вычислительной сети 59
2.2.1. Понятие проблемы функционирования сети 59
2.2.2. Локализация проблемы работы сети 61
2.2.3. Анализ контролируемых признаков 63
2.3. Методика выбора рекомендаций по устранению нарушений функционирования вычислительной сети 65
2.3.1. Общий вид правил выбора организационно-технических мероприятий 65
2.3.2. Суть методики выбора рекомендаций по устранению нарушений функционирования вычислительной сети 67
2.4. Создание ситуационных правил и правил выбора организационно-технических мероприятий 69
2.4.1. Классификация состояний сети и организационно-технических мероприятий 69
2.4.2. Схема задания правил и связанных с ними понятий 74
2.5. Выводы по второй главе 77
3. Разработка структуры, алгоритмов и информационного обеспечения системы поддержки работоспособности вычислительной сети предприятия .. 80
3.1. Разработка структуры функционирования системы 80
3.1.1. Общий принцип работы системы 80
3.1.2. Общий принцип работы блока ввода правил и описаний 83
3.1.3. Общий принцип работы блока представления сети 84
3.1.4. Общий принцип работы блока анализа проблемы 86
3.1.5. Общий принцип работы блока локализации проблемы 87
3.1.6. Общий принцип работы блока выработки рекомендаций по устранению проблемы 88
3.2. Разработка информационного обеспечения системы поддержки работоспособности вычислительной сети предприятия 89
3.3. Разработка основных алгоритмов функционирования системы 93
3.3.1. Блок ввода правил и описаний 93
3.3.2. Блок представления сети 95
3.3.3. Блок локализации проблемы 97
3.3.4. Блок выработки рекомендаций по устранению проблемы 98
3.3.5. Формирование совокупности организационно-технических мероприятий 100
3.4. Организация базы знаний 102
3.4.1. Общий принцип построения базы знаний 102
3.4.2. Оптимизация содержимого базы знаний относительно времени поиска решения 104
3.4.3. Алгоритмы задания ситуационных правил и правил выбора организационно-технических мероприятий 105
3.4.4. Перечень контролируемых признаков 111
3.5. Выводы по третьей главе 113
4. Разработка прототипа системы поддержки работоспособности вычислительной сети предприятия 115
4.1. Соблюдение общих требований к программному комплексу и корпоративной сети 115
4.1.1. Схема взаимодействия программных компонентов системы поддержки работоспособности вычислительной сети предприятия 115
4.1.2. Основные эксплуатационные требования к программным средствам системы поддержки работоспособности вычислительной сети предприятия 117
4.1.3. Основные функциональные требования к системе поддержки работоспособности вычислительной сети предприятия 119
4.2. Модель представления сети ОрёлГТУ 120
4.3. Адаптация унифицированной структуры программного комплекса к структуре сети ОрёлГТУ 125
4.3.1. Особенности программного комплекса 125
4.3.2. Реализация блока ввода правил и описаний 126
4.3.3. Реализация блока анализа проблемы 129
4.3.4. Реализация блока представления сети 131
4.4. Имитационная модель функционирования вычислительной сети в условиях сбоя 134
4.4.1. Схема имитационной модели 134
4.4.2. Реализация обработки событий имитационной модели 140
4.5. Пример приведения сети ОрелГТУ в режим штатного функционирования при условии нарушения работы ее конкретных компонентов 146
4.6. Практическая обоснованность достижения цели работы 150
4.7. Выводы по четвертой главе 153
Заключение 155
Список использованных источников 156
- Сущность процесса обеспечения работоспособности вычислительной сети
- Суть методики выбора рекомендаций по устранению нарушений функционирования вычислительной сети
- Блок выработки рекомендаций по устранению проблемы
- Схема взаимодействия программных компонентов системы поддержки работоспособности вычислительной сети предприятия
Введение к работе
Современные АСУП построены в виде распределенных систем, базирующихся на вычислительных сетях, в ходе эксплуатации которых могут возникать различные нарушения работы их устройств, делающие сеть неработоспособной. Для возвращения вычислительных сетей распределенных АСУП в режим штатного функционирования обслуживающий сеть персонал должен провести определенные организационно-технические мероприятия. Процесс выявления самих неисправностей и формирования комплекса мероприятий может занять значительное время и существенно повлиять на функционирование системы автоматизации предприятия в целом. Частые отказы или длительные периоды неработоспособного состояния сети могут привести к полной потере работоспособности системы автоматизации предприятия. Для повышения оперативности принятия мер, способных вернуть вычислительную сеть в режим штатного функционирования, необходимо проведение мониторинга сети, который в большей части зависит от человеческого фактора. Профессионального опыта специалиста, эксплуатирующего большие вычислительные сети, зачастую не хватает для оперативной диагностики сети и принятия решения при устранении сбоев в ее работе.
Существуют системы мониторинга, централизованного управления сетью, однако вопросы, связанные с формированием единого комплекса формализованных методик и инструментальных средств автоматизации поддержки процесса обеспечения работоспособности вычислительной сети, позволяющего по формализованной структуре сети найти нарушения работы ее устройств и предложить обоснованный оперативный вариант их устранения, изучены в недостаточной степени. В силу вышесказанного, актуальным вопросом является разработка методик и средств автоматизации поддержки процесса обеспечения работоспособности вычислительной сети.
Основное число исследований посвящено созданию, описанию работы и диагностике вычислительных сетей. Принципы построения вычислительных систем отражены в работах таких авторов, как Паркет К., Тир Д. и др. Теоретические основы технической диагностики рассматриваются в работах И.А. Биргера, А.И. Гиберта, А.С. Сердакова. Исследованием и описанием параметров, позволяющих описать функционирование и потенциал сети в различных ее состояниях, то есть работоспособном состоянии и состоянии нарушения работы устройств занимаются такие исследователи, как Потапов В.И., Башарин Г.П. Для оперативного реагирования на возникающие нарушения работы устройств сети можно использовать принципы, исследуемые в работах Поспелова Д.А., Клыкова Ю.И., Константинова И.С., Ракова В.И. Процесс восстановления сетей после сбоев в работе рассматривается в публикациях Потапова В.И.
Объектом исследования в данной работе является вычислительная сеть предприятия.
В качестве предмета исследования рассматриваются методы и
средства автоматизации поддержки процесса обеспечения
работоспособности вычислительной сети предприятия.
Цель диссертационной работы: уменьшение времени восстановления вычислительной сети предприятия после сбоев в работе за счет автоматизации поддержки процесса обеспечения работоспособности сети.
Для достижения поставленной цели решались следующие задачи:
анализ подходов к построению сетей, их диагностике, анализ возможных организационно-технических мероприятий и основных подходов к оперативному принятию решений при устранении сбоев в работе сети;
разработка формализованной модели представления вычислительной сети;
разработка методики поиска нарушений функционирования вычислительной сети;
разработка методики выбора рекомендаций по устранению нарушений функционирования вычислительной сети;
практическое обоснование предложенных методик.
Методы и средства исследований. При решении указанных задач использовались методы теории надежности, теории множеств, теории графов, объектно-ориентированного программирования, системного анализа, ситуационного и лингвистического подходов к управлению.
Достоверность научных положений и полученных результатов подтверждается их практической реализацией, а также корректной реакцией системы поддержки работоспособности вычислительной сети предприятия на однотипные сбои в схожих по структуре фрагментах конкретной сети.
Научная новизна работы заключается в:
разработанной системе поддержки работоспособности вычислительной сети предприятия, включающей оригинальную формализованную модель представления вычислительной сети, методику поиска нарушений функционирования вычислительной сети, методику выбора рекомендаций по устранению нарушений функционирования вычислительной сети и алгоритмы, поддерживающие эти методики;
разработанных алгоритмах поиска компонентов сети, вызвавших нарушение ее функционирования, и выбора рекомендаций по восстановлению работоспособности вычислительной сети, базирующихся на специальных продукционных правилах, использующих лингвистическое представление состояний, событий и ситуаций вычислительной сети;
предложенных методиках поиска нарушений функционирования вычислительной сети и выбора рекомендаций по устранению нарушений функционирования вычислительной сети, базирующихся на указанных алгоритмах.
Практическая ценность работы заключается в применении предлагаемых методик при внедрении системы поддержки работоспособности вычислительной сети предприятия.
9 Реализация и внедрение результатов работы.
Основные результаты диссертационной работы внедрены в ОрелГТУ в виде системы поддержки работоспособности вычислительной сети предприятия, используются в учебном процессе кафедры «Информационные системы» Орловского государственного технического университета.
Апробация работы.
Основные положения и результаты диссертационного исследования докладывались и обсуждались на I международной научно-практической конференции «Информационные технологии в науке, образовании и производстве» (май 2004 г., г. Орел), на всероссийском конкурсе инновационных проектов аспирантов и студентов по направлению «Информационно-телекоммуникационные системы» (2005 г., г. Москва), на II международной научно-практической конференции «Информационные технологии в науке, образовании и производстве» (май 2006 г., г. Орел), на II международной электронной научно-технической конференции "Бизнес-процессы и бизнес-системы" (2006 г., г. Тула); на III международной научно-практической конференции «Информационные технологии в науке, образовании и производстве» (май 2008 г., г. Орел).
Положения, выносимые на защиту:
система поддержки работоспособности вычислительной сети предприятия, включающая оригинальную формализованную модель представления вычислительной сети, методику поиска нарушений функционирования вычислительной сети, методику выбора рекомендаций по устранению нарушений функционирования вычислительной сети и алгоритмы, поддерживающие эти методики;
алгоритмы поиска компонентов сети, вызвавших нарушение ее функционирования, и выбора рекомендаций по восстановлению работоспособности вычислительной сети;
10 - методики поиска нарушений функционирования вычислительной сети и выбора- рекомендаций по устранению нарушений функционирования вычислительной сети.
Структура и объем работы. Диссертация состоит из введения, четырех глав, заключения, списка литературы. Работа изложена на 172 страницах машинописного текста, включающего 49 рисунков, 9 таблиц, список литературы из 108 наименований.
Во введении дано обоснование актуальности темы диссертационного исследования, сформулированы цель и задачи работы, отмечена научная новизна и практическая значимость результатов, апробация работы и достоверность результатов, а также дано краткое изложение работы по главам.
В первой главе проведен анализ подходов к построению сетей, их диагностике, анализ возможных организационно-технических мероприятий над сетью и основных подходов к их оперативному применению:
- проведен анализ технических средств передачи информации в
современных вычислительных сетях;
рассмотрены особенности процессов модернизации и оперативного устранения нарушений функционирования вычислительной сети;
проведен анализ методов построения, технического обслуживания и модернизации сетей в рамках обеспечения их работоспособности;
По результатам анализа сделан вывод о необходимости разработки группы методик автоматизации поддержки процесса обеспечения работоспособности вычислительной сети предприятия: методик выявления объектов, вызывающих некорректное функционирование сети, и методики выработки рекомендаций по устранению проблем функционирования сети. Также поставлены задачи автоматизации поддержки процесса обеспечения работоспособности вычислительной сети предприятия.
Во второй главе проведено исследование и построение модели представления сети и методик поддержки процесса обеспечения работоспособности вычислительной сети предприятия:
- построена формализованная модель представления вычислительной
сети;
предложена методика поиска нарушений функционирования вычислительной сети;
предложена методика выбора рекомендаций по устранению нарушений функционирования вычислительной сети.
Проведена классификация возможных сбоев в работе фрагментов сети, рассмотрены их причины и методы оперативного устранения.
В третьей главе проведена разработка и исследование системы поддержки работоспособности вычислительной сети предприятия:
описана структура функционирования системы поддержки работоспособности вычислительной сети предприятия;
описано информационное обеспечение системы поддержки работоспособности вычислительной сети предприятия;
- описаны основные алгоритмы функционирования системы поддержки
работоспособности вычислительной сети предприятия;
описана организация базы знаний системы поддержки работоспособности вычислительной сети предприятия.
В четвертой главе описан результат внедрения программного комплекса системы поддержки работоспособности вычислительной сети предприятия в сеть ОрелГТУ для практического обоснования методик поддержки процесса обеспечения работоспособности вычислительной сети:
описана реализация программного комплекса с учетом эксплуатационных и функциональных требований к программным продуктам;
- проведено описание структуры фрагмента сети ОрелГТУ посредством
предложенной формализованной модели представления сети;
описана реализация подсистем программного комплекса системы поддержки работоспособности вычислительной сети предприятия;
описана имитационная модель вычислительной сети, облегчающая проведение экспериментов;
- описан пример приведения сети ОрелГТУ в режим штатного
функционирования при условии наличия конкретного сбоя в ее работе;
- приведено практическое обоснование цели работы.
В заключении сформулированы основные выводы по результатам работы.
. 13
Сущность процесса обеспечения работоспособности вычислительной сети
Вычислительная сеть работоспособна, если параметры, описывающие ее работу и показывающие, что сеть выполняет возложенные на нее функции, находятся в пределах, предусмотренных технической документацией.
Вычислительная сеть неработоспособна, если хотя бы один из вышеуказанных параметров выходит за пределы, предусмотренные технической документацией.
В процессе функционирования сети может нарушаться работа группы устройств сети, поэтому персонал должен постоянно обеспечивать работоспособность вычислительной сети. В этот процесс входят диагностика работы сети в целях выявления устройств, нарушающих ее функционирование и оперативное устранение сбоев для возвращения вычислительной сети в режим штатного функционирования.
В процессе обеспечения работоспособности вычислительной сети, при условии нарушения работы группы устройств, для возвращения сети в режим штатного функционирования применяется комплекс организационно-технических мероприятий [13, 53]. В комплекс могут входить следующие мероприятия: - настройка сетевого оборудования; - проверка соединения кабеля с сетевым устройством; - перепланировка для устранения воздействия на оборудование источников, искажающих передаваемые сигналы; - удаление экземпляра сетевого оборудования; - «переконфигурация» фрагмента сети (извлечение из другой части сети экземпляра сетевого оборудования и замена им проблемной составляющей сети); - замена экземпляра сетевого оборудования; - добавление сетевых устройств. Недостаточно формализованным и трудоёмким является процесс анализа сбоев в работе сети и их устранение. Сбой - ситуация некорректного функционирования сети. Понятие сбоя включает физический отказ сетевого оборудования, сбой программного обеспечения, как на конечных, так и на промежуточных устройствах сети, некорректная настройка оборудования, недостаточное качество обслуживания [86]. Обобщенная схема процесса анализа сбоев в сети и их устранения изображена на рисунке 1.1: Процесс включает в себя ряд этапов, полная автоматизация которых не представляется возможной. Поэтому на схеме указывается область возможной автоматизации процесса анализа сбоев в сети и их устранения. В процессе эксплуатации вычислительной сети вследствие множества факторов в ее работе могут возникнуть ситуации, связанные с нарушением ее функционирования. Соответствующие сообщения поступают в ответственное подразделение. Формат сообщений зависит от формы связи с ответственным подразделением установленной его сотрудниками. Решение возможной проблемы начинается со сбора данных и фактов о функционировании вычислительной сети. Сбор данных и фактов осуществляется следующим образом: - уточнение факторов нарушения функционирования сети; - удалённая или непосредственная диагностика характеристик проблемного участка сети. Собранная статистика позволяет провести анализ проблемы и ее идентификацию. В случае принятия решения о необходимости принятия мер по проведению работ с сетью выполняется локализация проблемы, т.е. поиск компонентов, нарушающих функционирование сети. После локализации проблемы выявляются возможные пути её решения. Из них выбирается наиболее обоснованный вариант. Выбор множества организационно-технических мероприятий, позволяющих решить проблему, производится следующим образом. Для возвращения сети в состояние корректного функционирования к конкретному типу сетевой составляющей можно применить несколько вариантов организационно-технических мероприятий конкретной составляющей сети. Критерии выбора мероприятий: стоимость и трудоёмкость выполнения данных мероприятий. В порядке убывания приоритета по указанным критериям мероприятия можно выстроить следующим образом: проверить соединение, настроить, удалить, переконфигурировать (переставить деталь из другой части сети в проблемный участок), поменять, расширить. Однако на выбор мероприятия влияет важность составляющей сети. Определение важности является нечётким. Чем выше важность составляющей сети, тем больше снизится производительность сети при удалении данной составляющей. Если составляющая важна, то удалять ее нельзя. Главная цель, которую администратор ставит при поиске организационно-технических мероприятий по устранению проблемы -вернуть сеть в работоспособное состояние. Если существует несколько комплексов организационно-технических мероприятий, возвращающих сеть в режим штатного функционирования, то из них выбирается один обоснованный. Наиболее вероятный вариант организационно-технических мероприятий принимается и применятся. После этого анализируются работа сети после проведения организационно-технических мероприятий. Если после проведения мероприятий присутствуют нарушения функционирования сети, то следует провести повторную идентификацию проблемы. Если нарушения отсутствуют, то вариант структуры сети утверждается.
Сопровождение сети - это один из способов поддержания работоспособности сети. В случае решения о необходимости принятия мер по проведению комплекса организационно-технических мероприятий над сетью возникает потребность внедрения системы поддержки принятия решений (СГТПР) в данный процесс [55, 108].
СППР - это человеко-машинная информационная система, используемая для поддержки действий ЛПР в ситуациях выбора, когда невозможно или нежелательно иметь автоматическую систему представления и реализации всего процесса оценки и выбора альтернатив [85].
В случае устранения сбоев в процессе функционирования вычислительных сетей под СППР можно понимать программный комплекс, дающий рекомендации лицам, принимающим решения; по организации процесса поиска оптимальной совокупности организационно-технических мероприятий по устранению проблем в сети [57].
СППР может способствовать анализу и локализации проблемы, выявлению путей решения проблемы и выбору обоснованного варианта модернизации или оперативного устранения нарушений функционирования сети.
Суть методики выбора рекомендаций по устранению нарушений функционирования вычислительной сети
Схема процесса выбора обоснованного комплекса организационно-технических мероприятий, позволяющих вернуть сеть в режим штатного функционирования, представлена на рисунке 2.7.
Входными данными процесса выбора обоснованного комплекса организационно-технических мероприятий, способных вернуть сеть в режим штатного функционирования, являются: наименование проблемы, информация о компонентах сети, нарушающих ее функционирование. Выходные данные: комплексы организационно-технических мероприятий, способных вернуть сеть в режим штатного функционирования.
Методика выбора рекомендаций по устранению нарушений функционирования вычислительной сети, предполагает выполнение следующих операций: 1. Если среди входных данных существуют компоненты сети, к которым отсутствует доступ, то произвести их детализацию по модели представления вычислительной сети. 2. Если имела место детализация компонентов сети, к которым отсутствует доступ, то произвести поиск правила выбора организационно-технических мероприятий для текущего состояния СР и наибольшего количества типов компонентов детализированной сетевой составляющей, входящих во множество составляющих сети Т, нарушающих ее функционирование. 3. Если явно определены все компоненты сети, нарушающие ее функционирование, то произвести поиск правила выбора организационно-технических мероприятий для текущего состояния сети СР и множества Т, соответствующего найденным компонентам. 4. Сформировать статистику по найденному правилу выбора организационно-технических мероприятий для выдачи в качестве выходных данных процесса поиска комплекса. Существует группа правил выбора организационно-технических мероприятий, касающихся текущего состояния сети, которые позволяют по информации о некорректной работе конкретных сетевых составляющих выделить группу организационно-технических мероприятий для возвращения работоспособности сети. Сетевые составляющие, являющиеся причиной некорректного функционирования сети, могут быть связаны таким образом, что устранение проблемы для одной из них или подмножества проблемных составляющих может положительно сказаться на работе остальных проблемных составляющих и вернуть всю сеть в работоспособное состояние [95]. Если в процессе поиска компонентов сети, вызвавших нарушение ее функционирования, они былш обнаружены, то происходит поиск правила выбора организационно-технических мероприятий для выявленной группы сетевых составляющих с нарушенным функционированием. Если нет доступа к составляющей множества DC с нарушенным функционированием, то происходит декомпозиция этой составляющей по модели представления вычислительной сети и происходит поиск правил выбора организационно-технических мероприятий1 для группы составляющей, охватывающей как можно большее число типов детализированных составляющих. Когда подходящие правила выбора организационно-технических мероприятий найдены, по ним определяются комплексы организационно-технических мероприятий, способных вернуть сеть в режим штатного функционирования. Классификация состояний сети и возможных организационно-технические мероприятий приведена в таблице 2.1. Как уже говорилось в предыдущих главах, проблемная ситуация неоднозначна и требует классификации. Проблемная ситуация зависит от типа сетевой составляющей. Если рассматривать диагностику сети с позиции протокола SNMP, то точки контроля, имеющие доступ к контролируемым признакам, не располагаются на сетевых составляющих, относящихся к множеству каналов связи С. Однако проблему в составляющей сети множества С можно косвенно выявить, считав значение признаков прилегающих устройств. Проблема отказа канала возникает, когда до сетевого устройства на одном конце отрезка линии связи не доходят пакеты в течение определённого промежутка времени от сетевого устройства на другом конце отрезка линии связи. В данном случае проблема заключена в канале передачи данных, который должен быть заменён. Проблема ненадёжности канала возникает, когда сетевое устройство принимает превышенное количество пакетов с ошибками. В данном случае около канала может располагаться сильный источник электромагнитного поля, искажающий информацию, который должен быть определённым образом удалён от канала. Канал может быть повреждён или подвергнут превышенной степени деформации. В первом случае можно заменить канал, а во втором, помимо замены, можно попытаться решить проблему, устранив источник деформации. Проблемы, касающиеся множества сетевых сегментов S, обычно вытекают из коллизий. В случаях возникновения коллизий в области коллизий, совпадающей с определённым сегментом, информация становится непригодной для использования. Коммутаторы, объединяющие множества S, должны учитывать ошибки передачи кадров в сегментах на канальном уровне. Можно выделить следующие проблемы, возникающие на канальном уровне. Проблему недостоверной передачи имеет место в случае превышения лимита следующих ошибок канального уровня: 1) Ошибка CRC. При проверке контрольной суммы в данном случае выявляется ошибка. Если превышен порог CRC в течении промежутка времени, то можно констатировать проблему недостоверной передачи. 2) Превышение допустимого числа коллизий при посылке определённого кадра. 3) Ошибка длины. Превышенное количество кадров неожидаемой длины указывает на недостоверную передачу. Проблема некорректного кадрирования возникает при превышенном количестве ошибок кадрирования (когда число бит не кратно 8).
Блок выработки рекомендаций по устранению проблемы
Проблемных ситуаций в сети может быть достаточно много, причём каждая ситуация может характеризоваться огромным числом контролируемых признаков. Учесть всё это самостоятельно обслуживающий персонал не сможет. Поэтому при возникновении в сети неизвестной проблемной ситуации происходит её фиксация, и производится её .исследование и обработка обслуживающим персоналом.
Проблема может быть также неполно описана ситуационным правилом. В этом случае следует добавлять ограничения в левую часть соответствующего ситуационного правила. Алгоритм задания и использования ситуационных правил и правил выбора организационно-технических мероприятий представлен на рисунке 3.14: В процессе анализа текущего состояния сети происходит поиск в базе знаний ситуационного правила, способного описать текущее состояние сети. Существует три вида результата указанного поиска. В первом случае ситуационное правило, описывающее текущее состояние сети присутствует в базе знаний. Во втором случае ситуационное правило, описывающее текущее состояние сети присутствует в базе знаний, однако описание ситуации неполное. Это означает, что не затронуты все ограничиваемые контролируемые признаки, способные описать текущее состояние сети; В третьем случае в базе знаний отсутствует ситуационное правило, описывающее текущее состояние сети. Если ситуационное правило, описывающее текущее состояние сети присутствует в базе знаний, то из базы знаний выбираются соответствующие ситуационное правило и правило выбора организационно-технических мероприятий. Они в дальнейшем будут использованы для локализации проблемы и поиска обоснованного комплекса организационно-технических мероприятий, возвращающих сеть в режим штатного функционирования.
Если ситуационное правило, описывающее текущее состояние сети присутствует в базе знаний, но неполно описывает ситуацию, то необходимо редактировать соответствующее ситуационное правило и правило выбора организационно-технических мероприятий.
Для этого в начале выделяются ограничения, отсутствующие в ситуационном правиле. Ситуационное правило дополняется и редактируется. Затем определяются неучтенные организационно-технические мероприятия, которые возможно применить для устранения некорректного функционирования конкретных составляющих сети. Производится поиск комплексов организационно-технических мероприятий, способных решить проблему. На их основе редактируется правило выбора организационно-технических мероприятий.
Если ситуационное правило, описывающее текущее состояние сети отсутствует в базе знаний, то необходимо создать и добавить в базу знаний соответствующее ситуационное правило и правило выбора организационно-технических мероприятий.
Для этого в начале именуется новое состояние сети. Выделяются контролируемые признаки, описывающие это состояние. На основе ограничений контролируемых признаков создается ситуационное правило и добавляется в базу знаний. Затем определяются организационно-технические мероприятия, которые возможно применить для устранения некорректного функционирования конкретных составляющих сети. Производится поиск комплексов организационно-технических мероприятий, способных решить проблему. На их основе создается правило выбора организационно-технических мероприятий и добавляется в базу знаний.
При запросе у базы знаний наименования состояния сети происходит поиск такого ситуационного правила, значения контролируемых признаков которого соответствуют ограничениям левой части правила. Тогда наименование состояния сети берётся из правой части ситуационного правила.
При запросе у базы знаний информации, необходимой для локализации проблемы, происходит поиск такого ситуационного правила, значение правой части которого соответствует наименованию проблемы. Тогда условия из левой части ситуационного правила и будут являться информацией, необходимой для локализации проблемы.
Схема взаимодействия программных компонентов системы поддержки работоспособности вычислительной сети предприятия
Эксплуатационные требования определяют некоторые характеристики разрабатываемого программного обеспечения, проявляемые в процессе его функционирования [38]. Опишем, каким образом они были учтены при разработке программного комплекса системы поддержки работоспособности вычислительной сети предприятия и какие требования предъявляются-к сети, обслуживаемой системой [64].
В процессе апробации методик поддержки процесса обеспечения работоспособности вычислительной сети было проведено тестирование соответствующего программного комплекса. Были устранены все выявленные ошибки работы системы. В данный момент серьезных ошибок в работе программного комплекса системы поддержки работоспособности вычислительной сети предприятия не наблюдается. В процессе разработки системы были реализованы механизмы, обрабатывающие все существующие и предполагаемые исключительные ситуации, что повышает корректность ее работы. При разработке программного комплекса для представления выдаваемой статистики по комплексам организационно-технических мероприятий был разработан удобный интерфейс просмотра статистики. 2. Универсальность. В процессе разработки системы она была построена таким образом, чтобы обеспечить корректность входных данных. Формат вводимой информации постоянно проверяется, исключая несовпадения типов данных. 3. Надёжность. В процессе разработки программного комплекса учитывались непредвиденные сбои. В случаях сбоев необходимо системе терять как можно меньшее количество данных, поэтому в процессе работы с данными при завершении существенных операций (окончательно формирование структуры правила, добавление составляющей в схему сети и задание ее признаков) они без задержек сохраняются в базу данных и знаний. 4. Проверяемость. В процессе разработки программного комплекса выводимая по каждой проблемной ситуации информация была сформирована таким образом, чтобы было понятно, к каким устройствам, из-за чего и какие именно меры принимаются для приведения сети в состояние штатного функционирования. Это позволит на практике или посредством моделирования проверить правильность работы программы. 5. Защищённость. Данные о свойствах сети могут быть использованы злоумышленниками для взлома, поэтому существует потребность в защите этой информации. При разработке программного комплекса была организована возможность защиты паролем хранимой в базе данных информации. Однако ничто не мешает реализовать физические или административные мероприятия для обеспечения безопасности информации - на работе программного комплекса это ни в коей мере не отразится отрицательно. 6. Программная совместимость. Разрабатываемый программный комплекс не конфликтует с известными и часто используемыми резидентными программами. Система способна работать с командами протокола SNMP и структурой информационных баз МІВ в процессе анализа контролируемых признаков. К сети, которую обслуживает разработанный программный комплекс, для его корректного функционирования предъявляются следующие требования: поддержка протокола SNMP и свободная циркуляция в сети пакетов с его статистикой. 7. Аппаратная совместимость. Для установки программного комплекса необходимо рабочее место, превосходящее минимальные системные требования его использования. К сети, которую обслуживает разработанный программный комплекс, для его корректного функционирования предъявляются следующие требования: техническая поддержка модели «менеджер-агент», расположение на сетевых устройствах множеств NC и Е агентов для чтения значений МІВ, расположение менеджера на указанном выше рабочем месте, функционирование сети в рамках сетевой технологии Fast Ethernet или Gigabit Ethernet. 8. Эффективность. Реализованный программный продукт обладает невысокими системными требованиями, позволяющими! обеспечивать его функционирование на любом современном автоматизированном рабочем месте. 9. Адаптируемость. Формат ситуационных правил и правил выбора организационно технических мероприятий позволяет описать проблемную ситуацию и методы ее решения для любой сети, удовлетворяющей требованиям аппаратной совместимости. 10. Повторная видимость. Программный комплекс обладает потенциалом проведения любого количества сеансов анализа различных состояний сети в процессе одного сеанса своей работы. Основные функциональные требования к системе поддержки работоспособности вычислительной сети предприятия К основным функциональным требованиям можно отнести: - хранение и отображение структурного представления вычислительной сети (топология, наименование и расположение устройств, сервисов и каналов связи, их общее количество, технические характеристики и функциональное описание и т.д.); - наблюдение за определёнными динамическими атрибутами сети (доступность оборудования, служб и сервисов, уровень загруженности каналов связи, объём циркулирующего трафика, количество ошибок при передаче пакетов на различных уровнях взаимодействия и.т.д.); - осуществление анализа собранной информации и, как следствие, поддержки функционирования вычислительной сети; - оповещение обслуживающего персонала о возникновении заранее определённых ситуаций; - возможность автоматизированного или автоматического выявления причины возникновения той или иной сбойной ситуации, а также возможность автоматизированного формирования комплекса организационно-технических мероприятий для устранения проблемы со стороны обслуживающего персонала; - возможность хранения правил описания проблемных ситуаций и выбора организационно-технических мероприятий; - наличие удобного и гибко настраивающегося интерфейса взаимодействия пользователя с самой системой; - результат выполнения программы должен быть корректно и полно сформулирован, в нем должна отсутствовать лишняя информация; должна существовать возможность вывода его на печать; - исходные данные должны быть представлены в таком формате, чтобы легко идентифицировалась проблема.