Содержание к диссертации
Введение
ГЛАВА 1 .Анализ проблемы исследования 9
1.1 Объект исследования 9
1.2 Живучесть РИВС 15
1.3 Характеристики живучести 17
1.4 Постановка задачи обеспечения функциональной живучести РИВС 19
1.5 Механизмы обеспечения живучести 22
1.5.1 Восстановление 22
1.5.2 Адаптация 24
1.6 Сравнительный анализ вычислительных систем, обладающих свойством живучести... 26
1.6.1 Вычислительные системы с общим резервированием 26
1.6.2 Вычислительные системы с поэлементным резервированием 36
1.7 Анализ архитектур построения виртуального кластера 42
1.7.1 Базовая архитектура виртуального кластера 42
1.7.2 Кольцевая архитектура виртуального кластера 42
1.7.3 Модернизированная архитектура виртуального кластера 44
1.8 Уточнение задачи исследования 47
1.9 Выводы 48
ГЛАВА 2. Разработка моделей, алгоритмов и механизмов повышения живучести РИВС 49
2.1 Диаграмма взаимодействия параллельных процессов в ВК 49
2.2 Алгоритмы синхронизации и диагностики 53
2.3 Алгоритмы реконфигурации кластера 69
2.4 Служба мониторинга РИВС 76
2.5 Выводы 91
ГЛАВА 3. Анализ живучести распределенной информационно-вычислительной системы 92
3.1 Постановка задачи 92
3.2 Методика анализа живучести 95
3.3 Оценка показателей живучести виртуального кластера 100
3.4 Оценка показателей живучести статического кластера 108
3.5 Выводы 111
ГЛАВА 4. Реализация, эксперементальные исследования предложенных средств повышения живучести РИВС ... 112
4.1 Программное обеспечение организации ВК в РИВС 112
4.1.1 Программа генератор нагрузки 112
4.1.2 Программа обработчик запросов - рабочая функция 114
4.1.3 Пакет программ организации ВК 114
4.2 Результаты экспериментальных исследований 114
4.3 Объект №1. ОАО «Владимирский завод «Электроприбор» 119
4.4 Объект №2. ООО «МОКА» 122
4.5 Объект №3. Телекомпания "Радуга" - ТНТ- Владимир 124
4.6 Выводы 125
Заключение 126
Список принятых сокращений 128
Список использованной литературы 129
Приложения 142
- Постановка задачи обеспечения функциональной живучести РИВС
- Диаграмма взаимодействия параллельных процессов в ВК
- Оценка показателей живучести виртуального кластера
- Объект №1. ОАО «Владимирский завод «Электроприбор»
Введение к работе
Актуальность задачи. Одной из ключевых особенностей современного бизнеса является скорость реакции предприятия на изменяющиеся потребности рынка. Для получения конкурентного преимущества промышленное предприятие должно первым узнать о потребностях рынка и в кратчайшие сроки оптимизировать свои бизнес-процессы для производства товара с необходимыми потребительскими качествами. Основным путем достижения указанных целей является внедрение автоматизированных систем управления производством (АСУП). С помощью подобных систем управляющий персонал предприятия может узнать оперативную информацию об имеющихся ресурсах предприятия (запасов материалов, энергоносителей, сырья и т.д.), планировать производство и отслеживать качество выполнения принятых решений. Все это в совокупности позволяет минимизировать время адаптации производства под изменившуюся конъюнктуру рынка. Однако применение АСУП несет в себе потенциальную опасность - отказы и сбои в работе АСУП могут повлечь за собой довольно существенные убытки для предприятия. Данное обстоятельство делает задачу обеспечения живучести АСУП очень актуальной.
Современные АСУП строятся, как правило, на базе распределенных информационно вычислительных систем (РИВС). В качестве основных компонентов РИВС используются персональные компьютеры (ПК) и вычислительные сети (ВС), построенные на базе стандартных сетевых технологий. Задача обеспечения живучести РИВС АСУП разделяется на две подзадачи:
обеспечение структурной живучести;
обеспечение функциональной живучести.
Обеспечение структурной живучести подразумевает установку дополнительной аппаратуры и линий связи, либо модернизацию существующих компонентов более надежными и дорогими. Обеспечение
функциональной живучести может быть достигнуто за счет новых моделей и процедур организации вычислительного процесса. Если минимизация стоимости РИВС превалирует (что характерно для средних и малых промышленных предприятий), то решение второй подзадачи является предпочтительным.
В современной науке теория живучести сложных технических систем, в том числе и вычислительных, переживает этап становления в самостоятельную научную дисциплину. Наблюдается явный недостаток моделей и алгоритмов синтеза живучих РИВС, особенно в задачах построения АСУП на базе ПК с применением стандартных сетевых технологий, функционирующих в условиях воздействия поражающих факторов (ПФ).
Объект исследования диссертационной работы - РИВС АСУП, построенные на базе ПК с применением стандартных сетевых технологий, в которых необходимо обеспечить функционирование в условиях воздействия ПФ.
Целью диссертационной работы является решение научно-технической задачи разработки новых моделей, алгоритмов и процедур управления, направленных на повышение живучести РИВС АСУП.
Исходя из целей работы, задачами исследования являются:
сравнительный анализ существующих способов повышения живучести РИВС АСУП;
синтез новых моделей и алгоритмов функционирования РИВС с учетом требования обеспечения живучести;
разработка методик оценки живучести РИВС;
экспериментальное исследование полученных результатов и внедрение их на производстве.
Методы исследования. Исследования поставленных выше задач проведены с использованием методов теории систем массового обслуживания, теории графов, теории вероятностей. Проводился анализ
структур построения и процессов функционирования РИВС, моделирование и синтез на их основе оптимальных алгоритмов и моделей обработки информации.
На защиту выносится совокупность новых научно обоснованных научных результатов и технических решений в рамках проблемы обеспечения высокой эффективности автоматизации и управления технологическими процессами и производствами, включающая в себя:
модели, алгоритмы и процедуры функционирования РИВС, реализующие механизмы обеспечения живучести;
методика оценки живучести РИВС АСУП, позволяющая приводить качественное сравнение различных вариантов построения РИВС АСУП;
модели и алгоритмы службы мониторинга РИВС АСУП, позволяющие описывать структуру и характеристики РИВС АСУП.
Научная новизна работы состоит в обобщении известных и получении новых теоретических и практических результатов в области разработки и применения распределенных информационно-вычислительных систем в сфере автоматизации управления промышленным предприятием и сконцентрирована в следующем:
синтезированы новые модели и реализующие их алгоритмы обработки и представления информации, основанные на использовании структурных, аналитических и временных моделей и обеспечивающие оптимизацию управления в РИВС, что позволяет повысить живучесть АСУП в условиях воздействия поражающих факторов;
предложена методика оценки живучести РИВС АСУП, заключающаяся в анализе цикла работы системы в условиях воздействия ПФ и позволяющая исследовать влияние параметров РИВС на показатели живучести.
Практическая ценность полученных результатов заключается:
в разработанном программном обеспечении, расширяющем штатные возможности РИВС АСУП и позволяющем повысить ее живучесть;
в методике описания структуры РИВС и ее характеристик, позволяющей повысить качество работы персонала, ответственного за эксплуатацию.
Реализация и внедрение результатов работы. Работа по теме диссертационной работы проводилась на кафедре ИЗИ ГОУ ВПО «Владимирский государственный университет» в рамках х/д НИР №№ 3161/04, 3165/05. Полученные результаты исследований внедрены на ОАО Владимирский завод «Электроприбор», ООО «МОКА», Телекомпании ТНТ-Владимир, а также использовались при разработке учебных курсов «Вычислительные сети», «Базы данных», «Защита информационных процессов в компьютерных системах» кафедры ИЗИ ВлГУ.
Достоверность полученных результатов подтверждается полнотой и корректностью теоретических обоснований и результатами экспериментов, проведенных с помощью разработанных в диссертации программ.
Апробация работы и публикации. Основные результаты, полученные в ходе работы над диссертацией, были представлены на:
XXII межведомственной научно-технической конференции (Серпухов, 2003);
Международной научной конференции IMMD'2004 Informatics, Mathematical Modeling and Design in the Technics, Controlling and Education (Владимир 2004);
Ill Всероссийской научно-практической конференции: Образовательная среда сегодня и завтра (Москва 2006);
XX Международной научной конференции «Математические методы в технике и технологиях» (Ярославль 2007).
В процессе исследований опубликовано 12 работ, из них 7 статей и 4 тезиса докладов в трудах Международных и Российских научно-технических
конференций и семинаров, 1 учебное пособие. Одна из статей опубликована в издании, рекомендованном ВАК РФ для публикации результатов диссертационных работ - «Известия Тульского государственного университета» (2004 г.)
Структура работы. Диссертационная работа состоит из введения, четырех глав, заключения, списка литературы, списка использованных сокращений и 3 приложений. Общий объем диссертации - 145 страниц, список литературы содержит 135 наименований. Диссертация содержит 39 рисунков и 5 таблиц.
Постановка задачи обеспечения функциональной живучести РИВС
Вычислительные устройства и средства телекоммуникации КИВС группируются по организационно-территориальному признаку и представляют собой иерархическую структуру, состоящую из следующих типовых модулей: 1) сеть отдела; 2) магистральная сеть; 3) сеть производства. Сеть отдела состоит из следующих элементов: 1) ТП - терминалов пользователей - персональных компьютеров, субкомпьютерынх систем (смартфонов, карманных компьютеров), реализующих функции ТМ; 2) СОИ - серверов обработки информации, реализующих функции МОИ; 3) ТО - телекоммуникационного оборудования (концентраторов, коммутаторов и т.д.). Основным назначением сетей отделов является обеспечение удобной работы конечных пользователей КИВС. По сути, сети отделов образуют физическую основу РИВС. Тем не менее, в КИВС могут присутствовать РИВС, использующие оборудование нескольких сетей отделов. Следующим уровнем иерархии в КИВС являются магистральные сети, предназначенные для организации взаимодействия сетей отделов. В рамках магистральной сети могут функционировать различные сетевые сервисы, которые используются для обеспечения работоспособности высокоуровневых функциональных сервисов. Примерами сетевых сервисов могут быть службы доменных имен, службы каталогов и т.д [91,92,94]. В состав магистральной сети входят: 1) ТО - телекоммуникационное оборудование. 2) СОИ - специализированные сервера, выполняющие технологические функции (антивирусы, шлюзы, системы тарификации). В составе магистральной сети выделяют узел доступа - набор телекоммуникационного оборудования и СВТ, предназначенный для обеспечения связи с другими сетями производств и удаленного доступа пользователей. Узел доступа организует взаимодействие с территориальными каналами связи Магистральная сеть и сети отделов формируют сеть производства. Отличительной особенностью сети производства является то, что она сформирована из вычислительных сетей, расположенных в одном или нескольких близлежащих зданиях. Совокупность сетей производств, объединенных территориальными сетями передачи данных, образуют КИВС предприятия. Технологически сети отделов строятся с использованием аппаратуры локальных вычислительных сетей (ЛВС), что обеспечивает максимальную скорость обмена информации. Магистральные сети производства могут строиться как с использованием технологий ЛВС, так и с помощью технологий территориальных сетей. Данный факт позволяет утверждать, что скорость обмена данным в магистральной сети, как правило, меньше или сравнима со скоростью обмена данными в сетях отделов. Объединение сетей производств производится с помощью территориальных сетей передачи данных, к которым можно отнести телефонную сеть (PSTN) и Интернет [37,113,114]. Скорость обмена информации между сетями производств является минимальной по сравнению с сетями отделов и магистральными сетями. Помимо объединения сетей производств территориальные сети используются для подключения одиночных мобильных пользователей. С точки зрения качества функционирования к РИВС АСУП должна: 1) эффективно функционировать в режимах переменной вычислительной нагрузки; 2) обеспечивать непрерывное функционирование или восстанавливать его в течение заданного времени; 3) обеспечивать минимальную задержку обработки заявок пользователей, хотя работы в режиме реального времени не требуется; 4) обладать минимальной стоимостью обслуживания. Таким образом, объект исследования - РИВС современной АСУП -является сложной вычислительной системой, функционирующей в рамках КИВС предприятия, подверженного воздействию поражающих факторов. В современной литературе [4,8,10,21,23-26,54,71,79,80,93,108,112] понятие живучесть имеет довольно широкое трактование. Согласно ГОСТ 34.003-90 [21], живучесть автоматизированной системы (АС) - это свойство АС, характеризуемое способностью выполнять установленный объем функций в условиях воздействий внешней среды и отказов компонентов системы в заданных пределах. В работе [23] свойство живучести рассматривается как «способность системы адаптироваться к новым, изменившимся и не всегда предварительно учтенным ситуациям, противостоять любым воздействиям, выполняя при этом свою целевую функцию, за счет соответствующего изменения структуры и поведения системы даже при серьезных повреждениях самой системы». В [93] живучесть определяется как способность системы эффективно функционировать при получении повреждений (разрушений) или восстанавливать данную способность в течение заданного времени. Анализируя предложенные определения живучести, выделим следующие общности: 1) живучесть - комплексное свойство технической системы, описывающее функционирование системы в условиях негативных воздействий; 2) живучая система способна выполнять некоторый объем функций при получении повреждений. Различия указанных определений заключается в описании или отсутствии описания способа реализация свойств живучести. Сравним подходы в [21], [23], [93]. В определении, данном в работе [23], описывается реализация свойств живучести за счет изменения структуры системы и поведения, а [93] не рассматривает данные свойства, однако добавляет свойства восстановления работоспособности системы за заданное время. ГОСТ вообще не определят никаких механизмов реализации свойств живучести.
Выбирая из предложенных вариантов, определение, данное в работе [93], рассматривается как наиболее удачное, так как оно, по сути, включает в себя все предыдущие определения (работа [93] была издана в 2002 году, тогда как остальные труды относятся к 90-гг прошлого века) и добавляет такую важную характеристику, как свойство восстановления работоспособности, которая была не указанна в других определениях.
Диаграмма взаимодействия параллельных процессов в ВК
Диаграмму взаимодействия параллельных процессов в ВК можно увидеть на Рис. 2.1. Процесс 1. Инициация кластерного сервиса. Кластерный сервис инициируется на выполнение стандартным образом: путем явного запуска оператором либо по расписанию. Сразу после запуска сервис считывает из конфигурационных файлов требуемые параметры выполнения, которые будут затем использованы в Процессе 2. Технология ВК предполагает, что любая вычислительная задача в пределах АСУП изначально работает в кластерном режиме (как кластерный сервис). В зависимости от своих нужд (недостаток производительности, недостаток временной избыточности) задача может подключать в кластер дополнительные вычислительные мощности - ВСОИ. В результате выполнения Процесса 1 инициируются Процессы (2), (3), (4), которые затем непрерывно выполняются. Процесс 2. Оценка параметров выполнения. Данный процесс оценивает эффективность функционирования кластера по какому-нибудь параметру или группе параметров. В качестве параметров используются среднее время обслуживание заявки системой, максимальная длина входной очереди и т.д. Если исследуемый параметр не удовлетворяет заданным значениям, то кластер инициирует процедуры реконфигурации (Процесс 5). Например, если в качестве параметра эффективности взять коэффициент утилизации вычислительных ресурсов (отношение количества потребляемых ресурсов к общему количеству свободных вычислительных ресурсов), то реконфигурация может выполняться как при недостатке ресурсов (при этом в кластер будут добавляться новые ВСОИ), так и при переизбытке (тогда из состава кластера будут высвобождаться ВСОИ). Основным параметром работы данного этапа является время реакции -Тр, которое показывает: как быстро будет рассчитан параметр эффективности функционирования после его фактического изменения в действующей системе. Процесс 3. Выполнение рабочей функции. Данный процесс представляет собой выполнение функции, которая обслуживает заявки пользователей. С учетом того, что рабочая функция выполняется на ВСОИ, в качестве которых могут выступать персональные компьютеры пользователей системы, то на выполнение данного процесс накладываются ряд ограничений: а) Функционирование ВСОИ не должно мешать работе локальных служб компьютера. То есть ВСОИ может использовать только простаивающий ресурс компьютера. Если фоновая загрузка компьютера начинает возрастать, вычислительные ресурсы, которыми пользовался процесс ВСОИ, должны быть переданы для выполнения фоновых задач. б) В некоторых случаях процесс ВСОИ может монопольно использовать локальные ресурсы. Например, если после аварии данный ВСОИ остался единственным в кластере, то он может монопольно использовать вычислительные ресурсы, но лишь на то время, пока в кластер не будут добавлены новые ВСОИ. Помимо непосредственного обслуживания заявок пользователей к Процессу (3) будем относить также задачи распределения (маршрутизации) заявок по ВСОИ. При выполнении данного процесса должны быть гарантированно обнаружены все отказы, которые могут повлиять на функционирование кластера. К подобным отказам относятся отказы коммутатора, ВСОИ и отказы каналов связи. Основным параметром данного процесса Т является время, в течение которого будут обнаружены и отказы. В общем случае время обнаружения будет зависеть от типа отказа и параметров работы вычислительной сети. Процессы (2) и (4) могут инициировать запуск Процесса 5. Процесс 5. Реконфигурация. В результате выполнения данного процесса могут произойти следующие действия: а) добавление ВСОИ; б) удаление ВСОИ; в) выбор нового коммутатора; г) объединение сегментов кластера. Процесс 6. Служба мониторинга. Все компьютеры РИВС используют службу мониторинга для публикации и обновления информации о своих вычислительных ресурсах. Коммутатор кластера обращается к службе за информацией о свободных вычислительных ресурсах, когда необходимо добавить в кластер новый ВСОИ. ВК является динамически формируемой вычислительной системой, для эффективного управления которой коммутатор должен обладать информацией о структуре кластера и параметрах входящих в него ВСОИ. Данная информация содержится в таблице ресурсов кластера, типовой вариант построения которой представлен на Рис. 2. Таблица ресурсов кластера располагается на коммутаторе и обновляется в ходе операций по реконфигурации кластера и в процессе получения информации от службы мониторинга РИВС. С целью обеспечения живучести данная таблица реплицируется на все ВСОИ кластера.
Оценка показателей живучести виртуального кластера
В качестве параметра эффективности функционирования была выбрана производительность, поэтому расчет характеристик виртуального кластера начнем с определения его производительности. Рассмотрим один из способов расчета производительности, базирующийся на использовании теории систем массового обслуживания (СМО) [6,36,38,41,97,110]. Предметом теории является установление зависимостей между характером потока заявок, числом каналов обслуживания, производительностью элементов системы и эффективным обслуживанием с целью нахождения наилучших путей управления этими процессами. СМО состоит из определенного числа обслуживающих единиц, которые называются каналами обслуживания. В РИВС им соответствуют серверы системы. В качестве каналов связи могут фигурировать компоненты телекоммуникационной среды. Система обслуживания считается заданной, если известен поток заявок на обработку информации, его характер, множество узлов системы, дисциплины обслуживания заявок узлами. РИВС состоит из узлов обработки (СОИ) и коммуникационной среды. Учитывая сложность и приближенность описания системы, при моделировании можно отказаться от представления всей совокупности узлов [34,41,133]. Проанализируем свойства потока заявок в РИВС АСУП. Вероятность поступления определенного количества требований в течение определенного промежутка времени не зависит от начала отсчета времени, а зависит от длины промежутка, т.е. поток является стационарным. Для стационарного потока вероятность того, что за промежуток (0, t) поступит ровно п требований, равна вероятности поступления п требований за промежуток {а, a+f), где а 0, т. е.: Стационарность потока обуславливается тем фактом, что большую часть времени РИВС работает с фиксированной вычислительной нагрузкой. Пульсация нагрузки может происходить лишь на довольно длительных интервалах времени и связана с увеличением интенсивности работы пользователей в период бухгалтерской отчетности и т.д.
Суммарный входной поток запросов по своей природе неординарен, т.к. заявки в нем могут поступать одновременно (параллельно) из нескольких источников. В то же время при параллельном поступлении нескольких запросов происходит их накопление в очереди, время пребывания в которой всегда больше интервала их поступления (At). Тогда вероятностью попадания на участок времени At двух или более событий (запросов) можно пренебречь. Таким образом, можно считать, что входной поток является ординарным. Его также можно считать потоком без последствий, т.к. заявки не связаны во времени.
Таким образом, можно рассматривать поток заявок в РИВС АСУП как пуассоновский [1,12,105,106]. Как было отмечено, при выполнении запросов длительность их выполнения зависит от типа и множества выполняемых действий. Учесть все возможные значения крайне сложно как в теоретическом, так и в вычислительном отношении. Предположим, что в системе выполняется множество типовых задач обработки, длительность которых существенно не отличается и описывается экспоненциальным законом распределения.
Считается, что выполнение запроса есть процесс неделимый, а получение результатов выполнения запроса возможно только после завершения всего процесса обработки. ВК можно рассматривать как двухуровневую модель, каждый уровень которой работает по принципам СМО, а взаимодействие между уровнями осуществляется и контролируется коммутатором кластера (Рис. 3.4).
На первом уровне модели осуществляется взаимодействие между клиентскими компьютерами и коммутатором. Данное взаимодействие описывается в терминах СМО М/М/1 с ожиданием и ограниченной очередью [12,46] с учетом отмеченных ранее ограничений и параметров взаимодействия и обработки. Ограничение длины очереди осуществляется из соображений, что пользователь не будет ожидать ответа бесконечно. Тогда на основе времени ожидания можно определить максимальную длину очереди, которая будет обеспечивать на приемлемом уровне время ожидания ответа на пользовательский запрос.
На втором уровне модели осуществляется взаимодействие между коммутатором и ВСОИ, и в данном случае их взаимодействие может быть определено в терминах СМО М/М/п [6,12,116], где п определяет количество компьютеров, подключенных к кластерной структуре. Особенностью данного уровня является отсутствие очереди запросов у ВСОИ. Данное предположение определяется, во-первых, учетом очереди запросов в модели на первом уровне представления, а во-вторых, частой сменой ВСОИ. Вероятность того, что определенный ВСОИ будет существовать в системе время, достаточное для организации очереди, крайне мала, а ее присутствие в данном случае может вызвать увеличение накладных расходов, вызванных большим количеством ситуаций, связанных с восстановлением потерянных запросов.
Объект №1. ОАО «Владимирский завод «Электроприбор»
Телекомпания "Радуга" занимается ретрансляцией федерального телеканала ТНТ на территории Владимирской области и размещением рекламных сообщений в специализированных рекламных блоках.
Для повышения эффективности бизнеса телекомпанией ведется мониторинг телевизионного эфира с целью анализа рекламных блоков. Для мониторинга используется информационная система, разработанная в рамках НИР по договорам № 3161/04 от 30.11.2004 и №3265/05 от 01.09.2005. При проведении данных научно исследовательских работ Автор являлся ответственным исполнителем.
Рассмотрим принцип работы системы мониторинга телевизионного эфира. Система мониторинга в непрерывном режиме анализирует вещание по 10 телевизионным каналам. Для этого аналоговый сигнал телеканала оцифровывается с помощью ТВ тюнеров, затем анализируется на предмет наличия рекламного блока. При обнаружении такового его содержимое записывается для дальнейшего анализа. Главный сервер обработки видео в режиме реального времени анализирует содержимое в 10 видеопотоках. При обнаружении рекламы запускаются механизмы видеосжатия и записи на сервер хранения. При трансляции рекламных блоков одновременно на всех каналах может наблюдаться нехватка производительности главного сервера, которая будет выражаться в том, что в записываемом видеопотоке будут пропущены кадры. Для устранения данной проблемы было решено организовать всю информационную систему как виртуальный кластер. При нехватке производительности главного сервера к обработке данных подключаются ВСОИ, формируемые на базе АРМов пользователей. Для оценки эффективности применения ВК был проведен анализ системы с работающим механизмом перераспределения нагрузки (режим виртуального кластера) и в режиме одиночного сервера. Количество пропущенных кадров в час в расчете, на один ТВ канал в режиме одиночного сервера составило 1352. В режиме с работающим механизмом перераспределения нагрузки этот показатель составил 516. Эффект составил около 61 процента. Акт о внедрении приведен в приложении 3. 1) Экспериментальное исследование подтвердило адекватность разработанных в главе 2 моделей и алгоритмов организации ВК. 2) Архитектура ВК реализует механизмы адаптации и восстановления. Адаптация заключается в добавлении в ВК новых серверов обработки при повышении вычислительной нагрузки. Восстановление реализуется путем диагностики и оперативного реконфигурирования кластера. 3) Результаты внедрения на промышленных предприятиях и телекомпании показали общность идей, лежащих в основе предложенной архитектуры ВК и позволяющих повысить живучесть РИВС АСУП. 1) Анализ стандартных средств и методов живучести вычислительных систем АСУП показал, что они обеспечивают, как правило, структурную живучесть, что становится явно недостаточным в условиях современных АСУП, построенных по распределенной архитектуре и использующих ПК и сети общего пользования для обмена информацией. Выявлено, что наиболее перспективным подходом в данном классе задач могут стать методы функциональной живучести, основанные на оптимизации процесса обработки информации, однако они на практике фактически не используются. 2) Синтезирована новая архитектура РИВС АСУП, отличительной особенностью которой является введение в структурную модель новых модулей, информационных связей и соответствующая им модернизация процедур синхронизации, диагностики и реконфигурирования. Данный подход развивает идеи построения распределенных ВС по кластерной технологии и обеспечивает новый уровень функциональной живучести системы. 3) Разработана методика оценки живучести РИВС, базирующаяся на анализе цикла работы системы в условиях воздействия ПФ и позволяющая исследовать влияние параметров РИВС на показатели живучести, проводить качественный анализ вариантов построения РИВС с учетом требований эксплуатации. Проведенные в соответствии с данной методикой исследования показали, что наибольшая эффективность моделей и алгоритмов может быть получена в задачах с динамической вычислительной нагрузкой. 4) Предложены алгоритмы и модели функционирования службы мониторинга РИВС, позволяющие вести в автоматическом режиме диспетчеризацию системных ресурсов, а также обеспечивающие живучесть самой службы. 5) Разработано программное обеспечение, расширяющее функциональные возможности серверов РИВС и позволяющее обеспечить живучесть АСУП в практических задачах. Основными результатами внедрения на промышленных предприятиях и в организациях стало снижение времени устранения неисправностей, уменьшение внеплановых простоев и повышение производительности вычислительной системы АСУП, что позволяет судить об общности идей, положенных в основу реализации предложенных механизмов обеспечения живучести АСУП. Материалы диссертации использованы в учебных курсах по дисциплинам «Вычислительные сети», «Базы данных», «Защита информационных процессов в компьютерных системах».