Введение к работе
Актуальность темы. Рост объема функций управления, возлоягн-ных на автоматические и автоматизированные управляющие системы, а также повышение значимости задач, возлагаемых на эти системы, приводит к необходимости повышения надежности средств вычислительной техники. Интенсивные исследования по данной проблеме в последние годы привели к возникновению новых систем - отказоустойчивых или толерантных. Анализ особенностей построения отказоустойчивых вычислительных систем (ВС) показывает, что наиболее перспективными, с точки зрения использования избыточности и реконфигурации, являются параллельные вычислительные системыСПВС). Однако,применение традиционных способов резервирования не всегда обеспечивает требуемые уровни отказоустойчивости управляющих ВС, функционирующих в реальном времени. Это обусловлено имеющимися ограничениями по резерву времени,объему дополнительного оборудования, а такие сравнительно низкими возможностями встроенных средств контроля вычислительных модулей систем. Все это свидетельствует о необходимости разработки новых подходов, направленных на достижение гибкой и эффективной адаптации ВС к отказам я сбоям на основе экономичных научно-технических решений.
В связи с этим в диссертационной работе поставлена и решена актуальная научно-техническая задача обоснования и разработки предложений по обеспечению отказоустойчивости параллельных управляющих вычислительных систем.
Предмет исследования составляют вычислительные системы и способы обеспечения отказоустойчивости ПВС реального времени.
Цель исследования заключается в разработке методических и практических рекомендаций для анализа и достижения требуемых уровней отказоустойчивости параллельных вычислительных систем реального времени в условиях ограничений по структурной избыточности и применению встроенных средств контроля.
В соответствии с указанной целью в диссертации ставились и решались следующие основные задачи:
-
разработать инженерный метод, алгоритмы и программные средства для расчета показателей надежности сложных ВС;
-
разработать методику исследования надежности параллельных ВС с активной защитой от отказов и сбоев составных вычислительных модулей(Ш);
-
разработать комплекс моделей анализа надежности функцио-
нирования параллельных ВС с активной защитой(АЗ);
4; разработать экономичные и эффективные научно-технические решения по построению отказоустойчивых ПВС, функционирующих в режиме реального времени, при ограниченной или низкой эффективности встроенных средств контроля составных вычислительных модулей и в условиях незначительного резерва времени.
методика исследования включает анализ структур существующих отказоустойчивых ВС и способов обеспечения их отказоустойчивости, а также разработку новых высоконадежных структур параллельных вычислительных систем. Она базируется на применении теории надежности, теории вычислительных систем, теории графов, математического аппарата теории вероятности, линейной алгебры, топологического полумарковского метода расчета надежности сложных систем, теории алгоритмов.
Основные положения и результаты работы, выносимые на аащиту.
-
Инженерный топологический полумарковский метод расчета показателей надежности вычислительных систем.
-
Методика анализа надежности параллельных вычислительных систем с активной защитой.
-
Комплекс моделей анализа показателей безотказности и готовности ПВС с активной зашитой.
-
Научно-технические решения по построению параллельных вычислительных систем с одноуровневой и двухуровневой активной защитой от отказов и сбоев составных ВМ.
Научная новизна результатов состоит в следующем.
1. Разработанный инженерный топологический полумарковокий
метод расчета показателей надежности вычислительных систем, алго
ритмы и программное обеспечение, в отличие от известных,позволяют
решать задачи повышенной размерности, что существенно расширяет
возможности анализа надежности ВС. Штод прост в освоении и не
требует значительных затрат вычислительных ресурсов ЭВМ.
2. Методика анализа надежности ПВС учитывает особенности
структур ВС, в которых реализована концепция активной защиты.
-
Комплекс математических моделей анализа показателей безотказности и готовности ПВС с A3 позволяет определять эти характеристики при произвольных распределениях времени обнаружения отказов и времени адаптации системы к ним. В отличие от известных, модели учитывают особенности функционирования ПВС с A3.
-
Разработанные научно-технические решения по построению отказоустойчивых параллельных ВС с активной зашитой, в отличие от известных, позволяют с меньшими аппаратурными затратами в услови-
ях реального времени и при ограниченной или низкой эффективности встроенных средств контроля составных Ш, не только обнаруживать, но и классифицировать ошибки на сбой или отказ, выявлять и исключать из рабочей конфигурации отказавший ЕМ, восстанавливать вычислительный процесс.
Новизна, полезность и существенные отличия разработанных технических решений подтверждены государственной научно-технической экспертизой изобретений.
Практическая ценность работы заключается в дальнейшем развитии концепции активной защиты применительно к параллельным ВС.
Предложены новые нетрадиционные научно-тенические решения по построению отказоустойчивых параллельных ВС, функционирующих в режиме реального времени.
Использование методики и комплекса математических моделей анализа надежности ПВО с активной защитой позволяют при заданных значениях резерва времени и длительности такта A3 выбирать соответствующий уровень и дисциплину активной защиты для обеспечения требуемого уровня надежности ВС.
Разработанный инженерный топологический полумарковский метод расчета надежности вычислительных систем пригоден для решения широкого класса задач и расширяет возможности анализа надежности ВС, так как позволяет решать задачи ;:лпг7?нной размерности.
Реализация.
Инженерный топологический полумарковский метод расчета надежности ВС, алгоритмы и программы внедрены в Нормативный материал Межправительственной комиссии по вычислительной технике, на предприятиях ГОЩЭВТ и п/я Г-4097.
В ПВУРЭ при разработке перспективных вычислительных систем использованы методика и математические модели анализа и прогнозирования отказоустойчивых параллельных ВС.
Апробация работы. Основные положения работы докладывались и обсуждались на Всесоюзном семинаре "Надежность и диагностирование ЭВМ и микропроцессорных систем'Ч г. Ленинград, 1989г.), на Всесоюзном семинаре "Надежность ЭВМ, вычислительных сетей в процессе их разработки и эксплуатации"(г. Ленинград,1990г.),на IV научно-технической конференции ЖВУРЭ (г. Житомир, 1984 г. ),на I и II научно-технических конференциях ПВУРЭ (г. Ленинград, 1988,1991гг.), на VI научно-технической конференции ОЕВОКИУ (г.Одесса,1989 г.).
Публикации. По теме работы опубликовано 35 научных трудов, в том числе получено 5 авторских свидетельств на изобретения.
Структура и объем диссертации. Работа состоит из введения,
пяти разделов, заключения, списка литературы и трех приложений. Она изложена на-/65 машинописных листах, содержит 45 таблиц, 36 рисунков, библиографию из 44 5 наименований, 4 листа приложений.