Введение к работе
Актуальность темы. Постоянный рост требований к функциональным и конструктивным характеристикам ответственных вычислительных систем (ВС), к которым относятся и бортовые ВС летательных аппаратов (в дальнейшем, ВВС), вызывает необходимость разработки новых высоконадежных ВС и их функциональных блоков. Оперативные запоминающие устройства (ОЗУ); из-за крайне высокой плотности расположения и количества элементов на полупроводниковом кристалле, являются одними из наиболее влияющих на совокупную надежность ВВС. Объем оборудования ОЗУ составляет большую часть аппаратуры ВВС. Поэтому повышение надежности ОЗУ как функционального блока ВВС является актуальной задачей. Только совершенствование технологий из-за достижения естественных физических пределов не позволяет обеспечивать требуемый уровень надежности электронной вычислительной техники. Еще одним способом повышения надежности аппаратуры ВС является обеспечение устойчивости к неисправностям (сбоям и отказам). Устойчивость к неисправностям предполагает, что появление неисправностей аппаратуры во время работы ВС ожидается, но их влияние будет автоматически преодолено использованием избыточных компонент. Избыточные ВС, способные продолжать функционирование в полном объме после возникновения неисправностей аппаратуры и ошибок в программном обеспечении принято называть отказоустойчивыми ВС (ОВС).
Таким образом, устойчивость к неисправностям аппаратуры ВС обеспечивается введением избыточности. Методы обеспечения устойчивости к неисправностям в отношении ОЗУ основываются либо на структурной, либо на информационной, либо на временной избыточности. Возможно также сочетание указанных видов избыточности. Перечисленные виды избыточности могут обеспечиваться аппаратурно и программно.
Известны два основных способа реализации устойчивости к неисправностям ВС. Одним из них является маскирование возникшей неисправности и продолжение функционирования ВС без задержки. Другой способ подразумевает автоматическое обнаружение неисправности системой, обеспечение структурой системы определения типа неисправности (отказ/сбой), локализации неисправности, реконфигурации структуры и восстановления поврежденной неисправностью информации. ВС, устойчивые к неисправностям, могут комбинировать оба способа для реализации устойчивости к неисправностям и менять режимы обеспечения устойчивости к
неисправностям. До настоящего времени границы применения этих различных способов не определены. В этой связи исследование и разработка методов построения устойчивых к неисправностям ОЗУ ВВС, основанных на использовании различных видов избыточности в структурах ОЗУ, представляются актуальными.
Целью работы является разработка методики использования различных видов избыточности в структурах ОЗУ для обеспечения структур ОЗУ свойством устойчивости к неисправностям и применение этой методики для разработки новых устойчивых к неисправностям ОЗУ ВВС. Для этого в работе исследуются возможность использования внешних средств введения структурной, информационной и временной избыточности в структуры ОЗУ для реализации свойства устойчивости к неисправностям, а также способы обеспечения устойчивости к неисправностям.
Методы исследования. Основные результаты диссертационной работы проанализированы с привлечением теории вероятности и марковских процессов, основ теории классификации избыточности информационных систем.
Научная новизна работы состоит в разработке методики использования различных видов избыточности для проектирования новых структур ОЗУ со свойством устойчивости к неисправностям, в разработке способа реализации свойства устойчивости к неисправностям, позволяющего сокращать период скрытости неисправностей (латентный период). Разработанная методика представлена в виде последовательности действий процесса проектирования устойчивых к неисправностям ОЗУ и рекомендаций для их выполнения. Представлена структура подсистемы ОЗУ ОВС, в частности ее системной и пользовательской частей. Использование избыточности представлено в виде таксономии, построенной в трех ортогональных осях: структура ОЗУ подсистемы, класс неисправностей, относительно которого компоненты ОЗУ устойчивы к неисправностям, и рекомендуемые виды избыточности, необходимые для реализации свойства устойчивости к неисправностям структур ОЗУ. Новизна предложенного в работе способа обеспечения устойчивости к неисправностям заключается в использовании комбинации двух известных способов обеспечения устойчивости к неисправностям для разработки новых структур ОЗУ, устойчивых к накоплению неисправностей в классе неисправностей произвольной кратности, а также в обеспечении возможности менять режимы обеспечения устойчивости к неисправностям.
Показано применение предложенной методики для проектирования устойчивых к неисправностям ОЗУ ВВС. Исследована возможность модификации классической троированной структуры, и разработаны новые структуры ОЗУ, устойчивые к
накоплению неисправностей в классе неисправностей произвольной кратности, а также троированные структуры ОЗУ с возможностью реконфигурации структуры. Рассмотрено применение метода управляемой деградации при построении структур ОЗУ такого типа. Осуществлен сравнительный анализ разработанных структур ОЗУ БВС с точки зрения надежности и технической реализуемости. Показано, что предлагаемые структуры ОЗУ имеют существенно более высокую надежность, по сравнению с классическими.
Практическая ценность. Полученные в работе результаты позволяют формализовать проектирование устойчивых к неисправностям ОЗУ БВС с различными функциональными и надежностными требованиями. Подсистема ОЗУ представляется в виде семейства ОЗУ, устойчивых к неисправностям относительно наперед заданных классов неисправностей. Обеспечение свойства устойчивости к накоплению неисправностей значительно уменьшает вероятность отказа предлагаемых структур ОЗУ, что, во-первых, обосновывает введение избыточности в структуры ОЗУ, по сравнению с обычной структурой ОЗУ, во-вторых, позволяет увеличить надежность ОЗУ как функционального блока БВС, и, следовательно, надежность БВС в целом. Это позволяет повысить коэффициент готовности БВС, снизить затраты на ее обслуживание. Системы, построенные по таким принципам, дешевле в эксплуатации и более надежны.
Результаты работы нашли практическое внедрение и обеспечили возможность реализации новых принципов обеспечения активной безопасности отечественных летательных аппаратов.
Реализация результатов. Полученные в работе результаты использованы при разработке структуры ОЗУ регистратора полетных данных для отечественных самолетов АОЗТ "ОКБ Сухого", а также при разработке структуры ОЗУ цифровой системы управления двигателем АМНТК "Союз". Использование результатов работы подтверждено актами о внедрении и заключениями экспертных советов.
Апробация работы. Результаты работы докладывались на научных семинарах лаборатории технической диагностики ИПУ (1991-1997), на Международной конференции "Technologische Sicherheit, Umwelt und Konversion-Risiken der Technik und ihre Beherrshung" (1992) в Берлине (Германия), на VIII Международной школе-семинаре "Диагностика и отказоустойчивость в технике" (1995) в Алуште (Украина).
Публикации. Автором опубликовано три научных работы по теме диссертации.
Структура и объем работы. Диссертация состоит из введения, четырех глав, заключения, списка литературы 65 наименований, приложений, 39 рисунков, 14 таблиц. Приложения содержат 24 страницы. Всего 190 страниц.