Введение к работе
Актуальность темы
Быстрое развитие вычислительной техники и управляющих вычислительных систем в частности, внедрение новых технологий в разработку аппаратных и программных средств привели к необходимости развития новых подходов к проектированию средств обеспечения отказоустойчивости (СОО). Стало очевидным, что использование в сложных вычислительных системах (ВС) традиционных способов введения структурной, временной и программной избыточности эффективно только при условии, что они находятся в точном соответствии с организацией управления вычислительным процессом (ВП), реализуемого операционной системой (ОС). Этот факт нашел отражение в отечественных публикациях с середины девяностых годов в виде попыток систематизации способов управления и восстановления ВП, а также выявления закономерностей их взаимосвязи. Наиболее планомерные исследования в этом направлении проводятся Институтом проблем управления (РАН) на основе обобщения опыта отечественных и зарубежных разработок промышленных и бортовых ВС (БВС), в работах Э.М.Мамедли, Соболева Н.А., Менна А.А. и др. Теоретической основой исследований в этой области послужили труды Пархоменко П.П., Прангишвили И.В., Мироновского Л.А., Черкесова Г.Н., Шубинского И.Б., Щербакова О.В., Иыуду К.А. и др.
В последнее время очевиден рост количества зарубежных ОС реального времени, предназначенных для промышленного применения и использующих широкий спектр программно-аппаратных и программных СОО. Большинство из этих систем являются промышленной модификацией систем военного применения. Наиболее существенные результаты зарубежных исследований в области организации и разработки отказоустойчивых ВС (ОВС) представляются на ежегодном симпозиуме: International Symposium on FTC (ШЕЕ Computer Society), где в последние годы стала очевидной тенденция смещения интересов исследователей в область создания СОО в виде системных приложений для «микроядерных» ОС. Наиболее интересные работы в этом направлении опубликованы такими авторами, как Rick Harper, Alan Wood, R.Perez, H.Kim, Y.Huang, C.Kintala и др. Широко используется, так называемая, FLEET - технология проектирования структурно-избыточных ОВС. В силу этого необходим анализ и обобщение способов и механизмов управления и восстановления ВП, а также их реализации в ОС.
Таким образом, актуальность решаемых в диссертационной работе задач определяется необходимостью в организации процессов восстановления ВП в реальном времени с учетом свойств как структуры ВС, так и элементов ОС, управляющих вычислениями. Показатели качества ОВС существенно зависят от выбираемых механизмов и способов восстановления ВП, а последние, в свою очередь, определяются способом управления ВП. Поэтому наряду с классификацией и параметризацией отказоустойчивых бортовых ВС необходим анализ свойств и особенностей организации ВП в БВС, а также формализации описания программных СОО, являющихся составной частью операционной системы.
Кроме того, сама задача оценки качества как средств обеспечения отказоустойчивости, так и ОВС в целом не тривиальна. В связи с этим возникает необходимость в создании методики оценки вычислительной сложности и
надежности с учетом процесса восстановления, осуществляемого средствами ОС, в частности, гипервизором.
Широта спектра показателей, характеризующих структуру, особенности аппаратной и программной реализации ОВС, необходимых для комплексной оценки ее качества, существенно усложняет сам процесс оценки и сбор требуемой исходной информации. Для решения этой проблемы требуются специализированные средства моделирования, ориентированные на имитацию процесса функционирования ОВС.
Разнообразие структурно-алгоритмических методов и средств, предлагаемых сегодня для повышения отказоустойчивости ВС, делает трудоемким процесс выбора необходимых проектных решений для разработчика. Возникает необходимость в систематизации и формировании базового набора способов и механизмов восстановления, а также реализующих их алгоритмов применительно к БВС заданных классов в соответствии со свойствами и особенностями организации в них ВП.
В силу перечисленных причин диссертационная работа посвящена анализу существующих подходов и развитию на их основе системного подхода к проектированию средств обеспечения отказоустойчивости в структурно-избыточных управляющих ВС.
Тема диссертационной работы согласуется с приоритетными направлениями развития науки и техники, утвержденными Правительственной комиссией Российской Федерации по научно-технической политике № 2727п-П8 от 21 июля 1996 года [направление «Фундаментальные исследования», раздел «Информатика, вычислительная техника, автоматизация», а также разделы В.4.2.1, В.4.1.5 перечня технологий двойного назначения]; Федеральной научно-технической программой «Конверсия и высокие технологии 1997-2000 гг.» [раздел 2 «Информационные технологии, электроника и связь»]; Государственной «Программой создания комплексов бортового оборудования для перспективных летательных аппаратов»; с планом госбюджетной научно-исследовательской работы «Исследование и разработка систем управления, контроля и диагностики», N 0890301; с планами работ по Всероссийским грантам 1996-1997 гг, 1998-1999 гг. по фундаментальным исследованиям в области автоматики и телемеханики, информатики, кибернетики, метрологии и связи.
Предмет исследования:
управление восстановлением вычислительного процесса при проявлении дефекта;
организация структур и процессов в вычислительных средствах обеспечения отказоустойчивости;
математическое и программное обеспечение средств диагностирования, реконфигурации и восстановления вычислений в бортовых системах управления и контроля;
модели для определения качества средств обеспечения отказоустойчивости и их влияния на общие характеристики бортовой ВС;
средства моделирования процессов функционирования отказоустойчивых ВС. Целью диссертации является: разработка системного подхода для
проектирования программных и программно-аппаратных средств обеспечения отказоустойчивости управляющих структурно-избыточных ВС с детерминированным распределением ресурсов и создание на его основе математического обеспечения для восстановления ВП в бортовых ВС управления и контроля.
Для достижения поставленной цели необходимо выполнить следующие основные этапы и задачи:
1. Классификация и параметризация ОВС в соответствии с предъявляемыми к ним требованиями и применением, а также анализ свойств и особенностей организации ВП, определяющих способы и механизмы его восстановления в случае возникновения дефектов.
Цели этого этапа:
определить типы управления отказоустойчивостью и основные структурные параметры;
классифицировать БВС по применению и определить соответствующие им наборы прикладных задач;
выделить класс БВС для дальнейшего рассмотрения и провести анализ свойств и особенностей организации вычислительного процесса для выделенного класса ВС.
2. Определение базовых функций и структурирование программного
обеспечения (ПО) для поддержки отказоустойчивости в ВС.
Цели этапа:
сформулировать основные функции ПО, реализующие управление и восстановление ВП;
распределить эти функции между элементами ОС в соответствии со структурными параметрами и способами управления;
проанализировать варианты размещения ПО между структурными элементами ВС с целью оптимизации ее функционирования;
определить функции средств самоконтроля, разрабатываемого ПО и распределить их между элементами ОС;
3. Формализация процесса проектирования гипервизора на основе его
многоуровневого представления.
Цель этапа - предложить способ формального описания архитектуры программных средств обеспечения отказоустойчивости и, в частности, гипервизора для решения задачи синтеза этих средств.
4. Выбор системы показателей качества для средств обеспечения
отказоустойчивости и ОВС в целом, а также методика оценки этих показателей.
5. Разработка средств моделирования для оценки качества ОВС на основе
сформированной системы критериев.
Цель этапа - предоставить пользователю инструментарий и методику построения системы моделей функционирования ВС с выбранной конфигурацией программных и аппаратных средств обеспечения отказоустойчивости, а также возможность их коррекции и оптимизации на основе качествешгах и количественных оценок.
6. Проектирование математического обеспечения структурно-избыточных ВС с
детерминированным распределением ресурсов. Оценка вычислительной сложности
разрабатываемых средств с учетом аппаратных и программных решений,
формирование комплексной оценки процессов диагностирования, реконфигурации и
восстановления ВП, а также их влияния на производительность и надежность
системы в целом.
Цели этапа:
предложить функционально-структурную, семантическую, информациошгую и логическую организацию локального гипервизора отказоустойчивого комплекса выбранного класса, а также алгоритмический состав для его формирования;
оценить временные затраты и расходуемую память для различных механизмов и способов восстановления, реализованных в сформированном алгоритмическом базисе;
оценить качество процессов по интегральному критерию с учетом показателей, характеризующих аппаратную, временную и информационную избыточности;
проанализировать влияние качества исследуемых процессов на надежностные и иные комплексные оценки отказоустойчивой ВС;
оценить снижение потенциальных характеристик системы относительно идеально фушшиоїшрующей гипотетической ВС.
7. Разработка СОО для ВВС с заданными архитектурой и ОС с учетом ограничений на выбор механизмов управления и восстановления ВП.
Цель этапа: предложить способ восстановления вычислительного процесса, соответствующий механизмам управления функционирования, предусмотренным в заданной ОС; сформировать набор алгоритмов, реализующих диагностирование в стационарном режиме и восстановление ВП при проявлении дефектов; оценить качество предлагаемых средств и изменение характеристик ВВС, используя предложенные методики и разработанные средства моделирования.
Методы исследования В работе использованы методы технической диагностики и системного анализа, теории вероятностей и математической статистики, теории случайных процессов, имитационного моделирования.
Научные результаты и иж новизна 1. Сформулированы основные этапы проектирования СОО на основе системного подхода в структурно-избыточных ВС с учетом операционной системы. Предложено формализованное многоуровневое описание программных СОО, в том числе организации гипервизора, как основной составляющей СОО. В результате выделены новые типы объектов: текущий и полный локальный и глобальный гипервизоры, системная и прикладная составляющие гипервизора.
2. Сформирована система показателей качества СОО. Предложена обобщенная модель функционирования ОВС с учетом дефектов и формирования текущего гипервизора в соответствии со структурной и функциональной деградацией системы. Предложена концепция построения средств моделирования в виде проблемно-ориентированных библиотек, встраиваемых в существующие универсальные интегрированные среды проектирования ВС. Новизна достигается за счет включения в процесс моделирования структурной организации ВС, свойств и особенностей организации ВП, в том числе механизмов и способов управления и восстановления ВП, реализуемых элементами ОС, а также дефектов с различными формами их проявления.
3.Предложена методика оценки качества СОО и их влияния на производительность и надежность ОВС. В отличие от других существующих методик она позволяет учесть процесс восстановления с точностью до алгоритмической реализации отдельных механизмов и способов его организации.
4.Сформирован базисный набор способов и механизмов восстановления ВП, а также реализующих их алгоритмов применительно к структурно-избыточным ВВС
управления и контроля с детерминированным распределением ресурсов. Состав учитываемых факторов при формировании базиса расширен в соответствии с особенностями функционирования БВС.
5.Разработаны модели функционирования структурно-избыточных ВС с детерминированным распределением ресурсов на основе предложенных вариантов локального гипервизора, реализующих различные способы восстановления, с целью их сравнительной оценки. Представленные модели позволяют выбирать необходимое сочетание СОО, способствующее улучшению технических характеристик за счет согласования структурной избыточности, системы дефектов и взаимоподобных механизмов управления и восстановления ВП.
б.Разработано математическое обеспечение бортового комплекса управления и контроля с учетом ограничений заданной ОС. По сравнению с исходным бортовым комплексом предлагаемый отличается повышенной сбоеустойчивостью и точностью локализации дефекта без необходимости в перезагрузке или многократном выполнении копий прикладной задачи.
Основные положения, выносимые на защиту, представлены в разделе «Научные результаты и их новизна».
Достоверность результатов -"'"*- '-'
Обоснованность и достоверность результатов подтверждается моделированием, экспериментальными исследованиями; результатами экспертизы Регионального центра научно-технической экспертизы; корректным использованием математического аппарата; апробацией работы в виде докладов на Всероссийских и Международных конференциях и публикациях в научных и учебно-методических изданиях.
Научная значимость результатов
состоит в развитии системного подхода к гфоектированию СОО в виде: формализации многоуровневого описания программных СОО, систематизации способов и механизмов восстановления ВП для 'класса - бортовых ВС, а также концепции проектирования системы моделирования для оценки качества разрабатываемых средств.
Практическая ценность результатов ""'_
На основе полученных в диссертационной работе теоретических результатов:
- разработаны открытые проблемно-ориентированные библиотеки для комплексного
моделирования функционирования ОВС с учетом ОС, встраиваемые в различные
универсальные интегрированные среды проектирования. Предлагаемые средства, а
также возможность их выбора способствуют снижению трудоемкости и сокращению
времени проектирования СОО и ОВС в целом;
сформированный базис способов и механизмов восстановления БД а также алгоритмический базис для выбранного класса систем позволяет повысить качество проектирования БВС управления и контроля;
разработанные варианты локального гипервизора позволяют комплексировать разработанные средства с целью достижения компромиссных решений между затратами ресурсов и необходимым уровнем отказоустойчивости за счет варьирования различных параметров ВС и ВП.
Реализация результатов работы
Предложенные в работе подходы, методики и средства моделирования могут применяться без существенных изменений для более широкого класса управляющих ВС, используемых в судостроении, энергетике и других отраслях промышленности.
Это подтверждается исследованиями, проводившимися в соответствии с планом работ по Всероссийскому гранту 1996-1997 гт по фундаментальным исследованиям в области автоматики и телемеханики, информатики, кибернетики, метрологии и связи [в рамках научно-технической программы «Цифровые и цифро-аналоговые вычислительные комплексы»] по теме "Организация вычислительных процессов в бортовых системах функционального диагностирования" (№ 5868011). Полученные в диссертационной работе результаты, связанные с созданием системы моделирования процессов функционирования отказоустойчивых ВС, явились основой для дальнейшего развития направления и получения гранта 1998-1999гг. по теме "Разработка средств моделирования для анализа качества программно-аппаратных средств обеспечения отказоустойчивости бортовых вычислительных систем» (№ гос. регистрации 0198.0003849).
Реализация работы связана с использованием полученных результатов в НИР «Паритет» НИИ вычислительных средств «Спектр» по проектированию базового комплекта бортового оборудования летательных аппаратов пятого поколения, а также в НИР, проводимой НИИ радиоэлектронных систем холдинговой компании «Ленинец» в соответствии с Государственной «Программой создания комплексов бортового оборудования для перспективных летательных аппаратов» (1997г.).
Предложенные средства и методики используются в учебном процессе при организации практических занятий по курсам «Периферийные устройства ЭВМ и ВС», «Системное программное обеспечение», «Сети ЭВМ», а также при подготовке бакалавров и магистров соответствующих направлений.
Апробация работы
Результаты диссертационной работы докладывались и обсуждались на Международных и Всероссийских научно-технических конференциях (НТК): на ежегодной Международной НТК «Диагностика, информатика, метрология, экология и безопасность» (СПб.: 1995, 1996, 1997, 1998гг.), Международной НТК «Информационные технологии в моделировании и управлении» (СПб., 1996г.), Международной НТК «Управление и информационные технологии на транспорте» («ТРАНСКОМ- 97»), XV международной межвузовской школе - семинаре «Методы и средства технической диагностики» (Йошкар-Ола: МарГУ, 1998) и др.
Полнота изложения результатов диссертации в опубликованных работах По материалам диссертации опубликовано 17 печатных работ, в том числе 4 учебных пособия (включая переиздание одного из пособий автора в 1998г.). Структура и объем работы
Диссертация включает введение, пять разделов, заключение, список литературы и приложения. Материал изложен на 311 страницах машинописного текста (основной текст - 292 страницы), содержит 107 рисунков, 68 таблиц, библиографию из 152 наименований.