Введение к работе
Актуальность томі. В связи с широкім применением вычислительной тохннки во всех областях народного хозяйства, возрастанием значимости и ответственности решаемых с помощью вычислительной техники задач и уволичоїшя ущерба от неправильного функциоііироваїшя вычислительных процессов очевидна актуальность проблемы их надежности. Особенно актуально проблема надскностл стоит перед многопроцессорными вычислительными системами.
Проблемой повышения надеиюсти многопроцессорных вычислительных систем (МПВС) занимались многие отечественные к зарубежные ученые, в том числе С.М.Доманицкий, М.А.Гаврилов, Э.В.Евреинов, Я.А.Хетагуров, Р.Кэмпбел, Д.Рассол, Д.Ршшолс.
Практически малоизученной остается проблема восстановления программных систем реального времени, но имеющих аппаратной избыточности. Перспективным методом решения видится использование недозагрукенности (времетюй избыточности) процессоров системы для перераспределения выполняющихся в mix задач среди работоспосбных процессоров.
Целью работы является разработка методов, алгоритмов и программных средств обеспечения отказоустойчивого функционирования программных комплексов в многопроцессорных вычислительных системах с распределенной памятью при возникающих неисправностях аппаратуры.
Идея работы заключается в использовании модели параллелизма CSP (Communicating Sequential Processes - взаимосвязанных последовательных процессов) для формального описания исследуемых заданий и обеспечения их отказоустойчивого выполнения путем восстановления после отказов при сокращащемся числе процессорных модулей.
Методы исследования. В качестве основных методов исследования использованы методы дескретной математики, теории расписаний, теории графов и теории взаимодействующих
последовательных процессов.
Розультаты. внносимыо на защиту состоят в следующем:
- методика и алгоритмы нахокдеїшя расписаний выполнения
взаимодействующих, процоссов в многопроцессорной вычислительной
систомо с распродолешюй памятью;
формализация отказоустойчивого размещения задач по процессорным модулям в распределенной вычислительной системе ІІ метод построения размещения задач;
теоретическое обоснование стратегии расстановки контрольных точек во время функционирования программных комплексов, реализованных в соответствии с.моделью параллелизма CSP;
метод восстановления функционирования программных комплексов в (ШВС при отказах процессорных модулей.
Достоверность научных положений разработанных методов и алгоритмов подтверждена результатами экспериментальных исследований.
Практическая ценность работы состоит в следующем:
- разработаны и программно реализованы алгоритмы построения
расписаний и отказоустойчивых размещений задач;
предложены операционные принципы функционирования вычислительной системы, представляющей собой сеть транспьютеров, реализующие предложенный метод отказоустойчивости.
Реализация результатов. Предложенная в работе методика построения расписаний' использовалась в Московском опытно-конструкторском бюро '"Марс" при переносе существующего программного обеспечения стендов отработки бортовых програм,!, реализовашшх на базе одномашинных комплексов, на МПВС с архитектурой "много потоков команд - много потоков данных" и распределенной памятью (транспьютерную сеть).
Апробация работы. Основные полокэния и- результаты диссертационной работы докладывались и обсуадались на 1-м
всесоюзном семинаре "Логические метода построения однородных и
систолических структур" (Москва,1988), V Королевских чтоштях
11-ой республиканской конференции "Фундаментальные и прикладные
проблемы космонавтики" (г.Киов,1990), Всесоюзном
совещании-семинаре "микропроцессорные системы управления технологическими процессами в ГПС" (Одесса,1990), VIII и X советско-итальянских семинарах "Сети пакетной коммутации ЭВМ" (Москва, 1989 и 1991), 1-ой международной конференции советской транспьютерной ассоциации (Звенигород 1991), а также на научных семинарах Института проблем передачи информации РАН.
Структура и объем работы, диссертация состоит из введения, четырех глав, заключения, списка литературы из 10% наименований и приложения. |Основной текст работы занимает 150 машинописных страниц, включая 37 рисунков и 11 таблиц.