Введение к работе
АКТУАЛЬНОСТЬ РАБОТЫ. Постановка вычислительных экспериментов цельв моделирования реальных физических процессов, решение задач іалкза и прогнозирования природных явлений, задьч САПР и другах; ;язаны с необходимостью обработки больших мвссиеое данных, что інет Сыть обеспечено применением мощных многопроцезссргых [числительных систем. Высокая производительность, гиОксоть. и ібкльность, возможность эффективной реализации. широкого класса ідач, за счет их адекватного отображения на архитектуру, іусловливаит эффективность использования многопроцессорянх :числятельных систем с программируемой архитектурой {ИВй ПА), [лачавдих в свой состав множество процессорных элементов (ЬЭ). вышенив производительности МВС ПА обеспечивается увеличоназа 'личества ПЭ в составе решающего поля, что вызывает ухудавЕгэ дєеностшх характеристик.
Устранение отказа в вычислительных системах, не облздащзх . ойстеом отказоустойчивости, вызывает длительные простоя И HS. зЕоляет использовать систему в автономном режиме. Требуемый овень надежности в течение заданного времени функционирования Еысакая скорость восстановления могут быть обеспечены свойствс/д кззоустойчивости МВС ПА.
Существенным' фактором при обеспечении отказоустойчивости и ганизации гарантоспособных вычислений на МВС ПА является кращение накладных расходов, сзязанных с обработкой отказа ПЭ.. В язи с этим исследование и разработка средств, обеспечивающих казоустсйчиьость, минимизацию Ерэмени восстановления числительных процессов в fffiC ПА после возникновения нештатных туац^й в работе и высокую достоверность функционирозания, ляются актузл?"чмл.
ЦЕЛЬЮ РАБОТЫ является исследование и разработка способов и эдств обеспечения отказоустойчивости ішогопрсцессорних числительных систем с программируемся архитектурой ,-атрзлизованкым управлением, распределенной памятью и «мутационной системой матричного типа, гарантирувдих ^активнее фугопшонированнэ в условиях отказов ПЭ.
Для достижения поставленной цели необходимо: разработать модель надэшости, учитывающую параметры эцедуры обработки ошибок, 'И . методику надекностного
проектирования МВС ПА;
- разработать комплекс средств, обеспечивающих высокую скорое;
реконфигурации структуры коммуникационных связей решаїіщего паля I
для ЫВС ПА с коммутационной системой матричного типа;
-- разработать эффективные средства управления еоссїзнозлєшн вычислений в МВС ПА после возникновения сбоев и омазо^;
- разработать средства контроля узлоь управленая с ц^л:
повышения достоверности функционирования ПЭ и исдегстем ЫВС ПА.
МЕТОДЫ ИССЛЕДОВАНИЯ основаны на исгользсзашЕ аппарата тгзр: вероятностей, теории надиы*«к:ти, теории вытаслигелышх систэ; теории случайных процессов, теории мнояеетв.
НАУЧНАЯ НОВИЗНА. Разработан комплекс средстз, обеспачивакц возможность эффективного функционирования Е"02яогіроазЕодате^,іі ЫВС ПА в условиях отказов, в том числе:
разработана математическая модель нада^ностл SSC и позволящая, в отличие от известных, учитывать харзкт&ристі; средств обнаружения и устранения отказов, и ^зтодика нядеяаюстде проектирования, отличающаяся от традициииных впзмоішостью вибс стратегий' использования вычислительных ресурсов и среде обеспечения безотказности критических ресурсов, ЧТО ПОБШ?.: надежность и эффективность функцЕонирозания МВС ПА;
разработаны новые способи реконфигурации квЕпроцессорі свяаей после отказа процессорных элементов МВС ПА с коммутациош системой матричного типа, обеспечивавшие сокращение вромэш затрат на перенастройку по сравнению с традиционный, и методі выбора соответствующего способа реконфигурации;
предложен способ восстановления параллельного шадслательш процесса посредством управляемого отката и рззрзботі соответствующие алгоритмы формирования контрольных записей и ли отката, сокращающие время восстановления' по сравнению с извест способом формирования обобщенного восстанавливаемого блока реализацией восстановления с неуправляемым откатом за с устранения эффекта порожденноі-о отката;
разработан способ контроля последовательности микрокоманд циклическими участками в процессорных элементах МВС ПА, в отли от известных, сокращающий объем эталонных кодов завершения.
ПРАКТИЧЕСКУЮ ЦЕННОСТЬ рЕйоты представляют:
- католика надежностного проэктирования КВС ПА;
- . разработанные средства управления реконфигурац
межпроцессорных связей в fJBC Пі, , структуры соответствующих ЕМ коммутационных устройств, применение которых сокращает время перенастройки коммутатора после, отказа IE, и инженерная методика-выбора способа реконфигурации;
алгоритмы формирования корректной линии отката и кочтротьных записей, применение которых позволяет сократить время восстановления параллельного вычислительного процесса после отказа ПЭ по сравнению с алгорітмами обобщенного восстеязв.' заемого блока и восстановления с неуправляемым откатом;
структуры устройств . лкропрограммного управления с контролем последовательности микрокоманд и ео^становлением после сбоев, применение которых повышает достоверность функционирования IB МВС ТА по сравнению с .фадиционшмя микропрограммно управляемыми процессорами.
РЕАЛИЗАЦИЯ РЕЗУЛЬТАТОВ РАБОТЫ, материалы диссертационной
заботы использованы при выполнении' следующих
їаучно-исследовательских работ:
- "Разработка технического проекта вычислительного комплекса
тля цифрового моделирования задач:, создание экспериментального
образца, процессора ЕС 2703 и проведение исследований на
зействущем экспериментальном образце" (й ГР ОІ84ОО730Є0>,
іпполненного. для ШЩ 5ВГ в сответотвии с проблемой 0.80.15
гамшіексной программы 0.80.14, тема 01.10 по Постановлении ГКНТ
:ССР и Комиссии президиума ОТІ СССР & 442/377 .от 20.II.81г. и
гаиказа Минрадиопрома СССР и Минвуза PCSCP от 20/31.07.81г.
3 378/458 (ДСП);
"Разработка - технических предложений по созданию ^числительного комплекса на база ЕС 2703 для ЕС ЭВМ "Ряд 4" и рсзеденке экспериментальных исследований по обоснованию 'вхничесхис требований" (JS ГР 01860077320), выполненной на сновании Указанйл зам. руководителя минрадиопрома СССР JS 233 от 3.04.85г.
- "Разработка теории, принципов построения и организации
ниверсальпых и проблемно селектированных
вархвысокопрсизводительных многопроцессорных вычислительных
истэм с программируемой архитектурой" (JS ГР 01В700141ЭЭ),
ыполняемой по Постановлению СМ СССР . 328 от .
Кроме того, результаты работы были использованы при создании непосредственным участием автора технического проекта н.
вычислительный комплекс ЕСІ06І-ЕС27ОЗ (Т5-214-Э01Э7), ь таете экспериментального образца вычислительного комплекса, действующий макет которого был принят комиссией и рекомендован для серийного изготовления.
Результаты диссертационной работы внедрены на ряда поедприятий. г.Москвы и г. Нальчика. Экопсг,гт*;зск.; эффект ст внедрения составляет 34.5 тыс. рублей в год.
АПРОБАЦИЯ РАБОТЫ. Основные результаты работы доклэды^лизь к обсуждались на: Всероссийской конференции 'Новые электронные приборы и устройства" (г. Москва» 1983г.,і; Всесоюзной научно-технической конференции ^Совершенствование устройств памяти информационных, компьютерных и робототехнических систем" (г. Москва, 1988г.); Всесоюзной школе-семинаре "Разработке и внедрение; в народное хозяйство персональных ЭЕЧ" (г. Минск, 1938г.); Всесоюзной научно-технической конференции "Еивучесть и реконфигурация информационно-вычислительных и управляющих систем" (г. Москез, 1988г.); Всесоюзной школе-сеьянарв "Разработка л внедрение в народное хозяйство ЕС ЭВМ" (г. Киев, 1389г.): научно-технических конференциях.прсфзпссрско-прбподавзтельского состава,, асшфантов и сотрудников TFTII (г. Таганрог, І987-І99ІГ.Г.).
ПУБЛИКАЦИИ. По результатам диссертационной -работы опубликовано' 15 печатных работ, и том числе 2 авторских свидетельства на изобретение и 3 положительных, решения о выдаче авторского свидетельства на изобретение.
СТРУКТУРА И ОБЪЕМ РАБОТЫ. Диссертационная работа состоит из введения, четырех разделов и заключения, изложенных на 2СЭ страницах, содержит Є6 рисунков, 106 наименований библиографии и 16 страниц приложения, есэго 239 страниц.