Введение к работе
Актуальность проблемы. Центральная проблема вычислительной техники - повышение производительности ЭВМ до уровня, необходимого для построения систем искусственного интеллекта, систем обработки символьных и графических данных, многозадачных систем автоматизации. Последовательные ЭВМ не удовлетворяют требованиям по производительности, предъявляемым системами обработки информации, и нуждаются в привлечении дополнительных высокопроизводительных средств, например, параллельных акселераторных мультипроцессоров (ПАМ). Последние чаще всего реализуются по схеме сателлитной матричной многопроцессорной системы. Однако при увеличении числа процессоров, необходимого для повышения производительности, существенно возрастает аппаратная слоя-.; ность ПАМ и недопустимо увеличивается частота возникновения его неисправностей из-за отказов и сбоев компонентов.
Научно-техническая задача \ повышения отказоустойчивости однородных матричных акселераторных мультипроцессоров является весьма актуальной, так как ее решение и достижение удовлетворительных характеристик эксплуатационной надежности ПАМ позволит получить необходимые предпосылки для создания новой сверхбольшой интегральной элементной базы высокопроизводительных параллельных ЭВМ на основе полупроводниковых пластин. Последние достижения технологии производства СБИС делают экономически целесообразным размещение большого числа полупроводниковых компонентов на одном кристалле. Рассматриваемые в работе процессорные матрицы (ПМ) относятся к классу высокопараллельных процессорных систем, состоящих из большого числа соединенных регулярным образом идентичных процессорных элементов, которые обрабатывают поступающие данные, а результаты передают соответствующим соседним элементам матрицы. Свойство регулярности структуры ПМ существенно снижает их стоимость и упрощает реализацию в виде СБИС. . Подобные матрицы находят широкое применение, например, при обработке изображения, выполнении операций над матрицами, решении задач сортировки и поиска. однотипной обработке баз данных и динамическом программировании.
Традиционный путь снижения производственного брака путем совершенствования процессов изготовления и проверки схем требует слишком больших затрат и крайне сложен в реализации при увеличении количества элементов, размещаемых на кристалле. Вместе с тем. обеспечение отказоустойчивости за счет введения избыточности становится весьма экономичным решением проблемы повышения выхода годных изделий. Повышение выхода годных обеспечивается тем, что, вместо браковки неисправного
кристалла, его при некоторых видах дефектов после проверки реорганизуют и признают годным. Реорганизашю выполняют на различных этапах изготовления и эксплуатации изделий. В то ке время методы, используемые при реорганизации кристалла, можно использовать не только при создании систем на одном кристалле, но и в современной технологии изготовления параллельных ЭВМ из однотипных БИС. Используя методы реорганизации ПАН, можно создавать из ненадежных элементов отказоустойчивые нультимикроконтроллерные системы, обладающие высокой эксплуатационной надежностью.
Целью диссертационной работы является исследование методов реконфигурации матричных нультипроцессбров. разработка алгоритмов и аппаратных средств, восстановления их работоспособности, позволяющих достичь требуемых показателей эксплуатационной надежности при высоких порядках кратности отказов.
Для достижения поставленной цели в работе решались следующие задачи:
-
анализ методов реконфигурации матричных мультипроцессоров:
-
разработка методов перестройки матричных мультипроцессоров при высоких порядках кратности отказов;
-
построение имитационных моделей методов перестройки мультипроцессоров и оценка эффективности предлояенных решений;
-
разработка аппаратно-программных средств перестройки матричных мультипроцессоров.
Цетот исследования основаны на использовании математического аппарата высаеп алгебры, комбинаторики, теории вероятностей и математической статистики, теории систем массового обслуживания, имитационного моделирования.' Экспериментальные исследования выполнены на имитационной модели средств реконфигурации.
Научная новизна результатов, полученных в диссертационной работе, заключается в следующем:
-
созданы алгоритмы перестройки матричных мультипроцессоров, основанные на учете использованного резерва и диагональном поиске путей перестройки матриц;
-
предложен вариант структурной и функциональной организации акселераторного мультипроцессора, работоспособного при высоких порядках кратности отказов;
-
разработаны аппаратно-программные средства парирования отказов, которые основаны на гибком разделении функций контроля, тестирования и управления реконфигурацией между программной и аппаратной частями, существенно снижающем дополнительные аппаратные затраты при
незначительном уменьшении производительности вычислительной системы:
4) разработаны математическая и имитационная модели процедур реконфигурации для многовариантных сравнительных исследований матричных мультипроцессоров по множеству показателей эффективности.
Практическая ценность работы состоит в создании алгоритмов реконфигурации, позволяющих продлить срок службы параллельных акселера-торных мультипроцессоров, а также вариантов структурной организации средств реконфигурации, позволяющих снизить сложность их аппаратной части.
На основе результатов диссертации созданы:
-
алгоритмы реконфигурации;
-
аппаратные средства реконфигурации параллельных акселератор-ных мультипроцессоров; і
-
программные средства имитационного моделирования процедур отказоустойчивой реконфигурации, содержащие модуль контроля возможных некорректностей пакета программ и сб'рев ЭВМ в ходе длительного моделирования.
Реализация и внедрение результатов работы. Созданный на основе результатов диссертационной работы отказоустойчивый акселераторный матричный мультипроцессор (ОАММП) используется АО "Прибор".
Апробация работы. Основные положения диссертационной работы докладывались и обсуждались на юбилейной конференции ученых Курского политехнического института (Курск. 1994); "Микропроцессорные системы связи и управления на железнодорожном транспорте" (Алушта. 1994)'; "Приборы и приборные системы" (Тула. 1994): "Нейросетевые и транспьютерные технологии и пути их использования в специальных технических комплексах" (Курск. 1994): Российской научно-технической конференшш "Материалы и упрочняющие технологии-94" (Курск. 1994): Работа выполнена в рамках госбюджетной темы: "Аппаратное и научно-исследовательское обеспечение технологического оборудования с использованием прецизионных эффектов".
Публикации. По материалам диссертации опубликовано 14 работ.
Структура и обьем диссертационной работы. Диссертационная работа состоит из введения, четырех глав и заключения, содержащих 101 страницы основного текста, 70 рисунков и 8 таблиц, а также списка литературы из 89 наименований.на 10 страницах и 1 приложения на 32 страницах.
На зашиту выносятся:
1. Множество показателей эффективности ОАММП. позволивших провести сравнительный многовариантныП анализ методов реконфигурации.
ОАММП.
-
Методы и алгоритмы ортогонально-диагональной реконфигурации ОАММП, отличающиеся тем, что они позволяют восстанавливать работоспособность ОАММП при высоких кратностях отказов, достигающих количества резервных процессорных элементов.
-
Секционированная топология структуры ОАММП с двухуровневой организацией введения избыточных ПЭ.
-
Вычислительный алгоритм экстраполяции результатов имитационного моделирования в область отказов высоких порядков кратности.
-
Аппаратно-программные средства восстановления работоспособности ОАММП. основанные на гибком разделении функций контроля, тестирования и управления реконфигурацией между программной и „аппаратной частями.