Электронная библиотека диссертаций и авторефератов России
dslib.net
Библиотека диссертаций
Навигация
Каталог диссертаций России
Англоязычные диссертации
Диссертации бесплатно
Предстоящие защиты
Рецензии на автореферат
Отчисления авторам
Мой кабинет
Заказы: забрать, оплатить
Мой личный счет
Мой профиль
Мой авторский профиль
Подписки на рассылки



расширенный поиск

Разработка и исследование аналитического метода оценки вычислительной способности компьютеров Ракитский Антон Андреевич

Разработка и исследование аналитического метода оценки вычислительной способности компьютеров
<
Разработка и исследование аналитического метода оценки вычислительной способности компьютеров Разработка и исследование аналитического метода оценки вычислительной способности компьютеров Разработка и исследование аналитического метода оценки вычислительной способности компьютеров Разработка и исследование аналитического метода оценки вычислительной способности компьютеров Разработка и исследование аналитического метода оценки вычислительной способности компьютеров Разработка и исследование аналитического метода оценки вычислительной способности компьютеров Разработка и исследование аналитического метода оценки вычислительной способности компьютеров Разработка и исследование аналитического метода оценки вычислительной способности компьютеров Разработка и исследование аналитического метода оценки вычислительной способности компьютеров Разработка и исследование аналитического метода оценки вычислительной способности компьютеров Разработка и исследование аналитического метода оценки вычислительной способности компьютеров Разработка и исследование аналитического метода оценки вычислительной способности компьютеров Разработка и исследование аналитического метода оценки вычислительной способности компьютеров Разработка и исследование аналитического метода оценки вычислительной способности компьютеров Разработка и исследование аналитического метода оценки вычислительной способности компьютеров
>

Диссертация - 480 руб., доставка 10 минут, круглосуточно, без выходных и праздников

Автореферат - бесплатно, доставка 10 минут, круглосуточно, без выходных и праздников

Ракитский Антон Андреевич. Разработка и исследование аналитического метода оценки вычислительной способности компьютеров: диссертация ... кандидата технических наук: 05.13.17 / Ракитский Антон Андреевич;[Место защиты: Сибирский государственный университет телекоммуникаций и информатики].- Новосибирск, 2015.- 132 с.

Содержание к диссертации

Введение

ГЛАВА 1. Вычислительная способность 12

1.1 Вводная часть 12

1.2. Краткий обзор современных тенденций в области оценки производительности 13

1.3. Основные идеи и определения 22

1.4. Пример расчета вычислительной способности абстрактного компьютера 25

1.5. Программный комплекс для оценки вычислительной способности

процессоров и вычислительных систем 28

Выводы 32

ГЛАВА 2. Оценка вычислительной способности процессоров Intel и AMD 34

2.1. Оценка производительности ранних моделей процессоров Intel 34

2.1.1. Оценка производительности компьютера на базе процессора Intel 80286 34

2.1.2. Оценка производительности компьютера на базе процессора Intel 80486

2.1.3 Оценка производительности компьютера на базе процессора Intel Pentium(P5) 42

2.1.4 Оценка производительности компьютера на базе процессора Intel

Pentium ММХ 44

2.1.5. Анализ результатов для ранних моделей процессоров Intel 45

2.2. Оценка производительности современных моделей процессоров Intel и

AMD 47

2.2.1. Особенности определения вычислительной способности процессоров семейства Intel Р6 47

2.2.2. Оценка вычислительной способности процессоров микроархитектуры NetBurst (Pentium 4, Pentium D) 57

2.2.3. Оценка вычислительной способности для процессоров с микроархитектурой РМ (Pentium М, Intel Core Solo) 2.2.4. Оценка вычислительной способности для процессоров Core 2

(Merom) 67

2.2.5. Оценка вычислительной способности процессоров AMD К10 72

Выводы 76

ГЛАВА 3. Вычислительная способность суперкомпьютеров 79

3.1. Основные определения и понятия 79

3.2. Обзор существующих методик оценки производительности суперкомпьютеров 80

3.3. Вычислительная способность суперкомпьютеров

3.3.1. Вычислительная способность сетевого процессора 86

3.3.2. Пример определения вычислительной способности сетевого процессора 87

3.4. Определение вычислительной способности суперкомпьютера на

примере ASCI Red 88

3.5. Анализ полученных результатов 90

3.6. Применение метода в сфере облачных вычислений 106

Выводы 109

Основные заключения и выводы 111

Список литературы

Краткий обзор современных тенденций в области оценки производительности

В качестве второго бенчмарка был использован уже описанный выше SPECint и SPECfp. Первый бенчмарк оценивает процессоры по качеству решения задач, основанных на задачах с целыми типами данных, второй - по решению задач с плавающей точкой. Такое разделение является обоснованным, так как у абсолютного большинства процессоров для решения этих задач применяются различные блоки выполнения инструкций. Кроме того, большинство задач чаще всего сводится к работе с целочисленными типами данных, и оценка SPECint таким образом является достаточно объективной и показательной. Оценка при помощи бенчмарка SPECfp также необходима, т.к. блок для работы с плавающей точкой является неотъемлемой частью процессора. Конечно, оценка с помощью только этих бенчмарков не будет в должной степени объективной, поэтому сравним результаты применения предложенной характеристики не только с ними, но и с другими бенчмарками. Кроме того, эти бенчмарки постоянно дорабатываются и выпускаются новые версии, которые становятся все более и более объективными за счет включения в себя все большего количества разноплановых задач. Чтобы не нарушать объективность оценки мы рассматривали в течении сравнения результаты только одной версии. В случае ранних процессоров это была версия SPEC95, для следующей группы процессоров мы использовали SPEC2000 и т.д.

Третьим основным бенчмарком, с помощью которого мы оцениваем и сравниваем процессоры, является PassMark. PassMark - это один из крупнейших на данный момент проектов, который позволяет оценивать и сравнивать процессоры, разработанные в течение большого интервала времени. Этот бенчмарк является одним из самых популярных среди обычных пользователей и позволяет оценивать процессоры начиная с Pentium III вплоть до самых современных процессоров, выпущенных в последние годы. База результатов применения этого бенчмарка огромна и включает в себя практически все массово выпускаемые современные процессоры. Тестирование производится на ряде базовых задач, в которые входят:

Математические целочисленные операции (это базовые операции, которые используются во всех программах). В данном тесте операции сложения, вычитания, умножения и деления применяются к большому набору случайных 32 и 64 разрядных чисел. Сжатие данных без потерь (используется метод адаптивного кодирования, который был описан в работе «Arithmetic Coding for Data Compression» под авторством Ian H. Witten, Radfort M. Neal, John G. Cleary). Задача нахождения простых чисел. Этот тест основан на алгоритме нахождения всех простых чисел вплоть до некоторого заданного «схема Эйткена». Шифрование данных (используется несколько базовых, наиболее часто используемых шифров). В этом тесте применяются криптографические методы TwoFish, AES, Salsa20 и SHA256. Математические операции с плавающей точкой. Этот тест очень похож на описанный в первом пункте с одним важным отличием, что все операции применяются к типам данных с плавающей точкой.

Мультимедийный тест (тест для оценки качества работы блока SSE). SSE - это набор инструкций, который позволяет обрабатывать большие блоки данных на большой скорости. Частью этого теста, например, является задача умножения матрицы размером 4x4 на вектор из 4 элементов. Вектор представлен в виде 128-разрядного числа с плавающей точкой (4 32-разрядных дробных числа), а матрица представлена в виде 4 аналогичных 128-разрядных чисел (4x4x32). Стандартная сортировка строк (используется алгоритм qSort). Это одна из самых распространённых задач в многочисленных приложениях.

Физические задачи (оценивается, насколько быстро процессор может решать задачи физического взаимодействия нескольких сотен различных объектов).

Линейные задачи с использованием только одного ядра (многие программы до сих пор не адаптированы для использования нескольких ядер и поэтому такой тест является достаточно актуальным).

В комплексе все эти тесты делают оценку процессора достаточно объективной, что и сделало PassMark таким популярным. Многие пользователи при выборе процессора используют именно этот бенчмарк, а потому сравнение результатов применения вычислительной способности с данным бенчмарком является показательным и необходимым. Кроме того, можно с его помощью рассмотреть и сравнить достаточно большую группу процессоров, что делает результаты работы ещё более объективными.

Помимо оценки и сравнения уже существующих процессоров существует ряд других схожих задач, которые являются даже более важными и интересными в контексте данного проекта. Наиболее важной задачей, где применяется оценка производительности, является разработка новых процессоров и высокопроизводительных вычислительных систем. Рассмотрим подробнее сам процесс разработки. На первом этапе разработчики получают техническое задание, которое должно помочь определить какой будет архитектура процессора, его внутреннее устройство и технологический процесс изготовления. Разработка различных функциональных блоков процессора в дальнейшем ставится перед разными группами разработчиков, которые также должны обеспечить их взаимодействие и техническую совместимость. Следующий этап является наиболее интересным в контексте данной работы, так как на стороннем компьютере с помощью специализированного программного обеспечения строится виртуальная модель процессора. На этой модели проводится тестирование процессора, проверяется работа элементарных инструкций, производится запуск объемных задач, состоящих из множества команд. Также отрабатывается взаимодействие различных блоков вычислительного модуля, производится оптимизация конфигурации и процессор проходит полное тестирование, направленное на выявление ошибок, которые практически неизбежно возникают в проектах подобного уровня. Этот этап является очень трудоемким и требует больших временных затрат.

После проведенной оптимизации и исправления ошибок первоначальной модели, из базовых матричных кристаллов и микросхем, содержащих элементарные функциональные блоки цифровой электроники, строится физическая модель процессора. Уже на физической модели проверяются электрические и временные характеристики процессора, тестируется его архитектура, продолжается исправление найденных ошибок, ведётся проверка электромагнитной совместимости (например, при практически базовой тактовой частоте в 1 ГГц, некоторые отрезки проводника длиной в 7 мм уже могут работать как излучающие или принимающие антенны).

Последующий этап уже проводится инженерами-схемотехниками и инженерами-технологами, которые при помощи специализированного программного обеспечения преобразуют электрическую схему, содержащую архитектуру процессора, в топологию кристалла. На этом этапе инженеры занимаются реализацией технических решений, заложенных разработчиками, с применением имеющихся технологий. Данный этап является одним из самых долгих и сложных в разработке и зачастую разработчикам требуется идти на компромиссы, отказываясь от некоторых архитектурных решений. Кроме того, ряд производителей предлагает разработчикам использовать уже разработанные и серийно выпускаемые стандартизированные блоки и элементы. Это вводит множество дополнительных ограничений на архитектурные решения, тем не менее, этап технологической подборки элементов фактически сводится к работе с конструктором, в котором используются ограниченный набор уже разработанных деталей. В большинстве случаев микропроцессоры, разработанные без ограничений на базовый набор элементов, являются более быстрыми по сравнению с процессорами, созданными на базе имеющихся библиотек.

Оценка производительности компьютера на базе процессора Intel 80486

Основа архитектуры процессоров серии РМ такая же, как и у процессоров Р6. Основные стадии процессора: предсказание переходов, выборка команд, декодирование инструкций, переименование регистров, переупорядочивание команд, очередь ожидания исполнения, исполнительные модули, обратное переупорядочивание и восстановление регистров.

Естественно, некоторые изменения и доработки в архитектуру были внесены. Так, был доработан блок предсказывания переходов, некоторые изменения были внесены в исполнительные модули, но нас интересуют изменения, которые непосредственно влияют на построение уравнения и расчет характеристик. В процессорах семейства РМ появились так называемые "спаянные" микрооперации. Суть "спаянных" микроопераций заключается в том, чтобы повысить пропускную способность блоков, предшествующих исполнительным модулям и следующих за ними. Блок переименования регистров и блок восстановления имеют пропускную способность всего 3 микрооперации в такт. Для того, чтобы преодолеть этот предел и немного повысить пропускную способность, разработчики решили объединять некоторые микрооперации, которые в предыдущих процессорах были разделены. Их и назвали "спаянными" микрооперациями. Эти операции делят одну микрооперацию в большей части процессора, и одну ROB-запись. Однако эта запись описывает именно две микрооперации, которые выполняются в различных исполнительных модулях. Таким образом, эта запись для выполнения будет разделена на 2 разных порта, однако при восстановлении будет рассматриваться как одно целое. Техника "спайки" операций может быть применена только для двух типов комбинаций: операции записи в память, и операции чтения-изменения.

Операции записи в память состоят из расчета адреса памяти и непосредственно перемещения данных. Как мы помним из описания процессоров Р6, за расчет адреса отвечает порт 3, а для перемещения данных используется порт 4. Т.е. эти две операции могут выполняться одновременно. Второй тип операций - это чтение-изменение. Здесь лучше будет пояснить на примере. Рассмотрим операцию ADD ЕАХ [mem32] состоящую из 2х операций. Первая - это чтение данных из ячейки памяти, вторая -суммирование считанных данных с регистром ЕАХ. В предыдущих процессорах данная инструкция разбивалась на две микрооперации, но в процессорах РМ они будут "спаяны" друг с другом. Спайка будет работать почти для всех инструкций модификации данных, кроме инструкций, которые работают с ХММ-регистрами.

Добавление "спаянных" микроопераций даёт следующие преимущества: Декодирование становится более эффективным, т.к. если раньше инструкция образовывала 2 микрооперации, а теперь одну "спаянную" микрооперацию, то она может обрабатываться теперь любым из трёх декодеров.

За счет "спаянных" микроопераций увеличивается пропускная способность блока переименования регистров и блока восстановления.

Пропускная способность блока переупорядочивания также возрастает за счет использования одной ROB-записи для "спаянных" микроопераций.

Также в процессорах РМ появился буфер цикла, размером 4 X 16 байт, в котором хранятся частично декодированные инструкции. Это даёт преимущество при выделении инструкций в циклах малого размера, так как декодер сможет брать уже выделенные инструкции из этого буфера. В случае использования нашего метода оценки этот буфер не оказывает существенного влияния на производительность и не меняет методику вычисления, однако о нём необходимо упомянуть, как о существенном дополнении и серьезной модификации процессоров.

Инструкции для работы со стеком, такие как PUSH, POP, CALL и RET вносят изменения в стековый указатель ESP. Процессоры предыдущих семейств использовали для обработки этих инструкций обычный ALU в исполнительном блоке. Рассмотрим пример: инструкций PUSH ЕАХ генерирует 3 микрооперации. Две из них для сохранения значения регистра ЕАХ, ещё одна для изменения значения ESP. В процессорах РМ та же самая инструкция будет генерировать только одну микрооперацию, т.к. операции сохранения значения будут "спаяны" в одну, а микрооперацию по изменению стекового регистра выполнит так называемый стековый модуль.

Стековый модуль - это специальный механизм, который обрабатывает микрооперации, изменяющие только стековый регистр. Стековый модуль располагается сразу же за декодером инструкций. Этот механизм позволяет обрабатывать три сложения за один такт. Однако существует определённая сложность, которая заключается в том, что значение ESP может понадобиться как в стековом модуле, так и в исполнительном блоке. Поэтому требуется некоторый механизм, который будет синхронизировать значение в стековом модуле и значение в исполнительном блоке. Истинное значение стекового указателя ESPp получается из 32-битного значения ESP0, хранящегося в исполнительном блоке либо в постоянном регистровом файле, и знакового 8-битного значения ESPd, которое хранится в стековом модуле, как ESPp = ESP0 + ESPd.

Стековый модуль добавляет значение ESPd в адресное слово каждой микрооперации, работающей со стеком, как сдвиг таким образом, что оно прибавляется к ESP0 при расчёте адреса в порте 2 или 3. Очевидно, что значение ESPd не может быть прибавлено к каждой микрооперации. Только к микрооперациям, генерируемым инструкциями PUSH, POP, CALL и RET. Если же встречается другая инструкция и при этом значение ESPd ф О, то стековый модуль генерирует дополнительную микрооперацию, которая прибавляет это значение к ESP0, а в стековом модуле значение зануляет. Более подробное описание устройства процессора можно найти в работе [12].

Остальные блоки также претерпели некоторые изменения, однако они несущественны для нашего метода оценки вычислительной способности и на него не влияют. Итак, подводя итог описанию процессоров РМ, можно сказать, что определение вычислительной способности для этих процессоров будет схожим с процессорами Р6, однако при построении уравнения необходимо будет учесть то, какие микрооперации будет "спаяны", и какие будут выполняться в стековом модуле.

Оценка вычислительной способности процессоров микроархитектуры NetBurst (Pentium 4, Pentium D)

На рис.13 представлено схематичное изображение смешанной вычислительной системы, что, по сути, является обобщающей схемой большинства суперкомпьютеров. На данном рисунке Ш - это первый процессор узла, П2 - второй процессор, СП - сетевой процессор узла и ОП -оперативная память узла. Таким образом, на рис. 13 представлена схема суперкомпьютера, у которого каждый узел имеет два процессора, некий объем общей оперативной памяти и устройство, которое назовём сетевым процессором. Сетевым процессором будем называть интерфейс сетевого взаимодействия между процессорами, находящимися в разных узлах. Это необходимо для корректного учёта межузлового взаимодействия при оценке вычислительной способности суперкомпьютера.

Научимся сначала определять вычислительную способность узла. Для этого определим вычислительную способность всех процессоров, входящих в состав узла, считая, что весь объём оперативной памяти относится к каждому процессору. Так как определять вычислительную способность обычного процессора мы уже умеем, то это не составит труда. Рассмотрим вычислительную способность узла из примера в рис. 1. Пусть Сг -вычислительная способность первого процессора, С2 - вычислительная способность второго процессора, Ссп - вычислительная способность сетевого процессора. Су = С1 + С2 + Ссп, (3.1) где Су - вычислительная способность всего узла. Объяснение и доказательство этой формулы для многопроцессорных систем представлено в [28]. После этого определить вычислительную способность самого суперкомпьютера можно легко по формуле: где Сск - вычислительная способность суперкомпьютера, Су -вычислительная способность узла суперкомпьютера, iVy - количество узлов суперкомпьютера. Естественно, эта формула весьма упрощена и даёт только верхнюю границу оценки вычислительной способности суперкомпьютера, которая будет верной при идеальном распараллеливании. Основное различие между этим способом и теоретической оценкой производительности суперкомпьютеров, описанной выше, заключается в способе определения производительности узла. В предлагаемом в диссертации методе учитывается и объём памяти, и время доступа к ней, и скорость передачи данных, и обращения, как к оперативной памяти, так и к памяти других процессоров (что определяется протоколом передачи данных между узлами).

Представленная формула для оценки вычислительной способности описывает упрощённую схему суперкомпьютера, у которого все узлы одинаковы. В более общем случае, когда все узлы различны, можно применить следующую формулу:

Возникновение сетевого процессора в рассмотренной выше схеме обусловлено необходимостью описать и каким-то образом учесть все сетевые и межузловые взаимодействия. Скорость передачи данных в сети зависит напрямую от сетевого оборудования, способа соединения и протокола, по которому происходит обмен данными. Сетевое соединение может строиться как на массовых сетевых технологиях (например, Fast Ethernet), так и на основе специализированных высокоскоростных шин передачи данных (Infmiband, SCI, Myrinet, CLAN, ServerNet). Второй случай применяется, если от кластера требуется большая производительность при обмене данными между процессорами из разных узлов. Выделим основные характеристики этих соединений, особенно важные в разрезе определения вычислительной способности сетевого процессора. Первая и одна из наиболее важных характеристик - это так называемая латентность. Эта величина характеризует длительность задержки, которая возникает при формировании пакета данных, отправляемого в сеть. Следующая важная характеристика - это скорость передачи данных. Зная эту характеристику и размер передаваемого пакета данных, легко можно определить, сколько потребуется времени для передачи данных от одного узла к другому. Отсюда следует и третья важная характеристика - максимальный и минимальный размеры пакетов передаваемых данных.

Рассмотрев основные характеристики сетевых решений, можно описать подробнее представленный виртуальный сетевой процессор, а точнее список его инструкций. Будем считать, что сетевой процессор состоит только из инструкций приёма и передачи пакетов данных. Тогда все инструкции, у которых отличается размер пакета данных, будут представлены как различные и независимые друг от друга. Размеры будем рассматривать только кратные одному байту.

Рассмотрим один из наиболее простых вариантов, чтобы понять принцип построения списка инструкций и нахождения вычислительной способности сетевого процессора. Допустим, у нас есть кластер, состоящий из 10 одинаковых узлов, в каждом из которых находятся 2 процессора и 2 Гб общей оперативной памяти, а все эти узлы соединены между собой по технологии Gigabit Ethernet.

Минимальный размер пакета данных в сети Gigabit Ethernet составляет 512 байт, максимальный - 1518 байт. Рассмотрим команду передачи пакета данных минимального размера (512 байт). Латентность при создании пакета данных в данной сети составляет 170 мкс, скорость передачи данных - 10 Мбайт/с. Время передачи данных в микросекундах определим по формуле: где Тпд - время передачи данных от одного узла к другому в микросекундах, пакета размер пакета передаваемых данных, УпЄрЄдаЧи - скорость передачи данных (мегабайт в секунду).

Помимо этого команда запроса данных может обратиться к любой области оперативной памяти любого из узлов (кроме запрашивающего), а так как мы все инструкции, имеющие различные аргументы, считаем различными, то необходимо определить количество инструкций, запрашивающих тот или иной участок памяти заданного размера. Также необходимо учесть, что размер запрашиваемых данных не может превышать размер, отведённый под передаваемую информацию в пакете данных. Количество различных участков памяти заданного размера, к которым возможно обратиться, будем задавать формулой:

Nyn — \Nузлов 1) Х ($ОПУ Sданных)

где Nyn - количество участков памяти, к которым возможно обратиться, Ny3Jloe - количество узлов в кластере, Sony - размер оперативной памяти узла в байтах, Бдатых - размер запрашиваемых данных в байтах. В случае рассматриваемого примера, мы описываем команду, которая запрашивает минимальный размер данных в 46 байт, пакет при этом все равно будет минимально возможного размера 512 байт, тогда Nyn = 19327352418, Тщ = 48 мксу а с учётом латентности создания пакета, Т = 48 + 170 = 218 мкс. Следовательно, если рассматривать данную инструкцию в разрезе уравнения, которое необходимо решить для нахождения вычислительной способности сетевого процессора, то у нас будет 19327352418 слагаемых со временем выполнения 218 мкс. Аналогичным образом мы сформируем все остальные инструкции и составим тем самым уравнение. Решив данное уравнение, получим Ссп « 0.1863 Мбит/с.

Вычислительная способность сетевого процессора

Облачные вычисления - это модель, которая обеспечивает повсеместный и удобный сетевой доступ к конфигурируемым вычислительным ресурсам (серверы, устройства хранения данных, сети передачи данных, виртуальные распределённые вычислительные системы). Основными потребителями облачных ресурсов являются компании, которым по тем или иным причинам невыгодно приобретать собственный комплекс серверов, создавать инфраструктуру для хранения больших массивов данных или приобретать суперкомпьютер для выполнения трудоемких вычислительных задач.

В контексте данной работы особенно интересна последняя область. Многим компаниям (научным центрам, небольшим университетам) большие вычислительные мощности требуются крайне редко, для решения частных и редких трудоёмких задач, на подготовку которых уходит больше времени, чем на их непосредственное решение с помощью высокопроизводительных систем. Вполне естественно, что более выгодным вариантом для таких компаний будет временное приобретение в аренду вычислительных мощностей, которые позволят решить поставленную задачу, чем покупка, установка и обслуживание собственного суперкомпьютера со всей инфраструктурой.

На рис. 18 наглядно демонстрируется преимущество облачной инфраструктуры над собственной сетью предприятия. Как видно, для поддержания работы сети предприятия требуется покупка большого количества дорогостоящего оборудования, его установка и настройка, и, кроме того, найм персонала для обслуживания всей инфраструктуры. При аренде сетевых ресурсов и инфраструктуры в облачной среде затраты на оборудование и дополнительный персонал отстутсвуют. Для большинства небольших предприятий такой вариант является наиболее выгодным и предпочтительным.

Наиболее распространённым открытым программным обеспечением для управления облачными вычислительными центрами обработки данных (ЦОД) является OpenStack. Это открытое программное обеспесчение, полностью документированное, с открытым исходным кодом, и следовательно, с возможностью его модификации в зависимости от особенностей архитектуры ЦОД. Именно эти факторы обуславливают несомненную популярность OpenStack.

Это программное обеспечение позволяет создавать многоарендные архитектуры IaaS (Infrastructure as a Service) облачных вычислительных центров, когда вычислительные и сетевые ресурсы необходимо распределить между несколькими пользователями-арендаторами. Каждому арендатору предоставляются виртуализированные ресурсы в виде множества виртуальных машин, связанных виртуальной сетью. Пользователь может сам настраивать конфигурацию виртуальных машин, в том числе параметры процессора, памяти и всего программного наполнения.

Именно такой подход к предоставлению ресурсов пользователю и открывает возможность для применения метода. Как мы уже показали выше, метод аналитической оценки вычислительной способности может быть применён при проектировании высокопроизводительных распределённых вычислительных систем. Нетрудно заметить схожие моменты в настройке конфигурации облачной распределённой вычислительной системы и обычном высокопроизводительном кластере, например в подборе и настройке параметров процессора. Благодаря описанному в работе методу пользователь может выбрать оптимальную конфигурацию системы, которая будет решать требуемые задачи и при этом иметь минимальную стоимость.

Происходить это может следующим способом. Пользователь определяет, какая производительность системы будет достаточна для решения его задачи, после чего, при помощи метода определяет, при каких конфигурациях будет достигаться требуемая производительность и выбирает из них минимальную по стоимости. Аналогичным образом возможно и обратное, пользователь подбирает конфигурацию вычислительной системы с максимальной производительностью исходя из суммы, которую готов потратить.

Выводы

В данной главе было показано, что предложенный в диссертации метод подходит для оценки производительности суперкомпьютеров. Результаты предложенной характеристики для оценки производительности отличаются от результатов рассмотренных бенчмарков и от предоставляемой производителем суперкомпьютера теоретической оценки. Тем не менее, результаты показывают, что предложенная в работе оценка может применяться для оценки существующих суперкомпьютеров и могла бы стать неплохой альтернативой используемой характеристике (теоретический максимум).

Кроме того, было показано, что вычислительная способность может применяться на этапе разработки суперкомпьютера для оптимизации его архитектуры. А значит, эту характеристику можно применить и для оптимизации архитектуры высокопроизводительных облачных вычислительных систем, что также было продемонстрировано в этой главе. При этом явно видны плюсы использования метода оценки вычислительной способности:

Похожие диссертации на Разработка и исследование аналитического метода оценки вычислительной способности компьютеров