Введение к работе
з
Актуальность темы. На современном этапе развития технологий распре
деленных вычислений и систем под термином Грид подразумевается географи
чески распределенная, согласованная, открытая и стандартизованная среда раз
деления вычислительных и информационных ресурсов. В нашей стране суще
ственный вклад в развитие и применение технологий Грид внесли работы
В.П. Ильина, В.М. Котова, А.П. Афанасьева, В.Г. Хорошевского,
Л.Б. Соколинского и др. В настоящее время наиболее привычной является инфраструктурная интерпретация Грид как среды, предоставляющей совокупность высокопроизводительных вычислительных ресурсов для выполнения независимых задач различных пользователей1. Вместе с тем, интенсивное проникновение технологий Грид в различные прикладные области делает целесообразной и своевременной ресурсную интерпретацию Грид как среды, предоставляющей пользователю доступ к предметно-ориентированным ресурсам — прикладным Грид-сервисам (ПГС). Как следствие, отличительной особенностью процесса проектирования и разработки приложений в Грид является изначальная ориентация на использование ПГС как готовых компонентов с описанием схемы их взаимодействия в нотации потоков задач, или workflow (WF). В отличие от блок-схем алгоритмов, в WF очередность операций задана неявно и подчиняется принципу передачи управления по наличию исходных данных для блоков. Потому принципы проектирования эффективных параллельных вычислительных приложений в Грид существенно отличаются от традиционных подходов, характерных, например, для кластерных систем. Как следствие, «ручной» процесс разработки таких приложений является весьма трудоемким и требует высокой квалификации разработчиков в области Грид и параллельных вычислений. Потому для проектирования композитных2 приложений в Грид и их эффективного выполнения требуется применение соответствующего программного инструментария. Он должен в условиях роста сложности инфраструктуры Грид и количества ПГС позволить пользователю — не специалисту в области Грид — с минимальными затратами проектировать и выполнять сложные композитные приложения с заданными критериями эффективности, абстрагируясь от технологических трудностей использования Грид.
Предметом исследования являются технологии проектирования и разработки высокопроизводительных вычислительных приложений в среде Грид.
Целью работы является решение задачи, играющей существенную роль в области проектирования распределенных систем, а именно — изучение и обоснование подходов к организации процесса поддержки принятия решений разработчика высокопроизводительных приложений в среде Грид путем предоставления ему специального программного инструментария.
1 Так называемый Грид 1-го поколения.
2 Приложение, состоящее из вызовов нескольких прикладных Грид-сервисов.
Задачи исследования. Достижение поставленной цели подразумевает решение следующих задач:
обоснование способа формализации процесса проектирования композитных приложений на основе ПГС в форме неполного описания процесса вычислений посредством специальной нотации WF;
разработка и обоснование принципа действия инструментальной оболочки проектирования как интеллектуальной системы поддержки принятия решений (ИСППР)
выбор и реализация методов интерпретации, последовательного уточнения и выполнения неполного пользовательского описания композитного приложения в Грид;
разработка вычислительной инфраструктуры — алгоритмической и программной составляющих инструментальной оболочки проектирования высокопроизводительных приложений в Грид;
демонстрация работоспособности и эффективности разработанной инструментальной среды на примере создания композитного приложения для решения ресурсоемкой вычислительной задачи расчета климатических спектров морского волнения.
Методы исследования включают в себя методы искусственного интеллекта и инженерии программного обеспечения, аппарат теории вероятностей и математической статистики случайных величин и функций, методы организации баз знаний и осуществления логического вывода, эвристические методы планирования и создания расписаний, методы семантического поиска в базах знаний, а также элементы анализа алгоритмов и программ.
Научная новизна результатов работы состоит в том, что:
процесс проектирования высокопроизводительных композитных приложений в среде Грид описан последовательностью WF с операциями перехода между ее элементами. Первый элемент последовательности соответствует неполному описанию пользовательского приложения в терминах предметной области.
решение задачи проектирования высокопроизводительных композитных приложений в Грид осуществляется на основе интеллектуальных технологий, а соответствующая инструментальная оболочка интерпретируется как ИСППР разработчика.
Практическую ценность работы составляют:
нотация WF, допускающая неявное задание параллелизма и последовательное уточнение характеристик процесса выполнения как способ организации человеко-компьютерного взаимодействия при проектировании приложений в Грид;
семейство инструментальных оболочек PEG (Parallel Execution on the Grid) для проектирования, разработки и выполнения высокопроизводительных композитных приложений в корпоративных Грид-системах на основе Intel GPE и UNICORE.
На зашиту выносятся следующие положения:
формализация процесса проектирования приложений в Грид в виде метаописаний потоков заданий обеспечивает автоматизированную интерпретацию композитного приложения с использованием интеллектуальных технологий;
инструментальная оболочка PEG, реализующая интеллектуальные механизмы планирования и составления расписаний, обеспечивает создание композитных вычислительных приложений, достигающих оптимальной производительности в заданных условиях эксплуатации в Грид.
Достоверность научных результатов и выводов обусловлена обоснованностью применения математического аппарата, оценкой адекватности математических и информационных моделей, результатами тестирования алгоритмов и программного обеспечения, а также практическим использованием разработанных математических, алгоритмических и программных методов и средств.
Внедрение результатов работы. Результаты, полученные в ходе диссертационной работы, были использованы при выполнении НИР в рамках ФЦП «Исследования и разработки по приоритетным направлениям развития научно-технологического комплекса России па 2007-2012 годы»: «Разработка инструментальной оболочки проектирования высокопроизводительных приложений для Грид-архитектур в целях создания прикладных сервисов компьютерного моделирования и обработки данных» (2007-4-1.4-20-01-025) и «Высокопроизводительный программный комплекс моделирования и прогноза экстремальных гидрометеорологических явлений и расчета воздействий на морские объекты и сооружения» (2007-4-1.4-00-06-108). Проводимые исследования поддержаны персональными грантами Администрации Санкт-Петербурга для молодых ученых в 2007 и 2008 гг.
Апробация работы. Изложенные в диссертации результаты обсуждались на 10 международных и российских научных конференциях, семинарах и совещаниях, включая ежегодные Международные научно-практические семинары «Высокопроизводительные параллельные вычисления на кластерных системах» (2006 г., Санкт-Петербург; 2007 г., Нижний Новгород; 2008 г., Казань), ежегодные Всероссийские научные конференции «Научный сервис в сети Интернет» (2007 и 2008 гг., Новороссийск), ежегодную Международную научную конференцию «Параллельные вычислительные технологии (ПаВТ 2008)», XV Всероссийскую научно-методическую конференцию «Телематика 2008», IV и V Межвузовские научные конференции молодых ученых (2006 и 2007 гг., Санкт-Петербург).
Публикации. По теме диссертации опубликовано 11 печатных работ (из них 4 — в изданиях из перечня ведущих рецензируемых научных журналов и изданий ВАК РФ).
Личный вклад автора в работах, выполненных в соавторстве, заключается в обосновании принципов работы, проектировании и реализации инструмен-
тальной оболочки, проведении вычислительных экспериментов и интерпретации их результатов. Из работ, выполненных в соавторстве, в диссертацию включены результаты, которые соответствуют личному учасгию автора.
Структура и объем работы. Диссертация состоит из введения, четырех глав, заключения, списка литературы (72 наименования) и 1 приложения. Содержит 114 с. текста (из них ИЗ основного текста и 1 — приложений), включая 23 рис. и 6 табл.