Электронная библиотека диссертаций и авторефератов России
dslib.net
Библиотека диссертаций
Навигация
Каталог диссертаций России
Англоязычные диссертации
Диссертации бесплатно
Предстоящие защиты
Рецензии на автореферат
Отчисления авторам
Мой кабинет
Заказы: забрать, оплатить
Мой личный счет
Мой профиль
Мой авторский профиль
Подписки на рассылки



расширенный поиск

АЛГОРИТМЫ И ПРОГРАММНЫЙ ИНСТРУМЕНТАРИЙ ДЛЯ ГИБРИДНЫХ СУПЕР-ЭВМ В ЗАДАЧАХ ОБНАРУЖЕНИЯ ПОДЗЕМНЫХ ПОЛОСТЕЙ И АНАЛИЗА ГЕНЕТИЧЕСКИХ ДАННЫХ Якименко Александр Александрович

АЛГОРИТМЫ И ПРОГРАММНЫЙ ИНСТРУМЕНТАРИЙ ДЛЯ ГИБРИДНЫХ СУПЕР-ЭВМ В ЗАДАЧАХ ОБНАРУЖЕНИЯ ПОДЗЕМНЫХ ПОЛОСТЕЙ И АНАЛИЗА ГЕНЕТИЧЕСКИХ ДАННЫХ
<
АЛГОРИТМЫ И ПРОГРАММНЫЙ ИНСТРУМЕНТАРИЙ ДЛЯ ГИБРИДНЫХ СУПЕР-ЭВМ В ЗАДАЧАХ ОБНАРУЖЕНИЯ ПОДЗЕМНЫХ ПОЛОСТЕЙ И АНАЛИЗА ГЕНЕТИЧЕСКИХ ДАННЫХ АЛГОРИТМЫ И ПРОГРАММНЫЙ ИНСТРУМЕНТАРИЙ ДЛЯ ГИБРИДНЫХ СУПЕР-ЭВМ В ЗАДАЧАХ ОБНАРУЖЕНИЯ ПОДЗЕМНЫХ ПОЛОСТЕЙ И АНАЛИЗА ГЕНЕТИЧЕСКИХ ДАННЫХ АЛГОРИТМЫ И ПРОГРАММНЫЙ ИНСТРУМЕНТАРИЙ ДЛЯ ГИБРИДНЫХ СУПЕР-ЭВМ В ЗАДАЧАХ ОБНАРУЖЕНИЯ ПОДЗЕМНЫХ ПОЛОСТЕЙ И АНАЛИЗА ГЕНЕТИЧЕСКИХ ДАННЫХ АЛГОРИТМЫ И ПРОГРАММНЫЙ ИНСТРУМЕНТАРИЙ ДЛЯ ГИБРИДНЫХ СУПЕР-ЭВМ В ЗАДАЧАХ ОБНАРУЖЕНИЯ ПОДЗЕМНЫХ ПОЛОСТЕЙ И АНАЛИЗА ГЕНЕТИЧЕСКИХ ДАННЫХ АЛГОРИТМЫ И ПРОГРАММНЫЙ ИНСТРУМЕНТАРИЙ ДЛЯ ГИБРИДНЫХ СУПЕР-ЭВМ В ЗАДАЧАХ ОБНАРУЖЕНИЯ ПОДЗЕМНЫХ ПОЛОСТЕЙ И АНАЛИЗА ГЕНЕТИЧЕСКИХ ДАННЫХ АЛГОРИТМЫ И ПРОГРАММНЫЙ ИНСТРУМЕНТАРИЙ ДЛЯ ГИБРИДНЫХ СУПЕР-ЭВМ В ЗАДАЧАХ ОБНАРУЖЕНИЯ ПОДЗЕМНЫХ ПОЛОСТЕЙ И АНАЛИЗА ГЕНЕТИЧЕСКИХ ДАННЫХ АЛГОРИТМЫ И ПРОГРАММНЫЙ ИНСТРУМЕНТАРИЙ ДЛЯ ГИБРИДНЫХ СУПЕР-ЭВМ В ЗАДАЧАХ ОБНАРУЖЕНИЯ ПОДЗЕМНЫХ ПОЛОСТЕЙ И АНАЛИЗА ГЕНЕТИЧЕСКИХ ДАННЫХ АЛГОРИТМЫ И ПРОГРАММНЫЙ ИНСТРУМЕНТАРИЙ ДЛЯ ГИБРИДНЫХ СУПЕР-ЭВМ В ЗАДАЧАХ ОБНАРУЖЕНИЯ ПОДЗЕМНЫХ ПОЛОСТЕЙ И АНАЛИЗА ГЕНЕТИЧЕСКИХ ДАННЫХ АЛГОРИТМЫ И ПРОГРАММНЫЙ ИНСТРУМЕНТАРИЙ ДЛЯ ГИБРИДНЫХ СУПЕР-ЭВМ В ЗАДАЧАХ ОБНАРУЖЕНИЯ ПОДЗЕМНЫХ ПОЛОСТЕЙ И АНАЛИЗА ГЕНЕТИЧЕСКИХ ДАННЫХ АЛГОРИТМЫ И ПРОГРАММНЫЙ ИНСТРУМЕНТАРИЙ ДЛЯ ГИБРИДНЫХ СУПЕР-ЭВМ В ЗАДАЧАХ ОБНАРУЖЕНИЯ ПОДЗЕМНЫХ ПОЛОСТЕЙ И АНАЛИЗА ГЕНЕТИЧЕСКИХ ДАННЫХ АЛГОРИТМЫ И ПРОГРАММНЫЙ ИНСТРУМЕНТАРИЙ ДЛЯ ГИБРИДНЫХ СУПЕР-ЭВМ В ЗАДАЧАХ ОБНАРУЖЕНИЯ ПОДЗЕМНЫХ ПОЛОСТЕЙ И АНАЛИЗА ГЕНЕТИЧЕСКИХ ДАННЫХ АЛГОРИТМЫ И ПРОГРАММНЫЙ ИНСТРУМЕНТАРИЙ ДЛЯ ГИБРИДНЫХ СУПЕР-ЭВМ В ЗАДАЧАХ ОБНАРУЖЕНИЯ ПОДЗЕМНЫХ ПОЛОСТЕЙ И АНАЛИЗА ГЕНЕТИЧЕСКИХ ДАННЫХ
>

Диссертация - 480 руб., доставка 10 минут, круглосуточно, без выходных и праздников

Автореферат - бесплатно, доставка 10 минут, круглосуточно, без выходных и праздников

Якименко Александр Александрович. АЛГОРИТМЫ И ПРОГРАММНЫЙ ИНСТРУМЕНТАРИЙ ДЛЯ ГИБРИДНЫХ СУПЕР-ЭВМ В ЗАДАЧАХ ОБНАРУЖЕНИЯ ПОДЗЕМНЫХ ПОЛОСТЕЙ И АНАЛИЗА ГЕНЕТИЧЕСКИХ ДАННЫХ: диссертация ... кандидата технических наук: 05.13.11 / Якименко Александр Александрович;[Место защиты: Институт вычислительной математики и математической геофизики СО РАН - Учреждение Российской академии наук].- Новосибирск, 2014.- 108 с.

Содержание к диссертации

Введение

1 Проблема инспекции на месте. Обзор методов и средств решения задач моделирования сейсмических волн. Подходы к реализации перестановочного теста в задачах генетики 17

1.1 Общие сведения 17

1.2 Проблема инспекции на месте 17

1.3 Подходы к решению задач моделирования сейсмических волновых полей 20

1.4 Проблема перестановочного теста в анализе биологических данных 22

1.5 Характеристики используемых вычислительных средств 24

1.6 Выводы 26

2. Задача моделирования сейсмических волновых полей в сложнопостроенных средах 28

2.1 Постановка двумерной задачи моделирования сейсмических волновых полей 28

2.2 Программный комплекс для моделирования сейсмических волновых полей в трехмерных сложнопостроенных средах 30

2.2.1 Требования к реализации и общая характеристика программного комплекса 30

2.2.3 Построитель 3D модели неоднородной сложно построенной упругой среды 35

2.2.4 Программа для моделирования волновых полей в 3D неоднородных упругих средах 38

2.2.5 Верификация построителя моделей 40

2.2.6 Оценка времени работы программы 45

2.3 Выводы 46

3 Задача обнаружения и локализации кавернозных зон в проблеме ИнМ 47

3.1 Постановка задачи 47

3.2 Вычислительная технология и средства моделирования 51

3.3 Результаты численных экспериментов 53

3.4 Технология вибрационного просвечивания земной коры 59

3.4.1 Результаты регистрации и измерения абсолютных уровней колебаний от вибратора ЦВ-100 65

3.4.2 Результаты регистрации и измерения абсолютных уровней колебаний от вибратора ЦВ-40 69

3.4.3 Преимущества подхода и итоги выполнения работ 77

3.5 Выводы 78

4 Применение информационно-вычислительных технологий в задачах генетического анализа. Опыт реализации перестановочного теста на графическом процессоре 80

4.1 Обзор проблемы и подход к решению 80

4.2 Методика решения задачи 81

4.3 Алгоритм перестановочного теста для последовательной версии на языке С 83

4.4 Реализация на графическом процессоре 86

4.5 Производительность параллельной и последовательной версий программ 89

4.6 Выводы 91

Заключение 92

Список использованных источников 94

Введение к работе

Актуальность работы. Моделирование с применением

суперкомпьютерных информационно-вычислительных технологий является эффективным методом исследования сложных физических процессов, систем и используется во многих областях науки и техники. Параллельный принцип реализации такого моделирования - признанный способ ускорения численных экспериментов. Один из современных подходов к организации параллельного моделирования основан на использовании графических процессоров (GPU -graphics processing unit) в качестве ускорителей к центральным универсальным процессорам (CPU - central processing unit).

Развитие суперкомпьютерных технологий моделирования базируется на фундаментальных работах советских, российских ученых, среди которых: В.В. Воеводин, Г.И. Марчук, В.Г. Хорошевский, Б.Н. Четверушкин, Ю.И. Шокин, Н.Н. Яненко и др., а также зарубежные ученые: S. Gray, М. Flynn, I. Foster, D. Hillis, С. Kesselman, DL. Slotnick, A. Tanenbaum и другие. При решении задач моделирования сейсмических волновых полей и интерпретации полученных результатов большой вклад внесли исследования в этой области отечественных ученых: А.С. Алексеев, В.В. Адушкин, Б.М. Глинский, А.Ф. Еманов, В.В. Ковалевский, Б.Г. Михайленко, A.M. Овчинников, Г.В. Решетова М.С. Хайретдинов и др.

Настоящая работа посвящена рассмотрению возможностей использования суперкомпьютерной технологии моделирования применительно к решению двух современных актуальных задач - обнаружения подземных полостей (каверн), образующихся в результате проведения скрытых подземных ядерных взрывов и генетической детерминации признаков.

Решение первой задачи связано с проблемой «инспекции на месте» («ИнМ»), предусматривающей создание эффективных методов для уточненной локализации эпицентров скрытых подземных взрывов в районах испытательных полигонов.

Другая задача, решаемая в диссертационной работе средствами параллельного моделирования, относится к важной для биологии проблеме

определения генов-кандидатов, детерминирующих заданные признаки, на основе данных массовых экспериментов (полногеномный анализ данных, анализ протеомов и транскриптомов и т.п.).

Отметим, что наряду со сложностью программных систем, технологий и инструментальных средств, предназначенных для моделирования и процессов обработки данных, одновременно предъявляются высокие требования по надежности и корректности работы создаваемых программно-алгоритмических средств.

Цель и задачи исследования. Цель состоит в разработке и исследовании алгоритмов и программного инструментария для гибридных супер-ЭВМ в задачах обнаружения подземных полостей и анализа генетических данных.

Для этого необходимо:

разработать и реализовать на гибридном суперкомпьютере НКС-30T+GPU параллельную программу для решения задачи распространения сейсмических волн в сложнопостроенной среде, представленной моделью кавернозной зоны;

на основе созданного программного инструментария выполнить -моделирование сейсмических волновых полей в сложнопостроенных средах на примере решения актуальной проблемы «инспекции на месте». По результатам моделирования разработать рекомендации по выбору согласованных параметров натурных экспериментов для «инспекции на месте»;

разработать и реализовать параллельную программу на графическом процессоре от NVIDIA для проведения перестановочных тестов в задачах биологии и генетики. Провести численные расчеты на тестовом материале. Получить количественные оценки производительности алгоритмов определения генов-кандидатов, детерминирующих заданные признаки, на основе данных массовых экспериментов с использованием перестановочного теста.

Предмет и объект исследования. Объектом исследования являются технологии моделирования сейсмических волновых полей в кавернозных средах и перестановочного теста в задачах генетики. Предмет исследования -

параллельные алгоритмы и программы для гибридных суперкомпьютеров с графическими ускорителями.

Методы исследования. Для достижения цели и поставленных задач применялись методы теории функционирования распределенных гибридных вычислительных систем, теории алгоритмов, статистических вычислений, а также вычислительные методы. Численные эксперименты проводились путем моделирования на гибридном суперкомпьютере HKC-30T+GPU и персональной рабочей станции с графическим ускорителем от NVIDIA.

Научные результаты, выносимые на защиту. К основным новым результатам, полученным в диссертации, можно отнести следующие:

- разработанные автором параллельные алгоритмы и программный
инструментарий на гибридной супер-ЭВМ HKC-30T+GPU для решения
трудоемких задач распространения сейсмических волн в 2D и 3D средах, а
также реализации перестановочного теста в задачах генетики.
Методологически решаемые задачи объединяются предложенной схемой
распараллеливания и представлением структур хранения данных;

- результаты численного моделирования распространения сейсмических
волн в сложнопостроенной среде, содержащей модель кавернозной зоны,
показывающие, что для обнаружения кавернозных зон в качестве
информативных выделяются группы S-, SP-, SS-волн, волновые формы которых
зависят от геометрии кавернозной зоны и геофизических параметров
окружающей среды. Перечень требований к методике проведения «инспекции
на месте» для обнаружения и уточненной локализации эпицентров подземных
ядерных испытаний;

- параллельная программа для реализации перестановочного теста,
адаптированная к архитектуре гибридной супер-ЭВМ путем изменения
алгоритма вычислений и формата представления данных для выполнения
матрично-векторных операций, а также результаты оценивания времени
вычислений;

Научная новизна результатов исследования. На базе гибридного суперкомпьютера HKC-30T+GPU, персональной рабочей станции с

графическими ускорителями и программной технологии CUDA (англ. Compute Unified Device Architecture) получены следующие новые результаты:

разработаны новые программный инструментарий и алгоритмы на гибридной супер-ЭВМ HKC-30T+GPU для моделирования сейсмических волновых полей в 2D и 3D сложнопостроенных средах с кавернозными включениями и реализации перестановочного теста в задачах генетики. Методологически решаемые задачи объединяются предложенной схемой распараллеливания и представлением структур хранения данных;

выполнено численное моделирование волновых полей по схеме использования передвижного источника и стационарных сейсмических групп в задачах обнаружения кавернозных зон в слоистых средах. Показано, что в качестве информативных выделяются группы S-, SP-, SS-волн, волновые формы которых зависят от геометрии кавернозной зоны и параметров окружающей среды. Сформулированы требования к методике проведения «инспекции на месте» для обнаружения и уточненной локализации эпицентров подземных ядерных испытаний;

получены оценки производительности разработанных программ при решении задачи перестановочного теста на реальных данных большой размерности. Показано, что за счет перехода к матричному формату представления данных и распараллеливания алгоритма на графических процессорах достигается ускорение решения задачи до 150 раз;

Практическая значимость работы. Определяется тем, что на основе разработки и реализации программно-алгоритмического инструментария для гибридного вычислительного комплекса HKC-30T+GPU:

- в интересах решения актуальной проблемы «инспекции на месте»
методом вибрационного просвечивания Земли решена задача выделения
информативных типов волн и оценивания их параметров в средах с
кавернозными включениями;

достигнуто многократное повышение производительности перестановочного теста в задаче определения генов-кандидатов,

детерминирующих заданные признаки, при проведении массовых экспериментов;

- разработанные автором программные комплексы для геофизического моделирования и реализации перестановочного теста в генетике нашли свое практическое применение соответственно в Институте вычислительной математики и математической геофизики СО РАН и Институте цитологии СО РАН.

Личный вклад автора.

Основные научные результаты, включая результаты моделирования сейсмических волновых полей и интерпретацию полученных результатов численных экспериментов, являются личным вкладом автора. Параллельная программа для реализации перестановочного теста на гибридном суперкомпьютере разработана и реализована лично автором (прототип последовательной программы предоставлен к.б.н. с.н.с. КВ. Гунбиным). Отдельные результаты, представленные в диссертации в главе 3 (анализ, интерпретация записей натурных экспериментов), получены совместно с д.т.н., с.н.с. М.С. Хайретдиновым. Информационно-вычислительная технология решения задачи распространения сейсмических волн в сложнопостроенной среде, представленная моделью кавернозной зоны и ее программным построителем разрабатывалась совместно с к.т.н. Караваевым Д.А..

Соответствие диссертации паспорту специальности. Содержание работы соответствует п. 8 «Модели и методы создания программ и программных систем для параллельной и распределенной обработки данных, языки и инструментальные средства параллельного программирования», п. 9 «Модели, методы, алгоритмы и программная инфраструктура для организации глобально распределенной обработки данных» и п. 10 «Оценка качества, стандартизация и сопровождение программных систем» паспорта специальности 05.13.11 «Математическое и программное обеспечение вычислительных машин, комплексов и компьютерных сетей».

Апробация и реализация результатов диссертации. Основные результаты диссертации докладывались на следующих конференциях:

V Международная Азиатская школа-семинар «Проблемы оптимизации сложных систем», Бишкек, 2009 г.;

конференция молодых ученых ИВМиМГ СО РАН, март 2010г., апрель 2013 г., Новосибирск;

XII Всероссийская конференция молодых ученых по математическому моделированию и информационным технологиям, 3-6 октября 2011г. -Новосибирск, 2011г.;

международная научно студенческая конференция «Студент и научно-технический прогресс», Новосибирск, 2011г.;

XI Всероссийская конференция с участием иностранных ученых «Проблемы мониторинга окружающей среды», 24-28 октября, 2011- Кемерово;

VIII междунар. науч. конгресс «Интерэкспо ГЕО-Сибирь-2012», «Дистанционные методы зондирования земли и фотограмметрия, мониторинг окружающей среды, геоэкология»", 17-19 апреля 2012 г., Новосибирск, 2012г.;

международная Летняя Суперкомпьютерная академия при МГУ, 25 июня - 7 июля 2012г., Москва, 2012г.;

Всероссийская научно-практическая конференция "Новые технологии в науке о земле и горном деле", 13-21 сентября. - Новый Афон, 2012г.;

Всероссийская научно-практическая конференция «День суперкомпьютерных технологий: наука, образование, промышленность», 20-22 мая. -Новосибирск, 2013;

- отчетные сессии АВТФ-НГТУ, март 2011г., март 2012г, март 2013г.
Новосибирск.

Исследования выполнялись в рамках Государственного контракта с Минобрнаукой № П-857 от 25 мая 2010 г. «Разработка программного обеспечения для высокопроизводительных вычислений в биоинформатике», государственного контракта №14.740.11.0350, грантам РФФИ №№ 10-07-00387-а, 09-07120075, 11-05-92215-Монг_а.

Публикации. Основное содержание диссертации отражено в тринадцати печатных работах соискателя, включая три работы в журналах из списка ВАК и регистрацию программы в Фонде Алгоритмов и Программ СО РАН. Имеются

два акта о внедрении от Института цитологии и генетики СО РАН и Института вычислительной математики и математической геофизики СО РАН.

Структура и объем диссертации. Диссертационная работа состоит из введения, четырех глав, заключения, списка использованных источников из 87 наименований и приложения. Диссертация изложена на 108 страницах основного текста, включая 43 рисунка, 5 таблиц и 2 приложения.

Подходы к решению задач моделирования сейсмических волновых полей

В работе [1] предлагается комплекс идей, реализация которых позволит за короткий срок на большой площади, ограниченным числом персонала и оборудования, в условиях неизвестной сложной геологии и слабой афтершоковой эмиссии достигнуть целей ИнМ методом пассивной сейсмометрии [2]. Применение пассивной сейсмометрии предлагается разделить на два этапа, принципиально разных по методам обработки результатов наблюдений – поиска и локализации событий. Недостаток данного подхода связан с ограниченной живучестью афтершоковой эмиссии, обусловленной затухающим во времени процессом релаксации среды с момента акта самого взрыва.

Другой подход, предложенный в работе [3], определяет этапы технологии автоматизированной локации сейсмических источников, основанные на выделении и измерении волновых параметров сигнала на фоне шумов, расчете географического положения и отображения источников на цифровой карте. Высокая точность, обеспечиваемая предложенной технологией, подтверждена в процессе анализа множества событий.

На основе анализа нелинейных процессов, развивающихся на этапах излучения и распространения сейсмических колебаний при вибрационном зондировании Земли, предложен метод активного мониторинга сейсмо-вулканоопасных зон [4]. Такую технологию, с изменениями и дополнениями, можно применять для обнаружения последствий ядерных испытаний.

В работе [5] обсуждаются эффекты, связанные с прохождением волны давления, и результаты пластового давления в скважинах, расположенных на различном расстоянии от эпицентра взрыва. Необходимо учитывать такие особенности при локализации подземных ядерных взрывов.

Для проведения Инспекции на месте (ИнМ) предлагается и обосновывается метод активной сейсмометрии, основанный на зондировании среды сейсмическими колебаниями, порождаемыми наземным сейсмическим вибратором [6]. Позитивными сторонами рекомендуемой технологии являются: узконаправленные излучение и прием сейсмических колебаний, строгая повторяемость формы излучаемых колебаний, высокоточная синхронизация излучения по сигналам GPS, возможность синхронного накопления вибросейсмических сигналов. Все это, в конечном счете, призвано обеспечить повышенную точность локализации очаговой зоны и ее геометрических параметров.

В другой работе [7] рассматривается подход к решению задачи локализации и определения параметров очаговой зоны подземного ядерного взрыва (ПЯВ) путем сканирования инспектируемого района вибросейсмическим просвечивающим полем. Приводятся результаты численного моделирования характеристик направленности сейсмической антенны, описаны результаты экспериментов по направленному приему вибросейсмических колебаний.

Применение вибросейсмических методов для изучения трещиноватых зон, характерных для района проведения испытаний, описывается в работе [8]. На основе статистического подхода предложена модель среды с разномасштабной неоднородностью и трещиноватостью.

В работе [9] предложена автоматизированная технология поточного обнаружения сейсмических событий – промышленных, ядерных взрывов. Землетрясений и др., - на фоне шумов в условиях многоканальной обработки данных с дальнейшим применением процедур классификации и определения параметров источника в режиме реального времени. Разработана программная система, включающая набор алгоритмов, и оценена эффективность предложенного подхода на примерах обработки ряда сейсмических записей промышленных взрывов Кузбасса.

Возможности обнаружения подземных контрастных неоднородностей, вызванных разрушением среды в очаговой зоне подземного ядерного взрыва, обсуждаются в работе [10]. Приводится теоретическая модель рассеяния слабых сейсмических волн на неоднородностях. На основе результатов инструментальных наблюдений показано, что спектральные характеристики местного микросейсмического фона имеют аномалии в эпицентральных зонах ПЯВ, что позволяет использовать их для установления места проведения взрыва, а также оценивать степень нарушенности геологической среды и размер зоны разрушения.

В работе [12] предлагается информационная технология автоматизированной геоакустической локации событий, порождаемых природными и техногенными процессами, с использованием сейсмических сетей и мобильных сейсмических групп. Сформулирована общая постановка проблемы и связанные с ней задачи обеспечения высокоточного определения параметров сейсмических волн, порождаемых источниками, на фоне сейсмических шумов. Рассмотрены вопросы идентификации полезных волн и волн-помех. Эффективность предлагаемой технологии иллюстрируется на примере локации удаленных промышленных и полигонных взрывов.

Технология, позволяющая выделять и измерять вибросейсмические колебания нанометрового уровня на фоне многократно превосходящих шумов, описана в работе [13]. Она основана на методах корреляционного и синхронного накопления вибросейсмических колебаний, излучаемых прецизионно управляемыми вибраторами. Полученные результаты имеют практическую применимость для решения задач активного вибросейсмического мониторинга и глубинного зондирования Земли.

Программа для моделирования волновых полей в 3D неоднородных упругих средах

Второй разработанной программой является параллельная программа, которая непосредственно реализует конечно-разностную схему для численного моделирования распространения сейсмических полей с использованием поглощающих границ [42, 43, 44, 45]. Данная программа имеет несколько параллельных реализаций с использованием возможностей различных языков параллельного программирования MPI (Message Passing Interface), OpenMP (Open Multi-Processing), CUDA (Compute Unified Device Architecture). Для той или иной параллельной реализации проводилось исследование времени выполнения программ на различных моделях упругих сред.

Разработанные программы – программа для создания модели 3D упругой среды и программа для численных расчетов для удобства использования объединены в один комплекс (параллельную программу) по моделированию распространения упругих волн от сосредоточенного точечного источника в 3D неоднородных сложно построенных упругих средах.

Для проведения расчетов пользователем формируется определенный набор входных файлов. В них содержится вся необходимая информация для работы представленных двух программ. Часть файлов содержит информацию об основных параметрах математической модели: скорости распространения сейсмических волн и плотность для каждого из примитивов, сам список примитивов составляющих общую модель, а также информацию об их положении. Также пользователь определяет тип и положение источника сейсмических волн, задает положение системы наблюдения, которая может быть представлена несколькими линиями наблюдения из определенного пользователем числа сейсмоприемников. Наряду с этим пользователь задает информацию о снимках волнового поля, к примеру, координаты плоскостей в которых делаются снимки. Все формирование входных файлов производится с помощью дополнительной программы обладающей некоторым пользовательским интерфейсом, который позволяет «конструировать модель для расчетов». С помощью этой программы формируется список примитивов с заданием необходимых параметров, определяющих модель, информация о системе наблюдения и источнике сейсмических волн. Можно также использовать в качестве входных данных для расчетной программы и пользовательские файлы со значениями упругих параметров.

Результатом работы программы по численному моделированию распространения упругих волн в 3D упругой среде является набор бинарных файлов, содержащих рассчитанную информацию об исследуемом волновом поле: сейсмограммы для каждой из компонент вектора скоростей смещения 3D волнового поля и снимки волнового поля в различных плоскостях сечений трехмерной модели.

Необходимо отметить, что такого вида получаемая информация очень удобна в использовании. При интерпретации сейсмограмм нередко возникают вопросы определения типа наблюдаемой волны. По представленным снимкам волнового поля возможно наглядно проследить кинематику распространения отдельных групп упругих волн, что облегчает интерпретацию.

Необходимой частью работы является обработка и интерпретация полученных численных результатов. Для более удобного и наглядного представления всей картины можно использовать различные программные продукты, которые позволяют проводить визуализацию. К таким программным продуктам можно отнести Mathematica, Surfer, Aspis, SeisView. Наиболее широко используемым инструментарием в ИВМиМГ СО РАН является программа Aspis, разработанная в ОАО «Сибнефтегеофизика». 2.2.5 Верификация построителя моделей

Для проверки работоспособности созданных программ были проведены тестовые расчеты для нескольких 3D моделей упругих неоднородных сред. Исследовалась картина волнового поля для простых слоистых моделей [41. 45].

Моделировались две трехслойные среды. Обе модели содержат цилиндрическое включение (рис.6 и рис.7) со следующими параметрами объектов, составляющих модель, Табл.1. Отличие этих моделей состоит в наличие аналога анизотропии – присутствия включений (глинистых сланцев) в модели 1, регулярно распределенных внутри цилиндра[39, 40, 45].

Технология вибрационного просвечивания земной коры

Ресамплинг данных в настоящее время стал de facto стандартом анализа сложных биологических данных [Шитиков В.К., Розенберг Г.С. Рандомизация и бутстреп: статистический анализ данных по биологии и экологии с использованием R. Институт экологии Волжского бассейна РАН , Интернет-версия монографии, 289 с. (http://recept.znate.ru/pars_docs/ refs/8/7388/7388.pdf, http://www.ievbras.ru/ecostat/Kiril/Article/A32/Starb.pdf )]. Одним из приложений ресамплинга является анализ генетической детерминации признаков. Обычно такое исследование проводят на основе аналитических критериев (таких как t-тест, ANOVA, корреляция Пирсона и т.д.) построенных на замкнутой логике. Чтобы получить представление о распределении данных в генеральной совокупности используются выборочные данные, которые полагаются распределенными согласно субъективно заданного закона распределения данных. Выход из этого замкнутого круга предлагают методы ресамплинга (resampling), так как они не требуют никакой дополнительной информации о законе распределения данных в генеральной совокупности, рассматривая выборочные данные в различных комбинациях, как бы поворачивая их с разных сторон [23, 24]. Кроме того, еще одним важным преимуществом методов ресамплинга перед аналитическими методами является отсутствие необходимости постоянно корректировать уровень статистической значимости для одновременного тестирования многих статистических гипотез, отражающих, в случае анализа биологических данных, одновременный вклад многих факторов в формирование одного признака [25]. Таким образом, в большинстве биологических исследований методы ресамплинга являются более корректными в сравнении с аналитическими методами, однако, для достаточно точных оценок различных статистик анализируемых выборок они подчас требуют огромных вычислительных ресурсов.

Целью данной работы является программная разработка и исследование эффективности распараллеливания перестановочного теста, нацеленного на поиск статистически значимых перепредставленных свойств генов при различных внешних/внутренних условиях с применением графических процессоров. Полученное при этом ускорение дает возможность существенно повысить производительность решения обозначенной задачи.

В диссертации предлагается алгоритмический подход и программа для решения задачи поиска статистически значимых перепредставленных биологических характеристик генов из заданного множества. Задача связана с реализацией известного в биологии перестановочного (рандомизационного) теста. На основе учета потенциальной возможности распараллеливания перестановочного теста разработана параллельная программа с реализацией на графических процессорах.

Общая идеология организации перестановочного теста, разработанная к.б.н. Гунбиным КВ. [86, 87] нацелена на поиск статистически значимых перепредставленных свойств генов заключается в следующем: : 1) задается список генов, ассоциированный: а) со списком качественных (булевских) свойств этих генов (этим списком задаются разные выборки генов) и б) со списком заданных количественных величин; 2) для каждого из булевских свойств генов по списку количественных величин рассчитывается значение статистики G0(x1,x2,x3, ...,хп = f=0Xj,Xi Є Z), где х - измеренная количественная характеристика гена (уровень экспрессии, скорость эволюции и т.д.), D - множество наблюдаемых объектов, удовлетворяющих условию наблюдения; 3) осуществляется случайная перестановка количественных характеристик между генами; 4) для тех же генов со случайно переставленными величинами х1,х2,х3,... ,хп рассчитывается значение той же статистики G x x x ...,х п = =0х[,х[ Є D - для каждого из булевских свойств генов, индекс и отвечает номеру перестановки; 5) процедуры перестановки и расчета статистики 3) - 4) повторяются U раз; 6) определяется вероятность ошибки при отклонении нулевой гипотезы (Pvaiue = -значение) как доля значений Gu, превышающих G0.

Для реализации перестановочного теста на графической карте необходимо учитывать особенности ее архитектуры и программной модели CUDA [27]. Важно выделить участки кода и алгоритмы, поддающиеся распараллеливанию. Проблемными местами остаются неделимые операции над массивами данных и чтение/запись в файл. Циклы обработки независимых данных целесообразно распределить по мультипроцессорам видеокарты и минимизировать количество условных выражений внутри таких блоков.

Реализация на графическом процессоре

На графиках (рисунок 42, 43) представлены времена выполнения для параллельной версии на GPU и последовательной версии на CPU. Проводилось 4 запуска для каждой из версий программы: 1 – 492 перестановки и 10000 итераций; 2 - 492 перестановки и 100000 итераций; 3 – 2256 перестановок и 10000 итераций; 4 – 2256 перестановок и 100000 итераций. Для данной задачи достигается ускорение около 5 раз, что определено небольшими размерами задачи. Влияние количества итераций линейно увеличивает время выполнения программы. В то время как увеличение количества перестановок лишь незначительно замедляет процесс счета.

На рис.43 представлены времена выполнения второй задачи, в которой существенно больше исследуемых генов (19147) при немного большем количестве функциональных аннотаций (898). В отличие от первой задачи, вместо времени выполнения программы на CPU приведено достигнутое ускорение параллельной версии относительно последовательной. Количество запусков сократилось до трех: 1 – 5000 перестановок и 10000 итераций; 2 -19147 перестановок и 100000 итераций; 3 – 5000 перестановок и 100000 итераций. На этом примере достигается ускорение до 145 раз. Ожидается, что на задачах большей размерности ускорение будет расти.

Разработаны последовательная и параллельная варианты программ для проведения перестановочного теста, нацеленного на поиск статистически значимых перепредставленных свойств генов при различных внешних/внутренних условиях на вычислительных устройствах в составе ПК с GPU NVIDIA и гибридный суперкомпьютер НКС-30Т ССКЦ СО РАН. В ходе выполнения работы решена задача распараллеливания наиболее трудоемких алгоритмов программы перестановочного теста для выполнения на GPU. Для этого использовалась библиотека матрично-векторного умножения cuBLAS, позволившая перенести данный алгоритм на архитектуру графических процессоров.

По результатам оценивания быстродействия показано ускорение программы на рассматриваемых задачах 1 и 2(рис.42, 43) с применением графического процессора относительно последовательной версии до 150 раз Отмечено, что на время выполнения программы влияют размеры входных данных (количество генов и функциональных аннотаций) и количество итераций с перестановками.

Продемонстрировано несущественное влияние количества перестановок, выполняемых перед каждой итерацией расчета случайных сумм значений для функциональных аннотаций.

В настоящее время программа находится в опытной эксплуатации в Институте цитологии и генетики СО РАН. Заключение

1. Разработана схема параллельных вычислений и реализована на гибридном суперкомпьютере НКС-30Т технология решения задачи распространения сейсмических волн в сложнопостроенной среде, представленной моделью кавернозной зоны. Технология базируется на созданных в работе параллельной реализации программного комплекса для проведения численных расчетов, программном построителе сложной модели среды, анализе и выборе информативных типов волн с учетом решаемой задачи.

2. Проведены экспериментальные исследования трещиноватых сред, характерных для областей кавернозных зон, методом вибрационного просвечивания Земли с помощью мощного сейсмического вибратора типа ЦВ-40. Показано влияние зон трещиноватостей на изменение характеристик волновых форм, оцениваемых количественно с помощью коэффициентов корреляции до и после зоны трещиноватости. Для рассматриваемого в работе случая соответствующие оценки лежат в пределах 0.620-0.840 (для Р волн) и 0.377-0.560 (для S волн).

3. Разработаны рекомендации по выбору частотно-временных и геометрических параметров натурных экспериментов для «инспекции на месте» с учетом полученных на этапе моделирования оценок информативности разного типа сейсмических волн.

4. Создана геолого-физическая модель кавернозной среды, включающая каверну, зону деформации и зону трещиноватостей. На основе созданной модели выполнены численное моделирование процесса распространения и анализ сейсмических волн.

5. Разработан и находится в эксплуатации параллельный алгоритм для расчета сумм характеристик функциональных аннотаций и реализована параллельная программа на графическом процессоре от NVIDIA для проведения перестановочных тестов в задачах биологии игенетики.

Проведены численные расчеты с помощью созданной программы на тестовом материале. Получены количественные оценки эффективности разработки по отношению к ранее созданным программным средствам. Показано, что на рассмотренных в работе задачах при использовании GPU+CPU достигнуто ускорение до 150 раз, в сравнении с CPU. Продемонстрировано, что основное преимущество параллельной реализации заключается в использовании матрично-векторного перемножения, и решение задач с большим набором входных данных дает рост ускорения, пропорциональный размерности матрицы.

Похожие диссертации на АЛГОРИТМЫ И ПРОГРАММНЫЙ ИНСТРУМЕНТАРИЙ ДЛЯ ГИБРИДНЫХ СУПЕР-ЭВМ В ЗАДАЧАХ ОБНАРУЖЕНИЯ ПОДЗЕМНЫХ ПОЛОСТЕЙ И АНАЛИЗА ГЕНЕТИЧЕСКИХ ДАННЫХ