Электронная библиотека диссертаций и авторефератов России
dslib.net
Библиотека диссертаций
Навигация
Каталог диссертаций России
Англоязычные диссертации
Диссертации бесплатно
Предстоящие защиты
Рецензии на автореферат
Отчисления авторам
Мой кабинет
Заказы: забрать, оплатить
Мой личный счет
Мой профиль
Мой авторский профиль
Подписки на рассылки



расширенный поиск

Алгоритм и программное обеспечение выбора решателя систем линейных алгебраических уравнений при моделировании деформаций сжимаемых и несжимаемых материалов с учётом кристаллизации Стёпин Никита Евгеньевич

Алгоритм и программное обеспечение выбора решателя систем линейных алгебраических уравнений при моделировании деформаций сжимаемых и несжимаемых материалов с учётом кристаллизации
<
Алгоритм и программное обеспечение выбора решателя систем линейных алгебраических уравнений при моделировании деформаций сжимаемых и несжимаемых материалов с учётом кристаллизации Алгоритм и программное обеспечение выбора решателя систем линейных алгебраических уравнений при моделировании деформаций сжимаемых и несжимаемых материалов с учётом кристаллизации Алгоритм и программное обеспечение выбора решателя систем линейных алгебраических уравнений при моделировании деформаций сжимаемых и несжимаемых материалов с учётом кристаллизации Алгоритм и программное обеспечение выбора решателя систем линейных алгебраических уравнений при моделировании деформаций сжимаемых и несжимаемых материалов с учётом кристаллизации Алгоритм и программное обеспечение выбора решателя систем линейных алгебраических уравнений при моделировании деформаций сжимаемых и несжимаемых материалов с учётом кристаллизации Алгоритм и программное обеспечение выбора решателя систем линейных алгебраических уравнений при моделировании деформаций сжимаемых и несжимаемых материалов с учётом кристаллизации Алгоритм и программное обеспечение выбора решателя систем линейных алгебраических уравнений при моделировании деформаций сжимаемых и несжимаемых материалов с учётом кристаллизации Алгоритм и программное обеспечение выбора решателя систем линейных алгебраических уравнений при моделировании деформаций сжимаемых и несжимаемых материалов с учётом кристаллизации Алгоритм и программное обеспечение выбора решателя систем линейных алгебраических уравнений при моделировании деформаций сжимаемых и несжимаемых материалов с учётом кристаллизации Алгоритм и программное обеспечение выбора решателя систем линейных алгебраических уравнений при моделировании деформаций сжимаемых и несжимаемых материалов с учётом кристаллизации Алгоритм и программное обеспечение выбора решателя систем линейных алгебраических уравнений при моделировании деформаций сжимаемых и несжимаемых материалов с учётом кристаллизации Алгоритм и программное обеспечение выбора решателя систем линейных алгебраических уравнений при моделировании деформаций сжимаемых и несжимаемых материалов с учётом кристаллизации Алгоритм и программное обеспечение выбора решателя систем линейных алгебраических уравнений при моделировании деформаций сжимаемых и несжимаемых материалов с учётом кристаллизации Алгоритм и программное обеспечение выбора решателя систем линейных алгебраических уравнений при моделировании деформаций сжимаемых и несжимаемых материалов с учётом кристаллизации Алгоритм и программное обеспечение выбора решателя систем линейных алгебраических уравнений при моделировании деформаций сжимаемых и несжимаемых материалов с учётом кристаллизации
>

Диссертация - 480 руб., доставка 10 минут, круглосуточно, без выходных и праздников

Автореферат - бесплатно, доставка 10 минут, круглосуточно, без выходных и праздников

Стёпин Никита Евгеньевич. Алгоритм и программное обеспечение выбора решателя систем линейных алгебраических уравнений при моделировании деформаций сжимаемых и несжимаемых материалов с учётом кристаллизации: диссертация ... кандидата Физико-математических наук: 05.13.18 / Стёпин Никита Евгеньевич;[Место защиты: ФГБОУ ВО Тульский государственный университет], 2016.- 144 с.

Содержание к диссертации

Введение

Глава 1. Используемые теоретические сведения и предлагаемая модель 19

1.1. Основные термины и обозначения нелинейной теории упругости 19

1.2. Механическая и математическая постановка задачи 22

1.3. Предлагаемая модель образования включений в телах из несжимаемых материалов

1.4. Сведение уравнений теории упругости к системе линейных алгебраических уравнений 27

1.5. Особенности МКЭ для несжимаемых материалов. Смешанная постановка. Разнесённые сетки. 33

Глава 2. Разработка единой программной оболочки для решения СЛАУ 36

2.1. Реализованные методы решения и предобуславливатели 36

2.1.1. Прямые и итерационные методы 37

2.1.2. Предобуславливатели 41

2.1.3. Использование графического процессора и технологии CUDA

2.2. Реализованные форматы хранения матрицы в памяти 50

2.3. Метод Узавы для несжимаемых материалов 54

2.4. О выборе коэффициентов для алгоритма Узавы 56

2.5. Автоматизация выбора решателя 58

Глава 3. Результаты численных экспериментов 66

3.1. Пример решения трёхмерной задачи для материала Мурнагана 66

3.2. Сравнение прямых и итерационных решателей 74

3.3. Сравнение результатов производительности итерационных решателей с разными предобуславливателями 75

3.4. Сравнение результатов производительности итерационных решателей на CPU и GPU 78

3.5. Сравнение разных форматов хранения матрицы в памяти 79

3.6. Пример решения плоской задачи для несжимаемого материала 81

3.7. Сравнение различных вариантов алгоритма Узавы

Заключение 98

Работы автора по теме диссертации 99

Публикации в изданиях из перечня ВАК: 99

Зарегистрированные программные средства: 100

Остальные публикации: 100

Список литературы

Введение к работе

Актуальность инженерных прочностных расчётов для несжимаемых материалов, в том числе при больших деформациях, определяется актуальностью прочностных расчётов конструкций из этих материалов. Из резинокорда (анизотропный армированный композитный материал, в состав которого входит резина -слабосжимаемый материал), например, изготавливаются такие детали пневматической шины как каркас и брекер. Максимальные напряжения возникают в области пятна контакта шины с поверхностью. Возникающие при этом деформации являются конечными.

В связи с разработкой новых материалов (в том числе резиноподобных и полимерных), конструкции из которых способны испытывать в процессе изготовления и эксплуатации конечные деформации, а также усложнением самих конструкций и сложностью их нагружения, возникает необходимость в создании адекватных механических моделей и разработке систем инженерного анализа (либо программных модулей способных интегрироваться в существующие системы инженерного анализа) для оценки прочностных характеристик элементов таких конструкций. В ряде случаев необходимо учитывать несжимаемость материалов, чтобы точнее определить процессы, происходящие в таких конструкциях при их эксплуатации и хранении. Стоит также учитывать изменения механических характеристик материалов в некоторых областях, подвергающихся наибольшему воздействию, что можно моделировать как образование включения из другого материала (например, кристаллизация резины). Анализ этих процессов важен потому, что позволяет конструктору еще на этапе проектирования оценить возможность разрушения элемента конструкции.

На сегодняшний день существует большой выбор различных методов решения систем линейных алгебраических уравнений, возникающих в подобных задачах. Каждый из этих методов по-своему удобен и эффективен в той или иной задаче, а какие-то могут оказаться неприменимыми в отдельных ситуациях. Существует много различных реализаций тех или иных методов, ориентированных под определённые вычислительные устройства. Актуальным и удобным становится на сегодняшний день собрать наиболее часто используемые и наиболее эффективные из них в одном программном модуле, предоставив пользователю либо самому выбирать, какой из них он хотел бы использовать, либо делать такой выбор в автоматическом режиме без необходимости для пользователя разбираться во всём разнообразии и особенностях этих методов.

Цель диссертационной работы - предложить модель для оценки напряжённо-деформированного состояния при образовании упругих включений в теле из упругого несжимаемого материала после предварительного нагружения с учётом конечных деформаций и их перераспределения для случая сжимаемого включения и разработать программный модуль для выбора подходящего решателя для задач МДТТ.

Основными задачами диссертационной работы являются:

предложить модель для оценки напряжённо-деформированного состояния при образовании упругих включений в теле из упругого несжимаемого

материала после предварительного нагружения с учётом конечных деформаций и их перераспределения для случая сжимаемого включения;

разработать метод численного расчета напряжённо-деформированного состояния при образовании упругих включений в теле из упругого несжимаемого материала после предварительного нагружения на основе метода конечных элементов;

разработать алгоритм и программное обеспечение (систему компьютерного моделирования) для расчета напряжённо-деформированного состояния при образовании упругих включений в теле из упругого несжимаемого материала при конечных деформациях;

модификация алгоритма Узавы применительно к задачам МДТТ для несжимаемых материалов с учётом конечных деформаций и их перераспределения;

анализ различных решателей СЛАУ и разработка алгоритма автоматического выбора и настройки решателей в задачах МДТТ в зависимости от механической постановки задачи, размерности матрицы СЛАУ и возможностей компьютера;

разработка программного модуля, позволяющего из имеющихся решателей выбирать наиболее эффективный в данной задаче МДТТ на данном компьютере, в том числе для несжимаемых материалов;

проведение с помощью программного модуля численных экспериментов, включая расчёт напряжённо-деформированного состояния при образовании упругих включений в теле из упругого несжимаемого материала после предварительного нагружения; анализ полученных результатов.

Научная новизна. Предложена математическая модель для оценки напряжённо-деформированного состояния при образовании включений в теле из упругого несжимаемого материала после его предварительного нагружения с учётом конечных деформаций и их перераспределения для случая сжимаемого включения. Получены результаты численного анализа на основе этой модели.

Модифицирован алгоритм Узавы применительно к задачам механики деформированного твёрдого тела для несжимаемых материалов в случае малых и конечных деформаций.

Разработан алгоритм автоматического выбора и настройки решателей СЛАУ при конечно-элементном решении задач МДТТ в зависимости от механической постановки задачи, размерности матрицы жёсткости и возможностей компьютера.

Достоверность полученных результатов основывается на корректной математической постановке задачи, использовании апробированных соотношений механики деформируемого твёрдого тела, применении общепризнанных численных методов (метод конечных элементов) и рядом аналитических решений при конечных деформациях для несжимаемых материалов.

Полученные результаты для эталонного теста NAFEMS совпадают с аналитическим решением и результатами, полученными в программном комплексе AN-SYS.

Точность решения систем линейных алгебраических уравнений проверялась подстановкой полученного результата в начальную систему уравнений.

Практическая значимость. Разработан программный модуль на основе алгоритма, позволяющего из имеющихся решателей выбрать наиболее эффективный в данной задаче МДТТ на данном компьютере, в том числе для несжимаемых материалов при малых и конечных деформациях. Его эффективность подтверждается проведением большого числа численных экспериментов с разнообразными исходными данными.

Результаты диссертационной работы были использованы при выполнении
работ по гранту РФФИ №11-08-01284, госконтракту №11418р/17126 от 27 февраля
2012 г. по программе «Участник Молодёжного Научно-Инновационного Конкур
са» («У.М.Н.И.К.»). Исследования, представленные в диссертации, проводились
при финансовой поддержке Министерства образования и науки Российской Феде
рации (соглашение о предоставлении субсидии №14.579.21.0112, идентификатор
проекта RFMEFI57914X0112; соглашение о предоставлении субсидии

№14.579.21.0076, идентификатор проекта RFMEFI57914X0076).

Программный модуль используется в программном комплексе инженерного анализа CAE FIDESYS.

Положения, выносимые на защиту. Математическая модель для оценки напряжённо-деформированного состояния (НДС) при образовании включений в теле из упругого несжимаемого материала после его предварительного нагруже-ния с учётом конечности деформаций и их перераспределения для случая, когда материал включения является сжимаемым. Разработка алгоритма расчёта НДС на основе этой модели и программного обеспечения, реализующего этот алгоритм.

Модифицикация алгоритма Узавы (предложены варианты выбора коэффициентов релаксации) применительно к задачам механики деформируемого твёрдого тела для несжимаемых материалов, в том числе для случая конечных деформаций.

Алгоритм автоматического выбора и настройки решателей в задачах механики деформируемого твёрдого тела в зависимости от механической постановки задачи, размерности матрицы СЛАУ и возможностей компьютера.

Программный модуль на основе полученного алгоритма, позволяющий эффективно решать задачи механики деформируемого твёрдого тела, в том числе для несжимаемых материалов, при малых и конечных деформациях.

Результаты численных экспериментов с помощью программного модуля, анализ которых показал достоверность полученных результатов и эффективность выбора метода.

Апробация работы. Основные положения диссертационной работы докладывались и обсуждались на следующих научно-технических конференциях: «Ломоносовские чтения» в 2009, 2010 и 2012 годах (г. Москва) ]; «Ломоносов» в 2011 и 2012 годах (г. Москва) []; «Современные проблемы математики, механики, информатики» в 2009 и 2012 годах (г. Тула) [ ]; на XXII симпозиуме «Проблемы шин и резинокордных композитов» в 2011 году (г. Москва) ];

на X и XI Всероссийских съездах по фундаментальным проблемам теоретической и прикладной механики в 2011 (г. Нижний Новгород) и 2015 (г. Казань) годах .

Результаты работы в числе прочих были изложены на семинаре ОИВТ под руководством академика В.Е.Фортова 15 февраля 2016 года в докладе «Цифровое средство производства для прочностного инженерного анализа Фидесис: Результаты разработки и внедрения. Развитие Фидесис на основе теории наложения больших деформаций».

Публикации. Основные результаты диссертации представлены в 15 публикациях, в том числе 5 из перечня рецензируемых научных журналов и изданий для опубликования основных научных результатов диссертаций, рекомендованных ВАК Министерства образования и науки РФ.

На основе результатов диссертации было зарегистрировано 3 свидетельства о государственной регистрации программы для ЭВМ.

Структура и объём работы. Диссертация состоит из введения, трех глав, заключения, приложения и списка использованных источников из 146 наименований. Работа изложена на 115 страницах машинописного текста, содержит 25 рисунков.

Механическая и математическая постановка задачи

Основная трудность для моделирования заключается в том, что в момент возникновения включения тело накопило деформации, и образование включения приводит к перераспределению в теле напряжений и деформаций. Поэтому необходимо использовать теорию многократного наложения больших деформаций, позволяющую описать этот процесс. [54, 55, 61]

Пусть в нелинейно-упругом теле, находящемся в начальном (ненапряженном) состоянии, под воздействием внешних нагрузок возникли статические деформации и напряжения, которые будем называть начальными. Тело перешло в первое промежуточное состояние. Далее в этом теле мысленно намечается замкнутая поверхность (будущая граница включения). Часть напряженного тела, ограниченная намеченной поверхностью, мысленно удаляется, а ее действие на оставшуюся часть тела заменяется по принципу освобождаемости от связей силами, распределенными по этой поверхности. Такое действие не изменит напряженно-деформированное состояние оставшейся части тела. Затем полость, образованная удалением части тела, заполняется упругим материалом с другими свойствами (материалом включения). При этом считается, что к границе включения приложены силы. Рассматриваются два варианта их приложения. Первый вариант: прикладываются силы, вызывающие деформацию включения, равную начальной деформации удаленной части тела (причем включение принимает форму удаленной части тела после этой деформации). Второй вариант: данные силы считаются равными нулю, и вставляемое включение изначально не деформировано. Далее оставшаяся часть исходного тела (матрица) и включение “склеиваются” с сохранением действующих на них сил (термин “склеивание” понимается в смысле выполнения граничных условий, т.е. означает, что при дальнейшем деформировании тела перемещения граничных точек матрицы будут равны перемещениям соответствующих граничных точек включения). Затем в каждой точке границы между матрицей и включением сумма сил, приложенных к матрице, и сил, приложенных к включению, квазистатически (например, изотермически) уменьшается до нуля. Это вызывает возникновение новых деформаций и напряжений, которые накладываются на уже имеющиеся (начальные) деформации и напряжения. Меняется форма границы между матрицей и включением. Тело (матрица и включение) переходит в конечное состояние. [54]

Предложенная модель представляет собой существенное упрощение реальных процессов, происходящих при кристаллизации резины. Тем не менее, она позволяет смоделировать наиболее важные с точки зрения механики деформируемого твёрдого тела явления, происходящие при этом. В первую очередь это многократное увеличение жёсткости при переходе в кристаллическое состояние. В тоже время наблюдается процесс релаксации (уменьшения) напряжений во время кристаллизации. Если же после кристаллизации напряжение зависит от полных деформаций, то растёт модуль упругости, напряжения уменьшаются во столько раз, во сколько растёт модуль. Тогда энергия упругости, запасаемая в материале, тоже увеличится во много раз. Однако, это не наблюдается в экспериментах. При кристаллизации напряжения уменьшаются [113, 141], а энергия высвобождается и превращается в тепло. Таким образом, будет логично предположить, что после кристаллизации напряжения будут зависеть от дополнительных деформаций, которые возникли после того, как материал перешёл в следующее состояние. Другими словами, используя терминологию теории фазового превращения, предполагается, что собственные деформации при кристаллизации, совпадают с начальными деформациями, накопленными в теле до кристаллизации.

Для описания механического поведения полимеров при их частичной кристаллизации второй вариант модели представляется более предпочтительным, чем первый вариант. [35, 54] Это связано с тем, что, как было указано выше, при кристаллизации полимеров их модули упругости возрастают во много раз, а деформация меняется незначительно. Если использовать первый вариант модели, то при этом должны во много раз увеличиться напряжения. Однако в литературе [29, 30, 125] нет упоминаний о том, что при кристаллизации деформированных полимеров напряжения в них значительно возрастают. [35]

Рассмотренная модель легко может быть обобщена на случай одновременного или последовательного образования нескольких включений. Отметим, что в случае последовательного образования близко расположенных включений имеет место многократное наложение деформаций.

Сведение уравнений теории упругости к системе линейных алгебраических уравнений

Остановимся теперь немного подробнее на этом интерфейсе для решателей (рис.2.5.2). Как уже было сказано, в интерфейс (оболочку) передаётся матрица СЛАУ и правая часть. Затем по размеру матрицы определяется какой решатель использовать: прямой или итерационный. Этот порог можно задавать как параметр при изначальном подключении модуля к программе, или предоставить модулю выбрать порог автоматически, оценивая свободную оперативную память компьютера, на котором происходят вычисления, и оценки требуемой оперативной памяти для того или иного метода.

Если выбирается прямой решатель, то дальше стоит выбор только между версиями для симметричной и несимметричной матриц. Прямые решатели имеют только CPU-версию, т.к. в этих алгоритмах нечего «распараллелить», и использование графических процессоров в данном случае будет неоправданным.

Если выбирается итерационный решатель, то перед тем как выбрать симметричную или несимметричную версию, надо определиться, будем ли мы считать на CPU или на GPU. Тут выбор тоже достаточно прост: имеется ли на компьютере, где производятся вычисления, графическое устройство, поддерживающее данную технологию, или нет? Так как для итерационных решателей реализовано много различных алгоритмов и предобуславливателей, то выбирается наиболее оптимальный по соотношению время работы -сходимость из реализованных для данной комбинации CPU/GPU и Sym/Unsym (об исследовании наиболее эффективных методов можно прочитать в главе 3).

При желании, пользователь может сам ограничить некоторые возможности выбора и задать параметры, влияющие на выбор решателя. Например, всегда использовать только итерационные решатели, или только CPU, или выбрать какой-то определённый предобуславливатель и т.д. В таком случае неподходящие под условия ветки будут «отсекаться».

После выбора решателя переданная матрица и правая часть переводятся, если это необходимо, в формат, понимаемый данным решателем. Например, некоторые используемые пакеты используют нумерацию индексов с единицы, а некоторые с нуля; некоторым требуется формат CSR для хранения матрицы в памяти, а некоторым – HYB (см. раздел 2.2). Помимо этого задаются дополнительные параметры настроек для данного решателя. После этого уже запускается решатель, полученный результат кладётся в переменную, которая была передана из программы. После окончания счёта управление возвращается программе и там уже происходит необходимая обработка результата.

Особое положение занимают задачи для несжимаемых материалов. СЛАУ, возникающие в этих задачах имеют особый вид и требуют особого подхода к решению (см. раздел 2.3). Поэтому, если пользователь решает такую задачу, необходимо задать соответствующую настройку в модуль, которая будет сообщать о том, что необходимо выбирать один из вариантов метода Узавы. В остальном на уровне использования программного модуля для несжимаемых материалов никаких отличий нет.

Теперь обратим внимание, что автоматический выбор решателя предполагает выбор наиболее эффективного метода решения задачи на данном персональном компьютере, но вовсе не гарантирует, что данным методом результат будет получен. Вполне может получиться так, что по какой-то причине данный метод может не сойтись. Вероятность этого не велика, но вполне возможна; обычно причиной этому оказывается предобуславливатель, который «портит» систему, вместо того, чтобы улучшать (см. раздел 2.1.2). В таком случае будет разумным попытаться решить задачу другим методом. Если пользователь желает, он может выбрать соответствующую настройку для программного модуля.

В итоге, для каждой ветки из алгоритма выбора решателя (рис.2.5.2) можно определить некоторый рейтинг, который будет задавать приоритет выбора того или иного метода и предобуславливателя для этой ветки. Стоит обратить внимание, что если не получилось решить прямым методом, то мы можем попытаться использовать итерационный; если не получилось симметричным методом, то мы вполне можем попытаться решать несимметричным (это будет менее эффективно, но в некоторых случаях помогает найти решение, т.к. для несимметричных методов можно использовать другие предобуславливатели); если не получилось решить на графическом процессоре (ввиду особенностей и затруднений, которые возникают при его использовании), то можно попытаться решать на центральном процессоре и т.д.

В результате можно составить единый рейтинг, который задаёт приоритет использования того или иного метода решения и предобуславливателя, а ветка, в которой мы оказались после алгоритма выбора решателя, лишь «отсекает» начало этого списка. Аналогично можно трактовать выбор пользователем определённых настроек для программного модуля, например, такой как использование только итерационных методов или задание настройки, что задача имеет несимметричную матрицу. В последнем случае, очевидно, будет «отсекаться» не начало списка, а те пункты, где используется метод для симметричных систем.

Использование графического процессора и технологии CUDA

Используя технологию CUDA, которая даёт возможность параллельных вычислений на видеокартах, можно ускорить решение СЛАУ даже по сравнению с параллелизмом на процессорах. (см. главу 2)

На основе имеющегося решателя систем линейных алгебраических уравнений CUSP, использующего технологию CUDA, были проведены численные эксперименты [9, 10, 11] по определению производительности данного решателя и произведено сравнение скорости вычислений на центральном процессоре (CPU) и на видеокарте (GPU). Используемые методы являются итерационными и для более быстрой сходимости метода к решателю были добавлены предобуславливатели. Рис. 3.4.1. Производительность при вычислениях на графическом (GPU) и центральном (CPU) процессорах с использованием предобуславливателя Якоби и без него на примере СЛАУ с 300 000 неизвестными.

Стоит заметить, что, как уже говорилось выше, использование предобуславливателя вынуждает нас делать некоторые дополнительные действия, связанные с созданием предобуславливателя и домножением на него. Для того, чтобы убедиться в оправданности этих действий, и что уменьшение количества итераций перекрывает все дополнительные затраты на использование предобуславливателя, были проведены некоторые эксперименты, результаты которых представлены в диаграмме ниже.

Анализ [9, 10, 11] показал, что не маловажно, в каком формате будет храниться матрица системы – это будет влиять на время обращения к памяти, что играет большую роль при вычислениях на видеокарте. Так как матрица, с которой мы имеем дело, сильно разрежена, то вполне уместно использование таких форматов хранения, как CSR и диагональный. Так же стоит обратить внимание на такие форматы как координатный, ELL-формат и их разновидности (гибридный). Именно в этих форматах может храниться матрица в решателе CUSP и многих других пакетах. (см. главу 2)

Сравнивая результаты производительности для каждого из них, можно придти к выводу, что гибридный формат и CSR-формат наиболее эффективны, причём гибридный выигрывает на GPU, а CSR-формат выигрывает на CPU.

Производительность при различных форматах хранения матрицы в CUSP (одинарная точность) при вычислениях методами сопряжённых градиентов (CG) и стабилизированного метода бисопряжнных градиентов (BICGSTAB) на примере СЛАУ с 300 000 неизвестными при расчётах на CPU (host) и GPU (device). 3.6. Пример решения плоской задачи для несжимаемого материала Рассмотрим модель образования упругих включений в теле из несжимаемого материала после предварительного нагружения, предложенную в разделах

Пластинка представлена материалом с определяющим соотношение типа Трелоара и параметрами, соответствующими свойствам резины -40С: С1 =0.9МПа [29].

К модели прикладывается растягивающая нагрузка на внешней границе образца, направленная вдоль большой оси эллипса. Приложенное давление на соответствующих границах пластинки равно 0.05МПа. На других гранях пластинки перемещения вдоль малой оси эллипса считаются равными нулю.

Максимальное главное напряжение на пластинке получилось равным 0.456495МПа. Из [29] известно, что при таком напряжении и температуре -40С степень кристаллизации достигает 50% от своей максимальной величины примерно за 4000 минут. Будем считать, что пластинка находилась под этой нагрузкой именно такое время, а значит, в качестве критериальной величины необходимо взять величину 0.456495МПа. Выберем область, где максимальное главное напряжение отличается от критериального не более чем на а = 5%. Строится изолиния, соответствующая этой области (а точнее, выбираются элементы сетки, на которых выполняется это условие).

Затем материал на этих элементах заменяется на сжимаемый материал Трелоара с параметрами С1 = 50МПа и С2 = 0МПа. При этом рассматривается второй из вариантов образования включения, описанных в разделе 1.3, а именно считается, что силы, вызывающие деформацию включения, в момент образования включения равны нулю, и вставляемое включение изначально не деформировано. Далее оставшаяся часть исходного тела (матрица) и включение “склеиваются” с сохранением действующих на них сил (термин “склеивание” понимается в смысле выполнения граничных условий, т.е. означает, что при дальнейшем деформировании тела перемещения граничных точек матрицы будут равны перемещениям соответствующих граничных точек включения). Затем в каждой точке границы между матрицей и включением сумма сил, приложенных к матрице, и сил, приложенных к включению, квазистатически (изотермически) уменьшается до нуля. Это вызывает возникновение новых деформаций и напряжений, которые накладываются на уже имеющиеся (начальные) деформации и напряжения. Меняется форма границы между матрицей и включением. Тело (матрица и включение) переходит в конечное состояние. Результаты расчётов НДС показаны на рисунках 3.6.1-3.6.9. Форма области кристаллизации вблизи вершины эллиптической полости, полученная при расчетах, близка к той, которая наблюдалась в экспериментах [140] посредством анализа данных о дифракции рентгеновских лучей вблизи вершины трещины.

Сравнение результатов производительности итерационных решателей на CPU и GPU

Используя технологию CUDA, которая даёт возможность параллельных вычислений на видеокартах, можно ускорить решение СЛАУ даже по сравнению с параллелизмом на процессорах. (см. главу 2)

На основе имеющегося решателя систем линейных алгебраических уравнений CUSP, использующего технологию CUDA, были проведены численные эксперименты [9, 10, 11] по определению производительности данного решателя и произведено сравнение скорости вычислений на центральном процессоре (CPU) и на видеокарте (GPU). Используемые методы являются итерационными и для более быстрой сходимости метода к решателю были добавлены предобуславливатели. Рис. 3.4.1. Производительность при вычислениях на графическом (GPU) и центральном (CPU) процессорах с использованием предобуславливателя Якоби и без него на примере СЛАУ с 300 000 неизвестными. Стоит заметить, что, как уже говорилось выше, использование предобуславливателя вынуждает нас делать некоторые дополнительные действия, связанные с созданием предобуславливателя и домножением на него. Для того, чтобы убедиться в оправданности этих действий, и что уменьшение количества итераций перекрывает все дополнительные затраты на использование предобуславливателя, были проведены некоторые эксперименты, результаты которых представлены в диаграмме ниже.

Анализ [9, 10, 11] показал, что не маловажно, в каком формате будет храниться матрица системы – это будет влиять на время обращения к памяти, что играет большую роль при вычислениях на видеокарте. Так как матрица, с которой мы имеем дело, сильно разрежена, то вполне уместно использование таких форматов хранения, как CSR и диагональный. Так же стоит обратить внимание на такие форматы как координатный, ELL-формат и их разновидности (гибридный). Именно в этих форматах может храниться матрица в решателе CUSP и многих других пакетах. (см. главу 2)

Сравнивая результаты производительности для каждого из них, можно придти к выводу, что гибридный формат и CSR-формат наиболее эффективны, причём гибридный выигрывает на GPU, а CSR-формат выигрывает на CPU.

Производительность при различных форматах хранения матрицы в CUSP (одинарная точность) при вычислениях методами сопряжённых градиентов (CG) и стабилизированного метода бисопряжнных градиентов (BICGSTAB) на примере СЛАУ с 300 000 неизвестными при расчётах на CPU (host) и GPU (device). 3.6. Пример решения плоской задачи для несжимаемого материала Рассмотрим модель образования упругих включений в теле из несжимаемого материала после предварительного нагружения, предложенную в разделах 1.2, 1.3. В качестве примера приводятся результаты плоской деформации тела с эллиптическим отверстием. Размер пластинки LxL, а длина полуосей эллипса 0.1L и 0.025L , где L = 200мм . Пластинка представлена материалом с определяющим соотношение типа Трелоара и параметрами, соответствующими свойствам резины -40С: С1 =0.9МПа [29]. К модели прикладывается растягивающая нагрузка на внешней границе образца, направленная вдоль большой оси эллипса. Приложенное давление на соответствующих границах пластинки равно 0.05МПа. На других гранях пластинки перемещения вдоль малой оси эллипса считаются равными нулю.

Максимальное главное напряжение на пластинке получилось равным 0.456495МПа. Из [29] известно, что при таком напряжении и температуре -40С степень кристаллизации достигает 50% от своей максимальной величины примерно за 4000 минут. Будем считать, что пластинка находилась под этой нагрузкой именно такое время, а значит, в качестве критериальной величины необходимо взять величину 0.456495МПа. Выберем область, где максимальное главное напряжение отличается от критериального не более чем на а = 5%. Строится изолиния, соответствующая этой области (а точнее, выбираются элементы сетки, на которых выполняется это условие).

Затем материал на этих элементах заменяется на сжимаемый материал Трелоара с параметрами С1 = 50МПа и С2 = 0МПа. При этом рассматривается второй из вариантов образования включения, описанных в разделе 1.3, а именно считается, что силы, вызывающие деформацию включения, в момент образования включения равны нулю, и вставляемое включение изначально не деформировано. Далее оставшаяся часть исходного тела (матрица) и включение “склеиваются” с сохранением действующих на них сил (термин “склеивание” понимается в смысле выполнения граничных условий, т.е. означает, что при дальнейшем деформировании тела перемещения граничных точек матрицы будут равны перемещениям соответствующих граничных точек включения). Затем в каждой точке границы между матрицей и включением сумма сил, приложенных к матрице, и сил, приложенных к включению, квазистатически (изотермически) уменьшается до нуля. Это вызывает возникновение новых деформаций и напряжений, которые накладываются на уже имеющиеся (начальные) деформации и напряжения. Меняется форма границы между матрицей и включением. Тело (матрица и включение) переходит в конечное состояние. Результаты расчётов НДС показаны на рисунках 3.6.1-3.6.9. Форма области кристаллизации вблизи вершины эллиптической полости, полученная при расчетах, близка к той, которая наблюдалась в экспериментах [140] посредством анализа данных о дифракции рентгеновских лучей вблизи вершины трещины.