Электронная библиотека диссертаций и авторефератов России
dslib.net
Библиотека диссертаций
Навигация
Каталог диссертаций России
Англоязычные диссертации
Диссертации бесплатно
Предстоящие защиты
Рецензии на автореферат
Отчисления авторам
Мой кабинет
Заказы: забрать, оплатить
Мой личный счет
Мой профиль
Мой авторский профиль
Подписки на рассылки



расширенный поиск

Оценки погрешности методов Ланцоша и Арнольди в точной и машинной арифметике Книжнерман, Леонид Аронович

Диссертация, - 480 руб., доставка 1-3 часа, с 10-19 (Московское время), кроме воскресенья

Автореферат - бесплатно, доставка 10 минут, круглосуточно, без выходных и праздников

Книжнерман, Леонид Аронович. Оценки погрешности методов Ланцоша и Арнольди в точной и машинной арифметике : диссертация ... доктора физико-математических наук : 01.01.07 / Книжнерман Леонид Аронович; [Место защиты: Институт вычислительной математики РАН].- Москва, 2012.- 255 с.: ил. РГБ ОД, 71 13-1/224

Введение к работе

Исторический обзор

Численное решение дифференциальных и интегральных уравнений после дискретизации часто сводится к выбору приближённого решения из подпространства Крылова

Km(A, ф) = span{AV, AV,..., Am-V}, (1)

где A — матрица размера n х n и ф — вектор (далее предполагаемый нормированным). При непосредственной работе со степенным базисом

(A0 ф,А1ф,...,Ат-1ф) (2)

подпространства (1) вероятны вычислительные трудности, связанные с плохой обусловленностью этого базиса, поэтому обычно предпочитают работу с базисом, полученным в результате ортогонализации (2). Имеются два варианта ортогонализации, и выбор определяет возможность получения априорных оценок погрешности метода.

  1. Осуществляется в неявном виде ортогонализация по Граму-Шми- дту базиса (2). Соответствующие методы в случаях эрмитовой и неэрмитовой матрицы A называются методами Ланцоша и Арнольди. Проведение классической (эрмитовой) ортогонализации позволяет при исследовании этих методов использовать технику ортогональных многочленов и многочленов Фабера. Если A — не матрица, а ограниченный оператор в гильбертовом пространстве, то для получения оценок можно работать со спектрами и использовать теорию логарифмического потенциала. Вклад в обоснование именно этих методов призвана внести представленная диссертация.

  2. Все другие случаи: строится квазиортогональный базис или пара базисов. Методы этого подсемейства семейства крыловских методов (неэрмитовы обобщения метода Ланцоша и др.) также используются на практике, но в них случаются неприятности, когда в знаменателях расчётных формул появляются маленькие числа или ноль. Обычно эти методы можно использовать, когда имеется хороший предобуславливатель, но и это не даёт гарантии сходимости. Путей получения общих априорных оценок для методов этого подсемейства не видно.

Метод Арнольди вычисления собственных пар неэрмитовых матриц и несамосопряжённых операторов стал востребованным в 1980-х годах благодаря работам Ю. Саада. Метод Арнольди применяется во многих задачах: собственно для вычисления спектра;5 6 как средство решения систем линейных алгебраических уравнений;7 8 для локализации

спектра в итерационных методах решения линейных систем;9 10 при решении жёстких систем обыкновенных дифференциальных уравнений;12 для вычисления матричной экспоненты.13 14 15 16

Пусть A — ограниченный оператор в гильбертовом пространстве H, p Є H1 ||p|| = 1. Процесс Арнольди в H с A и p основан на ор- тогонализации по Граму-Шмидту степенного базиса подпространства Крылова (1). Первые m шагов процесса Арнольди можно выразить соотношением

AQ = QH + hTO+1

(3)

где Q = (q1,... ,qm) — набор первых m ортонормированных векторов Арнольди, верхняя хессенбергова m х m-матрица H = (hj) содержит коэффициенты рекурсии, а ej есть j-й единичный вектор размерности m).

Числа Ритца (собственные значения H), которые считают приближениями к собственным значениям A, не обязаны лежать в спектре S оператора A; они находятся в «поле значений» (множестве значений отношения Рэлея) {(Лф/ф) | ф Є H, ||ф|| = 1}. Замыкание поля значений будем обозначать K.

Предпринятые до наших работ попытки оценить скорость сходимости метода Арнольди для матриц не привели, на наш взгляд, к получению законченных естественных результатов. Расстояние от собственного вектора до крыловского подпространства (1) оценено Ю. Саадомчерез коэффициенты разложения p по собственным векторам A и значе
ния многочленов степени не выше m — 1 в точках спектра:

dist (zj, Km(A, ф)) (4)

|aj I peC[A], degpi

ak I

< V^ T-kT min max Ip(A) I

где ak — коэффициенты разложения ф = ^П=1 akzk входного вектора ф по набору нормированных собственных векторов Zk матрицы A. Коэффициенты ak могут быть велики при больших перекосах где-то в спектре A. Таким образом, плохая обусловленность «неинтересной» моды может послужить причиной «развала» оценки для искомой собственной пары. Кроме того, оценить расстояние от собственного вектора до крыловского подпространства недостаточно: из малости этого расстояния не следует малость расстояния от искомого собственного вектора до какого-либо вектора Ритца. Стьюарт распространяет результат Саада на недиа- гонализируемые матрицы, но оценивает то же расстояние, и его оценка также может содержать необоснованно большие величины. Стьюартом и Джа погрешность аппроксимации собственного значения Aj на шаге m оценена по порядку корнем m-ой степени из расстояния от соответствующего собственного вектора Zj до подпространства (1):

/ ЛИ All \ 1/m / ЛИ All \ 11/m

mm1^*<'< 4(VT—W (2»A" + VT—W , (5)

где Л = sin Z (zj, Km(A, ф)). Глава 9 диссертации показывает, что в одной из типичных ситуаций указанное расстояние убывает со скоростью геометрической прогрессии при росте m, а тогда из оценки (5) вряд ли можно извлечь что-либо полезное.

Для сравнения скажем, что одна из наших простейших оценок погрешности решения спектральной задачи имеет следующий вид: если есть конечное количество s собственных значений A1,..., As, не принадлежащих полю значений К сужения оператора A на подпространство, дополнительное к интересующим нас s модам (это условие даёт возможность вывести из оценок расстояний от нужных собственных векторов до крыловского подпространства оценки ошибок соответствующих векторов Ритца), то оценка погрешности вычисления Aj (1 < j < s) равна O(pmmc), где числа 0 < Pj < 1 определяются взаимным расположением Aj и К, c — константа, зависящая от формы границы К, и под знаком O не скрыты никакие перекосы (перекосы влияют на К). В общем
случае оценка не может быть существенно улучшена. Из этого следует, что оценки (4) и (5), игнорирующие поле значений сужения оператора, в принципе не могут даже гарантировать факт сходимости при m ^ ж для оператора или семейства матриц, удовлетворяющих условиям нашей оценки.

В тот же период Ю. Саадом была дана оценка погрешности решения системы линейных уравнений Au = ф с помощью обобщённого метода минимальных невязок GMRES, использующего базис, построенный процессом Арнольди. В этой оценке также (как ив (4)) фигурируют коэффициенты разложения правой части ф по системе собственных векторов A.

В [4], [5, 4], [18, 5] автором получены оценки погрешности метода спектрального разложения Арнольди (МСРА), т. е. варианта метода Арнольди, предназначенного для вычисления произведения матричной (операторной) функции на вектор. Если функция f аналитична в окрестности S и окрестности Sp(H) — спектра H, то МСРА в качестве приближения к вектору

U = f (A)P (6)

выдаёт вектор

Um = Qf (H )ei. (7)

Из рекурсии (3) следует, что МСРА точен для многочленов степени < m — 1, то есть

f(A)p = Qf (H)ei, f Є C[t], degf < m — 1. (8)

Если f аналитична на всём компакте K, то её можно разложить там в ряд Фабера и благодаря (8) свести оценку погрешности МСРА к оценке остатка ряда Фабера. Использование поля значений A в статье [4] благодаря оценке нормы резольвенты вне K освободило нас от необходимости явным образом отражать в оценке погрешности метода перекосы в спектре. Случай функций, которые могут иметь особенности между несколькими «внешними» собственными значениями A, рассмотрен нами в работах [5] и [18]; там с аналогичной целью мы использовали поле значений сужения A на подходящее инвариантное подпространство. А в работе [19] мы получили результаты, учитывающие спектр оператора (здесь — не матрицы) A; в частности, для FOM (метода полной ортогонализации вычисления A-1 ф) показана сходимость на некоторой последовательности шагов, если 0 лежит в неограниченной связной компоненте C \ Sp(A), о чём не было речи в старой матричной теории.

В [5, 2], [18, 3] мы получили оценки для точности вычисления собственных пар. Первое, что хочется сделать для оценки качества выделения собственной пары (Л, z), — воспользоваться формулой (8) и взять многочлен f степени не выше m — 1, равный 1 в точке Л и принимающий как можно меньшие значения на остальной части спектра или на поле значений ограничения A на подходящее инвариантное подпространство («дополнительное» к Cz). Так и делается, но ситуация осложняется ненормальностью оператора A и ненормальностью H. Часть оценок представляет собой обычные неравенства, но некоторые оценки получаются коши-адамаровского типа: оценивается верхний или нижний предел m-го корня ошибки в терминах функции Грина (с особенностью в бесконечности) поля значений или спектра. Нижним пределом приходится довольствоваться, когда поле значений ограничения A на инвариантное подпространство содержит искомое собственное значение. Наши оценки для спектральной задачи также сформулированы в терминах упомянутых функций Грина для подходящего сужения оператора; соответственно, в доказательствах используются элементы теории потенциала. То, что было сказано выше об отсутствии необходимости явно учитывать перекосы в спектре и об оценках, верных для подпоследовательностей, справедливо и здесь. Использование в формулировках функции Грина позволяет рассматривать произвольные, а не частные (отрезки, эллипсы) поля значений.

В статье [21] мы для частного случая f (A) = (zI — A)-1 и g = 1 установили в терминах операторов жёсткие ограничения на A, при выполнении которых есть толк от квадратуры Гаусса-Арнольди,22 23 под которой понимается приближённое равенство (f (A)^, д(A) ф) « (f (H)e1, g(H)e1), где функции f и д аналитичны на спектрах A и H; до нас оставался открытым вопрос о том, быстрее ли сходится квадратура по сравнению с приближённым вычислением векторов f (A)^ и g(A)<^> с помощью метода спектрального разложения Арнольди.

Метод Ланцоша теоретически представляет собой метод Арнольди, применённый к самосопряжённому оператору: A* = A. В этом случае матрица H коэффициентов рекурсии является вещественной симметричной трёхдиагональной, а многочлены Арнольди Qi (Qi(A) <р = qi+1) ортогональны на вещественной оси и удовлетворяют трёхчленному рекуррентному соотношению. Компакт K превращается в отрезок вещественной оси; ряд Фабера функции f на K становится сдвинутым рядом Фурье по многочленам Чебышёва. Эрмитовость матрицы H сильно облегчает построение теории в точной арифметике. Общая оценка погрешности метода спектрального разложения Ланцоша (МСРЛ; эрмитов аналог МСРА) была получена (для точной арифметики) в [2]; она позволила оценить ошибку вычисления произвольного собственного значения методом Ланцоша. До наших работ были известны лишь теоремы Каниэляи Саада, уточнённые Пэйджем, которые касались аппроксимации со скоростью геометрической прогрессии нескольких собственных значений на одном краю спектра. Результаты Каниэля и Саада оценивают качество приближения j-го точного собственного значения Xj j-ым же числом Ритца Oj. Оценки эффективны, если число этих собственных значений существенно меньше, чем размерность подпространства Крылова т.

Используя равенство (8), В. Л. Друскин и автор получили априорные оценки ошибки вычисления не обязательно близкого к краю спектра собственного значения методом Ланцоша.

Исследование метода Ланцоша существенно усложняется при переходе к машинной арифметике (естественно, в случае матриц).28 29 30 Было выяснено, что векторы Ланцоша qj теряют ортогональность и даже становятся почти линейно зависимыми после того, как появится хорошее приближение к какому-либо собственному значению. Процесс Ланцоша с одной и той же парой (A, ф) может по-разному идти на компьютерах разных типов или даже на одном компьютере при разных способах компиляции программы. Причина в том, что в процессе Ланцоша при стандартной реализации вследствие теоретической трёхдиагональности H новый вектор Ланцоша ортогонализуется только к двум предыдущим, а не ко всем, в отличие от метода Арнольди. Поведению процесса Ланцоша в условиях машинной арифметики посвящены основополагающие работы К. Пэйджа,31 32 33 в которых виртуозно вскрыт механизм появления неустойчивости в процессе Ланцоша и влияние неустойчивости на базовые матричные соотношения процесса. Оценки погрешности можно извлечь из эстетичной работы Гринбаум, которая, используя работы Пэйджа, результат реального процесса Ланцоша на шаге m представила как результат идеального процесса Ланцоша с матрицей размерности n + m, но в упомянутой работе наложены очень жёсткие ограничения на параметры задачи и нельзя в общем случае получить оценку погрешности лучше корня четвёртой степени є1/4 из элементарной ошибки округления Є.

Оценка погрешности МСРЛ в машинной арифметике с правильным порядком по є была дана в [3]. Для анализа влияния ошибок округления на процесс Ланцоша было построено чебышёвское рекуррентное соотношение с правой частью порядка ошибки округления; эта правая часть отвечает за неточность процесса. Получение оценки ошибки МСРЛ, в правой части которой слагаемое, отвечающее за ошибки округления, линейно по є (что выведено из результатов Пэйджа), свелось к доказательству устойчивости чебышёвской рекурсии.

В [3], [11] был также в принципе объяснён феномен Ланцоша — свойство процесса Ланцоша рано или поздно вырабатывать приближения к собственным значениям с почти машинной точностью. Попытка объяснить феномен Ланцоша была предпринята Каллэм и Уиллафби, однако в их работе используется ряд недоказанных предположений.

Априорных оценок погрешности МСРЛ и МСРА до наших работ не было, если не считать оценки для решения систем линейных уравнений (f (A) = A-1).

Итак, до нас:

спектральные «оценки» в неэрмитовом случае или содержали в левой части промежуточные величины (невязки, расстояния от собственного вектора до крыловского подпространства), а не истинные отклонения чисел и векторов Ритца от собственных значений и векторов соответственно, или в правой части необоснованно содержали потенциально большие величины (результаты Саада, Стьюарта и др.). Непосредственно применимые (а не содержащие оценки лишь промежуточных величин) априорные результаты о сходимости чисел Ритца к собственным значениям относились лишь к краю спектрального интервала в эрмитовом случае при точной арифметике (оценки Каниэля и Саада);

из матричных функций исследовалась только функция f (A) = A-1, соответствующая решению системы линейных уравнений. Не было средств теоретического рассмотрения даже такой важной и популярной функции, как матричная экспонента f (A) = exp(-tA), t > 0, A > 0;

априорные оценки для простого процесса Ланцоша и квадратуры Гаусса-Ланцоша в машинной арифметике имели в лучшем случае правую часть порядка n3m1/4 (результат Гринбаум и следствия из него);

Были лишь частные попытки объяснить явление адаптации методов к спектру. Оценки для квадратуры Гаусса-Арнольди ничего не говорили о её эффективности: не было ясно, имеет ли (и если имеет, то при каких условиях на спектр) применение квадратуры преимущество перед вычислением соответствующих матричных функций.

Цель работы:

построение общей теории сходимости методов Ланцоша и Арнольди.

Актуальность темы

Методы Ланцоша и Арнольди — классические методы вычислительной математики. Они широко используются, им уделяется много внимания. Однако имевшиеся до нас априорные результаты об их сходимости носили частный или незаконченный характер. Это и обусловило актуальность темы диссертации.

Научная новизна

В диссертации систематически изложена общая теория сходимости методов Ланцоша и Арнольди (в том числе в форме МСРЛ и МСРА), ликвидирующая имевшиеся качественные пробелы и содержащая прямые априорные оценки погрешности.

Теоретическая и практическая ценность

Результаты диссертации дают пользователям (математикам и программистам):

принципиальную уверенность в том, что обсуждаемые методы при установленных условиях работают. В частности, прояснены классы матричных функций, к вычислению которых можно применять методы спектрального разложения Ланцоша и Арнольди;

возможность априори оценивать объём вычислительной работы, достаточный для решения конкретной задачи, а также, зная вид аналитической зависимости границы ошибки от номера шага m, апостериорно прогнозировать фактическую ошибку путём подбора параметров (curve fitting);

инструмент для исследования методов в условиях машинной арифметики: возмущённые чебышёвские и фаберовские рекуррентные соотношения.

Ссылки на описания некоторых приложений, к которым имеет отношение автор, даны в диссертации. Приложений, возможно, и не было бы, если б не была развита теория.

Методы исследования

Из линейной алгебры применены теоремы типа Гершгорина и теоремы о невязке с учётом и без учёта отделённости, из вычислительной математики — теорема о сходимости ньютоновского процесса решения системы нелинейных уравнений, из математического анализа — ортогональные многочлены, многочлены Фабера, специальные функции, конформные отображения, функция Грина и экстремальные многочлены.

Положения, выносимые на защиту:

Доказано, что при вычислении методом Арнольди «крайних» собственных пар сходимость имеет место со скоростью геометрической прогрессии, показатель которой выражается через значение функции Грина дополнения к полю значений сужения оператора на инвариантное подпространство, порождённое «неинтересной» частью спектра. Предложен метод спектрального разложения Арнольди для вычисления умноженной на вектор операторной функции; дана оценка погрешности этого метода в терминах коэффициентов ряда Фабера вычисляемой функции, построенного на поле значений.

Исследован метод спектрального разложения Ланцоша для вычисления умноженной на вектор функции от эрмитовой матрицы. Для точной арифметики дана оценка погрешности метода в терминах коэффициентов ряда вычисляемой функции по многочленам Чебышёва, смещённым на спектральный интервал. Оценена погрешность вычисления произвольно расположенного в спектральном интервале собственного значения методом Ланцоша; в частности, показано, что числа Ритца сходятся к заданному собственному значению со скоростью геометрической прогрессии, показатель которой определяется отделённостью собственного значения в спектре.

С помощью техники возмущённых чебышёвских рекурсий оценка погрешности метода спектрального разложения Ланцоша обобщена на случай машинной арифметики. Показано, что неустойчивость метода спектрального разложения Ланцоша в машинной арифметике не препятствует его практическому применению. Аналогичный результат получен для квадратуры Гаусса-Ланцоша. Доказаны конкретные утверждения, касающиеся феномена Ланцоша; в частности, установлено, что при выполнении ограничений, проистекающих из теории Пэйджа, минимальная ошибка вычисления хорошо отделённого собственного значения имеет примерно порядок машинной ошибки округления.

В терминах линейных ограниченных операторов показано, почему на практике обсуждаемые методы работают лучше, чем гарантировано предыдущими оценками (адаптация к спектру). Адаптивные оценки погрешности сформулированы в терминах функции Грина неограниченной компоненты дополнения к операторному спектру. Получены результаты о сходимости на подпоследовательностях шагов процесса Ланцоша или Арнольди в ситуациях, когда процесс сходиться в обычном смысле не обязан. Проанализирована эффективность квадратуры Гаусса- Арнольди.

Обоснованность и достоверность результатов

Представленные в диссертации утверждения снабжены математическими доказательствами. Результаты численных экспериментов иллюстрируют многие из доказанных утверждений. Кроме того, справедливость положений представленной теории подтверждается многолетней практикой моделирования геофизических и иных процессов с помощью методов Ланцоша и Арнольди.

Апробация работы

Результаты диссертации излагались на юбилейной ланцошевской конференции (Рэйли, США, 1993), конференции по вычислительной линейной алгебре (Миловы, Чехия, 1997), конференции SIAM-GAMM-2006 (Дюссельдорф, Германия), на кафедре вычислительной математики Технического горного университета Фрайберга (Германия), в ВЦ РАН им. А. А. Дородницына, в ИПУ РАН им. В. А. Трапезникова, по нескольку раз обсуждались на семинарах в Институте вычислительной математики РАН и Институте прикладной математики РАН им. М. В. Келдыша (в том числе на семинаре им. К. И. Бабенко).

Публикации

Основные результаты диссертации изложены в статьях [2, 3, 4, 5, 6, 10, 11, 13, 17, 18, 21], опубликованных в рецензируемых научных журналах из списка, рекомендованного ВАК. Другие результаты диссертации опубликованы в работах [7] и [19] (последняя реферирована в Zentralblatt). Всего по теме диссертации, включая аннотации конференционных докладов и препринты, автором опубликована 21 работа, из них 12 — в рецензируемых научных изданиях.

В статьях, написанных совместно с В. Л. Друскиным, лично диссертант: использовал разложение в ряды Фурье-Чебышёва и специальные функции (В. Л. Друскин оценивал коэффициенты нужных рядов Фурье- Чебышёва с помощью сведения к оценке погрешности разностных схем для обыкновенных дифференциальных уравнений); провёл выкладки, связанные с многочленами Чебышёва; разработал и использовал технику возмущённых чебышёвских рекуррентных соотношений. Включённые в диссертацию результаты, полученные совместно с В. Л. Друскиным и Э. Гринбаум, принадлежат их авторам в равной степени.

Разумеется, результаты из совместных статей, полученные без участия автора, в диссертацию не включены.

Ссылки на статьи автора по теме диссертации можно найти в не-

скольких книгах41 42 43 44 45 46 47 ив статьях разных авторов.

Благодарности

Автор благодарит: В. Л. Друскина — за многолетнюю совместную деятельность по исследованию и практическому применению метода Лан- цоша, а также за полезные обсуждения личных статей автора; Э. Грин- баум — за совместное написание нескольких статей по теории метода Ланцоша, а также за полезные обсуждения личных статей автора; за полезные обсуждения диссертации в целом или части отражённых в ней статей и за библиографическую поддержку — М. Айерманна, С. К. Асва-

дурова, Б. Бекерманна, А. Б. Богатырёва, Дж. Голуба , С. А. Горейнова

В. И. Лебедева , О. В. Локуциевского

Б. Парлетта, Л. Райхеля, А. Руэ,

С. Н. Давыдычеву, Н. Л. Замарашкина, Х. Д. Икрамова, В. П. Ильина, Дж. Каллэм, А. В. Князева, В. И. Лебедева , О. В. Локуциевского , К. Любиха, Ю. М. Нечепуренко, Б. Парлетта, Л. Райхеля, А. Руэ,

С. Рябенького, А. Скороходова, А. В. Собянина, В. З. Соколинского,

П. Суетина, К. Торреса-Вердина, Е. Е. Тыртышникова, М. Хохбрук, О. Эрнста, участников перечисленных в пункте «Апробация» конференций и семинаров; Дэвида Бейли — за публикацию фортранного пакета повышенной точности в Интернете; Центральную геофизическую экспедицию и Schlumberger-Doll Research — за организационную помощь.

Структура и объём работы

Диссертация состоит из двенадцати глав, десять из которых содержат математические результаты и распределены между четырьмя частями. Объём диссертации — 255 с. Список литературы содержит 187 наименований.

Похожие диссертации на Оценки погрешности методов Ланцоша и Арнольди в точной и машинной арифметике