Электронная библиотека диссертаций и авторефератов России
dslib.net
Библиотека диссертаций
Навигация
Каталог диссертаций России
Англоязычные диссертации
Диссертации бесплатно
Предстоящие защиты
Рецензии на автореферат
Отчисления авторам
Мой кабинет
Заказы: забрать, оплатить
Мой личный счет
Мой профиль
Мой авторский профиль
Подписки на рассылки



расширенный поиск

О формулах малышевского типа для метрических матричных задач Назари Али Мохаммад Рахим

О формулах малышевского типа для метрических матричных задач
<
О формулах малышевского типа для метрических матричных задач О формулах малышевского типа для метрических матричных задач О формулах малышевского типа для метрических матричных задач О формулах малышевского типа для метрических матричных задач О формулах малышевского типа для метрических матричных задач О формулах малышевского типа для метрических матричных задач О формулах малышевского типа для метрических матричных задач О формулах малышевского типа для метрических матричных задач О формулах малышевского типа для метрических матричных задач
>

Диссертация - 480 руб., доставка 10 минут, круглосуточно, без выходных и праздников

Автореферат - бесплатно, доставка 10 минут, круглосуточно, без выходных и праздников

Назари Али Мохаммад Рахим. О формулах малышевского типа для метрических матричных задач : Дис. ... канд. физ.-мат. наук : 01.01.07 : Москва, 2004 104 c. РГБ ОД, 61:04-1/1303

Содержание к диссертации

Введение

Глава 1. Формула Малышева и ее следствия 15

1.1. Недиагонализуемость ближайшей матрицы 15

1.2. Необходимое условие экстремума в нуле 17

1.3. Случай нормальной матрицы Л 23

1.4. Вычислительные аспекты 27

Глава 2. Расстояние до множества матриц с тройным собственным значением нуль 33

2.1. Нижняя оценка для расстояния 33

2.2. Необходимые условия экстремума 36

2.3. Построение минимального возмущения в основном варианте 45

2.4. Случай нормальной матрицы Л 47

2.4.1. Редукция задачи 49

2.4.2. Сингулярные числа матрицы Г 51

2.4.3. Случай ап(А) = о-„ і(Л) 53

2.4.4. Доказательство неравенств (2.58) 58

2.5. Доказательство формулы для анормальной матрицы 61

2.5.1.Максимум в точке 7* = 0 64

2.5.2. Максимум в точке 7* = (іЬ 0> 0) 65

2.6. Вычислительные аспекты 71

Глава 3. Расстояние до множества матриц с парой собственных значений, симметричных относительно нуля 78

3.1. Нижняя оценка для расстояния 79

3.2. Исследование функции /(7) 81

3.3. Необходимые условия экстремума 83

3.4. Построение минимального возмущения 86

3.5. Случай нормальной матрицы А 89

Заключение 93

Литература 95

Приложение

Введение к работе

Метрические задачи — это раздел теории матриц, одновременно классический и продолжающий развиваться и приносить новые результаты, принадлежащий сразу и теоретической, и прикладной линейной алгебре. Вот несколько приметров, иллюстрирующих этот тезис.

Как известно, всякая квадратная комплексная матрица А может быть представлена суммой

А = В + іС, (ОД) где В и С — эрмитовы матрицы, и произведением A = SU, (0.2) где S положительно (полу)определенная, a U —унитарная матрицы. Представление (0.1), называемое теплицевым (или эрмитовым) разложением матрицы А, всегда единственно, причем

В = Ї(Л + А*), С = і(Л-Л*).

Представление (0.2), называемое полярным разложением, единственно, если А — невырожденная матрица, что для простоты и будет предполагаться ниже.

Теплицево и полярное разложения являются матричными аналогами соответственно алгебраической и показательной формы комплексного числа , т.е представлений z-хЛ-іу, z = реіф, (0.3) где х,у,р,ф Є R и р > 0. Более того, ряд свойств матриц В,С,5 и U аналогичен свойствам вещественных параметров представлений (0.3). Так, непосредственно очевидному факту — х есть точка вещественной оси, ближайшая к z, — соответствует матричное соотношение \\A-B\\F=pm\\A-H\\F. (0.4)

Другому геометрическому обстоятельству — число е1^ есть точка единичной окружности, ближайшая к z, — отвечает соотношение \\А-Щ\Р= mm р-Тф.. (0.5)

Равнства (0.4) и (0.5) относятся к матричной геометрии — красивому, но, возможно, не слишком прикладному разделу теории матриц. Примером гораздо более практичного метрического соотношения может служить знаменитая теорема Экарта—Янга:

Теорема 0.1. Пусть А — комплексная т х п~матрица с сингулярными числами <гх(А) > <72{А) >...> о-в(А), s = min(m,7i). (0.6)

Обозначим через Л4Г многообразие m х п—матриц ранга г. Тогда спектральное расстояние от А до 7Wr, определяемое как р2(А,Мг)=т^\\А-В\\2, (0.7) равно числу (тг+і(А). Если, в частности, А— квадратная п х п—матрица, то ее спектральное расстояние до множества вырожденных матриц равно числу ап(А). Пусть

А = УЕЇУ* (0.8) есть сингулярное разложение п х п.—матрицы А. В этом разложении U и V— унитарные матрицы, а S = diag(o-i,...,(7n). 0-9)

Сингулярные числа щ в (0.9), как правило, предполагаются упорядоченными по убыванию (см. (0.6)). В таком случае матрица В, реализующая расстояние от А до множества M.n-i, может быть вычислена по формуле

В - А - сгп*„<, (0.10) где vnVLUn— последние столбцы соответственно матриц V и U; иначе говоря, vn и ип суть левый и правый сингулярные векторы, ассоциированные с младшим сингулярным числом ап.

Рассмотренные примеры относятся к классике теории матриц. В частности, теорема Экарта—Янга известна еще с 1930—х годов. Приведем теперь примеры (сравнительно) недавно найденных метрических матричных соотношений.

Пусть Сь— непустое открытое подмножество комплексной плоскости, а Сд— его дополнение: C = CgUCb. (0.11)

Матрица А Є Мп(С) называется устойчивой (по отношению к Сд), если ее спектр содержится в Сд. Радиусом устойчивости этой матрицы (по отношению к Сд) называется число г (А, Сд) = іпі{||Д|| : A-f А имеет хотя бы одно собственное значение в Сд}. (0.12) Классическими примерами разбиения (0.11) являются случаи, когда Сд есть полуплоскость

Р- = {z С : Rez < 0} (0.13) или единичный круг

Сд = {z С : \z\ < 1}. (0.14)

Формулы для вычисления радиуса устойчивости известны с 1980-х годов[1-3]. Наиболее удобная из них имеет вид (норма в (0.12) предполагается спектральной) r(AC9)= mm *n(zl - А). (0.15)

В частности, для случая Сд = Р_ (см. (0.13)) получаем г (А, Сд) = min <тп{іьоІ ~ А). (0.16)

Если минимум в (0.16) достигается в точке ш* и a* =crn{iu)*I -А), то минимальное возмущение А, выводящее А из зоны устойчивости, можно выбрать как матрицу ранга 1 где и и V— соответственно правый и левый сингулярные векторы матрицы iufl — А для сингулярного числа а*.

Пусть теперь А - вещественная п х п—матрица, а Сд - множество, симметричное относительно вещественной оси. Тогда, наряду с (0.12), можно определить величину га(Л, Сд) = inf{i|Д|| : Л Є Mn{R) и А + А имеет хотя бы одно собственное значение В Сд}, называемую вещественным радиусом устойчивости. В этом случае о числе (0.12) говорят как о комплексном радиусе устойчивости той же матрицы. Формулы для вычисления вещественного радиуса устойчивости найдены в [4]. Приведем ту из них, которая по структуре ближе всего к формуле (0.15) (снова считаем, что в (0.17) взята спектральная норма): гъ{А,С9) = ш наах а2п-і(Р(т))> (0-18) где z = х + гу, а Р(7) ~ следующая матрица порядка 2п: ' A-xIn -yyln ' ^ 7 XWn A-xIn j Пусть минимакс в формуле (0.18) достигается при значениях параметров z = z4 = х* + и/*, 7 = 7*- Для этих значений положим a* = a-2„_i(P(7*)). (0.19)

Тогда минимальное вещественное возмущение Д, выводящее А из зоны устойчивости, можно построить как матрицу ранга 2

Д - -ет*(ь1ь2){и1и2)+. (0.20)

Здесь (0.21) \v2j суть специальным образом выбранные сингулярные векторы, соответственно правый и левый, для сингулярного числа а* матрицы Р(у*), а «і) u2i Щ, v2 - их подвекторы размерности п.

Можно было бы привести немало новых метрических соотношений из текущей журнальной литературы (см., например, [5-7]). Однако мы ограничимся лишь одним результатом, послужившим стимулом для выполнения данной работы.

В [S] А. Н. Малышевым получена следующая формула для спектрального расстояния геер(Л) от комплексной п х п—матрицы А до ближайшей матрицы, имеющей кратное собственное значение: rsep(A) = mm max 2n-i(P\(j)). (0.22)

Здесь (0.23) Px(l) = A - XIn jln

0 A-XIn

Пусть С - множество n X n—матриц с кратным собственным значением нуль. Основной элемент в выводе формулы (0.22) — это доказательство формулы для спектрального расстояния р2(А,) от матрицы А до множества С: (0.24) p2[AiC)=maxf(j), /(7)=^а»-і(Л)(7)). 9 (0.25)

Вкратце схема доказательства такова. Сравнительно просто доказывается неравенство

НІ)<Р2(АС) V7.

В точке 7*, где функция (0.25) достигает своего максимума <т*, исследуются свойства правых и левых сингулярных векторов матрицы Ро(т*)) отвечающих числу а*. Опираясь на свойства этих векторов, А. Н. Малышев строит матрицу Д со спектральной нормой а*, для которой А + Д имеет кратное собственное значение нуль. Это построение различно для случаев 7* = 0 и 7* > 0. Во всех случаях возмущение Д может быть выбрано как матрица ранга 1 или 2 и выражается формулами типа (0.10) или (0.20).

Содержание диссертации можно коротко охарактеризовать как развитие идей А. Н. Малышева в различных направлениях.

Первая глава диссертации посвящена важным деталям задачи Малышева, не покрываемым анализом, проведенным в [8], не рассмотренным в этом анализе или слишком сложно им объясняемым. В разделе 1.1 мы показываем, что матрица А + А из [8] (т.е. матрица из С, ближайшая к А ), как правило, недиагонализуема. Так заведомо будет, если 7* > 0, а также если 7* - 0 и <тп{А) < сг„_і(А).

Ситуация

7* - 0, <тп(А) < (7п~і{А) возможна лишь при выполнении условия v*nun = 0, (0.26) где ип и vn суть правый и левый сингулярные векторы матрицы А, ассоциированные с <тп{А) (см. [8, раздел 5.2]). В разделе 1.2 мы упрощаем вывод соотношения (0.26), пользуясь лишь стандартными фактами о производных сингулярных чисел; в частности, в отличие от доказательства в [8], мы не опираемся на аналитичность этих чисел и соответствующих сингулярных векторов.

В разделе 1.3 мы проводим подробный анализ задачи Малышева для случая, когда А ~ нормальная матрица. Главный результат этого раздела — формула, выражающая расстояние рг(Д С) через модули двух младших собственных значений матрицы А: Р2(Л,)=("іР2+|Л"Р)1/2. (0.27)

Построение минимального возмущения А в случае -у* > 0 требует предварительного вычисления специальной пары сингулярных векторов матрицы Pq(j*). Связанные с этим вычислительные проблемы обсуждаются в разделе 1.4.

Отметим, что изложение в первой главе диссертации основано на работах [9-11].

Вторая глава содержит основные результаты диссертации. Здесь мы доказываем формулу типа Малышева для спектрального расстояния от комплексной п х п—матрицы А (п > 3) до множества Лт матриц, имеющих собственное значение нуль кратности > 3.

Введем векторный параметр

7 = (7і) 72,7з), 7ь 72,7з С, (0.28) и положим ' Л тїЛі 7з4 ^

0 А тз4 0 0 А (0.29)

Определим функцию /(7)=^2(0(7))- (0-30)

Главный результат диссертации — формула р2(Д,Л4) = тах/(7). (0.31)

В обосновании формулы (0.31) мы следуем схеме доказательства формулы Малышева в [8]. При этом приходится преодолевать значительные технические сложности, связанные с переходом от одномерного вещественного параметра к трехмерному комплексному.

В разделе 2.1 устанавливается неравенство f(7)2(A,M) V7GC3. (0.32)

В разделе 2.2 мы исследуем свойства сингулярных векторов матрицы Q(j). Некоторые из них имеют место для всех 7, но наиболее важные для нас выполняются лишь в точке 7* локального экстремума функции /(7).

В разделе 2.3 мы конструируем возмущение Л, такое, что ||Д||2 = о*=/(7*)=тах/(7) (0.33)

А + ДЄА4. (0.34)

Это построение предполагает, что для точки максимума справедливо

7і72 > 0. (0.35)

Наличие точки экстремума, удовлетворяющей условию (0.35), мы называем основным вариантом. Таким образом, результатом раздела 2.3 является обоснование формулы типа Малышева в основном варианте.

В разделе 2.4 проведен подробный анализ случая нормальной матрицы А. Этот анализ показывает, что, за исключением ситуации ап-2(А) = n-i{A) = Vn{A), 12 когда равенство (0.31) выполняется очевидным образом, точка экстремума функции /(7) обязана подчиняться соотношению (0.35). Это доказывает формулу типа Малышева для нормальной матрицы А.

В разделе 2.5 мы возвращаемся к исследованию общего случая и доказываем формулу (0.31) для „плохих" матриц А, т.е. матриц, не подчиняющихся соотношению (0.35). В доказательстве используется непрерывность обеих частей формулы как функций от А и плотность в Мп(С) множества „хороших" матриц. Это завершает обоснование формулы типа Малышева.

В разделе 2.6 обсуждаются вычислительные аспекты, связанные с использованием формулы (0.31).

Отметим, что эта глава диссертации основана на работах [12-14].

В третьей главе диссертации мы исследуем вопрос о том, в какой мере идеи статьи [8] могут быть распространены на еще одну метрическую матричную задачу. Пусть /Сд0— множество комплексных п х гг—матриц, имеющих пару собственных значений (Ло, — А0), симметричную относительно нуля. Как найти спектральное расстояние от заданной п X п—матрицы А до множества /Сд0?

Положим (0.36)

А - A0in jln к 0 A + \0InJ /M^an-iWAoM)- (0-37)

В разделе 3.1 устанавливается неравенство

П>у)<Р2{А,Къ) V7>0. (0.38)

Свойства функции /(7) исследуются в разделе 3.2. Необходимые условия экстремума этой функции выводятся в разделе 3.3. В разделе 3.4 показано, что если экстремум достигается в точке 7* > 0, то имеет место равенство

Р*{А,Къ) = fi-f) = *f/М- (0.39)

При этом строится возмущение А со спектральной нормой а* = /(т*); такое, что

Л + Д еКхо-

В разделе 3.5 проведен анализ случая нормальной матрицы А. Установлены условия для каждой из двух возможных ситуаций:

7* > 0 и 7* = 0.

В заключении сформулированы основные результаты диссертации и представлен взгляд автора на их теоретическое и прикладное значение.

Необходимое условие экстремума в нуле

Здесь U2 и vi - подвекторы в представлениях (0.21) векторов и и v. Из (1.6) вытекает, в частности, что каждая из систем щ, щ и vi, v% линейно независима, т.е. обе матрицы имеют ранг 2. Искомая матрица возмущения задается теперь формулой Из определения сингулярных векторов и формулы (1.8) можно вывести соотношения и Их следствием является равенство Соотношения (1.9)-(1.11) означают, что векторы щ и —7 1 2 составляют жорданову цепочку для нулевого собственного значения матрицы А + Д мы покажем, как упростить вывод равенства (1.12) по сравнению с рассуждением, приведенным в [S]. Сейчас же обсудим следствия этого равенства. Возмущение А со свойствами (1.2) (где а — ап(А)) и (1.3) строится в рассматриваемом случае как матрица ранга 1 Если есть сингулярное разложение матрицы А, то возмущенная матрица А + А имеет редуцированное сингулярное разложенние Из него видно, что подпространство imA является линейной оболочкой левых собственных векторов v\,... ,і!п_і- Отсюда следует, что уравнение разрешимо относительно вектора го. Действительно, его правая часть ип, в силу (1.12), ортогональна к вектору vn, а потому Из (1.14) очевидно равенство Соотношения (1.15) и (1.16) означают, что векторы w и ип составляют жорданову цепочку для нулего собственного значения матрицы А + А. Таким образом, и в этом случае матрица А + А недиагонализуема и имеет в своей жордановой форме клетку порядка 2 для А = 0. Рецепт для выбора возмущения Д в остающемся случае содержится в теореме Экарта-Янга (см. теорему 0.1): исходя из сингулярного разложения (1.14), нужно положить так что А + Д есть матрица ранга п — 2: Число А = 0 является полупросгым собственным значением этой матрицы, если его алгебраическая кратность равна 2. При большей кратности в жор-дановой форме матрицы А + Д имеется нетривиальная жорданова клетка для А = 0. Сам по себе тот факт, что матрица с кратным собственным значением нуль, ближайшая к случайным образом выбранной матрице А, как правило, недиагонализуема, вовсе не удивителен. Дело в том, что матрица общего положения из множества С должна быть. Таким образом, мы приходим к следующему выводу (не сделанному в [8]): Если максимум функции /(7) достигается в точке 7 0) то матрица А Л- А, ближайшая к А в множестве , недиагонализуема и имеет в своей жордановой форме жорданову клетку порядка 2 для Л = 0. Пусть теперь 7 0 и выполняется неравенство (1.4). Обозначим через ип и vn правый и левый сингулярные векторы матрицы А, относящиеся к числу 7п(А). В [8, раздел 5.2] доказано, что векторы ип и vn должны подчиняться соотношению

В следующем разделе мы покажем, как упростить вывод равенства (1.12) по сравнению с рассуждением, приведенным в [S]. Сейчас же обсудим следствия этого равенства. Возмущение А со свойствами (1.2) (где а — ап(А)) и (1.3) строится в рассматриваемом случае как матрица ранга 1 Если есть сингулярное разложение матрицы А, то возмущенная матрица А + А имеет редуцированное сингулярное разложенние Из него видно, что подпространство imA является линейной оболочкой левых собственных векторов v\,... ,і!п_і- Отсюда следует, что уравнение разрешимо относительно вектора го. Действительно, его правая часть ип, в силу (1.12), ортогональна к вектору vn, а потому Из (1.14) очевидно равенство Соотношения (1.15) и (1.16) означают, что векторы w и ип составляют жорданову цепочку для нулего собственного значения матрицы А + А. Таким образом, и в этом случае матрица А + А недиагонализуема и имеет в своей жордановой форме клетку порядка 2 для А = 0. Рецепт для выбора возмущения Д в остающемся случае содержится в теореме Экарта-Янга (см. теорему 0.1): исходя из сингулярного разложения (1.14), нужно положить так что А + Д есть матрица ранга п — 2: Число А = 0 является полупросгым собственным значением этой матрицы, если его алгебраическая кратность равна 2. При большей кратности в жор-дановой форме матрицы А + Д имеется нетривиальная жорданова клетка для А = 0. Сам по себе тот факт, что матрица с кратным собственным значением нуль, ближайшая к случайным образом выбранной матрице А, как правило, недиагонализуема, вовсе не удивителен. Дело в том, что матрица общего положения из множества С должна быть недиагонализуемой. Действительно, пусть В — такая матрица. Приведем В к верхней форме Шура Т, причем так, чтобы первые две позиции главной диагонали занимало число нуль: „Быть в общем положении" означает в данном случае иметь ненулевой элемент t\2 Но при ii2 ф 0 матрица Т недиагонализуема. Несмотря на сказанное, утверждение, что в определенных ситуациях матрица Л + Д обязана быть недиагоиализуемой, содержательно. Например, такого утверждения нельзя сделать в ситуации (1.17): если А -нормальная матрица, то нормальна и, следовательно, диагонализуема также и матрица А + А. Соотношение (1.12) выведено в [8] посредством рассуждения, использующего наличие у матрицы Ро(т) аналитической системы сингулярных векторов. Ниже мы показываем, что, в действительности, для доказательства (1.12) достаточно опираться на гладкую зависимость матрицы от параметра и стандартные факты спектральной теории возмущений эрмитовых матриц. Чтобы упростить записи, мы заменяем символ -РоСт) на F(-y). Как известно, квадраты сингулярных чисел ті,. .., Т2п матрицы І (7о)

Необходимые условия экстремума

Учитывая, что \\0\\% — \\ ДЦг, и применяя неравенства Вейля для сингулярных чисел (см., например, [17, следствие 5.1]), выводим из представления (2.11) и равенства (7 п-2{Яв) = 0 оценку ІРІЬ 3 2((9(71,72,73)) Ввиду произвольности 7; получаем требуемое неравенство (2.4). 2.2. Необходимые условия экстремума Положим Если и — 0, то, в частности, сгзи-2(ф(1, 1, 0)) = 0. Выкладки, аналогичные тем, что проводились в предыдущем разделе, приводят к соотношению откуда следует, что гапкЛ3 п-3и, стало быть, А Є М. Таким образом, при а = 0 формула (2.3) выполняется. Это позволяет нам в дальнейшем считать, что а 0. В разделе 2.3 мы покажем, как строится матрица Д такая, что в так называемом основном варианте. Построение этой матрицы опирается на свойства сингулярных векторов матрицы Q{"[) как в произвольной точке 7, так и в точке 7 , реализующей локальный экстремум функции /(7)-Начнем с перечисления свойств, справедливых для всех 7 Пусть а — сингулярное число матрицы Q(y) = ф(7і)72)7з), а « и v — соответственно правый и левый сингулярные векторы, ассоциированные с т. Это значит, что Без ограничения общности, можно считать, что ЦиЦг = Нг — 1. Представим и и v в блочном виде где каждый из подвекторов щ и Vj имеет размерность п. Равенства (2.15) приводят к соотношениям Доказательство. Умножим (2.18) скалярно на г?і, а (2.19) на щ. Беря сопряжение от второго из полученных соотношений и вычитая его из первого, приходим к равенству откуда следует (2.22). Лемма 2.4. Для любых 61,62,63 Є R- справедливо равенство Доказательство. Умножим равенства (2.16)-(2.18) скалярно соответственно на 1 1,52 2 3 3- Затем умножим (2.19)-(2.21) соответственно на і і, 2 2» зиз- Возьмем сумму первых трех полученных соотношений и вычтем из нее результат комплексного сопряжения, примененного к сумме трех остальных соотношений. Это приводит к равенству (2.24). Лемма 2.5. Справедливы соотношения Доказательство. Чтобы получить (2.25), умножим скалярно (2.17) на vi, а (2.19) на и2, а затем вычтем из первого соотношения сопряженное ко второму. Аналогичные выкладки, где (2.18) умножается на v2, а (2,20) на г 3і приводят к (2.26).

Перейдем теперь к изучению дополнительных свойств, которые интересующие нас сингулярные векторы матрицы Э(т) имеют в точке локального экстремума Соответствующее значение функции обозначаем через а : Согласно разъяснению, сделанному в начале данной главы, можно считать, что 71 и 72 вещественные (и даже неотрицательные) переменные. Переменная 73) вообще говоря, комплексная: Удобно положить и рассматривать / как функцию четырех вещественных переменных i, ..., 4- Сингулярные векторы матрицы Q, относящиеся к числу а в точке локального экстремума помимо свойств, выражаемых леммами 2.3-2.5, подчиняются соотношениям, заключенным в следующей лемме. Лемма 2,6. Если точка (см.(2.27)) реализует локальный экстремум а 0 функции f, то найдутся ассоциированные с а правый и левый сингулярные векторы и и v такие, что Доказательство. Если ст — простое сингулярное число матрицы является (вещественной) аналитической функцией переменных 1, . . . 5 i Б некоторой окрестности точки и соотношения (2.28)-(2.31) суть попросту необходимые условия экстремума, записанные с помощью формулы дифференцирования сингулярного числа из [IS, лемма 4]. Предположим теперь, что о — кратное сингулярное число. В некоторой окрестности точки рассмотрим функции Они не дифференцируемы в вследствие наложенного на них условия упорядоченности -2 0"зп-з- Однако, если отказаться от этого условия, то в окрестности точки определены (вещественные) аналитические функции сг_() и 7+(), также имеющие смысл сингулярных чисел, причем Пусть и„{),! _() и и+(),и+() суть пары сингулярных векторов, ассоциированных соответственно с сг_() и 5-1-(4). Уравнение задает трехмерное (вещественное) аналитическое многообразие, содержащее точку . Выполним линейную замену переменных так, чтобы в переменных ?i,..., щ касательная гиперплоскость к многообразию (2.35) описывалась уравнением

Сингулярные числа матрицы Г

Для последующего анализа нам необходимы несколько простых оценок, связанных с сингулярными числами матрицы где а — произвольное комплексное число. Лемма 2.7. Если 01(7) старшее сингулярное число матрицы (2.73), тоДоказательство. Числа в правой части оценки (2.74) суть евклидовы длины первой строки и третьего столбца матрицы Г(7). Сама эта оценка есть простое следствие хорошо известных экстремальных описаний числа Следствие 1. Если хотя бы одно из чисел 7ь72 7з отлично от нуля, то Лемма 2.8. Пусть 03(7) младшее сингулярное число матрицы (2.73). требуемое соотношение (2.76), если хотя бы одно из чисел 7i и 72 отлично от нуля. В противном случае, 7з ф 0 и из той же оценки типа (2.74) выводим что снова приводит к (2.76). Доказанные леммы позволяют дать простое обоснование утверждений 1 и 2 в случае оп{А) an„i(A). Действительно, в этом случае в некоторой окрестности точки 7 = 0 тремя младшими сингулярными числами матриц Q(j) и 5(7) являются сингулярные числа блока Согласно (2.75), для точек 7 0В этой окрестности имеем Таким образом, в точке 7 = 0 нет даже локального максимума функции /(7) Фиксируем неотрицательные числа а и /3 и комплексное число /л, не равные нулю одновременно. Рассмотрим динамику сингулярных чисел матрицы 5(7) при движении от точки 7 = 0 вдоль луча Согласно (2.74), число сті(Тп) неограниченно возрастает с ростом t. Поэтому максимум функции / вдоль луча (2.80) достигается при значении t to, соответствующем точке пересечения графика o-i(Tn) с графиком младшего сингулярного числа одного из блоков Г, ( = 1,..., п — 1). Поскольку точка 7 глобального максимума является одновременно максимумом вдоль соответствующего луча, отсюда следует утверждение 2. Отметим, что сингулярные числа, значения которых совпадают в точке максимума, соответствуют собственным значениям Aj и Хп различного модуля. Это наблюдение будет использовано в разделе 2.4,4, Этот случай значительно сложнее предыдущего. Мы исследуем его вначале при дополнительном предположении: два собственных значения матрицы Д имеющие наименьший модуль, удовлетворяют условию Это означает, в частности, что Хп ф 0. Покажем, что при условии (2.81) существуют луч (2.80) и некоторая окрестность О точки t = 0 на этом луче, такие, что сг2(Гп) и J2(rn i) суть монотонно возрастающие функции от і в пределах О. Отсюда будет вытекать утверждение 1.

Действительно, для ненулевых і О имеем f(i) = тш{ст2(Гп), 72(Гп_і)} (0) = ?n-i{A) = /(0). Нам будет удобнее вместо самих чисел о-, (Гп) рассматривать их квадраты, являющиеся собственными значениями эрмитовой матрицы 2 л/Г Gn = Г Г„ = \а\Ч3 + (оМ + аМ ) + t2M M. Здесь Аналогичная интерпретация при необходимости применяется к сингулярным числам других блоков Г;. Для малых t справедливы представления где коэффициенты при линейных членах 1, 2, СУТЬ собственные значения эрмитовой матрицы Фиксируем положительные числа а, /3 и выберем число (м = х + гу так, чтобы det Я был отрицательным числом. Поскольку это равносильно тому, чтобы Нулевой след матрицы Н и отрицательность ее определителя вместе означают, что два из чисел 5х, 2- з положительны, а третье отрицательно. Отсюда следует, что при движении из нуля вдоль луча (2.80) два сингулярных числа клетки Гп возрастают, а третье убывает. Наложим на выбор числа fi еще одно ограничение, а именно Условие (2.81) обеспечивает, что система неравенств (2.82), (2.83) имеет решение ji = х + іу. Для соответствующего луча (2.80) сингулярные числа клетки Г„„і ведут себя так же, как для Ги, т.е. два из них возрастают, а третье убывает. В частности, (Гп-і), как и 72(ГП), растет с ростом t. Тем самым, утверждение 1 установлено. Предыдущие рассуждения относились к значениям t, принадлежащим окрестности О. Покажем, что и при дальнейшем продвижении вдоль луча (2.80) рост Т2{Тп) и Т2(Гп_і) продолжится по крайней мере до тех пор, пока графики этих чисел не пересекутся с графиком какого-либо из чисел З(ГІ)» « = 1,.-.,п- 2. Предположим противное; пусть, например, 02(ГП) имеет локальный максимум а\ при t = to, причем 02 не является сингулярным числом ни для одного из блоков Fj (г = 1,..., п — 2). U2 55 Повторяя для матрицы Гп те же рассуждения, какие в разделе 2.2 были применены к блочной матрице Qij), приходим к следующему заключению: существуют относящиеся к ст нормированные правый сингулярный вектор М Те же соображения применимы и к блоку Гп_і. Поэтому функция Дт) тт{о-2(Гп),сг2(Гп_і} возрастает вдоль луча (2.80), пока при некотором і = і0 график /(7) не пересечется с графиком некоторого числа аз(Гі), г = 1,... ,п — 2. Отметим, что в проведенном выше рассуждении локальный максимум функции Т2(Гге) может быть заменен ее локальным минимумом (лемма 2.6 справедлива для любого локального экстремума). Поэтому, если вдоль какого-то луча (2.80) Т2(ГП) убывает при t = 0 , то это убывание сохранится к в дальнейшем. На лучах этого типа, следовательно, глобальный максимум функции / достигаться не может. Он достигается на некотором луче рассмотренного ранее типа и, как вытекает из нашего анализа, а = /(7 ) есть кратное сингулярное число матрицы Q(j ). При этом сингулярные числа, значения которых совпадают в точке 7 соответствуют собственным значениям Хп и А$ (или An-i и Aj), і Є {1,...,и — 2}, различного модуля. Нам остается рассмотреть случай n-i \п- (2.88) В этом случае движение из нуля вдоль любого луча (2.80) с ненулевым \i не приводит к увеличению функции / по сравнению с Я0)=стп(А) = гп_і(А). (2.89) Действительно, одно из неравенств (2.82) и (2.83) будет нарушено и соответствующее сингулярное число 0 будет убывать вдоль луча. Оно и является значением функции /. Покажем, что, напротив, при движении по лучу 41= at, 72 = №, 73 = 0, а,0 О, (2.90) число 72(ГЯ) всегда будет больше числа (2.89), если і 0. Это же верно для о"2(Гп_і). В действительности, вдоль луча (2.90) блоки Гп-\ и Гп имеют одни и те же сингулярные числа, поскольку Gn-i — Г Г -і и Gn = Г ГП (с точностью до диагонального подобия) совпадают с одной и той же

Необходимые условия экстремума

Если подвекторьг у2 и zi векторов (3.10) линейно независимы, то из (3.12) следует: число — Ао является кратным собственным значением матрицы А. Но тогда тождество (3.9) выводится, как в первой части доказательства. Пусть векторы у2 и Z2 линейно зависимы, но хотя бы один, скажем, г/2, не равен нулю. Заменяя z подходящей линейной комбинацией векторов у и 3 можем считать, что z% = 0. В этом случае второе равенство (3.11) дает BlZl = 0, т.е., наряду с — Ао, матрица А имеет собственное значение AQ. Отсюда прежним образом выводится тождество (3.9). Пусть, наконец, уч = z% — 0. Тогда соотношения (3.11) сводятся к равенствам В\у\ — 0, B\Z\ = 0, причем векторы у\ и z\ линейно независимы. Таким образом, Ао есть кратное собственное значение матрицы Л, откуда снова следует (3.9). Лемма доказана. 3.3. Необходимые условия экстремума Перейдем теперь к исследованию свойств сингулярных векторов матрицы QxQ{l) в точке 7 локального экстремума функции /(7)) считая, что /(7) не равна нулю тождественно, т.е. = Пусть суть правый и левый сингулярные векторы матрицы Q\0(y ), отвечающие сингулярному числу а \ считаем, что ЦиЦг = Ц уЦг — 1- Векторы (3.14) удовлетворяют соотношениям (3.16) Лемма 3.3. Векторы (8.Ц) подчиняются соотношению (3.17) Доказательство фактически повторяет доказательство леммы 3 в [8]. Из равенств (3.15) и (3.16) следует, в частности, что и Умножая (3.18) слева на г; , имеем Умножая (3.19) слева на и\ и беря сопряжение от обеих частей полученного равенства, находим Вычитая (3.21) из (3.20), приходим к (3.17). Замечание. При Ло = 0 и в предположении (3.13) равенство (3.17) превращается в более простое соотношение (см. лемму 3 в [8]). Отметим, что в доказательстве леммы 3.3 не использовалось предположение о том, что 7 реализует локальный экстремум функции /(7) Следующее утверждение, приводимое без доказательства, есть лемма 5 из [8]. Лемма 3.4.

Пусть F y) — комплексная т х п—матрица, аналитически зависящая от вещественного параметра 7 на открытом множестве Г С R- Пусть k = min{m, п} и o i(j) 0 (7) суть упорядоченные сингулярные числа матрицы Р( у). Если для фиксированного і (1 і k) функция 04(7) имеет положительное значение 0 (7 ) в точке своего локального экстремума 7 , пго найдутся отвечающие числу 04(7 ) правый и левый сингулярные векторы и Є Сп и v Є Cm матрицы F(-y ), такие, что С помощью леммы 3.4 мы выведем для функции /(7) необходимые условия экстремума. Теорема 3.1. Пусть 7 0 — точка локального экстремума функции /(T)J Щичем /(7 ) = & 0- Тогда для матрицы QA0(7 ) найдутся нормированные сингулярные векторы (3.14), отвечающие числу т , такие, что При этом матрицы U = [щ и [ и V = [v\ г ] удовлетворяют соотношению Доказательство. Применяя лемму 3.4 к матрице QA0(T) ПРИ = 2п — 1, заключаем, что найдется пара нормированных сингулярных векторов (3.14), подчиненных соотношению Эта часть доказательства не отличается от первой части доказательства леммы 6 в [8]. Умножим обе части равенства (3.15) слева на (г — г ), что даст Равенство (3.16) умножим слева на {и{ — г ) и возьмем сопряжение от полученного соотношения; в результате найдем Вычитая (3.27) из (3.26), имеем Сличая мнимые части в равенстве (3.28) и учитывая, что у 0, получаем Вместе с (3.25) это приводит к равенству (3.23). Возвращаясь к (3.28), получаем Поскольку векторы и и v нормированы, выполняются соотношения Соотношения (3.32)-(3.34) дают матричное равенство (3.24). Теорема доказана. В этом разделе мы докажем формулу (3.4) для случая, когда локальный экстремум функции /(7) достигается в точке 7 0 Теорема 3,2. Пусть 7 0 — точка локального экстремума функции /(7), причем /(7 ) — с 0- Тогда Доказательство. В силу неравенства (3.2), для доказательства теоремы достаточно предъявить матрицу возмущения Д, такую, что и матрица К — Л + Д Є /Сл0, т.е. К имеет пару собственных значений (Ао, —До)

Пусть и и v — нормированные сингулярные векторы матрицы QxG{j ), найденные в теореме 3.1. Покажем, что подвекторы щ и и в (3.14) линейно независимы. Если допустить, что один из этих векторов, скажем, u i равен нулю, то, в силу (3.33), и v% = 0. Теперь из (3.16) выводим т.е. vi = 0 и, значит, v = 0, что невозможно. Предположим, что ненулевые векторы г і и и2 линейно зависимы: Тогда из (3.24) следует, что Подставляя (3.35) и (3.36) в (3.15), находим откуда и Подстановка (3.35) и (3.36) в (3.16) дает Отсюда и Поскольку при ненулевом 7 равенства (3.37) и (3.38) одновременно выполняться не могут, мы приходим к противоречию. Итак, векторы «1 И «2 линейно независимы. Определив матрицы U и У, как в теореме 3.1, положим Из матричного равенства (3.24) выводим, что [У7+І2 = 1 и, следовательно, ДІ2 — с - Далее, заметим, что где ег- — координатные векторы размерности 2. Поэтому

Похожие диссертации на О формулах малышевского типа для метрических матричных задач