Содержание к диссертации
Введение
ГЛАВА 1. Экстремумы целевых функционалов на больших временах 18
1.1 Формулировка задачи 22
1.2 Градиент и гессиан целевого функционала 24
1.3 Отсутствие ловушек для неособых управлений 29
1.4 Длительность управления, обеспечивающая отсутствие ловушек 36
ГЛАВА 2. Экстремумы целевых функционалов на малых временах 40
2.1 Формулировка задачи 44
2.2 Существование ловушек на малых временах 44
2.3 Свойства гессиана целевого функционала 45
2.4 Доказательство основного утверждения 47
ГЛАВА 3. Экстремумы целевой функции в задачах управления с помощью измерений 55
3.1 Формулировка задачи 57
3.2 Оптимальное управление в двухуровневой системе 58
3.3 Асимптотика целевой функции 66
Заключение 68
Библиоггафия
- Градиент и гессиан целевого функционала
- Длительность управления, обеспечивающая отсутствие ловушек
- Существование ловушек на малых временах
- Оптимальное управление в двухуровневой системе
Градиент и гессиан целевого функционала
Двухуровневая квантовая система, то есть система, имеющая два различных состояния \ и 2 с энергиями \ 2, является наименьшим элементом для хранения информации в квантовых вычислениях. В квантовой информатике такой элемент получил название кубита. Одним из простейших примеров двухуровневой системы может служить электрон СО СПИНОМ = 1/2, взаимодействующий с внешним магнитным полем В. Эта система имеет два состояния, отвечающие двум проекциям спина на направление магнитного поля с энергиями \ = ±В/2. В качестве двухуровневой системы, реализующей кубит, могут выступать также пара оптических уровней энергии в атоме, состояния фотона с двумя различными поляризациями, два состояния, соответствующие двум различным фазам сверхпроводника, состояния ионов в ловушках и другие [26,36,41]. Для реализации квантовых алгоритмов необходимо обеспечить возможность управления отдельным кубитом, например, уметь создавать произвольное состояние кубита или произвольную унитарную эволюцию. Для достижения этих целей на кубит воздействуют с помощью внешнего управления , реализованного, например, как специальный лазерный импульс, небольшое напряжение и т.д. Под его воздействием целевой функционал достигает максимума, который соответствует желаемым значениям управляемых величин. Поэтому нахождение оптимальных управлений для двухуровневых квантовых систем является важным для квантовых вычислений.
Терминальная задача управления квантовыми системами формулируется как задача максимизации функционала вида (2) где \JT — оператор унитарной эволюции, описывающий изменение состояния системы на интервале времени [0,Т] под воздействием управления / Є Ll([0,T]; Ш), J- : U{n) — К. — некоторая функция на унитарной группе U(n). График целевого функционала J\j\ на пространстве управлений L fOjTjjIR) называется динамическим ландшафтом управления. График функции J-{U) на унитарной группе U(n) называется кинематическим ландшафтом управления. Важной проблемой в теории управления квантовыми системами является анализ динамического ландшафта управления целевого функционала J\j\. Представляет интерес проблема наличия локальных минимумов и максимумов у J\j\ которые не являются глобальными, так называемых ловушек. Более простой проблемой является анализ кинематического ландшафта функции J-{U), поскольку область определения этой функции является конечномерным многообразием, в то время как функционал J\j\ определен на бесконечномерном пространстве. В некоторых случаях проблема ловушек для динамического ландшафта функционала J\j\ сводится к аналогичной проблеме для кинематического ландшафта функции J-(U). В частности, для заданной точки это имеет место, если дифференциал отображения J : / — К. в этой точке имеет максимальный ранг, что основывается на общем утверждении, содержащемся в работе [58].
Теорема 1.1. Пусть функция F(x) определена на многообразии М. Пусть х = h(y), где у принадлежит многообразию N размерности dimM dimTV. Если якобиан отображения h имеет максимальный ранг в некоторой точке уо
Кроме того, если кинематический ландшафт функции J {U) содержит ловушки, то и динамический ландшафт функционала J\j\ их содержит, поэтому анализ кинематического ландшафта представляет самостоятельный интерес. По-видимому, впервые подобный анализ, связанный с изучением функций на конечномерных многообразиях, был проведен в работе Дж. фон Неймана [39], хотя и в другом контексте. Им изучались функции на унитарной группе U(n) вида J (U) := Tr[UAWB], где А и В — симметричные матрицы с невырожденным спектром, a U Є U(n) — произвольная унитарная матрица. Такие функции совпадают с важным классом целевых функционалов для замкнутых квантовых систем. Для них Дж. фон Нейманом было показано наличие ровно одного максимума и ровно одного минимума, для остальных стационарных точек было показано, что они могут быть только седловыми. В работе Р. Брокетта [21] аналогичный результат был доказан для произвольных ортогональных матриц О Є 0(п). В работе С.Дж. Глезера и соавторов [31] результаты двух предыдущих работ были обобщены на случай произвольных несимметричных матриц Л и В. В работах X. Рабица и соавторов [34,50,51] и в ряде других работ данный анализ был обобщен на случай матриц А и В, имеющих вырожденный спектр, и показана важность такого анализа для задач управления квантовыми системами.
Вышеперечисленные работы посвящены исследованию замкнутых квантовых систем. Кинематические ландшафты управления для открытых квантовых систем исследовались в работах [43,45,58]. В этих работах проблема ловушек была сведена к задаче исследования функций следов на комплексных многообразиях Штифеля и было показано, что в кинематических ландшафтах открытых квантовых систем ловушки отсутствуют.
На исследование проблемы ловушек большое влияние оказала работа X. Рабица, М. Хсиеха и К. Розенталя [50], в которой была высказана гипотеза об отсутствии ловушек для случая общего положения в задачах управления квантовыми системами. Однако авторы аргументировали свое предположение, основываясь на отсутствии ловушек в кинематическом ландшафте вероятности перехода F(U) = Вф ф(и) = (0?7 )2, U Є U(n), что недостаточно для обоснования утверждения об отсутствии ловушек в динамическом ланд-шафте функционала J\j\ = Рф фіїІ ).
Несмотря на большой интерес к этой проблеме, исследовать проблему ловушек в динамическом ландшафте целевого функционала J\j\ удалось только в некоторых частных случаях. Впервые отсутствие ловушек для динамического ландшафта в широком классе квантовых систем было доказано в [44]. В этой работе рассматривается система Ландау-Зинера, которая задается уравнением Шредингера
Длительность управления, обеспечивающая отсутствие ловушек
Эта система имеет ненулевое решение, только если f(t) = f0- Если f(t) j f0 для некоторого t, то эта система несовместна и предположение о линейной независимости (1.46) приводит к противоречию. Таким образом, для любого , такого что fit) 7 /о? матрицы I, V, [HQ,V\ и Et линейно независимы. Их унитарные преобразования I, UpVU(, Ut [Но,У]Щ и Up EtU также являются линейно независимыми матрицами. Они образуют базис Mat(2, С) и, таким образом, уравнения (1.43-1.45) вместе с условием -L(I) = 0 влекут Ь{А) = 0 для любой А Є Mat(2,C). Лемма доказана. Доказательство теоремы 1.4.
Градиент целевого функционала Jo\f\ согласно (1.29) определяется выражением = -iTr ( [Vup0}OT) = iTr (Vt[0T,Po] ) =Lo(Vt)- (1-47) Для любого критического управления, bJoj f = 0 и, таким образом, Lo(Yt) = 0. Также -Lo(I) = 0 в силу фазовой инвариантности функционала Jo\f\- Тогда лемма 1.4 влечёт, что Lo = 0. Анализ ландшафта целевого функционала Jo\f\ Для двухуровневой системы эквивалентен случаю, в котором оператор О является проектором. Действительно, для двухуровневой системы любой оператор О имеет представление О = Х\Р\ + Х2Р2, где Р\ и Р два ортогональных проектора, таких что Р\ + Р = I, и Ai, А2 два собственных значения. Тогда Trfp O] = Ai + (А2 — \\)Тх\ртР2\ и в невырожденном случае (Ai 7 2) все ловушки целевого функционала Тг[/)уО] соответству-ют ловушкам Тг[руР2]- Вырожденный случай Ai = А2 тривиален, так как в этом случае J\f\ = Ai для любых управлений / и ловушек не существует. Таким образом, не теряя общности, в дальнейших рассуждениях можно положить От = \ф)(ф\ для некоторого вектора \ф), \\\ф)\\ = 1. Обозначим через бо о и ио\ два собственных значения ро и рассмотрим невырожденный случай uj\ бо о, так как вырожденный случай UOQ = ио\ = 1/2 тривиален, в этом случае J\f\ = UOQ ДЛЯ любых управлений /. Обозначим вектор ортогональный к \ф) через \ф±) Рассмотрим оператор А = \ф±)(ф\. Равенство Ьо{А) = 0 влечет соотношение (ф±\ро\ф) = 0 и, таким образом, \ф) есть собственный вектор ро- Возможные собственные значения есть х о и бо 1, что соответствует глобальному минимуму (J7"111 = ( ІроІ ) = шо) и глобальному максимуму (i7ax = (ФІРоІФ) = і) целевого функционала, соответственно. Это единственные достижимые критические точки, кроме fit) = /о- Доказательство теоремы завершено.
В следующей теореме доказывается, что / /о не является ловушкой целевого функционала Jw[f\- Этот результат получен в работе [10]. Теорема 1.5. Пусть 2x2 унитарная матрица U/ для данного f Є L TjjK) подчиняется уравнению (1.6), где [HQ,V] 0. Тогда для любого Т 0, если f j /о, mo f не является ловушкой в задаче максимизации (минимизации) (1.8) целевого функционала Jw[f], заданного формулой для некоторого а ЕІ. Поскольку матрица е Y унитарная, то равенство (1.50) выполняется только в том случае, если все ее собственные значения равны единице. Тогда собственные значения егаУ по модулю равны единице. При этом если их знаки совпадают, то Jw достигает глобального максимума Jw = 1, а если их знаки различны, то Jw достигает глобального минимума Jw = 0. Доказательство теоремы завершено.
Особое управление /о не является ловушкой целевых функционалов Jo[f] и Jw[f\i если Т достаточно велико и ТгУ = 0, как устанавливается в следующей теореме. Этот результат получен в соавторстве в работе [10]. Отметим, что время Т должно быть достаточно велико также и для того, чтобы обеспечить управляемость системы.
Теорема 1.6. Пусть 2x2 унитарная матрица Щ для данного f Є L TjjK) подчиняется уравнению (1.6), где [HQ V] /OU TIV = 0. Тогда еслиТ То, гдеТо = тг/\\Но — (1/2)ТтНо + /оУ\\, то /о не является ловушкой в задаче максимизации (минимизации) (1.8) целевых функционалов Jo\f\ и Jw[f], заданных формулами (1.10) и (1.11).
Доказательство. Эволюция системы под воздействием управления fit) = /о + 9 гДе 9 — малая вариация, описывается уравнением Шре дингера где Н = Но + foV. Матрица Н может быть представлена в виде Н = Tv{H)I + L, где матрица L имеет нулевой след. Первое слагаемое пропорционально единичной матрице и может быть опущено. Второе слагаемое в соответствующем базисе может быть записано в виде: L = uooo Zi иоо 0. Здесь uz — одна из трёх матриц Паули. С помощью соответствующей перенормировки времени можно положить бо о = 1. Таким образом вместо уравнения (1.51) можно рассматривать эквивалентное уравнение
Проверка того, что /о не является ловушкой для системы с эволюцией, описываемой уравнением (1.51), эквивалентна проверке того, что f(t) = 0 не является ловушкой для системы с эволюцией, описываемой уравнением (1.52). Произвольная матрица потенциала взаимодействия может быть записана в виде V = vxax + vy(jy+ vzaz +vol. (1.53) Рассматривается нетривиальный случай v = v + vh 0. Оператор эволюции, определяемый нулевым уравнением f(t) = 0, имеет вид Щ = е гіс7г. Вводя угол ф = &rct&n(vy/vx), получаем Vt := Ut]VUt = vcos(2 - ф)ах - vsin(2 - ф)ау + vzaz + v0I. (1.54)
В дальнейшем оба функционала Jo и Jw будем обозначать через J, поскольку для обоих случаев последующие рассуждения одни и те же. Линейная функция L(X), X Є Mat(2,С) будет обозначать либо Lo(X), либо Lw(X). Формула (1.54) дает следующее выражение для градиента целевого функционала: = L(Vt) = v cos(2 - ф)Ь{(тх) - v sin(2 - ф)Ь{ау) + vzL(az). (1.55) /=/o Предположим, что vz j 0 или L(az) = 0. Если /о — критическая точка, то градиент SJ /Sf\f=f0 = 0 для любого t Є [0,Т], и тогда L(ax) = L(ay) = 0. L(I) = 0 для любого целевого функционала, инвариантного относительно фазовых преобразований. Таким образом, в этом случае L = 0 на Mat(2,C). Тогда по аналогии с доказательством леммы 1.4 заключаем, что управление / = /о не является ловушкой.
Существование ловушек на малых временах
Эволюция квантовой системы под воздействием измерений её состояния замедляется и в предельном случае непрерывной последовательности измерений прекращается. Это явление было названо Сударшаном (E.C.G. Sudarshan) и Мисрой (В. Misra) эффектом Зенона в [53] по аналогии с парадоксом «стрела» Зенона Элейского. Квантовый эффект Зенона был впервые предсказан в работах Л.А. Халфина [14,15]. Использование неселективных квантовых измерений для управления квантовыми системами изучалось в [2,42,43,52,56]. Также большое значение приобретает управление зацепленными квантовыми состояниями [33], квантовое управление с обратной связью [29,57] и управление в стохастическом пределе квантовой теории [17].
Пусть система находится в начальном состоянии с матрицей плотности ро и через промежутки времени Stk над системой производятся неселективные измерения состояния, то есть результат измерения не считывается [9]. Измеряемое состояние задается проектором Р таким, что ро = РроР. В [53] доказана следующая теорема.
Таким образом, в пределе непрерывного измерения система с вероятностью единица остаётся в состоянии Р на протяжении всего времени.
В [18,19] рассматривается обобщение этого результата. Пусть измеряется зависящий от времени проектор Pt = WfPWf , где Wt — унитарный опера 56 тор эволюции, удовлетворяющий некоторым условиям гладкости, а эволюция матрицы плотности такая же, как в предыдущем случае. Тогда справедливо следующее утверждение.
Пусть при каждом измерении матрица плотности преобразуется по правилу pt-o - pt+o = Mpt(pt-o) = PtfH-oPt + (I - Д)А-О(І - Pt), где Pt = WfPWf, а между измерениями — pt+o — pt+st = e %5tHpt+oei6tH. Тогда lim Ji[ptPt] = l. (3.2)
Таким образом, в каждый момент времени система находится в состоянии Pt с вероятностью единица, то есть система точно следует за изменением величины Pt. Это так называемый динамический эффект Зенона. Его можно интерпретировать как возможность управлять квантовой системой, заставляя её с помощью достаточно частых измерений следовать заданной траектории, определяемой проектором Pt. Более подробное изложение квантового эффекта Зенона и связанных с ним вопросов содержится в [6].
В работе [49] рассматривается система Ландау-Зинера, динамика волновой функции которой описывается уравнением Шредингера вида id - = (Aax-etaz)i/j(t), А 0, є 0. (3.3)
Для этой системы можно определить адиабатические энергетические уровни. Они далеко отстоят друг от друга при больших временах/: — ±оо. Переходы между ними с подавляющей вероятностью происходят, когда при t — 0 они сближаются. В [49] анализируется влияние неселективных измерений в заданные моменты времени на величину вероятности перехода из одного асимптотического состояния в другое. Найдены оптимальные моменты времени для измерений, которые максимизируют Собственная динамика двухуровневой квантовой системы описывается уравнением Шредингера = [Я.Р], (3.4) где Н — гамильтониан системы (эрмитова 2x2 матрица), р — матрица плотности системы (неотрицательная эту вероятность. 3.1 Формулировка задачи эрмитова 2x2 матрица с единичным следом). В силу уравнения Шредингера (9) матрица плотности/) преобразуется с помощью оператора унитарной эволюции Ut = е : р -+ Щр) := UtpUl (3.5)
Кроме собственной динамики, задаваемой гамильтонианом Н, состояние квантовой системы преобразуется под воздействием неселективных измерений наблюдаемой Q по следующему правилу: Р МЯ(р):= РгрРг- (3.6) Здесь Р{ — проекторы на собственные подпространства измеряемой наблюдаемой Q, входящие в её спектральное представление Q = 2ІЯІРІ- Совместно неселективные измерения величин Qk в моменты времени tk и унитарная эволюция на временных отрезках [&,&+1] определяют следующее преобразование матрицы плотности: pN = UNo MQNO UN_io ... о MQl о UQ (ро). (3.7) Здесь Uk(p) = Utk+1kpUjk t , to = 0 — начальный момент времени и tN+i = Т — конечный момент времени, ро — матрица плотности начального состояния системы.
Рассматриваемая задача заключается в максимизации квантового среднего целевой наблюдаемой О в конечный момент времени Т на множестве, состоящем из последовательностей наблюдаемых Qi, QN ТО есть максимизации функции JN[Qh...,QN]:=Ti[pN0}. (3.8) Цель управления состоит в том, чтобы найти оптимальные наблюдаемые Qi ,... , QN , которые максимизируют целевую функцию:
В лабораторных условиях часто достаточно сложно проводить большое количество измерений за время, в течение которого система хорошо изолирована от внешних воздействий. Возникает вопрос: насколько можно приблизиться к описанной в [53] идеальной ситуации с помощью конечного числа измерений? Основная теорема 3.5 этой главы дает оценку для оптимального управления квантовой системой с помощью фиксированного числа измерений.
Общая задача оптимального управления, описанная в разделе 3.1, сводится к аналогичной задаче с тривиальной динамикой, то есть с нулевым гамильтонианом, как утверждается в следующей теореме.
Оптимальное управление в двухуровневой системе
В лабораторных условиях часто достаточно сложно проводить большое количество измерений за время, в течение которого система хорошо изолирована от внешних воздействий. Возникает вопрос: насколько можно приблизиться к описанной в [53] идеальной ситуации с помощью конечного числа измерений? Основная теорема 3.5 этой главы дает оценку для оптимального управления квантовой системой с помощью фиксированного числа измерений.
Общая задача оптимального управления, описанная в разделе 3.1, сводится к аналогичной задаче с тривиальной динамикой, то есть с нулевым гамильтонианом, как утверждается в следующей теореме.
Пусть а — матрица плотности, Q — эрмитова матрица, Qi,..., QN — наблюдаемые. Пусть — максимум целевой функции при отсутствии свободной эволюции системы, Qi ,... , Q — оптимальные наблюдаемые при отсутствии свободной эволюции системы, и р = UN О UN-I О О Ыо(ро) — матрица плотности в конечный момент времени при отсутствии измерений. Тогда
В этой формуле сделан переход от максимума по переменным Q\,.. . , QN К максимуму по переменным Qi, QN ЧТО даёт эквивалентный результат, так как этот переход — биективное отображение. Теорема доказана.
В двумерном случае произвольная наблюдаемая Q = q\P + (I — Р) задаётся одним проектором Р = — [I + а сг], где а = 1. Соответственно, к-я измеряемая величина Qk определяется проектором Р = — [I + а& сг], где а& = 1. Теорема 3.4 описывает изменение матрицы плотности под воздействием N неселективных измерений -Mgfc, к = 1,... , N. Теорема Доказательство. При однократном измерении величины, которая соответствует проектору Р, матрица плотности р испытывает преобразование р = МР(Р) = РрР + (1 - Р)р(1 -Р) = Р- [Р[Р,р}}. (3.15) Пусть вектор а соответствует матрице р = — [I + а сг], а вектор аі соответ ствует проектору Р = — [I + ai сг]. Используя выражение для коммутатора матриц Паули [ 7/, 7т] = 2ієітк(ік, где єітк — символ Леви-Чивиты, получим
Следующая основная в этой главе теорема 3.5, доказанная в работе [44], описывает выражения для наблюдаемых, которые доставляют глобальный максимум целевой функции в задаче управления с помощью измерений для любого фиксированного числа измерений.
Теорема 3.5. Пусть состояние системы преобразуется согласно (3.7), О = А-П+А-сг, Н = ho-1+h-a и рт = ИтРоЩ = [І+а-сг]. В моменты времени tk} к = 1,... ,N делаются неселективные измерения наблюдаемых Qk. Тогда выражения для оптимальных наблюдаемых Qkp , которые доставляют максимум целевой функции (3.8) в задаче максимизации (3.9), имеют вид popt
Доказательство. В соответствии с Теоремой 3.3, сначала рассмотрим задачу без собственной динамики. С помощью формулы (3.14) целевая функция JN[QII QN] = Tr[A выражается через параметры измеряемых наблюдаемых ai,... , адг следующим образом: JN[a.h,aw] = Л + (Л aw)(aw aw_i)... (а: а). (3.22) Для удобства обозначим ао = а/а, адг+і = Л/Л и будем предполагать, что индекс і пробегает значения от 1 до N. Случаи Л = 0, адг+і = 0 или (а& а -і) = 0 для некоторого к = 1,..., N + 1 рассмотрим отдельно.
С помощью метода неопределённых множителей Лагранжа можно доказать, что максимум функции 7дг[ai,... , адг] на множестве ai = 1, а.21 = 1, a/v = 1 достигается, когда все векторы a, ai,..., адг, Л принадлежат одной плоскости. Действительно, рассмотрим функцию Лагранжа
Из (3.25) следует, что каждый вектор а является линейной комбинацией двух соседних векторов aj__i и а _і. Поэтому любые три вектора с последовательными индексами принадлежат одной плоскости, а следовательно, и все векторы ац лежат в общей плоскости. Умножая (3.25) сначала Haaj+i(aj а _і), затем на aj_i(aj+i а ) и вычитая полученные выражения одно из другого получим
Теперь покажем, что другие векторы, удовлетворяющие условиям (3.25-3.28), соответствуют меньшем значениям целевой функции. Рассмотрим последовательность чисел (адг+1-адг), (aj-aj_i),... (ai-ao). Если не все элементы этой последовательности положительны, то применим к векторам а следующее преобразование. Пусть і — наименьший индекс, для которого (а а _і) 0. Заменим вектор а на — а . При этом соотношения (3.25-3.28) сохранятся, а значение целевой функции не изменится. Продолжая последовательно применять это преобразование, через конечное число шагов придем к последовательности, в которой все элементы положительны, кроме, возможно, (адг+і адг). Если (адг+і адг) 0, то величина целевой функции J будет меньше, чем в формуле (3.30), поскольку по построению Vi (д.і -aj_i) 0. Таким образом, остается рассмотреть случай (а.к а&_і) 0, к = 1,... ,N + 1. В этом случае условия (3.26) принимают вид cos tpk = cos(/?i или ц = ±(/?i. Из формулы (3.28) получаем выражение для tp\.
123