(annealing_paper_1998)=

# Сравнение квантовой и классической имитации отжига

Автор(ы):

- [Бурдейный Дмитрий](https://github.com/dmburd)


## Описание лекции

В этой лекции рассмотрим каноническую работу **Quantum annealing in the transverse Ising model**, опубликованную в 1998 году {cite}`kadowaki1998`. В ней двумя способами численно решается задача о нахождении основного состояния системы взаимодействующих спинов. Первый способ -- обычная классическая имитация отжига, второй -- имитация квантового отжига. Результаты применения этих подходов анализируются и сравниваются между собой.

## Постановка задачи

Итак, рассматривается одномерная система взаимодействующих спинов, которая описывается гамильтонианом Изинга (полностью аналогичным тому, который был представлен в [базовой лекции](../../problems/ru/ising.md) о модели Изинга):

$$
\hat{H}_{0} =
    -\sum_{i,j} J_{ij} \hat{\sigma}^{z}_i \hat{\sigma}^{z}_{j}
    - h \sum_{i} \hat{\sigma}^{z}_i,
$$

где $J_{ij}$ -- величины обменного взаимодействия для пар спинов, $h$ -- внешнее поле (оно направлено вдоль оси $z$ и потому называется продольным -- *longitudinal*). Требуется найти основное состояние гамильтониана $\hat{H}_{0}$, т.е. его собственное состояние, соответствующее его минимальному собственному значению.

Далее разберем численное решение этой задачи с помощью обычной классической имитации отжига (*simulated annealing*, SA для краткости) и с помощью квантовой имитации отжига (*quantum annealing* -- QA).


## Имитация квантового отжига (QA)

Как в [предыдущей лекции](../../dwave/ru/dwave.md) об аннилере D-Wave, добавляем к "целевому"  гамильтониану $\hat{H}_{0}$ (*problem Hamiltonian*) слагаемое, которое называется *tunneling Hamiltonian*:

$$
\hat{H}(t) =
    \hat{H}_{0} - \Gamma(t) \sum_{i} \hat{\sigma}^{x}_i
    = \hat{H}_{0} + \hat{H}_{tun}(t),
$$ (eqn:QA_Hamilt)

где $\hat{H}_{tun}(t)$ зависит от времени и отвечает за квантовомеханическое туннелирование между различными собственными состояниями гамильтониана $\hat{H}_{0}$. Оператор $\hat{H}_{tun}(t)$ соответствует приложенному внешнему магнитному полю вдоль оси $x$ (т.е. поперечному, *transverse*). Когда величина $\Gamma(t)$ очень велика по сравнению с $J_{i j}$ и $h$, собственное состояние гамильтониана $\hat{H}(t)$, соответствующее его минимальному собственному значению, представляет собой линейную комбинацию всевозможных состояний системы с приблизительно равными амплитудами вероятностей ориентации каждого спина вверх и вниз. Если достаточно медленно уменьшать $\Gamma(t)$ с очень большой величины до нуля, можно надеяться (в соответствии с адиабатической теоремой), что приведем систему в основное состояние гамильтониана $\hat{H}_{0}$.

В обсуждаемой статье в качестве примеров рассматриваются три различных закона изменения $\Gamma(t)$:

- $\Gamma(t) = \frac{c}{\ln(t+1)},$
- $\Gamma(t) = \frac{c}{\sqrt{t}},$
- $\Gamma(t) = \frac{c}{t},$

везде $t \in (0, +\infty)$ и $c = \textrm{const}$.

Квантовая динамика системы описывается нестационарным уравнением Шредингера

$$
i \frac{\partial}{\partial t} \ket{\psi(t)} =
    \hat{H}(t) \ket{\psi(t)}
$$ (eqn:Schrodinger_timedep)

Это уравнение решается численно (с помощью дискретизации по времени и применения конечно-разностной схемы) для небольшой системы (число спинов $N=8$). Измерить близость состояния $\ket{\psi(t)}$ к основному состоянию $\ket{g}$ гамильтониана $\hat{H}_{0}$ можно путем вычисления вероятности

$$
P_{QA}(t) = {\left| \braket{g | \psi(t)} \right|}^2
$$

```{admonition} Note
Основное состояние $\ket{g}$ для небольшого числа спинов можно найти точно, например, путем полного перебора.
```

Кроме того, можно рассмотреть так называемое [*квазистатическое приближение*](https://en.wikipedia.org/wiki/Quasistatic_approximation). Выберем какое-нибудь значение $\Gamma = \textrm{const}$ и решим задачу об основном состоянии $\ket{\psi_{\Gamma}}$ независящего от времени гамильтониана

$$
\hat{H}_{0} - \Gamma \sum_{i} \hat{\sigma}^{x}_i
$$

Следует ожидать, что при очень медленном изменении $\Gamma(t)$ вероятность

$$
P_{QA}^{st}(\Gamma) = {\left| \braket{g | \psi_{\Gamma}} \right|}^2
$$

будет близка к $P_{QA}(t)$ (имеется в виду, что значение $\Gamma$ соответствует значению $\Gamma(t)$). Отличие $P_{QA}(t)$ от $P_{QA}^{st}(\Gamma)$ говорит о том, насколько близко состояния системы при динамическом процессе отжига следуют за соответствующими "квазистатическими" состояниями.


## Классическая имитация отжига (SA)

В [лекции](../../problems/ru/copt.md), посвященной комбинаторной оптимизации, процесс имитации отжига описывался таким образом: выбиралось случайное начальное состояние, затем оно в цикле подвергалось случайной модификации, и новое состояние принималось или отклонялось в соответствии с некоторым критерием. В статье {cite}`kadowaki1998` принят другой подход к SA. Рассматривается так называемое [*основное кинетическое уравнение*](https://ru.wikipedia.org/wiki/Основное_кинетическое_уравнение) (англ. *master equation*). Оно описывает классический SA процесс, соответствующий нестационарному уравнению Шредингера {eq}`eqn:Schrodinger_timedep`. В нашем случае это система обыкновенных дифференциальных уравнений для вероятностей нахождения системы в различных состояниях $i$ в момент времени $t$:

$$
\frac{d P_i(t)}{d t} =
    \sum_j \mathcal{L}_{i j} P_j(t),
$$ (eqn:SA_master_eqn)

где $\mathcal{L}_{i j}$ -- вероятность перехода системы из состояния $j$ в состояние $i$ (при $j \neq i$) в единицу времени. Рассматриваются только элементарные переходы, сопровождающиеся изменением ориентации какого-либо одного спина (остальные спины при данном переходе не меняют ориентацию). Элементы матрицы переходов записываются следующим образом:

$$
\mathcal{L}_{i j} =
\begin{cases}
    \frac{1}{1 + \exp \left( \frac{E_i - E_j}{T(t)} \right) } & \quad (\text{single-spin transition}, j \neq i) \\
    -\sum_{k \neq i} \mathcal{L}_{k i} & \quad (j = i) \\
    0 & \quad \text{(otherwise)}
\end{cases}
$$ (eqn:L_trans_matr_elem)

Для первого условия правая часть в формуле {eq}`eqn:L_trans_matr_elem` соответствует [распределению Больцмана](https://ru.wikipedia.org/wiki/Распределение_Больцмана). Для понимания полезно проанализировать несколько предельных случаев:

- если $E_i < E_j$ и $\left| E_i - E_j \right| \gg T(t)$, то вероятность перехода $j \to i$ близка к 1;
- если $E_i > E_j$ и $E_i - E_j \gg T(t)$, то вероятность перехода $j \to i$ близка к 0;
- если $\left| E_i - E_j \right| \ll T(t)$, то вероятность перехода $j \to i$ близка к $1/2$.

Все случаи соответствуют интуитивным ожиданиям.

Во втором условии в {eq}`eqn:L_trans_matr_elem` сама сумма (без знака "минус") равна суммарной вероятности перехода из состояния $i$ во все остальные состояния. Так что эта сумма должна входить со знаком "минус" в выражение $\frac{d P_i(t)}{d t}$ для темпа изменения вероятности $P_i$ нахождения в состоянии $i$.

Третье условие в {eq}`eqn:L_trans_matr_elem` означает, что рассматриваем только перевороты одиночных спинов (*single-spin flip*) в качестве допустимых переходов между состояниями системы.

Зависимость температуры от времени выбирается равной $\Gamma(t)$:

$$
T(t) = \Gamma(t)
$$

Близость решения задачи SA к основному состоянию $\ket{g}$ гамильтониана $\hat{H}_{0}$ выражается величиной вероятности $P_g(t)$ найти систему в основном состоянии в момент времени $t$:

$$
P_{SA}(t) = P_g(t)
$$

Аналогично квантовому случаю, введем величину $P_{SA}^{st}(T)$, которая в квазистатическом приближении близка к $P_{SA}(t)$ (если величина температуры $T = T(t)$).


## Анализ и сравнение результатов

В статье обсуждаются численные результаты для $P_{SA}$ и $P_{QA}$ для различных конфигураций обменного взаимодействия и различных вариантов зависимости поперечного поля от времени. В всех случаях продольное внешнее поле выбрано постоянным: $h = 0.1$.

### Ферромагнитная модель

Здесь проводится численный эксперимент для ферромагнитной модели Изинга с $J_{i j} = \textrm{const}$ для всех пар спинов. Зависимости $T$ и $\Gamma$ от времени выбираются такими:

$$
\Gamma(t) = T(t) = \frac{3}{\ln(t + 1)}
$$

Результаты представлены на {numref}`QA_SA_fig_1`.

```{figure} /_static/dwave/ru/annealing_paper_1998/fig_1.png
:name: QA_SA_fig_1
:width: 500px

Зависимости $P_{SA}(t)$, $P_{QA}(t)$, $P_{SA}^{st}(T(t))$ и $P_{QA}^{st}(\Gamma(t))$ для ферромагнитной модели при $\Gamma(t) = T(t) = 3 / \ln(t+1)$.
```

Видно, что квазистатическое приближение работает очень хорошо, интересующие нас величины в динамическом процессе очень близки к вычисленным в равновесных условиях. Когда расписание отжига имеет вид $T(t) = c / \ln(t+1)$, гарантируется сходимость $P_{SA} \to 1$ при подходящем выборе константы $c$ (в статье {cite}`kadowaki1998` есть ссылка на соответствующую теорему). Выбор константы $c = 3$ достаточно произволен, но высокая точность приближенного равенства $P_{SA}(t) \approx P_{SA}^{st}(T(t))$ свидетельствует о том, что в рассматриваемом случае действительно $P_{SA} \to 1$ при $t \to +\infty$.

Для QA нет аналогичного точного утверждения о сходимости $P_{QA} \to 1$, но численные результаты для данного ферромагнитного случая при $\Gamma(t) = 3 / \ln(t+1)$ позволяют предположить такую сходимость.

Тот факт, что QA-кривая на {numref}`QA_SA_fig_1` всегда ниже SA-кривой, никакого значения не имеет, потому что в обеих задачах у нас все величины обезразмерены ($\hbar = 1$ в {eq}`eqn:Schrodinger_timedep` и единица времени $\tau = 1$ в {eq}`eqn:SA_master_eqn`) и никакого согласования при обезразмеривании в двух задачах нет.

Если уменьшать поперечное поле и температуру быстрее,

$$
\Gamma(t) = T(t) = \frac{3}{\sqrt{t}},
$$

то возникает качественное отличие QA и SA решений, см. {numref}`QA_SA_fig_2`.

```{figure} /_static/dwave/ru/annealing_paper_1998/fig_2.png
:name: QA_SA_fig_2
:width: 500px

Вид коэффициентов перекрытия для ферромагнитной модели при $\Gamma(t) = T(t) = 3 / \sqrt{t}$.
```

Видно, что решение квантовомеханической задачи лучше сходится к основному состоянию, чем решение классической задачи. Более того, SA-решение "застревает" в каком-то локальном минимуме с не очень малой вероятностью. На {numref}`QA_SA_fig_3` виден темп приближения $P_{QA}$ к 1 (на графике двойная логарифмическая шкала). Можно сделать вывод, что $(1 - P_{QA}) \propto 1/t$ в широком диапазоне $t$.

```{figure} /_static/dwave/ru/annealing_paper_1998/fig_3.png
:name: QA_SA_fig_3
:width: 500px

$(1 - P_{QA}(t))$ для ферромагнитной модели при $\Gamma(t) = 3 / \sqrt{t}$.
```

Если еще быстрее уменьшать поперечное поле и температуру,

$$
\Gamma(t) = T(t) = \frac{3}{t},
$$

то оба решения "застревают" в неосновных состояниях, как видно из {numref}`QA_SA_fig_4`.

```{figure} /_static/dwave/ru/annealing_paper_1998/fig_4.png
:name: QA_SA_fig_4
:width: 500px

Вид коэффициентов перекрытия для ферромагнитной модели при $\Gamma(t) = T(t) = 3 / t$.
```


### Фрустрированная модель

Здесь анализируется так называемая фрустрированная (*frustrated*) система, она изображена на {numref}`QA_SA_fig_5`.

```{figure} /_static/dwave/ru/annealing_paper_1998/fig_5.png
:name: QA_SA_fig_5
:width: 300px

Фрустрированная система спинов.
```

Сплошные линии обозначают ферромагнитное взаимодействие между спинами, пунктирная линия -- антиферромагнитное взаимодействие (сила которого по абсолютной величине равна силе ферромагнитного взаимодействия). Если в SA-задаче температура очень велика, то спины 4 и 5 меняют свою ориентацию с очень высокой частотой, так что взаимодействие спинов 3 и 6 посредством спинов 4 и 5 пренебрежимо мало. В этом случае прямое антиферромагнитное взаимодействие между спинами 3 и 6 оказывается доминирующим, поэтому наблюдается отрицательная корреляция между ориентациями спинов 3 и 6 (см. {numref}`QA_SA_fig_6`).

```{figure} /_static/dwave/ru/annealing_paper_1998/fig_6.png
:name: QA_SA_fig_6
:width: 500px

Величина корреляции спинов 3 и 6. Индекс `c` означает классическое решение (SA), индекс `q` означает квантовомеханическое решение (QA).
```

С другой стороны, при низкой температуре спины 4 и 5 стремятся принять определенную устойчивую ориентацию. В этом случае эффективное (непрямое) ферромагнитное взаимодействие между спинами 3 и 6 посредством спинов 4 и 5 примерно вдвое сильнее, чем прямое антиферромагнитное взаимодействие. Эти рассуждения подтверждаются положительной величиной корреляции $\braket{\sigma_3^z \sigma_6^z}_c$ при низких температурах ({numref}`QA_SA_fig_6`). Значит, спины 3 и 6 должны поменять взаимную ориентацию при некоторой промежуточной температуре.

Если поперечное поле в QA-задаче играет роль, аналогичную роли температуры в SA-задаче, то следует ожидать схожего поведения величины корреляции $\braket{\sigma_3^z \sigma_6^z}_q$ при изменении $\Gamma$. Здесь наблюдаемая $\braket{\sigma_3^z \sigma_6^z}_q$ вычисляется с использованием основного состояния гамильтониана {eq}`eqn:QA_Hamilt` при заданной $\Gamma$. Так и есть (см. пунктирную кривую на {numref}`QA_SA_fig_6`).

Если использовать расписание отжига

$$
\Gamma(t) = T(t) = \frac{3}{\sqrt{t}},
$$

то получаются результаты, изображенные на {numref}`QA_SA_fig_7`.

```{figure} /_static/dwave/ru/annealing_paper_1998/fig_7.png
:name: QA_SA_fig_7
:width: 500px

Вид коэффициентов перекрытия для фрустрированной модели при $\Gamma(t) = T(t) = 3 / \sqrt{t}$.
```

Обезразмеренное время $\tau = t T_c^2$ для SA-задачи и $\tau = t \Gamma_c^2$ для QA-задачи. Здесь $T_c$ и $\Gamma_c$ -- критические величины, при которых $\braket{\sigma_3^z \sigma_6^z}_c$ и $\braket{\sigma_3^z \sigma_6^z}_q$ переходят через ноль на графике {numref}`QA_SA_fig_6`. Видно, что квантовый отжиг лучше подходит для поиска основного состояния в такой системе.


### Модель со случайными взаимодействиями

Последний рассмотренный пример -- это модель спинового стекла, предложенная Шеррингтоном и Киркпатриком {cite}`sherrington1975`. Для всех пар спинов есть взаимодействие, сила которого является случайной величиной и семплируется из гауссова распределения с нулевым средним и с дисперсией $1/N$ (в нашем случае $N=8$). На {numref}`QA_SA_fig_8` показан типичный результат для эволюции коэффициентов перекрытия во времени при расписании отжига $\Gamma(t) = T(t) = 3 / \sqrt{t}$.

```{figure} /_static/dwave/ru/annealing_paper_1998/fig_8.png
:name: QA_SA_fig_8
:width: 500px

Вид коэффициентов перекрытия для модели Шеррингтона-Киркпатрика при $\Gamma(t) = T(t) = 3 / \sqrt{t}$.
```

Было проверено несколько реализаций для коэффициентов обменного взаимодействия (семплирование выполнялось из одной и той же функции распределения), результаты оказались качественно близкими. Графики на {numref}`QA_SA_fig_8` подтверждают, что для данной оптимизационной задачи квантовый отжиг подходит лучше, чем классический.


## Заключение

В этой лекции рассказали о канонической работе, в которой для модели Изинга рассмотрены классическая имитация отжига и квантовая имитация отжига, выполнен анализ и сравнение свойств решений в рамках этих двух подходов на нескольких примерах. Выяснилось, что:

- при одном и том же расписании отжига квантовый отжиг дает сходимость к основному состоянию с большей вероятностью, чем классический отжиг;
- для квантового случая система сходится к основному состоянию при расписании отжига $\Gamma = c / \sqrt{t}$, но не при более быстром уменьшении поперечного поля;
- для ферромагнитной модели при квантовом отжиге вероятность получения основного состояния ведет себя приближенно как $(1 - \frac{\text{const}}{t})$ на больших временах $t$.