<a href="https://colab.research.google.com/github/mzk8888/AI/blob/main/qa4u3_day1.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

pythonによるプログラミング開発ではpip installで必要なライブラリを準備してから始めます。
量子アニーリングマシンを用いた実験はアカウント登録をすると誰でもできるのですが、
１ヶ月間・1分のみの利用となります。
開催日時が1/31であることから初日はシミュレータであるOpenJijを利用させてもらいましょう。
ほとんどの機能がD-Wave Systems社のサービスと同じなのでほぼシームレスでD-Wave Systems社の量子アニーリングマシンに移行できます。
そのシミュレータの導入には、以下のおまじないコードを打ち出します。

In [None]:
pip install openjij

ご自身のローカル環境へインストールする際も同様の手順で差し支えありません。 （ただし環境によってうまくインストールできるかどうかはわかりませんので、適宜ご対応いただければと思います） これで量子アニーリングのシミュレーションを利用することができる準備が整いました。こちらは基本的に無料で無制限に利用できますから、初期検討や実験準備をする段階で活用してください。

## 量子アニーリングの目的

量子アニーリングは、「組合せ最適化問題」を解くために生まれた技術です！  
最適化問題と聞くと「うわ、数学だ…」と身構えるかもしれません。でも実は、これって中学・高校でやった「最大値・最小値を求めなさい」といった問題の発展版なんです。  

たとえば、将来の収入を予測する関数があれば、それを最大化したいですよね。逆に、将来の苦労を予測する関数なら、それを最小化して楽な人生を送りたい！  
こういった考え方を量子アニーリングでは、自然の力を利用して実現してくれるんです。

## 量子アニーリングによる「関数の最小化」

量子アニーリングでは、次のような関数の最小値と、そのときの最小値を与えるベストな「x」組み合わせを探してくれます。

\[
E({\bf x}) \sum_{i=1}^N \sum_{j=1}^N Q_{ij}x_ix_j
\]

「シグマ記号」をみて「なんかカッコイイ！でも難しそう…」と思った方、大丈夫です！要するに「全部足し算してるだけ」です。添え字は「考える要素が複数あるよ」ということを端的に表しているだけです。  

こういった関数を最小化する問題を、「制約なし2値の2次計画問題」と呼びます。英語だと **QUBO** (Quadratic Unconstrained Binary Optimization) といいます。  
この最小化の対象となる関数は「コスト関数」と呼ばれ、量子アニーリングにとってはいわば解決すべきお題のようなものです。

## 量子アニーリングマシンに命令を送る方法

量子アニーリングマシンに解かせたい問題を指示するには、「QUBO行列」というものを作って送ります。この行列は、問題の要素をギュッと詰め込んだ指令書のようなもの。量子アニーリングマシンは、この指令書を受け取って計算を始めます。  

ちなみに、このQUBO行列を作るときに使える便利ツールが **Python** のライブラリ「numpy」です。これを使えば、行列もサクッと準備できます！

## 簡単な問題を解かせてみよう！

問題を送るときは、先ほど紹介した **QUBO行列** を作って、それをカナダにある量子アニーリングマシンに送信するだけです。それの練習と思って今回はOpenJijによるシミュレータに投げてみましょう。

Python の **numpy** を使えば、行列作成はとっても簡単。まずはそうしたライブラリを利用するための準備です。importしましょう！


In [None]:
import numpy as np

次に簡単な例として、50×50行列によるQUBOを考えてみます。 np.random.randn()は、平均0、分散1のガウス分布に従う乱数を生成するという関数です。
それをN**2=25000個作ったのち、reshape(N,N)として、50×50の行列の形にします。

In [None]:
#変数の数を10個に指定します
N = 50
#QUBO行列を作ります
QUBO = np.random.randn(N**2).reshape(N,N)
#細かいことですが、対称行列にしましょう。
QUBO = (QUBO + QUBO.T)/2

ここでQUBO+QUBO.Tというところで、.Tというコマンドで転置をとっています。 行列の形を対称な形にするためです（細かいことですがたまに忘れます） どんな値になっているのか調べたい人はprint等を利用して調べてみると良いでしょう。

さてこうした下準備が終わりましたら、シミュレータに投入してみましょう。 これだけで準備完了です。

In [None]:
from openjij import SQASampler

**from openjij**とあるのはOpenJijから呼び出すということですね。
**import SQASampler**でSQASamplerという関数を呼び出しています。
このSQAという言葉が、シミュレーテッド量子アニーリング（Simulated Quantum Annealing）という意味でして、量子アニーリングのシミュレーション用の関数です。

In [None]:
sampler = SQASampler()

これでシミュレータの準備完了です。みなさんのQUBO行列をなんでも埋め込めるようになりました。それでは早速シミュレータに問題を投入しましょう。 以下のコマンドでOKです。その際にnum_readsで何回量子アニーリングを実行するのかを指定しましょう。

In [None]:
sampleset = sampler.sample_qubo(QUBO, num_reads=100)

このコマンドを実行すると、シミュレータ上ですが、量子アニーリングを実行します。一瞬で終わったかと思いますが、どんな結果が出てきたのかを確認してみましょう。そういうときにはsampleset.recordなどを打つと良いでしょう。

In [None]:
print(sampleset.record)

いくつか数値が並んでいますが、最初にある0,1のリスト（たくさんの数字の要素が並んでカッコでまとめられているもの）が結果です。
次にある数値がエネルギー、これはコスト関数の値が実際どのような値になるのかがわかると言うものです。次に出てくる整数値は何回その結果が出てきたと言うものです。

コスト関数がどのような値を取っていたのか、その頻度をプロットしたヒストグラムを描くのに便利です。エネルギーだけのリスト（numpy.array）を取得するためにはsampleset.data_vectors["energy"] を利用します。

In [None]:
ene = sampleset.data_vectors["energy"]

どんなエネルギーの値が、どれだけの頻度出現したのか、ヒストグラムを調べてみることにしましょう。
そうした結果のグラフ化に使うライブラリもPythonでは用意されていて、matplotlibを利用します。

In [None]:
import matplotlib.pyplot as plt

その上でplt.hist関数を利用すればヒストグラムを描くことができます。

In [None]:
plt.hist(ene, bins=20)
plt.show()

それではこれを残しておいて、別の条件でいくつか結果を出して比較してみましょう。
そのために結果を格納しておく辞書を用意します。

In [None]:
ene_dict = {}
ene_dict[1000] = ene

辞書はデータを複数格納しておくのに便利です。"default"という名前で指定したキーに紐づけられた各種データをそのまま残しておくことができます。


量子アニーリングでは実行時間によって、探索の範囲が変化していきます。じっくりゆっくりと長い時間をかけて行けば、多くの範囲が探索できますので精度が良くなります。逆に短ければあまり多くの範囲を探索できません。
その探索時間を変えるには、sample_quboのところでオプションを選択します。
num_sweepsで実行ステップ数（アニーリング時間）を変えることができます。
num_sweeps = 1000がデフォルト値ですので、そこから短くしてみましょう。

In [None]:
sampleset = sampler.sample_qubo(QUBO, num_sweeps= 10, num_reads=100)

結果の表示までまとめて実行してみましょう。

In [None]:
ene = sampleset.data_vectors["energy"]
plt.hist(ene, bins=20)
plt.show()

おそらく結果が異なる傾向にあると思います。

それでは次々に実行してヒストグラムを重ね打ちしてみることにしましょう。
次々に実行する条件をリストという形式で用意します。

In [None]:
num_sweep_list = [10,100,500]

この用意した数値をnum_sweepsに次々と代入して結果を表示することにします。
for文という繰り返し同じ作業をするためのプログラムを利用します。
その際にnum_sweep_listの中にあるもの（in）をnum_sweepとして順次利用するという書き方ができます。

In [None]:
for num_sweep in num_sweep_list:
  sampleset = sampler.sample_qubo(QUBO, num_sweeps= num_sweep, num_reads=100)
  ene = sampleset.data_vectors["energy"]
  ene_dict[num_sweep] = ene

せっかくですので重ねて比較してみましょう。 range=(min,max)で範囲を揃えて描くと綺麗に仕上がります。
凡例がわかるようにlabelの指定、そしてplt.legend()を利用しましょう。
ここでenedictにあるkeys（10,100,500,そして1000）利用してfor文の要素として使います。

In [None]:
for num_sweep in ene_dict.keys():
  plt.hist(ene_dict[num_sweep], bins=50, alpha=0.3, label=num_sweep)
plt.legend(loc='upper right')
plt.show()

num_sweepが長い方が低いエネルギーをとることがわかります。range(min,max)というオプションをつけて範囲を指定すると綺麗に揃ったヒストグラムが描けます。

## いくつかあるサンプラーとその設定
量子アニーリングのシミュレーションにおいては仮想的にコピーを用意する鈴木トロッター分解という計算手法を利用しています。そのコピーの数が多い方が量子系のシミュレーションとして正確です。そのトロッター数を指定することもできます。



In [None]:
ene_dict = {}
ene_list = []

trotter_list = [2,4,8,12,24,36,48]
for trotter in trotter_list:
  sampleset = sampler.sample_qubo(QUBO, num_sweeps= 10, trotter= trotter, num_reads=10)
  ene = sampleset.data_vectors["energy"]
  ene_dict[trotter] = ene
  ene_list.append(ene.mean())

デフォルトのトロッター数は4です。それ以外にもいくつかの例で調べてみましょう。
先ほどのlistを使って調べる方法を利用します。
さらにここでlistを使って複数の値を記録しておく方法を紹介します。ene_list =[]と言うからのリストを用意します。その空のリストにappend、追加していくことで結果を格納していくと言う方法です。
このように結果をリストで用意しておくと、グラフを描きやすいです。

In [None]:
plt.plot(trotter_list,ene_list)
plt.show()

この問題では大体4-12程度のトロッター数が良い答えを出しているように見えますね。
トロッター数はあくまで量子力学のシミュレーションの精度を上げるためには大きな数が必要であるということを言っていて、必ずしも最適化問題を解くためには大きい方が良いというわけではありません。

先ほどと同じようにヒストグラムを出すこともできます。

In [None]:
for trotter in ene_dict.keys():
  plt.hist(ene_dict[trotter], bins=20, alpha=0.3, label=trotter, range=(-160, -120))
plt.legend(loc='upper right')
plt.show()

この問題では大体4-12程度のトロッター数が良い答えを出しているように見えますね。
トロッター数はあくまで量子力学のシミュレーションの精度を上げるためには大きな数が必要であるということを言っていて、必ずしも最適化問題を解くためには大きい方が良いというわけではありません。

ちなみに量子アニーリングの名前の由来になったシミュレーテッドアニーリングというのもあります。
鈴木トロッター分解という手段は取らずに純粋に0と1をランダムにある基準に従って動かしていくというものです。使い方も簡単で計算時間も早いです。

In [None]:
from openjij import SASampler
sampler = SASampler()

samplerをSASamplerに切り替えるだけです。それ以外の部分は全く同様にしてできます。
トロッター数を変えた量子アニーリングのシミュレータと比較してみましょう。

In [None]:
sampleset = sampler.sample_qubo(QUBO, num_sweeps= 10, num_reads=10)
ene = sampleset.data_vectors["energy"]
ene_dict["SA"] = ene

In [None]:
for trotter in ene_dict.keys():
  if trotter == "SA":
    plt.hist(ene_dict[trotter], bins=20, alpha=1.0, label=trotter)
  else:
    plt.hist(ene_dict[trotter], bins=20, alpha=0.3, label=trotter)
plt.legend(loc='upper right')
plt.show()

こんな感じでSAは量子アニーリングのシミュレータSQAよりも最適化という観点では比較的良好な結果を出すことがあります。
これは量子アニーリングが悪いというわけではなく、そのシミュレータの動作機構の問題で、わざわざコピーを作ってシミュレーションをするしかないので、結構無理強いをしているということでもあります。
ただ素朴に最適化を目指すのであればSAで十分なこともあることに注意しましょう。

## わかりやすい例題で量子アニーリング！

それでは量子アニーリングの元々の出自でもある磁性体の模型であるイジング模型を例にシミュレーテッドアニーリングや量子アニーリングを実行してみましょう。

In [None]:
N = 50
Jmat = np.zeros([N,N])
for i in range(N):
  for j in range(N):
    Jmat[i,j] = -1/(2*N)

hvec = np.zeros(N)

ここで用意したのはJmatとありますが、相互作用を示す行列です。そしてもうひとつhvecは磁場を表すベクトルです。
１つ１つのスピンに何も磁場はかけず、互いに相互作用をしている様子を示しています。
これをシミュレーテッドアニーリングで冷やしてみましょう。


In [None]:
import dimod
model = dimod.BinaryQuadraticModel(hvec, Jmat, 0.0, vartype='SPIN')
qubo, offset = model.to_qubo()

こうやってJmatとhvecによるモデルの指定方法もあります。0,1で問題を考えるのか、それとも-1,+1で問題を考えるのかの違いがあります。どちらの形式であっても最終的にquboに直すことができます。

In [None]:
sampler = SASampler()

シミュレーテッドアニーリングではどこまで冷やすのか、という最後の温度を指定することができます。
そのオプションをbeta、逆温度というもので示します。
温度の逆数ですのでbeta=1/Tであることに注意してください。
最後の逆温度を指定する方法はbeta_maxを指定することでできます。

In [None]:
sampleset = sampler.sample_qubo(qubo, beta_max = 0.1, num_sweeps= 1000, num_reads=1)
binary = sampleset.record[0][0]
print(binary)

samplesetからはrecordを利用してスピンの向きを調べることができます。ここで出力は0,1になってしまいますので、ちょっと加工して±1に直します。

In [None]:
spin = 2*binary-1
print(spin)

この平均値と分散を調べることでスピンの全体的な様子を見てみましょう。

In [None]:
print(spin.mean(),spin.var())

ただ平均値を調べるとわかりますが、０付近であったりすると、あまり上下の傾向がはっきりしていないのだな、立ち上がっていないのだな、というのが伺えます。案外と揃っていません。
つまり逆温度0.1程度ですと温度で言うと10ですから、結構な熱の影響を受けていて、全体的にバラバラなんだなと言うことが伺えます。
このバラバラ度合いと、揃っている度合いを調べると変化がわかるでしょう。揃っているかどうかが大事なので向きを気にしない（±を気にしない)と言うことで二乗を計算しておくと良いでしょう。


これをいくつかの逆温度でしらべていきましょう。
いくつかの逆温度をリストで設定しようと考えますが、しかしそれを手打ちするのは大変ですから
np.linspaceを利用します。

In [None]:
beta_list = np.linspace(0.1,2.0,20)

これで0.1から2.0まで10個の数値のリストを作ることができます。

それぞれの逆温度において、シミュレーテッドアニーリングを用いて、その逆温度の状態をシミュレーションしてみました。

In [None]:
num_reads = 1000
mag_list = []
var_list = []

for beta in beta_list:
  m2_list = []
  sampleset = sampler.sample_qubo(qubo, beta_max=beta, num_sweeps= 1000, num_reads=num_reads)
  for k in range(num_reads):
    binary = sampleset.record[k][0]
    spin = 2*binary-1
    m2 = spin.mean()**2
    m2_list.append(m2)
  m2_array = np.array(m2_list)
  print(beta,m2_array.mean(),m2_array.var())
  mag_list.append(m2_array.mean())
  var_list.append(m2_array.var())

ある程度の時間が経過しましたけど、たくさんのデータをとることができました。

それではその結果をbetaごとにプロットしてみましょう。
matplotlibを利用して結果を表示することができます。

In [None]:
plt.plot(beta_list,mag_list)
plt.show()

分散を調べましたが、これは平均を調べた値がどれだけぶれているかの度合いですので、誤差棒としてプロットしておきましょう。分散に対してルートを取り、標本数N-1のルートで割るというのが誤差の計算方法です。

In [None]:
err = np.sqrt(var_list)/np.sqrt(num_reads-1)

In [None]:
plt.errorbar(beta_list, mag_list, yerr = err, fmt='o', markersize=5)
plt.show()

このようにして調べられた磁化（スピンの平均値）の２乗が急激に立ち上がっているのが観測されますね。
そのような現象を相転移といいます。
磁石の温度を変えると、バラバラな状態から綺麗に揃った状態に相転移するというわけです。
そうした現象を調べるのに、微視的なメカニズムを考慮したエネルギーを考えて、シミュレーションすると自然現象の結果を調べることができます。

量子アニーリングでは逆温度を変える代わりに横磁場というパラメータを変化させます。


In [None]:
sampler = SQASampler()

横磁場の値はgammaで指定されます。同じようにlistを組んで一斉に調べていくとしましょう。

In [None]:
gamma_list = np.linspace(0.1,0.9,20)

横磁場の制御のやり方は少し独特ですが、（横磁場の強さ、ステップ数）という数字をまとめたリストを用意します。横磁場の強さは0.0から1.0（ただし0.0が最も強く、1.0が最も弱い）で指定されます。
途中の値を大きくしたり小さくしたりスケジュールを組むこともできます。



In [None]:
num_reads = 1000
mag_list = []
var_list = []

for gamma in gamma_list:
  m2_list = []
  schedule_list = [(gamma, 0),(gamma, 1000)]
  sampleset = sampler.sample_qubo(qubo, schedule=schedule_list, num_reads=num_reads)
  for k in range(num_reads):
    binary = sampleset.record[k][0]
    spin = 2*binary-1
    m2 = spin.mean()**2
    m2_list.append(m2)
  m2_array = np.array(m2_list)
  print(beta,m2_array.mean(),m2_array.var())
  mag_list.append(m2_array.mean())
  var_list.append(m2_array.var())

同じように誤差棒をつけて結果をプロットしてみましょう。
同じように横磁場でも秩序が壊され、弱めると綺麗に揃う傾向が出ていることがわかります。つまり熱によるダイナミクスと同じように横磁場という重ね合わせの状態を誘発する作用でも同じように秩序を壊すことが確認できます。

In [None]:
err = np.sqrt(var_list)/np.sqrt(num_reads-1)
plt.errorbar(gamma_list, mag_list, yerr = err, fmt='o', markersize=5)
plt.show()

## ホップフィールド模型

最後に磁石のこうした秩序形成を利用した人工知能の元祖となるホップフィールド模型を紹介しましょう。
まずは手書き文字画像を準備してみます。

In [None]:
from sklearn.datasets import load_digits

In [None]:
digit=load_digits()

load_digit()で0-9の10種類の手書き文字による数字のデータセットを呼び出すことができます。
そのうちK個だけデータをピックアップしてみます。

In [None]:
K = 2
ind = np.random.choice(len(digit.data), K, replace=False)

このrandom.choiceで全てデータ数を最大値として、K個だけ番号を選び、その番号の画像を取り出すことができます。

In [None]:
data = digit.data[ind]

このデータを２値の白黒画像に直します。
そのために利用するのがnp.whereで、条件にはまる要素に、のちに続く値を返し、そうでない場合には続く数値を返す関数です。

In [None]:
binary_data = np.where(data > np.mean(data), 1, -1)

この結果を見てみれば、何が起きたかは一目瞭然かと思います。
ここでrange(K)は、K個の数値を羅列したlistを作成してくれます。

In [None]:
N = 8
for k in range(K):
  plt.imshow(binary_data[k,:].reshape(N,N))
  plt.show()

plt.imshow()で2次元の配列（行列）を渡すと数値に応じた画像表示をしてくれます。
さてこの画像をイジング模型を用いて記憶させましょう！

In [None]:
Jmat = np.zeros([N*N,N*N])
for k in range(K):
  for i1 in range(N):
    for j1 in range(N):
      for i2 in range(N):
        for j2 in range(N):
          Jmat[i1+N*j1,i2+N*j2] -= binary_data[k,i1+N*j1]*binary_data[k,i2+N*j2]/K

hvec = np.zeros(N*N)

1画素1画素をスピンであるとして、そのスピンがどうあるべきかをJmatに書き込むというやり方で画像を記録します。
これをquboに直してみます。

In [None]:
model = dimod.BinaryQuadraticModel(hvec, Jmat, 0.0, vartype='SPIN')
qubo, offset = model.to_qubo()

まずは一度これで画像が想起できるのか調べてみましょう。

In [None]:
sampleset = sampler.sample_qubo(qubo, num_reads=10)

いくつか量子アニーリングを実行してみたところ、うまく再現できているのか。その出力結果をいくつか出してみましょう。

In [None]:
for k in range(len(sampleset.record)):
  res_image = sampleset.record[k][0]
  plt.imshow(res_image.reshape(N,N))
  plt.show()

無事に出力できましたね。
さてこれはいくつまで記憶することができるのか？
などなど気になることがいっぱいありますね。
そこからニューラルネットワークの統計力学的な研究が始まったのです。