# numpyを使う
前節では、行列の基本的な演算をおこなう関数を一通り準備しました。Numpyは行列計算を含む、高度な数値計算を高速に行うライブラリで、これを使うと、行列計算の関数は自作する必要がまったくなくなります。(とはいえ、スキルを上げるためには、自分で書けたほうが良いです)

### ベクトル
numpyには、arrayと呼ばれる、リストに似たデータ形式があります。実際のところ、listは簡単にarrayに変換できます。

In [None]:
import numpy as np

L = [1.0,2.0,3.0]
vector = np.array(L)
vector

要素が0ばかりのarrayを作る便利な関数があります。

In [None]:
z = np.zeros(100)
z

arrayの一部分をとりだす方法は、listと同じです。

In [None]:
vector[1],vector[1:3]

しかし、演算子を使う時に、大きな違いがあります。list同士を足し算すると、長いリストになるのに対し、array同士を足すと、ベクトルの加算を行ってくれます。

In [None]:
L1 = [1,2,3]
L2 = [4,5,6]
print(L1+L2)

In [None]:
v1 = np.array(L1)
v2 = np.array(L2)
print(v1+v2,v2-v1)

ベクトルに定数を掛けることも可能です。

In [None]:
v1*10

ベクトル同士のかけ算をすると、どうなるでしょうか。

In [None]:
v1*v2

要素同士がかけあわされたarrayになりました。この要素を足しあわせれば、2つのベクトルの内積(dot product)が得られます。

In [None]:
sum(v1*v2)

ですが、これだと一見して何を計算しようとしているのかわかりにくいので、dot関数を使いましょう。

In [None]:
np.dot(v1,v2)

外積(cross product)はcross関数で計算できます。(外積って何だったか覚えていますか?)

In [None]:
np.cross(v1,v2)

これで、ベクトルの基本的な計算はすべてできることがわかりました。

### 行列
次に行列に挑戦します。2次元のリストをarrayに変換すると、行列として扱われます。

In [None]:
LX = [[1,2,3],
      [4,5,6],
      [7,8,9]]
LX

In [None]:
NX = np.array(LX)
NX

0ベクトルと同じように、0行列も簡単に作れます。

In [None]:
np.zeros((3,3))

単位行列もよく使います。

In [None]:
np.identity(3)

行列(あるいは多次元のarray)の要素を指定する時は、リストの場合よりも直感的な表記ができます。

In [None]:
print(LX[1])
print(NX[1])
print(LX[1][1])
print(NX[1,1])

また、多次元arrayを切り出す場合には、":"(コロン)を使った独特の記法が使えます。おなじことを多次元リストに対してやろうとすると、forループを書かざるをえません。

In [None]:
print(NX[1:3,1:3])
print(NX[0:2,2])

行列NXにベクトルを掛けてみます。

In [None]:
v = np.array([10,100,1000])
NX*v

これは妙な計算になってしまいました。では、dotなら?

In [None]:
np.dot(NX,v)

vと答の両方が縦ベクトルだと思えば、ちゃんと行列とベクトルのかけ算になっていることはわかると思います。

では、行列のかけ算を試してみましょう。

In [None]:
A = np.array([[1,1],
              [2,2]])
B = np.array([[3,4],
              [3,4]])
print(np.dot(A,B))
print(np.dot(B,A))

ちゃんと順序通りのかけ算ができることがわかりました。

行列を2乗すると?

In [None]:
A**2

だめでした。ベクトル同士を"\*"した時と同じように、要素ごとのかけ算になってしまいました。やはり、次のように書かないといけないようです。

In [None]:
np.dot(A,A)

転置行列はtranspose()関数で。

In [None]:
np.transpose(A)

行列式、逆行列も簡単です。numpyの拡張ライブラリlinalg(Linear Algorithm?)の中に、いろんな関数が準備されています。

In [None]:
A = np.array([[1,1],[1,2]])
B = np.linalg.inv(A)
d = np.linalg.det(A)
print(B)
print(np.dot(A,B))
print(np.dot(B,A))
print(d)

行列計算で、あと面倒くさいものといえば、固有値計算ですが、これもnumpyに組みこまれています。

ある行列Aに対し、次のような関係を満たす数$a$とベクトル$\vec{v}$を、固有値と固有ベクトルと呼びます。
$$A\vec{v}=a\vec{v}$$

In [None]:
A = np.array([[1,1],[1,2]])
np.linalg.eig(A)

eig関数は、2つの値を返すことがわかります。1つめのarrayは、2つの固有値を含んでいます。そして、2つめの2次元arrayには、対応する固有ベクトルが行列の形で含まれています。ただし、縦に入っているらしいので、個々のベクトルを取りだす時には一工夫必要です。

In [None]:
eigenvalues, eigenvectors = np.linalg.eig(A)
eigenvectors= np.transpose(eigenvectors)   #転置する
print(eigenvalues[0],eigenvectors[0])
#上の関係式を満たすかどうか確認する。
print(eigenvalues[0]*eigenvectors[0], np.dot(A,eigenvectors[0]))

数値計算では、通常のリストの代わりにnumpyのarrayを使うことをおすすめします。ベクトルや行列の計算が簡単にでき、プログラムがすっきりするというメリットの他に、計算が非常に高速になるというメリットもあります。

In [None]:
import numpy as np
import time

#リストLの各要素をx倍する。
def mul_list(L,x):
    ans = []
    for i in L:
        ans.append(i*x)
    return ans

#array Aの各要素をx倍する。
def mul_array(A,x):
    return A*x

L = list(range(1000000))
A = np.array(L)

#time()関数は現在の時刻(秒)を教えてくれます。
#関数を実行する前と後の秒の差をとると、実行時間がわかります。

#リストの場合
now = time.time()
mul_list(L,10)
print(time.time()-now)

#arrayの場合
now = time.time()
mul_array(A,10)
print(time.time()-now)



所要時間に30倍以上の差があることがわかりました。

データが大きくなればなるほど、numpyは威力を発揮します。ここでは、3次元の小さな行列やベクトルしか扱いませんでしたが、フーリエ変換や相関関数の計算も、つきつめれば超多次元のベクトルや行列の演算とみなせます。

最後に、少し変態的なnumpyの機能を紹介します。

まず、randomライブラリを使って、-1から+1の間の乱数を100個作り、array aに入れます。

In [None]:
import random
a = np.array([random.random()*2-1 for x in range(100)])
print(a)

arrayに対して定数の足し算やかけ算をすると、個々の要素に対して定数が足されたり掛けられたりしました。

それと同じように、arrayに対して比較演算子を使うと、個々の要素に対して比較が行われ、その結果が論理型(True or False)のarrayになります。

In [None]:
b = (a > 0)
print(b)

そして、aの引数を指定する代わりに、論理型のarrayを与えると、真(True)な要素だけを抽出できます。

In [None]:
c = a[b]
print(c)

途中の変数bやcを使わないで、次のように書いても同じように動作します。

In [None]:
print(a[a>0])

これも、大量のデータを操作するときには欠かせない機能です。この機能のおかげで、arrayを利用すると、forループ処理を書かなくてすみます。

### 練習問題1
次の覆面算を解いてみましょう。ただし、H=0とします。

1. O+N+E = 1
* T+W+O = 2
* T+H+R+E+E = 3
* F+O+U+R = 4
* F+I+V+E = 5
* S+I+X = 6
* S+E+V+E+N = 7
* E+I+G+H+T = 8
* N+I+N+E = 9
* T+E+N = 10
* ....

これは、一見複雑に見えますが、たんなる連立方程式の求解です。全部まとめて解くのは難しいので、この中で同じ変数が適度にまず、でてくる変数を並べると、

* 1.だけだと(O,N,E)
* 2までだと(O,N,E,T,W)
* 3までだと(O,N,E,T,W,R)
* 4までだと(ONETWRFU)
* 5までだと(ONETWRFUIV)
* 7までだと(ONETWRFUIVSX)
* 10までだと(ONETWRFUIVSXG)
* 14までだと(ONETWRFUIVSXGL)

で、14まで並べれば、変数の個数と方程式の個数が等しくなり、解けるかもしれないことがわかります。

連立方程式を解くことは、逆行列を求めることにほかなりません。

In [None]:
#              O N E T W R F U I V S X G L
A = np.array([[1,1,1,0,0,0,0,0,0,0,0,0,0,0],   #ONE
              [1,0,0,1,1,0,0,0,0,0,0,0,0,0],   #TWO
              [0,0,2,1,0,1,0,0,0,0,0,0,0,0],   #THREE
              [1,0,0,0,0,1,1,1,0,0,0,0,0,0],   #FOUR
              [0,0,1,0,0,0,1,0,1,1,0,0,0,0],   #FIVE
              [0,0,0,0,0,0,0,0,1,0,1,1,0,0],   #SIX
              [0,1,2,0,0,0,0,0,0,1,1,0,0,0],   #SEVEN
              [0,0,1,1,0,0,0,0,1,0,0,0,1,0],   #EIGHT
              [0,2,1,0,0,0,0,0,1,0,0,0,0,0],   #NINE
              [0,1,1,1,0,0,0,0,0,0,0,0,0,0],   #TEN
              [0,1,3,0,0,0,0,0,0,1,0,0,0,1],   #ELEVEN
              [0,0,2,1,1,0,0,0,0,1,0,0,0,1],   #TWELVE
              [0,1,2,2,0,1,0,0,1,0,0,0,0,0],   #THIRTEEN
              [1,1,2,1,0,1,1,1,0,0,0,0,0,0]])  #FOURTEEN
V = np.array([1,2,3,4,5,6,7,8,9,10,11,12,13,14])
print(np.linalg.det(A))

残念ながら、Aが特異行列らしく、逆行列が作れません。そこで、いろいろ試行錯誤した結果、#TWOの行を削り、代わりに#FIFTEENを追加すると、Aが特異行列でなくなることがわかりました。

In [None]:
#              O N E T W R F U I V S X G L
A = np.array([[1,1,1,0,0,0,0,0,0,0,0,0,0,0],   #ONE
#             [1,0,0,1,1,0,0,0,0,0,0,0,0,0],   #TWO
              [0,0,2,1,0,1,0,0,0,0,0,0,0,0],   #THREE
              [1,0,0,0,0,1,1,1,0,0,0,0,0,0],   #FOUR
              [0,0,1,0,0,0,1,0,1,1,0,0,0,0],   #FIVE
              [0,0,0,0,0,0,0,0,1,0,1,1,0,0],   #SIX
              [0,1,2,0,0,0,0,0,0,1,1,0,0,0],   #SEVEN
              [0,0,1,1,0,0,0,0,1,0,0,0,1,0],   #EIGHT
              [0,2,1,0,0,0,0,0,1,0,0,0,0,0],   #NINE
              [0,1,1,1,0,0,0,0,0,0,0,0,0,0],   #TEN
              [0,1,3,0,0,0,0,0,0,1,0,0,0,1],   #ELEVEN
              [0,0,2,1,1,0,0,0,0,1,0,0,0,1],   #TWELVE
              [0,1,2,2,0,1,0,0,1,0,0,0,0,0],   #THIRTEEN
              [1,1,2,1,0,1,1,1,0,0,0,0,0,0],   #FOURTEEN
              [0,1,2,1,0,0,2,0,1,0,0,0,0,0]])  #FIFTEEN
numbers = np.array([1,3,4,5,6,7,8,9,10,11,12,13,14,15])

np.linalg.det(A)

逆行列を使うと、それぞれの記号の値が直ちに一意に求まります。(多少の誤差は生じます)

In [None]:
O,N,E,T,W,R,F,U,I,V,S,X,G,L = np.dot(np.linalg.inv(A),numbers)
O,N,E,T,W,R,F,U,I,V,S,X,G,L

In [None]:
H=0
print(O+N+E)
print(T+W+O)
print(T+H+R+E+E)
print(F+O+U+R)
print(F+I+V+E)
print(S+I+X)
print(S+E+V+E+N)
print(E+I+G+H+T)
print(N+I+N+E)
print(T+E+N)
Z=6
print(Z+E+R+O)


確かにO+N+E=1になることがわかります。また、計算では省いたT+W+Oもちゃんと2になることがわかります。さらに、Zを適当に定めれば、Z+E+R+O=0も満たせます。

### 練習問題2
数字のリストが与えられた時に、その平均と分散をnumpyを使って求めて下さい。平均mと分散$\sigma^2$は次の式で定義されます。
$$m=\frac{1}{N}\sum_{i=1}^Nx_i$$
$$\sigma^2=\frac{1}{N}\sum_{i=1}^N(x_i-m)^2$$

In [None]:
x = np.array([ 0.22164031,  0.61727899,  0.3739398 ,  0.79191903,  0.52999859,
               0.75259054,  0.83869619,  0.37511643,  0.18840985,  0.26941082])

### 練習問題3
時間変化する信号を10回測定して、それぞれノイズののった測定値が得られた。これらを積算平均して、ノイズを減らしたい。

In [None]:
x = np.array([[ 0.01306063,  0.52318416,  0.6842348 ,  0.88659925,  1.43062419,
         1.65557941,  1.96092085,  2.11682415,  2.43555061,  2.45417248,
         2.76068272,  2.86108612,  3.0173588 ,  2.95329312,  2.98960379,
         3.26120876,  3.27238782,  3.08431247,  3.20790142,  2.98567376],
 [ 0.11384668,  0.42683156,  0.69887399,  1.03426265,  1.41374148,
         1.71369006,  1.69965929,  2.21541997,  2.33950939,  2.39870044,
         2.7403247 ,  2.68219194,  2.88680574,  2.96167865,  2.98542131,
         3.10429555,  3.1765024 ,  3.1214933 ,  3.20840224,  3.0101024 ],
 [ 0.05321219,  0.37241418,  0.81798184,  1.12045628,  1.3842116 ,
         1.54211121,  1.8723874 ,  2.18039462,  2.32535101,  2.40062611,
         2.74065761,  2.69438143,  2.82414584,  3.1442926 ,  3.05182578,
         3.0919835 ,  3.12119082,  3.27042575,  3.0548667 ,  2.91240206],
 [ 0.29958307,  0.48826081,  0.59821522,  0.95298047,  1.25393654,
         1.55158793,  1.79146239,  2.13168153,  2.34429752,  2.62020428,
         2.68890192,  2.75369354,  2.99650511,  3.12675426,  2.95744638,
         3.07042868,  3.13874391,  3.1175062 ,  2.9697316 ,  2.96604274],
 [  8.95486843e-04,   4.78099068e-01,   8.28350840e-01,
          1.12466287e+00,   1.31529180e+00,   1.53211768e+00,
          1.77580852e+00,   2.11289709e+00,   2.21203768e+00,
          2.37508200e+00,   2.68273514e+00,   2.79832837e+00,
          2.97237006e+00,   3.04740097e+00,   3.08015002e+00,
          3.24949769e+00,   3.05859623e+00,   2.99955393e+00,
          3.07468165e+00,   3.13141516e+00],
 [ 0.1546176 ,  0.34380903,  0.73875515,  1.17206458,  1.23962685,
         1.58828719,  1.74234345,  2.06950884,  2.33550848,  2.492627  ,
         2.58372354,  2.71208119,  3.03045237,  3.05116902,  3.19724291,
         3.18640899,  3.29753745,  3.04263655,  3.06478375,  2.98563735],
 [ 0.14197954,  0.45233175,  0.80051213,  1.01296238,  1.1692362 ,
         1.69775992,  1.75605971,  1.95864613,  2.21454585,  2.47220208,
         2.57415561,  2.70864983,  2.83899076,  3.11507708,  2.99158238,
         3.15628167,  3.02768404,  3.16362439,  3.14590727,  2.90096532],
 [ 0.15281607,  0.50981811,  0.85425746,  0.99499797,  1.28542632,
         1.60915566,  1.9310765 ,  2.14322098,  2.31923896,  2.64589036,
         2.78277593,  2.79802198,  2.86259494,  2.98234801,  2.98571814,
         3.18533329,  3.14515223,  3.12138175,  2.96030298,  2.86238004],
 [ 0.04645865,  0.31229686,  0.74050961,  1.09465264,  1.21385032,
         1.67470476,  1.72481892,  1.98010989,  2.28011651,  2.44438769,
         2.63112608,  2.69160678,  2.82627485,  3.17813874,  3.1101046 ,
         3.14887469,  3.05903264,  3.176241  ,  2.92505185,  3.11092727],
 [ 0.14853626,  0.46710442,  0.72931594,  0.92093626,  1.174658  ,
         1.70589293,  1.78431614,  1.9611697 ,  2.24361246,  2.51401689,
         2.60125842,  2.77471708,  2.948813  ,  3.07635662,  2.98824014,
         3.0481058 ,  3.24268459,  3.03588112,  3.13376977,  2.97784376]])