<a href="https://colab.research.google.com/github/vitroid/PythonTutorials/blob/2021/1%20For%20beginners/7-3numpy.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

<!-- Advancedの050numpyの簡略版 -->

# numpyを使う Use numpy
Numpyは行列計算を含む、高度な数値計算を高速に行うライブラリで、これを使うと、行列計算の関数は自作する必要がまったくなくなります。(とはいえ、スキルを上げるためには、自分で書けたほうが良いです)
Pythonの実用的なライブラリ(画像処理、機械学習、統計など)のほとんどはnumpyをつかって作られています。もしnumpyがなかったなら、Pythonがここまで普及することもなかったと思います。


### ベクトル Vector
numpyには、arrayと呼ばれる、リストに似たデータ形式があります。違うのは、arrayには同じ種類のデータしか入れられない点です。実際のところ、実数のlistは簡単にarrayに変換できます。


In [None]:
import numpy as np

L = [1.0,2.0,3.0]
vector = np.array(L)
vector

データが混在していると?

In [None]:
D = [1.0, 12, "A"]
vector2 = np.array(D)
vector2

全部文字列にされてしまいました。

要素が0や1ばかりのarrayを作る便利な関数があります。


In [None]:
zero = np.zeros(10)
one = np.ones(10)
zero,one

arrayの一部分をとりだす方法は、listと同じです。


In [None]:
vector[1],vector[1:3]

しかし、演算子を使う時に、大きな違いがあります。list同士を足し算すると、長いリストになるのに対し、array同士を足すと、ベクトルの加算を行ってくれます。


In [None]:
L1 = [1.,2.,3.]
L2 = [4.,5.,6.]
print(L1+L2)

In [None]:
v1 = np.array(L1)
v2 = np.array(L2)
print(v1+v2,v2-v1,v2/v1,v2*v1)

ベクトルに定数を掛けることも可能です。


In [None]:
v1*10

numpyにあらかじめ準備されている各種関数(ufunc)を使うと、arrayのすべての要素に一気に関数を作用させることができます。

In [None]:
np.sin(v1)

ちなみに、arrayの代わりに数値のリストを与えても問題ありません。

In [None]:
np.sin(L1)

よくやる使い方は、等差数列を作るlinspaceやarangeとufuncを組みあわせて、グラフを描くという方法です。


In [None]:
# arangeはrangeに似ていますが、範囲と間隔に実数が使えます。
?np.arange

In [None]:
# 1以上3未満で0.5間隔の等差数列を生成する。
np.arange(1.0, 3.0, 0.5)

In [None]:
# こちらは間隔ではなくデータ点の数を指定します。
?np.linspace

In [None]:
# 1から10の間で等間隔に10点とる。
np.linspace(1.0, 10.0, num=10)

In [None]:
# xの値は0から10PIまで1000点
x = np.linspace(0, np.pi*10, 1000)
# yの値はsin(x)
y = np.exp(-x/100)*np.sin(x)

import pylab

pylab.plot(x,y)

ベクトル同士のかけ算をすると、どうなるでしょうか。


In [None]:
v1*v2

要素同士がかけあわされたarrayになりました。この要素を足しあわせれば、2つのベクトルの内積(dot product)が得られます。


In [None]:
np.sum(v1*v2)

ですが、これだと一見して何を計算しようとしているのかわかりにくいので、@演算子を使いましょう。


In [None]:
v1@v2

外積(cross product)はcross関数で計算できます。(外積って何だったか覚えていますか?)


In [None]:
np.cross(v1,v2)

関数の意味や引数の使い方がわからなくなったら、関数名の前に?を付けてヘルプを表示できます。

In [None]:
?np.cross

これで、ベクトルの基本的な計算はすべてできることがわかりました。


ちなみに、文字列データからarrayを作る簡単な方法があります。三連ダブルクオーテーションは、改行を含む長い文字列を定義したい時に使います。


In [None]:
s = """
1  2
3   4
5    6
"""
v = np.fromstring(s, sep=" ")
v

`fromstring()`は改行も空白と同一視し、一列のarrayに変換してしまいます。
これを、3行2列の行列(後述)にしたい場合は、`reshape`関数を使います。`reshape`はその名の通り、1次元(あるいは多次元)のarrayの形を変形して多次元arrayにしてくれます。


In [None]:
w=v.reshape((3,2))
w

`.shape`(これは関数ではありません)を次のように使うことで、その行列のshapeを知ることができます。このことからもわかるように、listとは違い、多次元のarrayでは、各行の長さはすべて等しくなければなりません。(listの場合は、`[[1,2],[3,4,5]]`のような長さの違う要素でも構いません。)


In [None]:
w.shape

もうすこし、arrayの操作を練習してみましょう。


In [None]:
v=np.array([1.,2.,3.,4.,5.])

1番目から3個の要素をとりだす方法はリストの場合と同じです。


In [None]:
v[1:1+3]

:を使った記法では、v[start:end]のほかに、v[start:end:interval]という書き方があります。
startが0の場合には省略できます。endが最後の要素の場合にも省略できます。
例えば、0番目から最後の要素まで、1つとばしで選ぶ場合は、v[0:5:2]あるいはv[::2]と書きます。


In [None]:
v[::2]

v[:]はvの全要素という意味で、vと同じ意味になります。


In [None]:
v[:]+10

In [None]:
v+10

例えば、ベクトルの要素の順番を逆にするにはどうしたらいいでしょうか?
リストの場合には、そのための特別な命令reverse()がありますが、numpyではそんなものがなくても簡単に逆順にできます。


In [None]:
v[::-1]

ほかにもいろんな書き方を試してみて下さい。


In [None]:
v[::-2]

In [None]:
v[-1:-3:-1]

In [None]:
v[1::2]

### 行列 Matrix
次に行列に挑戦します。2次元のリストをarrayに変換すると、行列として扱われます。


In [None]:
LX = [[1,2,3],
      [4,5,6],
      [7,8,9]]
LX

In [None]:
NX = np.array(LX)
NX

0ベクトルと同じように、0行列も簡単に作れます。


In [None]:
np.zeros((3,3))

単位行列もよく使います。


In [None]:
np.identity(3)

行列(あるいは多次元のarray)の要素を指定する時は、リストの場合よりも直感的な表記ができます。


In [None]:
print(NX[1])
print(NX[1,1])

また、多次元arrayを切り出す場合には、":"(コロン)を使った独特の記法が使えます。

In [None]:
print(NX[1:3,1:3])
print(NX[0:2,2])

行列NXにベクトルを掛けてみます。


In [None]:
v = np.array([10,100,1000])
NX*v

これは妙な計算になってしまいました。では、@演算子なら?


In [None]:
NX @ v

vと答の両方が縦ベクトルだと思えば、ちゃんと行列とベクトルのかけ算になっていることはわかると思います。


では、行列のかけ算を試してみましょう。


In [None]:
A = np.array([[1,1],
              [2,2]])
B = np.array([[3,4],
              [3,4]])
print(A @ B)
print(B @ A)

ちゃんと順序通りのかけ算ができることがわかりました。

行列を2乗すると?


In [None]:
A**2

だめでした。ベクトル同士を"\*"した時と同じように、要素ごとのかけ算になってしまいました。やはり、次のように書かないといけないようです。


In [None]:
A@A

内積演算子`@`はかけ算に似ていますが、`A@A`を`A@@2`とは書けないみたいです。

転置行列はtranspose関数か、または簡単に.Tで作れます。


In [None]:
np.transpose(A)

In [None]:
A.T

行列式、逆行列も簡単です。numpyの拡張ライブラリlinalg(Linear Algebra)の中に、いろんな関数が準備されています。

In [None]:
A = np.array([[1,1],[1,2]])
B = np.linalg.inv(A) # Aの逆行列
d = np.linalg.det(A) # Aの行列式
print(B)
print(A @ B)
print(B @ A)
print(d)

ほかにも、numpyの機能はたくさんありすぎて、全部を紹介することはできません。必要に応じてその都度説明していきます。

### 応用例1: 覆面算
次の覆面算を解いてみましょう。ただし、H=0とします。

Let's solve the following simultaneous equations.

* O+N+E = 1
* T+W+O = 2
* T+H+R+E+E = 3
* F+O+U+R = 4
* F+I+V+E = 5
* S+I+X = 6
* S+E+V+E+N = 7
* E+I+G+H+T = 8
* N+I+N+E = 9
* T+E+N = 10
* ....

これは、一見複雑に見えますが、たんなる連立方程式の求解です。全部まとめて解くのは難しいので、この中で同じ変数が適度にまず、でてくる変数を並べると、

It seems quite wierd, but it is just a normal simultaenous equation, so you can solve it with linear algebra. 

* 1.だけだと(O,N,E)
* 2までだと(O,N,E,T,W)
* 3までだと(O,N,E,T,W,R)
* 4までだと(ONETWRFU)
* 5までだと(ONETWRFUIV)
* 7までだと(ONETWRFUIVSX)
* 10までだと(ONETWRFUIVSXG)
* 14までだと(ONETWRFUIVSXGL)

で、14まで並べれば、変数の個数と方程式の個数が等しくなり、解けるかもしれないことがわかります。

連立方程式を解くことは、逆行列を求めることにほかなりません。

In [None]:
#              O N E T W R F U I V S X G L
A = np.array([[1,1,1,0,0,0,0,0,0,0,0,0,0,0],   #ONE
              [1,0,0,1,1,0,0,0,0,0,0,0,0,0],   #TWO
              [0,0,2,1,0,1,0,0,0,0,0,0,0,0],   #THREE
              [1,0,0,0,0,1,1,1,0,0,0,0,0,0],   #FOUR
              [0,0,1,0,0,0,1,0,1,1,0,0,0,0],   #FIVE
              [0,0,0,0,0,0,0,0,1,0,1,1,0,0],   #SIX
              [0,1,2,0,0,0,0,0,0,1,1,0,0,0],   #SEVEN
              [0,0,1,1,0,0,0,0,1,0,0,0,1,0],   #EIGHT
              [0,2,1,0,0,0,0,0,1,0,0,0,0,0],   #NINE
              [0,1,1,1,0,0,0,0,0,0,0,0,0,0],   #TEN
              [0,1,3,0,0,0,0,0,0,1,0,0,0,1],   #ELEVEN
              [0,0,2,1,1,0,0,0,0,1,0,0,0,1],   #TWELVE
              [0,1,2,2,0,1,0,0,1,0,0,0,0,0],   #THIRTEEN
              [1,1,2,1,0,1,1,1,0,0,0,0,0,0]])  #FOURTEEN
V = np.array([1,2,3,4,5,6,7,8,9,10,11,12,13,14])
print(np.linalg.det(A))

残念ながら、Aが特異行列らしく、逆行列が作れません。そこで、いろいろ試行錯誤した結果、#TWOの行を削り、代わりに#FIFTEENを追加すると、Aが特異行列でなくなることがわかりました。

In [None]:
#              O N E T W R F U I V S X G L
A = np.array([[1,1,1,0,0,0,0,0,0,0,0,0,0,0],   #ONE
#             [1,0,0,1,1,0,0,0,0,0,0,0,0,0],   #TWO
              [0,0,2,1,0,1,0,0,0,0,0,0,0,0],   #THREE
              [1,0,0,0,0,1,1,1,0,0,0,0,0,0],   #FOUR
              [0,0,1,0,0,0,1,0,1,1,0,0,0,0],   #FIVE
              [0,0,0,0,0,0,0,0,1,0,1,1,0,0],   #SIX
              [0,1,2,0,0,0,0,0,0,1,1,0,0,0],   #SEVEN
              [0,0,1,1,0,0,0,0,1,0,0,0,1,0],   #EIGHT
              [0,2,1,0,0,0,0,0,1,0,0,0,0,0],   #NINE
              [0,1,1,1,0,0,0,0,0,0,0,0,0,0],   #TEN
              [0,1,3,0,0,0,0,0,0,1,0,0,0,1],   #ELEVEN
              [0,0,2,1,1,0,0,0,0,1,0,0,0,1],   #TWELVE
              [0,1,2,2,0,1,0,0,1,0,0,0,0,0],   #THIRTEEN
              [1,1,2,1,0,1,1,1,0,0,0,0,0,0],   #FOURTEEN
              [0,1,2,1,0,0,2,0,1,0,0,0,0,0]])  #FIFTEEN
numbers = np.array([1,3,4,5,6,7,8,9,10,11,12,13,14,15])

np.linalg.det(A)

逆行列を使うと、それぞれの記号の値が直ちに一意に求まります。(多少の誤差は生じます)

In [None]:
O,N,E,T,W,R,F,U,I,V,S,X,G,L = np.dot(np.linalg.inv(A),numbers)
O,N,E,T,W,R,F,U,I,V,S,X,G,L

In [None]:
H=0
print(O+N+E)
print(T+W+O)
print(T+H+R+E+E)
print(F+O+U+R)
print(F+I+V+E)
print(S+I+X)
print(S+E+V+E+N)
print(E+I+G+H+T)
print(N+I+N+E)
print(T+E+N)
Z=6
print(Z+E+R+O)


確かにO+N+E=1になることがわかります。また、計算では省いたT+W+Oもちゃんと2になることがわかります。さらに、Zを適当に定めれば、Z+E+R+O=0も満たせます。

## 応用例2: 画像の編集

画像データは、巨大な行列とみなすこともできます。次の例では、白黒の画像ファイル(8ビットグレースケール、0が黒、255が白)をnumpyを使って操作します。


In [None]:
# ファイルから画像をnumpy arrayとして読みこむためのライブラリ
from skimage import io
# Google Colab上で画像を表示するためのライブラリ
from IPython.display import display

def Show(a):
    """
    2次元array aを画像として表示する。
    """
    from PIL import Image # 画像操作ライブラリ
    img = Image.fromarray(a)
    display(img)

あ = io.imread('https://github.com/vitroid/PythonTutorials/blob/master/2%20Advanced/%E3%81%82.png?raw=true')
print(あ.shape)
Show(あ)

### 画像の縮小

画像データは、100x100の巨大なarrayです。これを、行、列ともに1つおきに抽出することで、縮小します。

In [None]:
# 縦方向に1つおき、横方向には2つおきにデータをとりだして、小さい行列smallに入れる。
small = あ[::2, ::3]
Show(small)

### 左右反転

縮小するのと同じ要領で、データ順を逆にすると、左右を反転できます。

In [None]:
turn = あ[:, ::-1]
Show(turn)

### 階調の反転

画像データは0が黒、255が白です。画像を反転したい時には、これらを逆にします。

In [None]:
inverted = 255 - あ
Show(inverted)

下半分だけ反転するには、こんな風に書きます。

In [None]:
inv2 = あ.copy() #まずcopyを作る
# 50行目以降を、「あ」の反転におきかえる。
inv2[50:] = 255 - あ[50:]
Show(inv2)

もし、numpyの便利な機能がなかったなら、このような画像処理をするためには、長々とプログラムを書く必要があるでしょう。

## 今日の課題

画像「あ」に対して、以下のいずれかの処理を行うプログラムを書いて下さい。

1. 右半分だけ色を反転する。
3. 上下を反転する。
4. 対角線に関して反転する。(右上と左下がいれかわる)
5. 時計回りに90度回転する。
6. 横に40ピクセルずらす。(numpy.roll()を使います)
7. 背景(白)をグレーにする。
