## NumPy

配列や行列計算などの数値計算を行うためのライブラリ。
裏ではC++で実装されているので早い（たぶん）

In [1]:
# numpyのインポート (numpy を np　と言う名前で読み込む) 
import numpy as np

In [3]:
# NumPy配列の生成
x = np.array([1.0, 2.0, 3.0])
y = np.array([2.0, 4.0, 6.0])
print('x + y:', x + y ) # 要素ごとの足し算
print('x - y:', x - y ) # 要素ごとの引き算
print('x * y:', x * y ) # 要素ごとの掛け算
print('x / y:', x / y ) # 要素ごとの割り算
print('x * 2:', x * 2 ) # スカラー値との計算

x + y: [ 3.  6.  9.]
x - y: [-1. -2. -3.]
x * y: [  2.   8.  18.]
x / y: [ 0.5  0.5  0.5]
x * 2: [ 2.  4.  6.]


In [8]:
# NumPyのN次元配列
# 一般に、1次元配列はベクトル、2次元配列は行列、3次元以上の配列はテンソルか多次元配列と言われる
A = np.array([ [1, 2], [3, 4] ])
print('A:\n', A, "\n")
print('A.shape:',A.shape) # (2, 2) は 2x2 の行列ということを意味する
print('A.dtype:',A.dtype)

B = np.array([ [3, 0], [0, 6] ])
print('A + B:\n', A + B, "\n")
print('A * B:\n', A * B,)

A:
 [[1 2]
 [3 4]] 

A.shape: (2, 2)
A.dtype: int64
A + B:
 [[ 4  2]
 [ 3 10]] 

A * B:
 [[ 3  0]
 [ 0 24]]


In [9]:
# 要素へのアクセス
X = np.array([ [51, 55], [14, 19], [0, 4] ])
print(X)
print(X[0]) # 0行目
print(X[0][1]) # (0, 1)の要素

# 各列へのアクセス
for row in X:
    print(row)

# 特定の条件の要素を取得
print( X > 15)
print( X[X > 15] )

[[51 55]
 [14 19]
 [ 0  4]]
[51 55]
55
[51 55]
[14 19]
[0 4]
[[ True  True]
 [False  True]
 [False False]]
[51 55 19]


In [10]:
# 行列演算
# 内積
A = np.array([ [1, 2], [3, 4] ]) # (2, 2)
B = np.array([ [5, 6], [7, 8] ]) # (2, 2)
print( np.dot(A, B) )

# ニューラルネットワークの内積
X = np.array([1, 2]) # 入力値 (2,)
W = np.array([ [1, 2, 5], [2, 4, 6] ]) # 重み (2, 3)
print( np.dot(X, W) ) # 出力値 (3,)

[[19 22]
 [43 50]]
[ 5 10 17]


## 便利メソッド

In [11]:
# arange(from, to, interval): from〜toまでをinterval刻みにした配列を作成
np.arange(1, 2, 0.1)

array([ 1. ,  1.1,  1.2,  1.3,  1.4,  1.5,  1.6,  1.7,  1.8,  1.9])

In [13]:
# argmax: 元も確率の高い要素のインデックスを取得
# (Softmaxの出力をOne Hotベクトルに変換するときなどに使用)
p = [0.2, 0.1, 0.3, 0.1, 0.2, 0.1]
np.argmax(p)

2

In [14]:
# choice: ランダム値を取得
# (ミニバッチのデータ取得などに使用)
np.random.choice(100, 5) # 0〜99の間からランダムに5つデータを取得

# 次のようにすれば、5つだけのミニバッチを作成できる
# X_mini = X[np.random.choice(100, 5)] 

array([31, 82, 51, 56, 34])

In [16]:
# randn: ガウス分布のデータを返す
# (重みの初期値とかに利用)
rand = np.random
rand.randn(5)

array([-0.86695341, -0.05363151,  0.54694436, -0.21320089,  0.48103334])