# 第2回 その2: numpy ライブラリの解説
numpyライブラリはその1（02_01_graph.ipynb）でも紹介しましたが，ここでは numpy の使い方についてさらに詳しく説明します。  
次回からは本格的にデータの解析を行っていきますが，基本的には numpy を使って数値演算を行いますので，基本的な使い方を学んでおきましょう。

## ステップ1: データの型と定義方法  
02_01_graph.ipynb でも説明しましたが，numpy は特にベクトルや行列の演算で効果を発揮します。  
numpy を使ってベクトル・行列演算を行うためには，データを<font color="Red"> **ndarray**</font>というnumpy専用のデータ型で定義する必要があります。  
ndarray型データの定義方法としては，以下のような例があります。

### ベクトルの定義

In [None]:
# numpy ライブラリを np という名前で呼び出す。
import numpy as np

# array関数を使用する。
print('array関数を使用')
data = np.array([1.0, 2.0, 3.0])
print(type(data))
print(data)

# zeros関数を用いてゼロベクトルとして定義
data = np.zeros(3)
print('\nzeros関数を使用')
print(data)

# ones関数を用いて，全ての要素が1のベクトルとして定義
data = np.ones(3)
print('\nones関数を使用')
print(data)

# arange関数を用いて数列を定義（arange関数の使い方は，range関数(第1回参照)とほぼ同じです。）
data = np.arange(0, 3, 0.5) # 0から3まで0.5刻みのベクトルを作成
print('\narange関数を使用')
print(data)
data = np.arange(5) # 0から5までの1.0刻みのベクトルを作成
print(data)

### 行列の定義
行列の定義は以下のようにします。

In [None]:
# array関数を使用する場合
data = np.array([[1.0, 2.0, 3.0],[4.0, 5.0, 6.0]])
print('array関数を使用')
print(data)
# zeros関数を用いてゼロ行列を定義
data = np.zeros([2,3]) # [行数, 列数]で定義
print('\nzeros関数を使用')
print(data)
# ones関数を用いて定義
data = np.ones([2, 3]) # 使い方はzerosと同じ
print('\nones関数を使用')
print(data)

ベクトルの要素数は<font color="Red"> **`size`**</font>を用いて取得できます。  
行列のサイズは<font color="Red"> **`shape`**</font>を用いて取得できます。

In [None]:
data = np.zeros(15)
print('ベクトルの要素数をsize, shapeを使って取得')
print(np.size(data))
print(np.shape(data)) # shapeを用いた場合，要素数が行数の情報として得られます

data = np.zeros([4, 3])
print('\n行列の要素数をshape, sizeを使って取得')
print(np.shape(data))
print(np.size(data)) # sizeを用いた場合，全要素数が得られます。

行列の転置は`.T`を使用します。

In [None]:
data = np.array([[1.0, 2.0, 3.0],[4.0, 5.0, 6.0]])
print(data)
print(data.T)

## ステップ2: ベクトル・行列の基本演算
四則演算の例を以下に示します。以下の点がポイントです。  
* ベクトル同士，行列同士の四則演算は，「<font color="Red"> **要素ごと**</font>」に計算される。  
* ベクトル/行列とスカラーの四則演算は，ベクトル/行列の各要素とスカラーの演算が行われる。
* ベクトルと行列の演算は，行列の各行のベクトルと，ベクトルの要素ごとの演算が行われる。  
* 演算するベクトルと行列の次元数が合わない場合はエラーとなる。

まずはベクトル同士，行列同士の演算例です。

In [None]:
# ベクトル
vector_a = np.array([1.0, 2.0, 3.0])
vector_b = np.array([4.0, 5.0, 6.0])
# 行列
matrix_a = np.array([[1.0, 2.0, 3.0], [4.0, 5.0, 6.0]])
matrix_b = np.array([[7.0, 8.0, 9.0], [10.0, 11.0, 12.0]])

print(vector_a + vector_b)
print(vector_a - vector_b)
print(vector_a * vector_b)
print(vector_a / vector_b)

print(matrix_a * matrix_b)
print(matrix_a / matrix_b)

ベクトル/行列とスカラーの四則演算は，ベクトル/行列の各要素とスカラーの演算が行われます。 
``` 
2 * [1, 2, 3] = [2, 4, 6]  
2 * [[1, 2, 3],  
     [4, 5, 6]]  
  = [[2, 4, 6],  
     [8, 10, 12]]
```

In [None]:
# スカラー値
scalar = 2.0
# ベクトル
vector_a = np.array([1.0, 2.0, 3.0])
# 行列
matrix_a = np.array([[1.0, 2.0, 3.0], [4.0, 5.0, 6.0]])

print(vector_a * scalar)
print(matrix_a * scalar)

ベクトルと行列の演算は，行列の各行のベクトルと，ベクトルの要素ごとの演算が行われます。  
```
[1, 2, 3] * [[1, 2, 3],  
             [4, 5, 6]]
          = [[1, 4, 9],
             [4, 10, 18]]
```

In [None]:
# ベクトル
vector_a = np.array([1.0, 2.0, 3.0])
# 行列
matrix_a = np.array([[1.0, 2.0, 3.0], [4.0, 5.0, 6.0]])

print(vector_a * matrix_a)

`ndarray`型データの各要素へのアクセスはリスト（第1回参照）と同じです。  
スライシングも使用できます。

In [None]:
data = np.array([1.0, 2.0, 3.0])
print(data[0])
print(data[:2])

## ステップ3: numpyの便利な関数  
numpyには様々な関数が用意されており，それらを用いることで複雑な計算も簡単に書けるようになります。

平均値の計算には<font color="Red"> **`mean`**</font>を使います。  
行列を対象とする場合，引数にaxisを使用することで，計算する軸を指定できます。  
* `axis = 0`の場合，行方向に沿って平均値を計算します。  
* `axis = 1`の場合，列方向に沿って平均値を計算します。
* `axis`を指定しない場合は，行列内の全ての値の平均値を計算します。 

In [None]:
# ベクトル
vector_a = np.array([1.0, 2.0, 3.0])
# 行列
matrix_a = np.array([[1.0, 2.0, 3.0], [4.0, 5.0, 6.0]])

# 平均値
print(np.mean(vector_a))  # ベクトルの全要素の平均を計算
print(np.mean(matrix_a, axis=0)) # 行列の行方向に平均を計算
print(np.mean(matrix_a, axis=1)) # 行列の列方向に平均を計算
print(np.mean(matrix_a))         # 行列の全要素で平均を計算

標準偏差と分散の計算には<font color="Red"> **`std`**</font>および<font color="Red"> **`var`**</font>を使います。  
`mean`と同様に，行列を対象とする場合，引数にaxisを使用することで，計算する軸を指定できます。  


In [None]:
# ベクトル
vector_a = np.array([1.0, 2.0, 3.0])
# 行列
matrix_a = np.array([[1.0, 2.0, 3.0], [4.0, 5.0, 6.0]])

# 標準偏差と分散
print(np.std(vector_a)) # 標準偏差
print(np.var(vector_a)) # 分散
print(np.std(matrix_a, axis=0)) # axisの使い方はmeanと同じ
print(np.var(matrix_a, axis=0)) 

総和の計算には<font color="Red"> **`sum`**</font>を使います。  
`mean`と同様に，行列を対象とする場合，引数にaxisを使用することで，計算する軸を指定できます。  

In [None]:
# ベクトル
vector_a = np.array([1.0, 2.0, 3.0])
# 行列
matrix_a = np.array([[1.0, 2.0, 3.0], [4.0, 5.0, 6.0]])

# 総和
print(np.sum(vector_a))
print(np.sum(matrix_a, axis=0)) # axisの使い方はmeanと同じ
print(np.sum(matrix_a, axis=1)) 
print(np.sum(matrix_a))

最大値と最小値の計算には<font color="Red"> **`max`**</font>および<font color="Red"> **`min`**</font>を使います。  
また，<font color="Red"> **`argmax`**</font>および<font color="Red"> **`argmin`**</font>とすることで，最大値と最小値の場所を得ることができます。  
`mean`と同様に，行列を対象とする場合，引数にaxisを使用することで，計算する軸を指定できます。

In [None]:
# ベクトル
vector_a = np.array([1.0, 2.0, 3.0])
# 行列
matrix_a = np.array([[1.0, 2.0, 3.0], [4.0, 5.0, 6.0]])

# 最大と最小
print(np.max(vector_a))
print(np.max(matrix_a, axis=0)) # axisの使い方はmeanと同じ
print(np.min(matrix_a, axis=1))
print(np.min(matrix_a))

# 最大と最小の場所
print(np.argmax(vector_a))
print(np.argmin(vector_b))
print(np.argmax(matrix_a, axis=0))

ベクトルや行列の内積を計算するには，<font color="Red"> **`dot`**</font>を使用します。

In [None]:
# ベクトル
vector_a = np.array([1.0, 2.0, 3.0])
vector_b = np.array([4.0, 5.0, 6.0])
# 行列
matrix_a = np.array([[1.0, 2.0, 3.0], [4.0, 5.0, 6.0]])
matrix_b = np.array([[7.0, 8.0], [9.0, 10.0], [11.0, 12.0]])

# ベクトル同士の内積
print(np.dot(vector_a, vector_b))

# 行列同士の内積
print(np.dot(matrix_a, matrix_b))

# ベクトルと行列の内積
print(np.dot(vector_a, matrix_b))

## ステップ4: おわりに 
ここでは紹介しきれないほど，numpyには沢山の関数が用意されています。  
ベクトルや行列の処理でやりたい処理があれば，とりあえずインターネットで"numpy ○○"と検索してみるといいでしょう。 