# NumPy 練習  

## NumPy とは

> プログラミング言語 Python において数値計算を効率的に行うための拡張モジュールである。効率的な数値計算を行うための型付きの多次元配列（例えばベクトルや行列などを表現できる）のサポートを Python に加えるとともに、それらを操作するための大規模な高水準の数学関数ライブラリを提供する。([Wikipedia](https://ja.wikipedia.org/wiki/NumPy)より)  

---

In [None]:
# モジュールのインポート
import numpy as np

## NumPy の配列の基本操作  

Python 本体には `list` というクラス（以下リスト）がありますが、配列に相当するクラスはありません。リストは格納されている要素のクラスが同じでなくてもよく、気軽に要素を追加できるなどの柔軟性で利点がありますが、数値計算をするときの速度などの点では NumPy の `ndarray` クラスの方が優秀です。  その代わり、`ndarray` では各要素はすべて同じクラスである必要があります。

### リストから ndarray を作る numpy.array()  

1 次元の `ndarray` はリストと似ていますが、全ての要素が同じクラスであるという点が異なります。1 次元の `ndarray` は、下記のように `numpy.array()` を使うことで、リストから簡単に作れます。  

In [None]:
basic_array = np.array([1, 2, 3])
print(basic_array)
print(type(basic_array))

1 次元の `ndarray` の `i` 番目の要素にアクセスするにはリストと同様に `ndarray[i]` とします。ただし Python では、インデックスは `0` から始まるので、要素を順に「0 番目」「1 番目」と呼ぶことにします。2 次元配列の場合の「i 行目」「j 列目」の呼称も同様です。  

In [None]:
basic_array[1]

`ndarray` の形状はその属性 (プロパティ) を参照して、`ndarray.shape` で確認することができます。  

In [None]:
basic_array.shape

要素のクラスは、`ndarray.dtype.name` で確認することができます。  

In [None]:
basic_array.dtype.name

### 等差数列を要素とする配列を作る numpy.arange() と numpy.linspace()  

等差数列を要素とする配列を作るには `numpy.arange()`、`numpy.linspace()` を使います。  

`numpy.arange()` は公差を、`numpy.linspace()` は要素数を指定する点が異なります。それぞれ a"rr"ange、lin"e"space **ではない**ので注意💦  

In [None]:
# 0 から 3 (4 のひとつ手前) まで
arange_array_1 = np.arange(4)  
arange_array_1

In [None]:
# 2 から 3 (4 のひとつ手前) まで
arange_array_2 = np.arange(2, 4)  
arange_array_2

In [None]:
# 3 から 0.1 刻みで 4 の直前まで
arange_array_3 = np.arange(3, 4, 0.1)  
arange_array_3

In [None]:
# linspace() は始点と終点を必ず指定する
# 要素数を指定しない場合、自動で 50 要素となる
# 1 から 5 まで (5 を含む) 50 等分
linspace_array_1 = np.linspace(1, 5)  
linspace_array_1

In [None]:
# 1 から 5 まで (5 を含まない) 50 等分
linspace_array_2 = np.linspace(1, 5, endpoint=False)
linspace_array_2

In [None]:
# # 1 から 5 まで (5 を含む) 10 等分
linspace_array_3 = np.linspace(1, 5, 10)  
linspace_array_3

### 名前付き引数 dtype で配列の要素のクラスを指定する  

配列の要素のクラスは自動的に設定されますが、`numpy.array()` の名前付き引数 `dtype=` で明示的に指定することもできます。  

In [None]:
int_array = np.array([1, 2, 3])
int_array.dtype.name

In [None]:
float_array = np.array([1., 2., 3.])
float_array.dtype.name

In [None]:
converted_float_array = np.array([1, 2, 3], dtype="float64")
converted_float_array.dtype.name

### 多次元リストから多次元 ndarray を作る  

`numpy.array()` の引数に多次元のリストを渡すと、多次元の `ndarray` を作成することができます。  
2 次元 `ndarray` から要素を取り出すには `ndarray[i, j]` のようにします。もちろんインデックスは `0` から始まります。  
3 次元では、`ndarray[i, j, k]` です。  

`ndarray.shape` で `ndarray` の形 (各次元の要素数) を確認することができます。 

ndarray の次元と axis (軸) の方向との関係は以下の通りです。  

![関係](./pictures/ndarrayとaxisの関係.png)

`np.array()` に渡すリストの外側の `[ ]` から順に、次元のインデックス `0, 1, 2,…` が対応することになります。  

In [None]:
one_dim_list = [0, 1, 2, 3]

one_dim_array = np.array(one_dim_list)
print(one_dim_array)
print(one_dim_array.shape)

In [None]:
two_dim_list = [[0, 1, 2, 3], [4, 5, 6, 7], [8, 9, 10, 11]] # 2次元のリスト

two_dim_array = np.array(two_dim_list)
print(two_dim_array)
print(two_dim_array.shape)

In [None]:
two_dim_array[1, 2]

In [None]:
three_dim_list = [[[0, 1, 2, 3], [4, 5, 6, 7], [8, 9, 10, 11]], [[12, 13, 14, 15], [16, 17, 18, 19], [20, 21, 22, 23]]]

three_dim_array = np.array(three_dim_list)
print(three_dim_array)
print(three_dim_array.shape)

In [None]:
three_dim_array[1, 0, 2]

## スライシング  

### 与えられた配列の一部を取り出すスライシング  

与えられた配列の一部を取り出すには「スライシング」という仕組みを使います。1 次元の `ndarray` である `vec` に対して、`vec[i:j], v[i:], v[:j]` などとして一部の要素を抽出できるのはリストと同様です。  

`vec[i:j:step]` のようにすれば抽出のステップを指定することができ、インデックスを負の数にすれば要素の後ろから数えたインデックスを意味します。これらもリストの扱いと同様です。  

また、2 次元の `ndarray` については `mat[i:j, k:l]` のように、それぞれの次元のインデックスでのスライシングができます。

In [None]:
vec = np.array([1, 2, 3, 4])
vec

In [None]:
vec[1:3]

In [None]:
vec[2:]

In [None]:
vec[:3]

In [None]:
vec[::2]

In [None]:
vec[:-1]

In [None]:
# reshape() メソッドで形を変えることができる
mat = np.arange(9).reshape(3, 3)
mat

In [None]:
mat[1, 2]

In [None]:
mat[:2, :]

In [None]:
mat[:, 1:]

In [None]:
mat[0:3, 2]

## ndarray の要素の書き換え  

In [None]:
base_array = np.arange(45).reshape(5, -1)  # -1 を指定すると、その他の情報から適当な数にしてくれる
base_array

In [None]:
base_array[0, 0] = -1
base_array

In [None]:
base_array[2:5, 0] = -2
base_array

In [None]:
base_array[2:4, 5:7] = -3
base_array

In [None]:
base_array[4, 4:7] = [-4, -5, -6]
base_array

## ndarray の要素の条件による抽出  

In [None]:
# 比較した結果を真偽値とする ndarray が返る
base_array == -1

In [None]:
base_array < 0

In [None]:
# 比較した結果 True の要素のみを 1 次元の ndarray として抽出
base_array[base_array < 0]

### numpy.any() と numpy.all()  

`numpy.any()` は、引数として与えられた真偽値を要素とする `ndarray` の要素のうち、ひとつでも `True` があれば `Ture` を返します。  
`numpy.all()` は、引数として与えられた真偽値を要素とする `ndarray` の要素が、すべて `True` であれば `Ture` を返します。  

さらに、それぞれ `axis=` で指定することで、集計の軸 (方向) を指定して、真偽値を要素とする `ndarray` を返します。  

In [None]:
np.any(base_array < 0)

In [None]:
np.any(base_array < 0, axis=0)

In [None]:
np.any(base_array < 0, axis=1)

In [None]:
np.all(base_array >= 0)

In [None]:
np.all(base_array >= 0, axis=0)

In [None]:
np.all(base_array >= 0, axis=1)

### numpy.where()  

`numpy.where(ndarrayに対する比較式, Trueのときの値, Falseのときの値)` のように引数を与えると、比較した結果によって `ndarray` の要素の値を置き換えた、**新たな** `ndarray` を返します。  

In [None]:
np.where(base_array <= 0, 1, -1)

In [None]:
# 元の ndarray 自体は変わっていない
base_array

## ndarray の複製  

In [None]:
origin_array = np.array(range(10))
origin_array

In [None]:
# まずはベースの ndarray を代入したものを作り、
# 値を書き換えてみる
# ベースにも同じ変更が反映されている
assigned_array = origin_array

assigned_array[7] = 70

print("origin array:\t{}".format(origin_array))
print("assigned_array:\t{}".format(assigned_array))

In [None]:
# ベースの ndarray を copy() したものの場合
# ベースに変更の影響はない
copied_array = origin_array.copy()

copied_array[8] = 80

print("origin array:\t{}".format(origin_array))
print("copied array:\t{}".format(copied_array))

In [None]:
# スライスによって作られた ndarray についても同じ
sliced_array = origin_array[:5]
sliced_and_copied_array = origin_array[:5].copy()

print("sliced array:\t\t\t{}".format(sliced_array))
print("sliced and copied array:\t{}".format(sliced_and_copied_array))

In [None]:
sliced_array[0] = -1
sliced_and_copied_array[1] = 100

print("origin array:\t\t\t{}".format(origin_array))
print("sliced array:\t\t\t{}".format(sliced_array))
print("sliced and copied array:\t{}".format(sliced_and_copied_array))

## ndarray の要素の追加と削除

In [None]:
one_dim_array_1 = np.array([0, 1])
one_dim_array_2 = np.array([10])

In [None]:
# append() で末尾に追加
one_dim_array_1 = np.append(one_dim_array_1, 3)
one_dim_array_1

In [None]:
one_dim_array_2 = np.append(one_dim_array_2, [11, 12])
one_dim_array_2

In [None]:
# insert() で任意の場所に追加
one_dim_array_1 = np.insert(one_dim_array_1, 2, 2)
one_dim_array_1

In [None]:
one_dim_array_2 = np.insert(one_dim_array_2, 0, [100, 200])
one_dim_array_2

In [None]:
# delete() で任意の要素の削除 (-1 で末尾を指定している)
one_dim_array_1 = np.delete(one_dim_array_1, -1)
one_dim_array_1

In [None]:
one_dim_array_2 = np.delete(one_dim_array_2, np.s_[0:2])
one_dim_array_2

`np.s_[start:stop:step]` はスライス記法と同じものと考えてください。  

In [None]:
# concatenate() で ndarray 同士を連結
np.concatenate([one_dim_array_1, one_dim_array_2])

In [None]:
# hstack() で水平方向に連結
np.hstack([one_dim_array_1, one_dim_array_2])

In [None]:
# vstack() で垂直方向に連結
two_dim_array_1 = np.vstack([one_dim_array_1, one_dim_array_2])
two_dim_array_1

In [None]:
# concatenate() で axis を指定して 2 次元の ndarray を連結
two_dim_array_2 = np.array([[4, 5], [24, 25]])

np.concatenate([two_dim_array_1, two_dim_array_2], axis=1)

In [None]:
# numpy.newaxis を以下のように加えると ndarray に新たな次元を追加する
one_dim_array_1[:, np.newaxis]

In [None]:
one_dim_array_2[np.newaxis, :]

## 様々な ndarray の作成  

### numpy.zeros() と numpy.ones()  

あらかじめ決められた値の入った `ndarray` が必要なこともよくあります。要素が全部 `0` である行列は `numpy.zeros()` で、要素が全部 1 である行列は `numpy.ones()` で作れます。これらも `dtype=` で要素のクラスを指定できます。

In [None]:
zeros_array = np.zeros((3, 4))
zeros_array

In [None]:
ones_array = np.ones((3, 4))
ones_array

In [None]:
int_zeros_array = np.zeros((3, 3), dtype="int64")
int_zeros_array

### 特定の値で初期化されていない ndarray を作る numpy.empty()  

「中身は何でも構わないから、ただ配列の入れ物だけ用意して、要素は後で入れる」という場合、`numpy.empty()` を使います。これは、配列の入れ物を用意するだけで要素への設定は行わないので、配列の要素が何になるかは分かりません。たまたま配列のメモリ領域を確保したときに、そこにあった値がそのまま使われます。  

In [None]:
empty_array = np.empty((4, 3))
empty_array

### 乱数値を要素に持つ ndarray  

関数名|機能
-|-
`numpy.random.rand()`|0 以上 1 未満の一様分布から抽出した乱数
`numpy.random.uniform()`|任意の区間の一様分布から抽出した乱数
`numpy.random.randint()`| 任意の区間の一様分布から抽出した整数の乱数
`numpy.random.randn()`|標準正規分布 (平均 0, 標準偏差 1) から抽出した乱数
`numpy.random.normal()`|任意の平均、標準偏差の正規分布から抽出した乱数

In [None]:
# (疑似) 乱数を生成する際のシード値を指定することができる
# シード値を指定して生成した乱数は、毎回同じものとなる
# 追試、検証には便利
np.random.seed(0)

In [None]:
# 0 以上 1 未満の乱数 (一様分布)
print(np.random.rand())

rand_array = np.random.rand(2, 3)
print(rand_array)

# 本セルを上のセルに続けてはじめて実行した場合、以下の結果が出力されるはず
# 0.5488135039273248
# [[0.71518937 0.60276338 0.54488318]
#  [0.4236548  0.64589411 0.43758721]]

In [None]:
# 区間を指定した一様分布に従う乱数
print(np.random.uniform(0, 6)) # 区間[0, 6)の一様分布から抽出

uniform_array = np.random.uniform(0, 6, (5, 3))
print(uniform_array)

In [None]:
# 区間を指定した整数の乱数 (一様分布)
print(np.random.randint(0, 5))

randint_array = np.random.randint(0, 10, [2, 3])
print(randint_array)

In [None]:
# 平均 0 標準偏差 1 の標準正規分布に従う乱数
print(np.random.randn())

randn_array = np.random.randn(2, 3)
print(randn_array)

In [None]:
# 平均、標準偏差を指定した正規分布に従う乱数
print(np.random.normal(5, 2)) # 平均 5、標準偏差 2 の正規分布

normal_array = np.random.normal(-2, 3, (2, 3)) # 平均 -2、標準偏差 3 の正規分布の 2x3 配列
print(normal_array)

## ndarray を使った計算  

### 和を求める numpy.sum() と平均値を求める numpy.mean()  

和と平均値を求めるには `numpy.sum()`、`numpy.mean()` を使います。これらは名前付き引数 `axis=` を指定することで、どの方向に計算するかを指定でき、`axis=` の指定がない場合は全ての要素の和/平均値を計算します。

In [None]:
target_array = np.arange(20).reshape(5, 4)
target_array

In [None]:
np.sum(target_array)

In [None]:
np.sum(target_array, axis=0)

In [None]:
np.mean(target_array, axis=1)

`ndarray` に対する `sum()` メソッドや `mean()` メソッドを使うことで同様の結果を得ることができます。

In [None]:
target_array.sum()

In [None]:
target_array.sum(axis=0)

In [None]:
target_array.mean(axis=1)

### 最小値と最大値  

`ndarray` の最小値を求める `numpy.min()`、最大値を求める `numpy.max()` があります。  

また、最小値の**インデックス**を求める `numpy.argmin()`、最大値の**インデックス**を求める `numpy.argmax()` もあります。  

さらに、`sum()`、`mean()` と同様に `ndarray` に対するメソッドとしても使うことができます。

In [None]:
target_array

In [None]:
np.min(target_array, axis=1)

In [None]:
np.max(target_array, axis=1)

In [None]:
np.argmin(target_array, axis=1)

In [None]:
np.argmax(target_array, axis=1)

### 行列積を求める numpy.dot()  

`numpy.dot()` で、行列同士の積を下記の公式に沿って行うことができます。  

$${
\boldsymbol{A} = 
\begin{pmatrix}
a & b \\
c & d \\
\end{pmatrix},~
\boldsymbol{B} =
\begin{pmatrix}
e & f \\
g & h \\
\end{pmatrix} 
}$$

$${
\boldsymbol{A}  \boldsymbol{B} = 
\begin{pmatrix}
ae + bg & af + bh \\
ce + dg & cf + dh \\
\end{pmatrix}
}$$  

In [None]:
array_A = np.arange(1, 5).reshape(2, 2)
array_A

In [None]:
array_B = np.arange(5, 9).reshape(2, 2)
array_B

In [None]:
np.dot(array_A, array_B)

In [None]:
# 1次元配列 (ベクトル) 同士は内積計算を行う
vec_a = np.array([1, 2, 3])
vec_b = np.array([4, 5, 6])
np.dot(vec_a, vec_b)

In [None]:
# 1x2 行列 (ベクトル) と 2x2 行列の行列積
vec_c = np.array([10, 20])
np.dot(vec_c, array_A)

なお、Python 3.5 から追加された `@` 演算子は `numpy.dot()` と同じように作用します。  

In [None]:
# @ 演算子による行列積、ベクトル内積の計算
array_A @ array_B

In [None]:
vec_a @ vec_b

In [None]:
vec_c @ array_A

`numpy.dot()` や `@` ではなく、演算子 `*` を用いた場合は**同位置の要素ごとの積を計算します。**その他の四則演算も同様に同じ位置の要素同士に作用します。  
ただしこのような結果が得られるためには、次元数が同じ配列である必要があります。  

In [None]:
array_A * array_B

In [None]:
array_A + array_B

In [None]:
array_A - array_B

In [None]:
array_A / array_B

## NumPy のブロードキャスティング  

ブロードキャスティングとは、`ndarray` の全ての要素に、何らかの演算を作用させることを意味します。  

### NumPy における配列の四則演算  

In [None]:
array_C = np.arange(5)
array_D = np.arange(9).reshape(3, 3)

array_C

In [None]:
array_D

In [None]:
array_C + 1

In [None]:
array_C / 2

In [None]:
array_D - 2

In [None]:
# * による積算も同様
array_D * 4

### ユニバーサル関数  

NumPy では、四則演算に限らず、幾つかの関数でもブロードキャスティングが行えます。  

ただし全ての関数についてこのような操作ができるわけではありません。ブロードキャスティング可能な関数を「ユニバーサル関数」、または略して `ufunc` と呼びます。  
例えば以下のように、NumPy モジュールの関数である `numpy.exp()` を括弧を付けずに評価すると次のように `ufunc` と表示されます。  

In [None]:
np.exp

In [None]:
# numpy.exp() は自然対数 e のべき乗を返す
np.exp(1)  # = e^1

In [None]:
array_E = np.arange(6).reshape(2, 3)
array_E

In [None]:
np.exp(array_E)

その他、下記のような一般的に使用する数学関数もユニバーサル関数として提供されています。(一部抜粋)  

関数名|機能
-|-
`numpy.sin()/cos()/tan()`|三角関数
`numpy.sinh()/cosh()/tanh()`|双曲線関数
`numpy.arcsin()/arccos()/arctan()`|逆三角関数
`numpy.log()/log2()/log10()`|対数関数
`numpy.abs()`|絶対値

また、下記のような数学定数も関数として利用することができます。  

関数名|機能
-|-
`numpy.e()`|ネイピア数 $e$
`numpy.pi()`|円周率 $\pi$

### その他  

In [None]:
# 引数として与えられた ndarray の要素の差分を要素とする ndarray を返す
array_F = np.array([0, 1, 4, 9, 16, 25])
np.diff(array_F)

In [None]:
# 要素の累積和は…
np.cumsum(array_F)

In [None]:
# ndarray の転置
array_G = np.array([[0, 1], [4, 9], [16, 25]])
array_G.T

In [None]:
# 多次元の ndarray を 1 次元に変換
array_H = np.array([[0, 1], [4, 9], [16, 25]])
array_H.flatten()

## 補足資料  

この資料による説明は以上です。さらに詳しく知りたい場合は、  

- [NumPy](https://www.numpy.org/)  
- [8. NumPy 入門 — ディープラーニング入門：Chainer チュートリアル](https://tutorials.chainer.org/ja/src/08_Introduction_to_NumPy_ja.html)  
- [Pythonでの数値計算ライブラリNumPy徹底入門 - DeepAge](https://deepage.net/features/numpy/)  

などを参照してください。  