# 8. NumPy 入門

## 8.1. NumPy を使う準備

In [1]:
# これは言うまでもない
import numpy as np

## 8.2. 多次元配列を定義する

In [2]:
# ベクトルを定義
a = np.array([1, 2, 3])

print(a)

[1 2 3]


`a.shape`で多次元配列の形がわかる  
要素が整数のタプルで返却される

In [3]:
print(a.shape)

(3,)


次元数は`ndim`という属性に保存されている  
これは`len(a.shape)`と同じ値になる  
今回、`a`というndarrayは1次元配列であるため、`a.shape`は要素数1のタプルで、  
`ndim`の値は1となる

次に3×3行列を定義してみる

In [4]:
# 行列を定義
b = np.array(
    [[1, 2, 3],
     [4, 5, 6],
     [7, 8, 9]]
)

print(b)

[[1 2 3]
 [4 5 6]
 [7 8 9]]


形と次元数を調べる

In [5]:
print('Shape : ', b.shape)
print('Rank : ', b.ndim)

('Shape : ', (3, 3))
('Rank : ', 2)


次に`size`という属性も確認する  
この属性はndarrayがもつ要素数を表している  
今回`b`は3×3行列なので、要素数は9

In [6]:
print(b.size)

9


`np.array()`以外にも多次元配列を作る方法は色々ある  
代表例は以下の通り

`np.zeros((m, n))`：要素がすべて0の m×n行列を作る関数

In [7]:
# 形を指定して、要素がすべて0の ndarray を作る
# 3×3行列なので、関数には(3, 3)を代入
a = np.zeros((3, 3))

print(a)

[[0. 0. 0.]
 [0. 0. 0.]
 [0. 0. 0.]]


`np.ones((m, n))`：要素がすべて1の m×n行列を作る関数

In [8]:
# 形を指定して、要素がすべて1の ndarray を作る
# 2×3行列なので、関数には(2, 3)を代入
b = np.ones((2, 3))

print(b)

[[1. 1. 1.]
 [1. 1. 1.]]


`np.full((m, n), p)`：要素がすべて p の m×n行列を作る

In [9]:
# 形を指定して、指定した値のみを要素とする ndarray を作る
# 今回は3×2行列で、値が9なので、関数には"(3, 2), 9"を代入する
c = np.full((3, 2), 9)

print(c)

[[9 9]
 [9 9]
 [9 9]]


`np.eye(n)`：n×n の単位行列を作る関数

In [10]:
# 指定された大きさの単位行列を表す ndarray を作る
# 今回は5×5行列なので、関数には5を代入
d = np.eye(5)

print(d)

[[1. 0. 0. 0. 0.]
 [0. 1. 0. 0. 0.]
 [0. 0. 1. 0. 0.]
 [0. 0. 0. 1. 0.]
 [0. 0. 0. 0. 1.]]


`np.random.random((m, n))`：要素がすべて0 ～ 1の乱数で構成される n×m行列を作る関数

In [11]:
# 形を指定して、0 ～ 1 の間の乱数を要素とする ndarray を作る
# 今回は4×5行列なので、関数には(4, 5)を代入
e = np.random.random((4, 5))

print(e)

[[0.34788815 0.2193847  0.12309164 0.98176099 0.38804275]
 [0.48038467 0.2104851  0.28059677 0.1959107  0.26267131]
 [0.56283689 0.67065836 0.92717665 0.33089533 0.82359477]
 [0.00279757 0.98876594 0.00956209 0.54560212 0.0413438 ]]


`np.arange(n, m, p)`：n から始まり m になる（mは含まない）まで p ずつ増加する数列を作る関数

In [12]:
# 3 から始まり 10 の手前まで1ずつ増加する数列を作る
# ベクトルで返却される
f = np.arange(3, 10, 1)

print(f)

[3 4 5 6 7 8 9]


## 8.3. 多次元配列の要素を選択する

作成したndarrayのうちの特定の要素を選択して、値を取り出す方法を確認する。   
最もよく行われる方法は`[]`を使った添字表記（subscription）による要素の選択である。

### 8.3.1. 整数による要素の選択

上で作成した 4×5 行列`e`から 1 行 2 列目の値を取り出す  
i 行 j 列の要素を取り出す際には、`[i - 1, j - 1]`を指定する

In [13]:
val = e[0, 1]

print(val)

0.21938469886583623


### 8.3.2. スライスによる要素の選択

Pythonのリストと同様にスライス表記（slicing）を用いて選択したい要素を範囲指定することができる。  
ndarrayではさらに、カンマ区切りで複数の次元に対するスライスを指定できる。

In [14]:
# 4 × 5 行列 e の中央 2 × 3 = 6 個の値を取り出す
center = e[1:3, 1:4]

print(center)

[[0.2104851  0.28059677 0.1959107 ]
 [0.67065836 0.92717665 0.33089533]]


`e`と`center`の形を比較してみる

In [15]:
print('Shape of e : ', e.shape)
print('Shape of center : ', center.shape)

('Shape of e : ', (4, 5))
('Shape of center : ', (2, 3))


また、インデックスを指定したり、スライスを用いて取り出した ndarray の一部に対し、値を代入することもできる

In [16]:
# 上の真ん中 6 個の値を 0 にする
e[1:3, 1:4] = 0

print(e)

[[0.34788815 0.2193847  0.12309164 0.98176099 0.38804275]
 [0.48038467 0.         0.         0.         0.26267131]
 [0.56283689 0.         0.         0.         0.82359477]
 [0.00279757 0.98876594 0.00956209 0.54560212 0.0413438 ]]


### 8.3.3. 整数配列による要素の選択

ndarrayの`[]`には、整数やスライスのほかに、整数配列を渡すこともできる。  
整数配列とは、ここでは整数を要素とするPythonリストまたはndarrayのことを指す。

In [17]:
a = np.array(
    [[1, 2, 3],
     [4, 5, 6],
     [7, 8, 9]]
)

print(a)

[[1 2 3]
 [4 5 6]
 [7 8 9]]


このndarrayから、  
1. 1行2列目：`a[0, 1]`  
2. 3行2列目：`a[2, 1]`
3. 2行1列目：`a[1, 0]`  
の3つの要素を選択して並べ、形が`(3,)`であるようなndarrayを作りたいとする。

以下のように、順に対象の要素を指定して並べ、新しいndarrayにすることによっても実現はできる。

In [18]:
b = np.array([a[0, 1], a[2, 1], a[1, 0]])

print(b)

[2 8 4]


しかし、同じことを**選択したい行、選択したい列をそれぞれ順にリストとして与える**ことでも行える。

In [19]:
# 上と同じ表示を違う方法で
b = a[[0, 2, 1], [1, 1, 0]]

print(b)

[2 8 4]


**選択したい3つの値がどの行にあるか**だけに注目すると、それぞれ1行目、3行目、2行目にある要素。　　
ゼロベースインデックスでは、それぞれ0,2,1行目である。  
これが`a`の`[]`に与えられた1つ目のリスト`[0, 2, 1]`の意味である。  

同様に**列に着目**すると、ゼロベースインデックスでそれぞれ1,1,0列目の要素である。  
これが`a`の`[]`に与えられた2つ目のリスト`[1, 1, 0]`の意味となる。

## 8.4. ndarrayのデータ型

1つのndarryの要素は、すべて同じ型を持つ。  
NumPyでは様々なデータ型を使うことができるが、ここでは一部のみ確認する。  
NumpyはPythonリストを渡してndarrayを作る際に、その値からデータ型を推測する。  
ndarrayのデータ型は、`dtype`という属性に保存されている。

In [20]:
# 整数（Python の int 型）の要素を持つリストを与えた場合
x = np.array([1, 2, 3])

print(x.dtype)

int64


In [21]:
# 浮動小数点（Python の float 型）の要素を持つリストを与えた場合
x = np.array([1., 2., 3.])

print(x.dtype)

float64


以上のように、**Python の int 型は自動的に NumPy の int64 型**となった。また、**Python の float 型は自動的に NumPy のfloat64型**となった。
Python の int 型は NumPy の int_ 型に対応付けられており、Python の float 型は NumPy の float_ 型に対応付けられている。  
このint_ 型はプラットフォームによって int64 型と同じ場合と int32 型と同じ場合がある。float_ 型についても同様で、プラットフォームによって float64 型と同じ場合と float32 型と同じ場合がある。

特定の型を指定して ndarray を作成するには以下のようにする。

In [22]:
# 型を float32 に指定
x = np.array([1, 2, 3], dtype=np.float32)

print(x.dtype)

float32


このように、`dtype`という引数に Numpy の dtype オブジェクトを渡す。
上のコードは 32 ビット浮動小数点型を指定する例である。
同じことが、文字列で指定することによっても行うことができる。

In [23]:
# 型を float32 に指定
x = np.array([1, 2, 3], dtype='float32')

print(x.dtype)

float32


これは以下のようにさらに短く書くこともできる。

In [24]:
# 型を float32 に指定
x = np.array([1, 2, 3], dtype='f')

print(x.dtype)

float32


一度あるデータ型で定義した配列のデータ型を別のものに変更するには、`astype`を用いて変換を行う。

In [25]:
x = x.astype(np.float64)

print(x.dtype)

float64


## 8.5. 多次元配列を用いた計算

ここでは ndarray を使って行列やベクトルを定義して、それらを用いていくつかの計算を行う。

ndarray として定義されたベクトルや行列同士の**要素ごとの加減乗除**は、Python の数値同士の四則演算に用いられる `+`, `-`, `*`, `/` という記号を使って行うことができる。

まず、同じ形の行列を２つ定義し、それらの**要素ごとの**加減乗除を行う。

In [26]:
# 同じ形（3 × 3）の行列を 2 つ定義する
a = np.array([
    [0, 1, 2],
    [3, 4, 5],
    [6, 7, 8]
])

b = np.array([
    [1, 2, 3],
    [4, 5, 6],
    [7, 8, 9]
])

In [27]:
# 足し算
c = a + b

print(c)

[[ 1  3  5]
 [ 7  9 11]
 [13 15 17]]


In [29]:
# 引き算
c = a - b

print(c)

[[-1 -1 -1]
 [-1 -1 -1]
 [-1 -1 -1]]


In [30]:
# 掛け算
c = a * b

print(c)

[[ 0  2  6]
 [12 20 30]
 [42 56 72]]


In [33]:
# 割り算
c = a / b

print(c)
# すべて 1 以下の小数になるので、0 しか出ない

[[0 0 0]
 [0 0 0]
 [0 0 0]]


NumPy では、与えられた多次元配列に対して要素ごとに計算を行う関数が色々と用意されている。
以下にいくつかの例を示す。

In [34]:
# 要素ごとに平方根を計算する
c = np.sqrt(b)

print(c)

[[1.         1.41421356 1.73205081]
 [2.         2.23606798 2.44948974]
 [2.64575131 2.82842712 3.        ]]


In [35]:
# 要素ごとに値を n 乗する
# 今回は 2 乗で（n = 2）
n = 2
c = np.power(b, n)

print(c)

[[ 1  4  9]
 [16 25 36]
 [49 64 81]]


要素ごとに値を n 乗する計算は、以下のようにも書くことができる。

In [36]:
c = b ** n

print(c)

[[ 1  4  9]
 [16 25 36]
 [49 64 81]]


はじめに紹介した四則演算は、**同じ大きさの**２つの行列同士で行っていた。
ここで、**3 × 3**行列`a` と3次元ベクトル`b`という大きさの異なる配列を定義して、それらを足してみる。

In [37]:
a = np.array([
    [0, 1, 2], 
    [3, 4, 5],
    [6, 7, 8]
]) 

b = np.array([1, 2, 3])

c = a + b

print(c)

[[ 1  3  5]
 [ 4  6  8]
 [ 7  9 11]]


列が同じ行列同士の場合と同様に計算することができた。

これは NumPy が自動的に**ブロードキャスト（broadcast）**と呼ばれる操作を行っているためである。

## 8.6. ブロードキャスト