# NumPy

NumPyはPythonでの数値計算の中核となるライブラリです。NumPyには高速な計算を可能にする多次元配列オブジェクトとそれを使うためのツールが用意されています。

## NumPyのインポート
NumPyを使う際には、短縮名npを指定するのが慣例となっています。

In [None]:
import numpy as np

# NumPy配列

NumPyの中心となるのがNumPy配列です。NumPy配列を使うことで、行列・ベクトルの処理が非常に簡単に行えるようになります。  
NumPy配列は、リストと異なり、すべての要素が同じデータ型でなければなりません。データ型に関しては後述します。 　

## 行列・ベクトルの初期化

### Pythonのリストからの配列生成
NumPy配列を作成するにはPythonのリストを引数としてarray()関数を呼び出します。

In [None]:
a1 = np.array([1, 2, 3, 4, 5])
a1

多次元配列からの生成も可能です。  
行列は行ベクトルの集まりとして表現されます。

In [None]:
a2 = np.array([[1, 2, 3], [4, 5, 6]])
a2

### ゼロ配列の生成
要素が全てゼロの配列を作成するにはnp.zeros()関数を用います。

In [None]:
a3 = np.zeros(6)
a3

引数に次元を表すタプルを渡すことで多次元のゼロ配列も生成できます。

In [None]:
a4 = np.zeros((6,6))
a4

### 全てが1の配列の生成
要素が全て1の配列を作成するにはnp.ones()関数を用います。

In [None]:
a5 = np.ones(9)
a5

こちらも、タプルを渡すことで、多次元配列が生成できます。

In [None]:
a6 = np.ones((3,3))
a6

### 等差級数を要素に持つ配列の生成
一定の値ずつ増加する等差級数を要素とする配列を生成するには、np.arange()関数を用います。

In [None]:
a7 = np.arange(5)
a7

In [None]:
a8 = np.arange(3,8)
a8

3つ目の引数で、ステップを指定できます。

In [None]:
a9 = np.arange(3, 20, 3)
a9

### 1次元配列から多次元配列を作る
np.reshape()関数を用いると、1次元の配列から多次元の配列を生成することができます。

In [None]:
a10 = np.arange(6).reshape(2, 3)
a10

In [None]:
a11 = np.arange(27).reshape(3, 3, 3)
a11

### 単位行列の作成
対角要素が1で、それ以外の要素が0の単位行列を作成するには、np.identity()関数を使用します。

In [None]:
np.identity(5)

## 行列・ベクトルの操作

### 要素の取り出し

In [None]:
a12 = np.arange(12).reshape(4, 3)
a12

複数次元の位置指定は、カンマ区切りの添字を使用します。

In [None]:
a12[1, 1]

### 要素の置き換え

In [None]:
a12[1, 1] = 8
a12

### スライシング

In [None]:
a13 = np.arange(10)
a13

:（コロン）を使って、添字の範囲を指定できます。右端は含まれないことに注意します。

In [None]:
a13[3:8]

マイナスの添字は右端からの位置指定となります。

In [None]:
a13[1:-2]

開始位置を省略すると、左端からの範囲指定になります。

In [None]:
a13[:8]

終了位置を省略すると、開始位置から右端までになります。

In [None]:
a13[4:]

:を2つ使うことで、ステップを指定可能です。

In [None]:
a13[1:8:2]

下記の記法により、要素を逆順に取り出すことができます。

In [None]:
a13[::-1]

多次元の場合には、次元ごとに範囲指定します。

In [None]:
a14 = np.arange(12).reshape(6,2)
a14

開始位置、終了位置を省略した:（コロン）のみの指定で、その次元のすべての要素を指定したことになります。

In [None]:
a14[2:5,:]

## データ型変換

### NumPyのデータ型
Numpyで扱えるデータ型には次のようなものがあります。

|データ型dtype|説明|
|:--:|:--|
|int8|符号あり8ビット整数型|
|int16|符号あり16ビット整数型|
|int32|符号あり32ビット整数型|
|int64|符号あり64ビット整数型|
|uint8|符号なし8ビット整数型|
|uint16|符号なし16ビット整数型|
|uint32|符号なし32ビット整数型|
|uint64|符号なし64ビット整数型|
|float16|半精度浮動小数点型（符号部1ビット、指数部5ビット、仮数部10ビット）|
|float32|単精度浮動小数点型（符号部1ビット、指数部8ビット、仮数部23ビット）|
|float64|倍精度浮動小数点型（符号部1ビット、指数部11ビット、仮数部52ビット）|
|float128|四倍精度浮動小数点型（符号部1ビット、指数部15ビット、仮数部112ビット）|
|complex64|複素数（実部・虚部がそれぞれfloat32）|
|complex128|複素数（実部・虚部がそれぞれfloat64）|
|complex256|複素数（実部・虚部がそれぞれfloat128）|
|bool|ブール型（True or False）|
|unicode|Unicode文字列|
|object|Pythonオブジェクト型|


### 作成時にデータ型を指定

In [None]:
a15 = np.array([1, 2, 3, 4, 5, 6], dtype=np.int32)
a15

データ型を指定しないで作成した数値型のNumPy配列では、データ型が既定のint64あるいはfloat64になります。

In [None]:
a15.dtype

In [None]:
np.array([0.1, 0.2, 0.5, 0.7]).dtype

### データ型変換

In [None]:
a16 = a13.astype(np.float16)
a16

In [None]:
a17 = a13.astype('float128')
a17

### 次元拡張
np.newaxis を使うと、配列の次元を拡張することが可能です。

In [None]:
a18 = np.array([1, 2, 3])
a19 = a16[:, np.newaxis]
a19

In [None]:
a20 = a16[np.newaxis, :]
a20

In [None]:
a21 = a16[np.newaxis, :, np.newaxis]
a21

np.expand_dims()を使用して次元拡張を行うこともできます。

In [None]:
a22 = np.expand_dims(a16, axis=1)
a22

# 行列・ベクトルの演算

## 四則演算
NumPy配列どうしの四則演算は、要素ごとに行われます。  
つまり、要素の次元やサイズが同じでなければなりません。  

In [None]:
a = np.array([[1, 2, 3], [4, 5, 6]])
b = np.array([[0.1, 0.2, 0.3], [-0.3, -0.2, -0.1]])

a + b

In [None]:
a - b

In [None]:
a * b

In [None]:
a / b

## 配列とスカラーの演算
配列とスカラーの計算では、スカラーと配列側の全要素との演算になります。  
つまり、相手方の配列と同じ次元・要素数で、要素がスカラーという配列との演算と同義になります。  
この動作のことを**ブロードキャスト**と呼びます。  

In [None]:
c = 10
a + c

In [None]:
a / c

In [None]:
c / a

## 配列どうしでのブロードキャスト
配列同士の演算で、次元・要素数が異なる場合、小さい方の配列が繰り返し使われる場合があります。  

In [None]:
d = np.array([[4], [8]])
a + d

## ベクトルの直積

2つのベクトル $\boldsymbol{a}$ と $\boldsymbol{b}$ を
$$
\boldsymbol{a} =
  \left(
    \begin{array}{c}
      a_1 \\
      a_2 \\
      \vdots \\
      a_n
    \end{array}
  \right)  
 \boldsymbol{b} =
   \left(
     \begin{array}{c}
       b_1 \\
       b_2 \\
       \vdots \\
       b_m
     \end{array}
   \right)
$$
としたとき、$\boldsymbol{a}$ と $\boldsymbol{b}$ の直積 $\boldsymbol{a}\otimes\boldsymbol{b}$ は
$$\boldsymbol{a}\otimes\boldsymbol{b}=
\left(
  \begin{array}{cc}
   a_1b_1 & a_1b_2 & \cdots & a_1b_m \\
   a_2b_1 & a_2b_2 & \cdots & a_2b_m \\
   \vdots & \vdots & \ddots & \vdots \\
   a_nb_1 & a_nb_2 & \cdots & a_nb_m
  \end{array}
\right)
  $$

In [None]:
e = np.array([1, 2, 3])
f = e[:, np.newaxis]
e * f

In [None]:
g = np.outer(e, f)
g

## ベクトルの内積

同じ n次元のベクトル $\boldsymbol{a}$ と $\boldsymbol{b}$ を
$$
\boldsymbol{a} =
  \left(
    \begin{array}{c}
      a_1 \\
      a_2 \\
      \vdots \\
      a_n
    \end{array}
  \right)  
 \boldsymbol{b} =
   \left(
     \begin{array}{c}
       b_1 \\
       b_2 \\
       \vdots \\
       b_n
     \end{array}
   \right)
$$
としたとき、$\boldsymbol{a}$ と $\boldsymbol{b}$ の内積 $\boldsymbol{a}\cdot\boldsymbol{b}$ は
$$\boldsymbol{a}\cdot\boldsymbol{b}=
  a_1b_1 + a_2b_2 + \cdots + a_nb_n
  $$

In [None]:
np.dot(e, f)

### 転置行列
行列の行と列を入れ替えた転置行列を求めるには、np.transpose()関数あるいは.Tを用います。

In [None]:
np.transpose(a)

In [None]:
a.T

### 行列の積

行列の積は、それぞれの位置に対応する行ベクトルと列ベクトルの内積からなる行列です。  
行列の積を求めるにはベクトルの内積と同様にnp.dot()関数を使います。

$$
\boldsymbol{A} =
  \left(
    \begin{array}{c}
      a_{11} & a_{12} & \cdots & a_{1k} \\
      a_{21} & a_{22} & \cdots & a_{2k} \\
      \vdots & \vdots & \ddots & \vdots \\
      a_{n1} & a_{n2} & \cdots & a_{nk} \\
    \end{array}
  \right)  
\boldsymbol{B} =
   \left(
     \begin{array}{c}
       b_{11} & b_{12} & \cdots & b_{1m} \\
       b_{21} & b_{22} & \cdots & b_{2m} \\
       \vdots & \vdots & \ddots & \vdots \\
       b_{k1} & b_{k2} & \cdots & b_{km} \\
     \end{array}
   \right)
$$

としたとき、$\boldsymbol{A}$ と $\boldsymbol{B}$ の積 $\boldsymbol{A}\cdot\boldsymbol{B}$ は

$$\boldsymbol{A}\cdot\boldsymbol{B}=
\left(
  \begin{array}{cc}
   a_{11}b_{11}+a_{12}b_{21}+\cdots+a_{1k}b_{k1} &
   a_{11}b_{12}+a_{12}b_{22}+\cdots+a_{1k}b_{k2} &
   \cdots &
   a_{11}b_{1m}+a_{12}b_{2m}+\cdots+a_{1k}b_{km} \\
   a_{21}b_{11}+a_{22}b_{21}+\cdots+a_{2k}b_{k1} &
   a_{21}b_{12}+a_{22}b_{22}+\cdots+a_{2k}b_{k2} &
   \cdots &
   a_{21}b_{1m}+a_{22}b_{2m}+\cdots+a_{2k}b_{km} \\
   \vdots & \vdots & \ddots & \vdots \\
   a_{n1}b_{11}+a_{n2}b_{21}+\cdots+a_{nk}b_{k1} &
   a_{n1}b_{12}+a_{n2}b_{22}+\cdots+a_{nk}b_{k2} &
   \cdots &
   a_{n1}b_{1m}+a_{n2}b_{2m}+\cdots+a_{nk}b_{km} \\
  \end{array}
\right)
  $$

In [None]:
np.dot(a, a.T)

## 行列式の計算
行列式はnumpy内の線形代数モジュールlinalgを使って計算できます。

In [None]:
np.linalg.det(g)

In [None]:
h = np.array([[1, 2],[3, 4]])
np.linalg.det(h)

## 逆行列の計算
行列式が0でなければ逆行列を求めることもできます。

In [None]:
np.linalg.inv(h)

# 乱数の生成

Pythonの標準ライブラリにも乱数を生成するrandomモジュールがありますが、NumPyのrandomモジュールは高速で多機能です。

## 一様乱数
np.random.rand()関数を使うと、0から1の間の一様乱数を生成できます。  
引数で生成する乱数の個数を指定できます。  
引数を2個以上与えると、多次元配列を生成できます。　　

randomモジュールが生成する乱数は擬似乱数であるため、再現性のある乱数列を得るために、np.random.seed()関数で種となる数値を与えることができます。

In [None]:
from numpy.random import *

seed(100)

rand(10)

In [None]:
rand(10, 10)

## 様々な分布の乱数
np.randomモジュールには様々な統計分布関数に沿った乱数を生成する関数が用意されています。

### 正規分布

In [None]:
randn(10)

In [None]:
normal(10, 20, 10)

### 二項分布

In [None]:
binomial(n=100, p=0.5)

### ポアソン分布

In [None]:
poisson(lam=10)

### ベータ分布

In [None]:
beta(a=3, b=5)

## 整数の乱数

引数が1つの場合、その引数未満の整数の乱数が生成されます。

In [None]:
randint(100)

乱数の取る範囲と個数を指定することもできます。

In [None]:
randint(0, 20, 10)

## 乱択
複数の選択肢からランダムに取り出すことができるnp.random.choice()関数が用意されています。

In [None]:
city = ["札幌", "仙台", "新潟", "東京", "名古屋", "大阪", "京都", "広島", "福岡"]

choice(city, 10)

既定では、すでに選択された要素がまた選択される設定となります。(`replace=True`)  
すでに選択された要素を除外するには、`replace=False` を指定します。

In [None]:
choice(city, 5, replace=False)