## Numpy個人的tips

numpyもデータ分析には欠かせないツールの一つです。個人的な備忘録としてメモを残しておきます。詳細は
- [公式ページ](https://docs.scipy.org/doc/numpy/reference/)
を参照してください。

import の仕方は以下の通りです。

In [1]:
import numpy as np

np.__version__

'1.18.1'

## スカラー、ベクトル、行列、テンソル

- スカラー : 0階のテンソル
- ベクトル : 1階のテンソル
- 行列 : 2階のテンソル

## numpyのデータ型

numpyの実際の数値計算部分はC言語で実装されています。よってデータを定義するときにデータの型を指定することが出来ます。この情報によりメモリ上に確保する量を最適化することが出来ます。大規模な数値計算に慣れなるほど、重要なプロパティになります。

本家の[サイト](https://numpy.org/devdocs/user/basics.types.html)にはたくさんのデータタイプが定義されているますが、実際に使うのはそれほど多くありません。

<div class="table_center_80">

|表記1 |表記2|表記3|データ型 |説明  |
|---|---|---|---|---|
|np.bool |-| ?|bool  |真偽値  |
|np.int8 | int8 | i1  |int8  |8ビット符号付き整数 |
|np.int16 | int16 | i2  |int16  |16ビット符号付き整数 |
|np.int32 | int32 | i4  |int32  |32ビット符号付き整数 |
|np.int64 | int64 | i8  |int64  |64ビット符号付き整数 |
|np.uint8 | uint8 | u1  |uint8  |8ビット符号なし整数 |
|np.uint16 | uint16 | u2  |uint16  |16ビット符号なし整数 |
|np.uint32 | uint32 | u4  |uint32  |32ビット符号なし整数 |
|np.uint64 | uint64 | u8  |uint64  |64ビット符号なし整数 |
|np.float16 | float16 | f2  |float16  |半精度浮動小数点型 |
|np.float32 | float32 | f4  |float32  |単精度浮動小数点型 |
|np.float64 | float64 | f8  |float64  |倍精度浮動小数点型 |
|np.float128 | float128 | f16  |float128  |4倍精度浮動小数点型 |

</div>

表記1、表記2、表記3は定義の方法としては同じです。

In [2]:
a = np.array([i for i in range(5)  ], dtype=np.int8)
b = np.array([i for i in range(5)  ], dtype='int8')
c = np.array([i for i in range(5)  ], dtype='i1')

print(a.dtype)
print(b.dtype)
print(c.dtype)

d = np.array(True, dtype='?')
e = np.array(True, dtype=np.bool)

print(d.dtype)
print(e.dtype)

int8
int8
int8
bool
bool


## ブロードキャスト
numpyは行列やベクトルとスカラー量の演算がされたとき、行列やベクトルのすべての要素に対してスカラー量の演算が実行されます。最初慣れないと勘違いしてしまうので、押さえておきましょう。スカラー量である$a$がベクトル$b$の全成分に対して演算されていることがわかります。

In [3]:
a = 10
b = np.array([1, 2])

print('a     : ',a)
print('b     : ',b)
print('a + b : ',a + b)
print('a * b : ',a * b)
print('b / a : ',b / a)

a     :  10
b     :  [1 2]
a + b :  [11 12]
a * b :  [10 20]
b / a :  [0.1 0.2]


## 基本定数

### 自然対数の底

In [4]:
np.e

2.718281828459045

### 円周率

In [5]:
np.pi

3.141592653589793

## 基本的な四則演算

### np.add()
要素ごとの足し算です。一般的なベクトルの加法です。

In [6]:
a = np.array([1.,2.])
b = np.array([4.,3.])
np.add(a,b)

array([5., 5.])

### np.reciprocal()
要素ごとの逆数になります。

In [7]:
b = np.array([4.,3.])
np.reciprocal(b)

array([0.25      , 0.33333333])

この関数について面白い事に気づきました。python3系では、整数型の割り算であっても小数点以下まで計算してくれます。python2系では、整数部分だけ表示されます。しかし、逆数を計算するこの関数で整数型の逆数を計算すると、整数部分しか表示してくれません。データ型を浮動小数型である事を明示するとちゃんと小数点以下まで計算してくれます。

In [8]:
# print(1/8) # => 0.125が返る@python3系
# print(1/8) # => 0が返る@python2系
print(np.reciprocal(8))
print(np.reciprocal(8, dtype='float16'))
print(np.reciprocal(8.))

0
0.125
0.125


### np.multiply()
要素ごとのかけ算です。アダマール積といわれています。ベクトルの内積とは異なります。

In [9]:
a = np.array([1.,2.])
b = np.array([4.,3.])
np.multiply(a,b)

array([4., 6.])

### np.divide
要素ごとの割り算の商を求めます。

In [10]:
a = np.array([1.,2.])
b = np.array([4.,3.])
np.divide(b,a)

array([4. , 1.5])

### np.mod()
要素ごとの割り算のあまりを求めます。

In [11]:
a = np.array([3.,2.])
b = np.array([11.,3.])
print(np.mod(b,a))

[2. 1.]


### np.divmod()
要素ごとの割り算の商とあまりを同時に求めます。

In [12]:
a = np.array([3.,2.])
b = np.array([11.,3.])
print(np.divmod(b,a))

(array([3., 1.]), array([2., 1.]))


### np.power
累乗の計算です。ベクトルを指定するとベクトル同士の指数の計算になります。

#### $2^3=8$

In [13]:
np.power(2,3)

8

#### $4^1$ と $3^2$

In [14]:
a = np.array([1.,2.])
b = np.array([4.,3.])
np.power(b,a)

array([4., 9.])

In [15]:
a = np.array([1.,2.])
b = np.array([4.,3.])
np.subtract(b,a)

array([3., 1.])

## 指数と対数

### np.exp()
$\exp{x}$を計算します。

In [16]:
print(np.exp(0))
print(np.exp(1))
print(np.exp(2))

1.0
2.718281828459045
7.38905609893065


### np.expm1()
$\exp{x}-1$を計算します。

In [17]:
print(np.expm1(0))
print(np.expm1(1))
print(np.expm1(2))

0.0
1.7182818284590453
6.38905609893065


### np.exp2()
$2^{x}$を計算します。

In [18]:
print(np.exp2(0))
print(np.exp2(1))
print(np.exp2(2))

1.0
2.0
4.0


### np.log()
$\log{x}$を計算します。底は自然対数になります。

In [19]:
print(np.log(1))
print(np.log(2))
print(np.log(np.e))

0.0
0.6931471805599453
1.0


### np.log10()
$\log_{10}{x}$を計算します。

In [20]:
print(np.log10(1))
print(np.log10(2))
print(np.log10(10))

0.0
0.3010299956639812
1.0


### np.log2()
$\log_{2}{x}$を計算します。

In [21]:
print(np.log2(1))
print(np.log2(2))
print(np.log2(10))

0.0
1.0
3.321928094887362


### np.log1p()
$\log{(x + 1)}$を計算します。底は自然対数になります。これはデータ分析においてよく利用します。元の数字が0になる場合、1を足して対数をとり、分類器にかけることがしばしば発生します。いわゆるloglossを計算するときです。

In [22]:
print(np.log1p(0))
print(np.log1p(1))
print(np.log1p(-1 + np.e))

0.0
0.6931471805599453
1.0


## その他の便利関数

### np.sqrt()
平方根を計算します。

In [23]:
np.sqrt(4)

2.0

### np.cbrt()
三乗根を計算します。

In [24]:
np.cbrt(8)

2.0

### np.square()
2乗を計算します。

In [25]:
np.square(2)

4

### np.absolute()
絶対値を計算します。複素数に対応しています。

In [26]:
print(np.absolute(-4))
print(np.absolute([1,-2,-4]))
print(np.absolute(complex(1,1))) # => sqrt(2) 

4
[1 2 4]
1.4142135623730951


### np.convolve()
畳み込みを計算します。

In [27]:
a = np.array([1,2,3])
b = np.array([0,1.5,2])

print(np.convolve(a,b, mode='full')) # defalut mode = full
print(np.convolve(a,b, mode='same'))
print(np.convolve(a,b, mode='valid'))

[0.  1.5 5.  8.5 6. ]
[1.5 5.  8.5]
[5.]


### np.heaviside()

ヘヴィサイドの階段関数です。
<div>

$$
H_c(x)=
{
  \begin{cases}
  1\ (x \gt 0)\\\\
  c\ (x = 0)\\\\
  0\ (x \lt 0)
  \end{cases}
}
$$
</div>

データ分析などではそれほど使う機会はありませんが、一応記載しておきます。
```python
np.heaviside(a, 10)
```
と表記し、$c=10$に対応します。

In [28]:
a = [i for i in range(-2,3)]
print(a)
print(np.heaviside(a, 10))

[-2, -1, 0, 1, 2]
[ 0.  0. 10.  1.  1.]


### np.interp()
線形補間した値を返します。

```python
x = [0,1,2]
y = [2,100,50]

x1 = [0.5, 1.8]
y1 = np.interp(x1, x,y)
```

このように定義することで、$(x,y) = (0,2), (1,100)$を結ぶ直線の$x=0.5$の値と、$(x,y) = (1,100),(2,50)$を結ぶ直線の$x=1.8$の値を求める事ができます。以下の様にグラフに書くとわかりやすいかと思います。


In [29]:
import matplotlib.pyplot as plt

x = [0,1,2]
y = [2,100,50]

plt.grid()
plt.plot(x,y,marker='o')

x1 = [0.5, 1.8]
y1 = np.interp(x1, x,y)

plt.scatter(x1,y1,marker='^',c='red')
print('x1 : ', x1)
print('y1 : ', y1)

x1 :  [0.5, 1.8]
y1 :  [51. 60.]


## 三角関数

### np.sin()
$\sin x$です。

In [30]:
print(np.sin(0))
print(np.sin(np.pi / 2))
print(np.sin(np.pi))

0.0
1.0
1.2246467991473532e-16


### np.cos()
$\cos x$です。

In [31]:
print(np.cos(0))
print(np.cos(np.pi / 2))
print(np.cos(np.pi))

1.0
6.123233995736766e-17
-1.0


### np.tan()
$\tan x$です。

In [32]:
print(np.tan(0))
print(np.tan(np.pi / 4))
print(np.tan(np.pi))

0.0
0.9999999999999999
-1.2246467991473532e-16


### np.arcsin()
$\sin x$の逆関数です。

In [33]:
print(np.arcsin(0))
print(np.arcsin(1))
print(np.arcsin(-1))

0.0
1.5707963267948966
-1.5707963267948966


### np.arccos()
$\cos x$の逆関数です。

In [34]:
print(np.arccos(0))
print(np.arccos(1))
print(np.arccos(-1))

1.5707963267948966
0.0
3.141592653589793


### np.arctan()
$\tan x$の逆関数です。

In [35]:
print(np.arctan(0))
print(np.arctan(1))
print(np.arctan(-1))

0.0
0.7853981633974483
-0.7853981633974483


### np.sinh()
双曲線正弦関数です。
<div>
$
\displaystyle \sinh x = \frac{e^x - e^{-x}}{2}
$
</div>

In [36]:
print(np.sinh(0))
print(np.sinh(-1))
print(np.sinh(1))

0.0
-1.1752011936438014
1.1752011936438014


### np.cosh()
双曲線余弦関数です。
<div>
$
\displaystyle \cosh x = \frac{e^x + e^{-x}}{2}
$
</div>

In [37]:
print(np.cosh(0))
print(np.cosh(-1))
print(np.cosh(1))

1.0
1.5430806348152437
1.5430806348152437


### np.tanh()
双曲線正接関数です。
<div>
$
\displaystyle \tanh x = \frac{\sinh x}{\cosh x}
$
</div>

In [38]:
print(np.tanh(0))
print(np.tanh(-1))
print(np.tanh(1))

0.0
-0.7615941559557649
0.7615941559557649


### np.arcsinh()
$\sinh x$の逆関数です。

In [39]:
print(np.arcsinh(0))
print(np.arcsinh(1))
print(np.arcsinh(-1))

0.0
0.881373587019543
-0.881373587019543


### np.arccosh()
$\cosh x$の逆関数です。

In [40]:
print(np.arccosh(0))
print(np.arccosh(1))
print(np.arccosh(-1))

nan
0.0
nan


  """Entry point for launching an IPython kernel.
  This is separate from the ipykernel package so we can avoid doing imports until


### np.arctanh()
$\tanh x$の逆関数です。

In [41]:
print(np.arctanh(0))
print(np.arctanh(0.5))
print(np.arctanh(-0.5))

0.0
0.5493061443340549
-0.5493061443340549


### np.deg2rad()
弧度法からラジアン表記に変換します。

In [42]:
np.deg2rad(45) # => pi / 4 

0.7853981633974483

### np.rad2deg()
弧度法からラジアン表記に変換します。

In [43]:
np.rad2deg(np.pi / 4)

45.0

## 統計情報の取得

### np.max()
配列の最大値を返します。

In [44]:
a = np.random.randint(100,size=10)

print('a   : ',a)
print('max : ',np.max(a))

b = np.random.randint(10, size=9).reshape(-1,3)
print(b)
print(np.max(b, axis=0))

b = np.random.randint(10, size=27).reshape(-1,3,3)
print(b)
print(np.max(b, axis=1))

a   :  [13 62 95 31 34  2 29 40 99  4]
max :  99
[[2 8 5]
 [3 4 5]
 [9 2 3]]
[9 8 5]
[[[3 3 7]
  [6 4 9]
  [4 0 1]]

 [[1 7 2]
  [2 7 6]
  [4 7 9]]

 [[9 3 7]
  [1 5 6]
  [4 5 5]]]
[[6 4 9]
 [4 7 9]
 [9 5 7]]


### np.argmax()
配列の最大値の位置を返します。

In [45]:
a = np.random.randint(100,size=10)

print('a            : ',a)
print('max position : ',np.argmax(a))

a            :  [54 37 64 12 90 86 27  5 52 43]
max position :  4


### np.min()
配列の最小値を返します。

In [46]:
a = np.random.randint(100,size=10)

print('a   : ',a)
print('min : ',np.min(a))

a   :  [61 43  5 55 85 45 62 98 23 12]
min :  5


### np.argmax()
配列の最小値の位置を返します。

In [47]:
a = np.random.randint(100,size=10)

print('a            : ',a)
print('min position : ',np.argmin(a))

a            :  [16 64  0 50 69 78 71 68 87 72]
min position :  2


### np.maximum()
二つの配列を比較し、大きい値を選択し新たなndarrayを作ります。

In [48]:
a = np.random.randint(100,size=10)
b = np.random.randint(100,size=10)

print('a   : ',a)
print('b   : ',b)
print('max : ',np.maximum(a,b))

a   :  [41 19 30 67 56 82 51 62 85 88]
b   :  [98 22 77 63 69 54  6 84 74 80]
max :  [98 22 77 67 69 82 51 84 85 88]


### np.minimum()
二つの配列を比較し、小さい値を選択し新たなndarrayを作ります。

In [49]:
a = np.random.randint(100,size=10)
b = np.random.randint(100,size=10)

print('a   : ',a)
print('b   : ',b)
print('min : ',np.minimum(a,b))

a   :  [47 79  5 70 11 14 92 51 43 18]
b   :  [91  4 87 70 37 81 50 52  6 63]
min :  [47  4  5 70 11 14 50 51  6 18]


## 行列計算

### np.eye()
単位行列を作成します。

In [50]:
np.eye(3)

array([[1., 0., 0.],
       [0., 1., 0.],
       [0., 0., 1.]])

### np.identify()
単位行列を作成します。

In [51]:
np.identity(3)

array([[1., 0., 0.],
       [0., 1., 0.],
       [0., 0., 1.]])