# 機械学習で使う数学

ニューラルネットワークの理論を学習し理解するには、数学の知識が必要になります。具体的な分野は
**偏微分** と **線形代数** の２つです。しかし、高度な知識までは必要なく基本的なことを押さえれば
問題ありません。

## 微分

### 変数関数の微分


関数 $f(x)$ を微分するとは

$$
f'(x)=\lim_{\Delta x\to0}\frac{f(x + \Delta x) - f(x)}{\Delta x}
$$

あるいは $f'(x)$ を
$$
\frac{dx}{dy}
$$

と表現することもあります。微分によって得られた関数は導関数とも呼ばれます。

例として以下の2次関数を微分してみると
$$
f(x) = x^2 + 2x + 3
$$

$$
\frac{dx}{dy}=2x + 2
$$

の値は、接線の傾きを表す。従って点(4,27)における接線の傾きは、10となる。
これを図にすると以下ようになる。

![%E3%82%B9%E3%82%AF%E3%83%AA%E3%83%BC%E3%83%B3%E3%82%B7%E3%83%A7%E3%83%83%E3%83%88%202018-04-15%2016.33.29.png](attachment:%E3%82%B9%E3%82%AF%E3%83%AA%E3%83%BC%E3%83%B3%E3%82%B7%E3%83%A7%E3%83%83%E3%83%88%202018-04-15%2016.33.29.png)

In [5]:
%matplotlib tk

import matplotlib.pyplot as plt
import numpy as np


def func(x):
    return x**2 + 2*x + 3

def dev(x):
    return 10*x - 13

x = np.linspace(1,10,10)
y = [ func(x1) for x1 in x]
plt.plot(x,y)
plt.grid()


### 代表的な微分の主な公式


$$
(x^\alpha)' = \alpha x^{\alpha-1}
$$

特に $\alpha = \frac{1}{2}$のとき

$$
(\sqrt{x})' = \frac{1}{2\sqrt{x}}
$$

三角関数

$$
(\sin x)' = \cos x
$$

$$
(\cos x)' = -\sin x
$$

指数・対数

$$
(e^x)' = e^x
$$

$$
(\log x)' = \frac{1}{x}
$$

線形性

$$
(af(x) + bg(x))' = af'(x) + bg'(x)
$$

積の微分
$$
(fg)' = f'g + fg'
$$

商の微分

$$
(\frac{f}{g})' = \frac{f'g-fg'}{g^2}
$$

## 2変数関数の微分
２変数の関数 $ z=f(x,y) $の微分は、各変数に対して微分を行います。各変数に対して微分することを **偏微分** と呼びます。


$$
\frac{{\partial z}}{\partial x}=\lim_{\Delta x\to0}\frac{f(x + \Delta x,y) - f(x,y)}{\Delta x}
$$

$$
\frac{{\partial z}}{\partial y}=\lim_{\Delta x\to0}\frac{f(x ,y + \Delta y) - f(x,y)}{\Delta y}
$$

記号　$\partial$ は　「デル」「ラウンドディー」または「パーシャル」 と読む

例ととして　関数 

$$
f(z) = x^2 + 3x + 4y^2 + 3 
$$ 

を偏微分してみると

$$
\frac{{\partial z}}{\partial x}=2x+3
$$

$$
\frac{{\partial z}}{\partial x}=8y
$$



# 線形代数

## ベクトル

ベクトルとは、「向き」と「大きさ」を持つ量である。以下のように表現される
    
    
$$
a=
\begin{pmatrix}
a_1  \\
a_2  \\
\vdots \\
a_n
\end{pmatrix}
$$
あるいは、次のように表現する場合もある。

$$
\vec{a} = 
\begin{pmatrix}
a_1 & a_2 & \cdots & a_n
\end{pmatrix}
$$

### ベクトルの和
$$
a=
\begin{pmatrix}
a_1  \\
a_2  \\
\vdots \\
a_n
\end{pmatrix}
,
b=
\begin{pmatrix}
b_1  \\
b_2  \\
\vdots \\
b_n
\end{pmatrix}
$$
とした場合、ベクトルの和は次のよになる。

$$
a + b = \begin{pmatrix}
a_1 +b_1  \\
a_1 +b_2  \\
\vdots \\
a_n + b_n
\end{pmatrix}
$$

例として
$$
\begin{pmatrix}
2  \\
9  \\
4
\end{pmatrix}
+
\begin{pmatrix}
7  \\
2  \\
3
\end{pmatrix}
=
\begin{pmatrix}
9  \\
11  \\
7
\end{pmatrix}
$$

### スカラー倍

任意の数 $c$ に対して

$$
c
\begin{pmatrix}
a_1  \\
a_2  \\
\vdots \\
a_n
\end{pmatrix}
=
\begin{pmatrix}
ca_1  \\
ca_2  \\
\vdots \\
ca_n
\end{pmatrix}
$$

例として
$$
3
\begin{pmatrix}
1  \\
8  \\
4
\end{pmatrix}
=
\begin{pmatrix}
3  \\
24  \\
12
\end{pmatrix}
$$

### ベクトルの内積

２つのベクトル　$\vec{a} , \vec{b}$がある時
$$
\vec{a} =
\begin{pmatrix}
a_1  \\
a_2  \\
\vdots \\
a_n
\end{pmatrix}
,
\vec{b} =
\begin{pmatrix}
b_1  \\
b_2  \\
\vdots \\
b_n
\end{pmatrix}
$$

ベクトル　$\vec{a} ,\vec{b}$の内積は以下のようになる。
$$
\begin{align}
\vec{a}\cdot\vec{b} &= a_1b_1 + a_2b_2 + \cdots + a_nb_n \\
&= \sum_{i=1}^{n}a_ib_i
\end{align}
$$

例として$\vec{a} , \vec{b}$が以下のベクトルである場合

$$
\vec{a} =
\begin{pmatrix}
1  \\
2
\end{pmatrix}
,
\vec{b} =
\begin{pmatrix}
3  \\
4
\end{pmatrix}
$$

$$
\begin{align}
\vec{a}\cdot\vec{b} &= 1\cdot3 + 2\cdot4 \\
&= 3 + 8 \\
&= 11
\end{align}
$$

### 行列

行列とは、$m , n$ を自然数としたとき

$$
A=
\begin{pmatrix}
a_{11} & a_{12}  & \cdots & a_{1n}\\
a_{21} & a_{22} & \cdots & a_{2n}  \\
\vdots & \vdots &\ddots &\vdots \\
a_{m1} & a_{m2} & \cdots & a_{mn}
\end{pmatrix}
$$
で表現される。

#### 行列の和
行列 $ A=(a_{ij}) , B=(b_{ij})$ とすると行列の和は以下のようになる。
$$
A+B = (a_{ij} + b_{ij} )
$$

例として 行列 $A,B$ を以下のように定義したとき
$$
A=
\begin{pmatrix}
1  & 2\\
3 & 4 
\end{pmatrix}
,
B=
\begin{pmatrix}
5  & 6\\
7 & 8 
\end{pmatrix}
$$
行列の和は以下のようになる。
$$
\begin{align}
A+B &=
\begin{pmatrix}
1  & 2\\
3 & 4 
\end{pmatrix}
+
\begin{pmatrix}
5  & 6\\
7 & 8 
\end{pmatrix} \\
&=
\begin{pmatrix}
6  & 8\\
10 & 12 
\end{pmatrix}
\end{align}
$$

#### 行列の積

行列 $　m \times n %$ 列の行列 $ A=(a_{ij}) $ および　$ n \times l $ 列の行列 $B=(b_{jk})$ とすると行列の積は以下のようになる。

$$
\begin{align}
AB &= (c_{jk}) \\
&= \sum_{j=1}^{n}a_{ij}b_{jk} (i=1,\cdots,m, k=1,\cdots,l)
\end{align}
$$
と表現される。

例として 行列 $A,B$ を以下のように定義したとき
$$
A=
\begin{pmatrix}
1  & 2\\
3 & 4 
\end{pmatrix}
,
B=
\begin{pmatrix}
5  & 6\\
7 & 8 
\end{pmatrix}
$$

行列の積は以下のようになる。
$$
\begin{align}
AB &=
\begin{pmatrix}
1  & 2\\
3 & 4 
\end{pmatrix}
\cdot
\begin{pmatrix}
4  & 3\\
2 & 1 
\end{pmatrix} \\
&=
\begin{pmatrix}
1\times4 + 2\times 2  & 1\times3 + 2\times 1\\
3\times4 + 4\times 2  & 3\times3 + 4\times 1
\end{pmatrix} \\
&=
\begin{pmatrix}
8  & 5 \\
20  & 13
\end{pmatrix}
\end{align}
$$
また、$BA$ を計算すると

$$
BA =
\begin{pmatrix}
13  & 20\\
5 & 8 
\end{pmatrix}
$$

となり

$$
AB \neq BA
$$
となることが確認できる。

#### 転置行列
行列の行と列を入換えた行列を **転置行列** という。行列 $A$　の転置行列　は $ A^T $ と表現される。

例えば行列$A$　が以下の場合 
$$
A =
\begin{pmatrix}
1  & 2 & 3\\
4 & 5 & 6 
\end{pmatrix}
$$

転置行列　は $ A^T $ は

$$
A^T =
\begin{pmatrix}
1  & 4 \\
2 & 5 \\
3 & 6
\end{pmatrix}
$$

となる

## Numpyを使った演算

ベクトルや行列の計算を行うには、**numpy** パッケージを使用する。

In [2]:
#
#ベクトルの和の計算
#
import numpy as np

a = np.array([2,9,4])
b = np.array([7,2,3])
c = a + b
c


array([ 9, 11,  7])

In [12]:
import numpy as numpy

d = np.array([1,2,3])
e = np.array([4,5,6])
f = d + e
f
print(c)

array([5, 7, 9])

In [14]:
#
#ベクトルのスカラー倍
#
import numpy as np

a = np.array([1,8,4])
c = 3 * a
c
print(c)

b = np.array([1,2,3])
d = b * 3
d


[ 3 24 12]


array([3, 6, 9])

In [2]:
#
#ベクトルの内積
#
import numpy as np

a = np.array([1,2])
b = np.array([3,4])
c = np.dot(a,b)
c
print(c)

d = np.array([5,6])
e = np.array([7,8])
f = np.dot(d,e)
f

11

In [3]:
#
#行列の和
#
import numpy as np

a = np.array([[1,2],[3,4]])
b = np.array([[5,6],[7,8]])
              
c = a + b
c


array([[ 6,  8],
       [10, 12]])

In [7]:
#
#行列の積
#
import numpy as np

a = np.array([[1,2],[3,4]])
b = np.array([[4,3],[2,1]])
              
c = np.dot(a,b)
print(c)


[[ 8  5]
 [20 13]]


In [11]:
#
#行列の積
#
import numpy as np

a = np.array([[1,2],[3,4]])
b = np.array([[4,3],[2,1]])
              
c = np.dot(b,a)
c
print(c)

array([[13, 20],
       [ 5,  8]])

In [10]:
#
#転置行列
#
import numpy as np

a = np.array([[1,2,4],[4,5,6]])
              
a.T
print(a.T)

[[1 4]
 [2 5]
 [4 6]]
