# 多層パーセプトロン（MLP）
今回はnumpyを用いたMLPの実装を通じて，Neural Networkを理解します．

最終的にはpytorchというライブラリを用いて実装をしていきますが，その裏側を理解することで柔軟な実装が行えることを目指します．

## 多層パーセプトロンの構造

入力層→中間層→出力層

今回は，全ての層で全結合（Dense）層を考える．

入力データ
$$
X = 
$$

In [1]:
import numpy as np

## 活性化関数

### Sigmoid関数
\begin{equation}
\sigma(x) = \frac{1}{1+\text{exp}(-x)} \tag{1}
\end{equation}

\begin{equation}
\sigma'(x) = \sigma(x)(1-\sigma(x)) \tag{2}
\end{equation}

In [None]:
def sigmoid(x):
    # 単純な実装
    # return 1 / (1 + np.exp(-x))
    
    # expのoverflow対策を施した実装
    # x >=0 のとき sigmoid(x) = 1 / (1 + exp(-x))
    # x < 0 のとき sigmoid(x) = exp(x) / (1 + exp(x))
    return np.exp(np.minimum(x, 0)) / (1 + np.exp(- np.abs(x)))


def deriv_sigmoid(x):
    return sigmoid(x) * (1 - sigmoid(x))

## ReLU関数

\begin{equation}
\text{ReLU}(x) = \text{max}(0, x) \tag{3}
\end{equation}

\begin{equation}
\text{ReLU}'(x) =  \begin{cases}
    1 \quad \text{if} \quad x > 0 \tag{4} \\
    0 \quad \text{otherwise}
    \end{cases}
\end{equation}

In [None]:
def relu(x):
    return np.maximum(x, 0)


def deriv_relu(x):
    return (x > 0).astype(x.dtype)

## tanh関数

\begin{equation}
    \text{tanh}(x) = \frac{\text{exp}(2x)-1}{\text{exp}(2x)+1} \tag{5}
\end{equation}

\begin{equation}
    \text{tanh}'(x) = 1 - \text{tanh}^2(x) \tag{6}
\end{equation}

In [None]:
def tanh(x):
    return np.tanh(x)


def deriv_tanh(x):
    return 1 - tanh(x) ** 2