In [1]:
%%javascript
MathJax.Hub.Config({
    TeX: { equationNumbers: { autoNumber: "AMS" } }
});

<IPython.core.display.Javascript object>

In [2]:
%%javascript
MathJax.Hub.Queue(
  ["resetEquationNumbers", MathJax.InputJax.TeX],
  ["PreProcess", MathJax.Hub],
  ["Reprocess", MathJax.Hub]
);

<IPython.core.display.Javascript object>

## ニューラルネットワーク

パーセプトロンは，複雑な振る舞いをする関数であっても重みやバイアスを変えるだけで表現できる可能性を秘めていたが，問題としては，その重みを人間が与えていたことが課題であった．

適切な重みをデータから自動で学習できると言うのがニューラルネットワークの重要な性質の1つである。
ニューロン同士のつながり方に関して言えば，パーセプトロンと何ら変わることはない．

$$
\begin{equation}
y = \begin{cases}
    0 \quad(b + w_1 x_1 + w_2 x_2 \leqq 0) \\
    1 \quad(b + w_1 x_1 + w_2 x_2 > 0) \\
\end{cases}
\end{equation}
$$

を

$$
\begin{equation}
y = h(b + w_1 x_1 + w_2 x_2)
\end{equation}
$$

とおくと，

$$
\begin{equation}
h(x) = \begin{cases}
    0 \quad(x \leqq 0) \\
    1 \quad(x > 0) \\
\end{cases}
\end{equation}
$$

とかきなおせる．この$h(x)$を活性化関数と呼ぶ.

パーセプトロンでは，この活性化関数に，閾値を超えれば，On/Offを切り替える**ステップ関数**を使っているといえる．

また，ニューラルネットワークでよく使われる活性化関数として，

### シグモイド関数

$$
\begin{equation}
h(x) = \frac{1}{1 + exp(-x)}
\end{equation}
$$

### ReLU

$$
\begin{equation}
h(x) = \begin{cases}
x\quad(x>0) \\
0\quad(x\leqq0) \\
\end{cases}
\end{equation}
$$


重要なこととして，ニューラルネットワークでは，活性化関数に非線形関数を用いる必要があることが挙げられる．線形関数を用いると，隠れ層を用いなくても同じことを行うネットワークが必ず存在するため，結局隠れ層を使う意味がなくなってしまうからである．

これは，$h(x) = cx$とすると，たとえば３層の場合, $y = h(h(h(x))$となるが，展開して，$y=c^3x$と書けてしまうから，というのがわかりやすい説明だろう．

以下，活性化関数の実装をしていく

In [4]:
import numpy as np

# numpyを使うことで，numpyの配列（ベクトル）や行列も受け取ることができるようになる
def step_function(x):
    y = x > 0
    return y.astype(np.int)

print(step_function(np.array([-1.0, 0.5, 1.0])))

def sigmoid(x):
    return 1 / (1 + np.exp(-x))

def relu(x):
    return np.maximum(x, 0)

[0 1 1]
