### 3 ニューラルネットワーク

### 3.1 パーセプトロンからニューラルネットワーク

### 3.1.1 ニューラルネットワークの例

ニューラルネットワークを図で表すと, 図3-1のようになります.  
ここで一番左の列を**入力層**, 一番右の列を**出力層**, 中間の列を**中間層**と呼びます.  
中間層は**隠れ層**と呼ぶこともあります
「隠れ」という言葉は, 隠れ層のニューロンが(入力層や出力層とは違って)人の目には見えない, ということを表しています.  
ここでは, 入力層から出力層へ向かって, 順に第0層, 第1層, 第2層と呼ぶことにします.  
図3-1では, 第0層が入力層, 第1層が中間層, 第2層が出力層に対応することになります.  

図3-1を見る限り,前章で見たパーセプトロンと同じような形をしています.  
実際, ニューロンの"つながり方"に関して言えば, 前章で見たパーセプトロンと何ら変わりません.  
それでは,ニューラルネットワークではどのように信号を伝達するのでしょうか.  

### 3.1.2 パーセプトロンの復習

これからニューラルネットワークにおける信号の伝達方法を見ていきますが, それに先立ち,ここではパーセプトロンの復習から始めたいとおもいます.  
それでは,初めに,図3-2の構造のネットワークを考えましょう.  

図3-2は$x_1$と$x_2$の2つの入力信号を受け取り, $y$を出力するパーセプトロンです.  
図3-2のパーセプトロンを数式で表すと, 次の式(3.1)で表せるのでした.  

$$
    \mathrm{y} =
        \begin{cases}
            0 \quad ( b + w_1x_1 + w_2x_2 \leqq 0 ) \\
            1 \quad ( b + w_1x_1 + w_2x_2 > 0 ) \\
        \end{cases}
    \tag{3.1}
$$

ここで,$b$は「バイアス」と呼ばれるパラメータで,これはニューロンの発火のしやすさをコントロールします.  
一方, $w_1$や$w_2$は各信号の「重み」を表すパラメータで, これらは各信号の重要性をコントロールします.  
ところで, 図3-2のネットワークにはバイアス$b$が図示されていません.  
もしバイアスを明示するならば, 図3-3のように表すことができます.  
図3-3では,重みが$b$で入力が1の信号が追加されています.  
このパーセプトロンの動作は, $x_1$と$x_2$と1の3つの諡号がニューロンの入力となり, それら3つの信号にそれぞれの重みが乗算され, 次のニューロンに送信されます.  
次のニューロンでは,それらの重み付けされた信号の和が計算され, その和が0を超えたら1を出力し, そうでなければ0を出力します.  
ちなみに,バイアスの入力信号は常に1であるため, 図で表す際には, ニューロンを灰色で塗りつぶし, 他のニューロンと差別化することにします.  

それでは,式(3.1)をよりシンプルな形に書き換えたいと思います.  
式(3.1)を簡略化するためには, 場合分けの動作---を超えたら1を出力し,そうでなければ0を出力するという動作---をひとつの関数で表します.  
ここでは$h(x)$という新しい関数を導入し, 式(3.1)を次の(3.2), (3.3)のように書き換えます.  

$$
    \mathrm{y} = h(b + w_1x_1 + w_2x_2)
    \tag{3.2}
$$

$$
    \mathrm{h(x)} =
        \begin{cases}
            0 \quad ( x \leqq 0 ) \\
            1 \quad ( x > 0 ) \\
        \end{cases}
    \tag{3.3}
$$

式(3.2)は,入力信号の総和が$h(x)$という関数によって変換され, その変換された値が出力$y$になるということをあらわしています.  
そして, 式(3.3)であらわされる$h(x)$関数は入力が0を超えたら1を返し, そうでなければ0を返します.  
そのため, 式(3.1)と式(3.2),(3.3)は同じことを行ってます.  

### 3.1.3 活性化関数の登場

ここで$h(x)$という関数ですが,このような関数---入力信号の総和を出力信号に変換する関数---は,一般に**活性化関数**(activation function)とよばれます.  
「活性化」という名前が意味するように, 活性化関数は入力信号の総和がどのように活性化するか(どのように発火するか)とうことを決定する役割があります.  
それではさらに式(3.2)を書き換えていきます.  
式(3.2)では,重み付きの入力信号の総和を計算し, そして, その和が活性化関数によって変換される, という2段階の処理を行っています.  
そのため, 式(3.2)を丁寧に書くとすれば, 次の2つの式に分けて書くことができます.  

$$
    \mathrm{a} = b + w_1x_1 + w_2x_2
    \tag{3.4}
$$

$$
    \mathrm{y} = h(a)
    \tag{3.5}
$$

式(3.4)では,重み付き入力信号とバイアスの総和を計算し, それを$a$とします.  
そして,式(3.5)において, $a$が$h()$で変換され, $y$が出力される, という流れになります.  
さて, これまでニューロンはひとつの○で図示してきましたが, 式(3.4)と式(3.5)を明示的に示すとすれば, 次の図3-4のように表すことができます.  

図3-4で表されるように, これまでのニューロンの○の中に,活性化関数によるプロセスを明示的に図示しています.  
つまり, 重み付き信号の和の結果が$a$というノードになり, そして, 活性化関数$h()$によって$y$というノードに変換される,ということがはっきりと示されているわけです.  
なを,ここでは,「ニューロン」と「ノード」という用語を同じ意味で用います.  
ここで, $a$と$y$の○を「ノード」と呼んでいますが, これは, これまでの「ニューロン」と同じ意味で用いています.  

それでは続いて活性化関数について詳しく見ていくことにします.  
この活性化関数が, パーセプトロンからニューラルネットワークへ進むための架け橋になります.  

In [None]:
### 3.2 活性化関数

In [None]:
式(3.3)で表される活性化関数は, 閾値を境にして出力が切り替わる関数で, それは「ステップ関数」や「階段関数」と呼ばれます.  
