# Section 3: 出力層

本書は、「深層学習前編（day1）レポート」の、「Section 3: 出力層」についてのものです。


## 1. 要点まとめ

出力層は、ニューラルネットワークにおいて、欲しい結果を出力する層である。<br>
例えば、分類問題の場合、分類した結果が主力層のノード毎に出力される。<br>
( 各クラスは確率なので、0 - 1 の範囲、そして、総和は 1 )

全体像の例において、出力層にあたる数式は、以下の通り。

- 出力と出力層活性化関数<br>
$$
\textbf{y}_N^{(t)} = \textbf{z}^{(2)} = f^{(2)}(\textbf{u}^{(2)})
$$

- 誤差関数<br>
訓練結果と、訓練データの正解値との、誤差を計算する。<br>
$$
E_n(\textbf{w})
$$


#### 問題による活性化関数と誤差関数の使い分け

適用する問題により、以下の関数を使用する。

| 関数の種類 | 回帰 | 二値分類 | 他クラス分類 |
| --- | --- | --- | --- |
| 活性化関数 | 恒等写像 | シグモイド関数 | ソフトマックス関数 |
| 誤差関数 | 二乗誤差 | 交差エントロピー | 同左 |


### 3-1 誤差関数


#### 二乗誤差

page. 37 の例では、誤差関数に、二乗誤差を使っている。計算式は以下の通り。<br>
(分類問題では、通常、交差エントロピーを使うことに注意)

$$
E_n(\textbf{w})
=
\frac{1}{2}
\sum_{k = 1}^K(
  y_k - d_k
)^2 \\
=
\frac{1}{2}
\Vert
  \textbf{y}_k - \textbf{d}_k
\Vert^2
$$
<br>
( $ k $: 出力層ノードのインデックス )


#### 交差エントロピー

数式は以下の通り。

$$
E_n(\textbf{w})
=
- \sum_{k = 1}^K d_k \log y_k
$$


また、学習あたり ( 訓練データのインデックス: $ n = 1 \cdots N $  の $ N $ まで ) の誤差は以下となる。

$$
E(\textbf{w}) = \sum_{n = 1}^N E_n
$$


### 3-2 出力層の活性化関数

出力層で使われる活性化関数は、中間層と異なり、信号の大きさ(比率)をそのままに変換する。

それぞれの活性化関数の数式は以下の通り。

#### シグモイド関数

$$
f(u) = \frac{1}{1 + e^{-u}}
$$

( $ u $ : 出力層の入力 )


#### ソフトマックス関数

$$
f(i, u) = \frac{e^{u_i}}
{ \sum_{k = 1}^K e^{u_k}}
$$


## 2. 確認テスト

以降の "page. " は、講義資料のページの番号です。


### page. 38

- 2乗する理由<br>
誤差は負の場合もあるので、大きさ(絶対値)を得るため。

- 続く勾配降下法で、微分するときに、
$ x^2 $ を微分して $ 2 x $ としたら、
$ \frac{1}{2} $ で打ち消せるから。(計算の都合)


### page. 45

ソフトマックス関数の、 1 - 3 に該当するコードは以下の通り。

1. 
```python
return np.exp(x) / np.sum(np.exp(x))
```
にあたる。

1. 
```python
return np.exp(x) / np.sum(np.exp(x))
```
の、 `np.exp(x)` にあたる。

1. 
```python
return np.exp(x) / np.sum(np.exp(x))
```
の、 `np.sum(np.exp(x))` にあたる。


### page. 47

1. 
```python
return -np.sum(np.log(y[np.arange(batch_size), d] + 1e-7)) / batch_size
```
にあたる。

1. 
```python
return -np.sum(np.log(y[np.arange(batch_size), d] + 1e-7)) / batch_size
```
の、
`-np.sum(np.log(y[np.arange(batch_size), d] + 1e-7))` にあたる。

- NOTE: 講義のメモ<br>
  - 'y': 0, 1
  - `1e-7`: 対数関数で 0 の時、 $ - \infty $ になってしまうの回避するため。
