In [None]:
import numpy as np

In [None]:
import sys,os,os.path
HOME='/home/jovyan/'

# 3.5 出力層の設計


- NNは分類問題と回帰問題の両方に用いることができる
- 分類と回帰のどちらに用いるかで、出力層の活性化関数を変更する必要がある
    - 一般的に回帰問題では恒等関数を
    - 分類問題ではソフトマックス関数を用いる

# 3.5.1. ソフトマックス関数の定義

- ソフトマックス関数は次の式で表すことができる

$$
    y_{k} = \frac{exp(a_{k})}{\sum_{i=1}^{n} exp(a_{i})}
$$

- n: 出力層の個数
- ソフトマックス関数の分子は入力信号$ ak $の指数関数
- 分母は全ての入力信号の指数関数の和

- ソフトマックスの出力はすべての入力信号から影響を受ける


In [None]:
# ソフトマックス関数の実装(準備)
a = np.array([.3, 2.9, 4.])
exp_a = np.exp(a)
print(f'exp_a: {exp_a}')

sum_exp_a = np.sum(exp_a)
print(f'sum_exp_a: {sum_exp_a}')

y = exp_a / sum_exp_a
print(f'y: {y}')
print(f'sum_y: {np.sum(y)}')

In [None]:
# ソフトマックス関数の実装(オーバーフロー対策前)
def softmax(a):
    exp_a = np.exp(a)
    sum_exp_a = np.sum(exp_a)
    y = exp_a / sum_exp_a
    
    return y

- コンピュータでの計算は、オーバーフロー等を起こす問題がある
- ソフトマックス関数の実装では指数関数の計算があるが、**それは容易に大きな値になる**
- 大きな値どうしてで割り算を行うと, 数値が"不安定"な結果となってしまう

In [None]:
a = np.array([1010, 1000, 990])
np.exp(a) / np.sum(np.exp(a))    # => 正しく計算されない

- ソフトマックスの指数関数の計算を行う際に、**定数を加減算しても、結果は変わらない**
- オーバーフロー対策としては**入力信号の中で最大の値を用いることが一般的**

In [None]:
c = np.max(a)
print(f'a-c: {a-c}')

print(np.exp(a-c) / np.sum(np.exp(a-c)))

In [None]:
# ソフトマックス関数の実装(オーバーフロー対策後)
def softmax(a):
    c = np.max(a)
    exp_a = np.exp(a-c)
    sum_exp_a = np.sum(exp_a)
    
    y = exp_a / sum_exp_a
    
    return y

## 3.5.3. ソフトマックス関数の特徴

- ソフトマックス関数の出力は0から1.0の実数になる
- ソフトマックス関数の出力の総和は1になる

- 上記の特徴から, **ソフトマックス関数の出力を確率として解釈することができる**
- ソフトマックス関数を用いることで、**問題に対して確率的(統計的)な対応ができるようになる**

### 注意点 
- ソフトマックス関数を適用しても各要素の大小関係は変わらない
    - 指数関数$ (y=exp(x)) $が単調増加する関数であることに起因

- NNのクラス分類では, 一般的に出力の一番大きいニューロンに相当するクラスだけを認識結果とする(ことが多い)
- ソフトマックス関数を適用しても出力の一番大きいニューロンの場所は変わらない
- そのため, NNが運類を行う際には出力層のソフトマックス関数を省略することができる
    - 指数関数の計算は計算機にとって重い処理となるため, **出力層のソフトマックス関数は省略するのが一般的**
    - 推論フェーズでは出力層のソフトマックス関数は省略するのが一般的らしい

## 3.5.4. 出力層のニューロンの数

- 出力層のニューロンの数は、**解くべき問題に応じて適宜決める必要がある**
    - クラス分類を行う問題では、出力層のニューロンの数は分類したいクラスの数に設定するのが一般的
    - e.g.) 10クラスを識別したい問題なら, **出力層のニューロンの数は10個に設定する**
    