# 出力層の設計

## 3.5.1 恒等関数とソフトマックス関数

In [1]:
import numpy as np

In [2]:
a = np.array([0.3 , 2.9 , 4.0])

exp_a = np.exp(a)
print(exp_a)

[ 1.34985881 18.17414537 54.59815003]


In [3]:
sum_exp_a = np.sum(exp_a)
print(sum_exp_a)

74.1221542101633


In [4]:
y = exp_a / sum_exp_a
print(y)

[0.01821127 0.24519181 0.73659691]


In [5]:
def softmax(a):
    exp_a = np.exp(a)
    sum_exp_a = np.sum(exp_a)
    y = exp_a / sum_exp_a
    
    return y

# 3.5.2 ソフトマックス関数の実装上の注意

softmax関数の実装は、コンピュータで計算を行う上では欠点があります。その欠点とは、オーバーフローに関する問題です。ソフトマックス関数の実装では、指数関数の計算を行うことになりますが、その際、指数関数の値が容易に大きな値になります。例えば、$e^{10}$は20,000を超え、$e^{100}$は０が40個以上も並ぶ大きな値になり、$e^{1000}$の結果は無限大を表すinfが返ってきます。そして、このような大きな値どうしで割り算を行うと、数値が不安定な結果になってしまうのです。

オーバーフローの対策としては、入力信号の中で最大の値を用いることが一般的です。

In [6]:
a = np.array([1010 , 1000 , 990])
exp_a = np.exp(a)
sum_exp_a = np.sum(exp_a)
y = exp_a / sum_exp_a
print(y)

[nan nan nan]


  exp_a = np.exp(a)
  y = exp_a / sum_exp_a


In [7]:
a = np.array([1010 , 1000 , 990])
c = np.max(a)
print(a-c)
exp_a = np.exp(a-c)
sum_exp_a = np.sum(exp_a)
y = exp_a / sum_exp_a
print(y)

[  0 -10 -20]
[9.99954600e-01 4.53978686e-05 2.06106005e-09]


In [8]:
def softmax(a):
    c = np.max(a)
    exp_a = np.exp(a - c)
    sum_exp_a = np.sum(exp_a)
    y = exp_a / sum_exp_a
    
    return y

## 3.5.3 ソフトマックス関数の特徴

ソフトマックス関数の出力は、0から1.0の間の実数になります。また、ソフトマックス関数の出力の総和は1になります。さて、この総和が1になるという性質ですが、これはソフトマックス関数の重要な性質です。この性質のおかげでソフトマックス関数の出力を「確率」として解釈することができます。

In [9]:
a = np.array([0.3 , 2.9 , 4.0])
y = softmax(a)
print(y)

[0.01821127 0.24519181 0.73659691]


In [10]:
np.sum(y)

1.0