# ソフトマックス関数

In [None]:
import numpy as np
import matplotlib.pyplot as plt

## ソフトマックス関数
* ソフトマックス関数は、複数の入力を正規化し、合計値が1になるようにする関数
* 正規化する前に、指数関数(exp)を計算している。

$\displaystyle{y(k)=\frac{\exp(a_k)}{\Sigma_{i=1}^{n}(\exp(a_i))}}$  
  
$k$:出力ノードの番号

### [問]
* expしてから正規化する理由は？
* 参考として、exp関数を以下に示す。

In [None]:
# exp関数
x = np.linspace(-5,5,100)
y = np.exp(x)
plt.plot(x,y)
plt.show()

### ソフトマックス関数実装上の注意
指数関数の値が大きくなり、オーバーフローを起こす可能性がある。例えば、

In [None]:
print(np.exp(40))
print(np.exp(100))
print(np.exp(1000))

これを回避する方法の一つとして、入力信号の最大値を引くという方法がある。  
ここでもその方法で実装することにする。

### [演習]
- 以下のソフトマックス関数を完成させましょう

In [None]:
def softmax_1(x):    
    """
    オーバーフロー対策なしの場合
    """    
    return

def softmax_2(x):
    """
    オーバーフロー対策ありの場合
    """
    return

In [None]:
x = np.array([1.0, 2.0, 3.0])

# オーバーフロー対策なしの場合
y = softmax_1(x)
print(y)
# 合計が1になることの確認
print("合計=", np.sum(y))

# オーバーフロー対策ありの場合
y = softmax_2(x)
print(y)
# 合計が1になることの確認
print("合計=", np.sum(y))

* 最大値を引いても還り値は同じであることがわかる

### [演習]
* 上記セルのxの配列に大きな値を入れて、オーバーフローを発生させてみましょう。

### [演習]
* 以下のセルの実行結果をみながら、ソフトマックス関数の特徴を考察してみましょう。
* expしてから正規化するのではなく、単純に正規化するとどうなりますか？(冒頭の問い)
* expしてから正規化するのではなく、シグモイド関数に通してから正規化するとどうなりますか？

In [None]:
def sigmoid(x):
    return 1 / (1+ np.exp(-x))


x = np.array([1, 0, 2])
print("x=", x)
print("ソフトマックス=", softmax_2(x).round(3))
print("単純な正規化=", (x/np.sum(x)).round(3))
print("シグモイド関数を通した後に正規化=", (sigmoid(x)/sigmoid(x).sum()).round(3))
print()
x = np.array([5, 0, 10])
print("x=", x)
print("ソフトマックス=", softmax_2(x).round(3))
print("単純な正規化=", (x/np.sum(x)).round(3))
print("シグモイド関数を通した後に正規化=", (sigmoid(x)/sigmoid(x).sum()).round(3))
print()
x = np.array([50, 0, 100])
print("x=", x)
print("ソフトマックス=", softmax_2(x).round(3))
print("単純な正規化=", (x/np.sum(x)).round(3))
print("シグモイド関数を通した後に正規化=", (sigmoid(x)/sigmoid(x).sum()).round(3))
print()
x = np.array([-50, 0, 1])
print("x=", x)
print("ソフトマックス=", softmax_2(x).round(3))
print("単純な正規化=", (x/np.sum(x)).round(3))
print("シグモイド関数を通した後に正規化=", (sigmoid(x)/sigmoid(x).sum()).round(3))
print()
x = np.array([-50, 0, 10])
print("x=", x)
print("ソフトマックス=", softmax_2(x).round(3))
print("単純な正規化=", (x/np.sum(x)).round(3))
print("シグモイド関数を通した後に正規化=", (sigmoid(x)/sigmoid(x).sum()).round(3))



### [演習]
* オーバーフロー対策ありソフトマックス関数のxに大きな値が入ってもエラーが出ずに計算できることを確認しましょう。

## ソフトマックス関数の2次元への拡張

### [演習]
- ソフトマックス関数を2次元へ拡張させましょう。以下のソフトマックス関数を完成させてください。

### [問]
- ソフトマックス関数を2次元へ拡張させる意味は何でしょうか？　 2次元へ拡張させると、どういう計算が可能になるでしょうか？

In [None]:
# ヒント
x = np.array([[1.0, 2.0, 3.0],
                        [4.0, 3.0, 2.0]])
print(x.T)
print()
x = x.T
print(np.max(x, axis=0))
print()
print(np.exp(x))
print()
print(np.sum(np.exp(x), axis=0))

In [None]:
def softmax(x):
    if x.ndim == 2:

        return

    x = x - np.max(x) # オーバーフロー対策
    return np.exp(x) / np.sum(np.exp(x))

In [None]:
# 入力[1.0, 2.0, 3.0]に対するソフトマックスと入力[4.0, 3.0, 2.0]に対するソフトマックを計算できるようにすること

x = np.array([[1.0, 2.0, 3.0],
                        [4.0, 3.0, 2.0]])

y = softmax(x)
print("y=")
print(y)
print("yの合計=")
print(y.sum(axis=1))