# Hàm sofmax
$$a_i = \frac{\exp(z_i)}{\sum_{j=1}^C \exp(z_j)}, ~~ \forall i = 1, 2, \dots, C$$

In [1]:
import numpy as np
def softmax(Z):
    e_Z = np.exp(Z)
    A = e_Z / np.sum(e_Z)
    return A

In [2]:
print(softmax(np.array([[1, 2, 2], [3 ,4, 2]])))

[[0.02730045 0.07421031 0.07421031]
 [0.20172453 0.54834411 0.07421031]]


Dễ thấy trong hàm `softmax()` có tham số `Z` là 1 `np.array` đại diện cho `z_i = w_i^T.x` <br/>
Tuy nhiên với các phần tử lớn, có thể xảy ra tình trạng tràn số (overflow), vì vậy có cách để giảm số mũ z_i đi

$$\begin{eqnarray}
\frac{\exp(z_i)}{\sum_{j=1}^C \exp(z_j)} &=& \frac{\exp(-c)\exp(z_i)}{\exp(-c)\sum_{j=1}^C \exp(z_j)}\newline
&=& \frac{\exp(z_i-c)}{\sum_{j=1}^C \exp(z_j-c)}
\end{eqnarray}$$
Trong đó, giá trị c thường được chọn là $c = \max_i z_i$

In [3]:
def stable_softmax(Z):
    print(np.max(Z))
    e_Z = np.exp(Z - np.max(Z, axis = 0, keepdims=True))
    A = e_Z / np.sum(e_Z, axis=0)
    return A

In [4]:
print(stable_softmax(np.array([[1, 2, 2], [3 ,4, 2]])))

4
[[0.11920292 0.11920292 0.5       ]
 [0.88079708 0.88079708 0.5       ]]
