# Softmax

> Sei
> 
> $$
> \mathbf{z} = \mathbf{W} \begin{bmatrix} 1 \\ \mathbf{x} \end{bmatrix}
> \text{ mit }
> \mathbf{W} = \begin{bmatrix}
>     b_1 &w_{1,1} &w_{1,2} \\
>     b_2 &w_{2,1} &w_{2,2} \\
>     b_3 &w_{3,1} &w_{3,2} \\
>     b_4 &w_{4,1} &w_{4,2}
> \end{bmatrix} = \frac{1}{10} \begin{bmatrix}
>     1 &5 &-2 \\
>     3 &0 &2 \\
>     2 &1 &0 \\
>     -1 &3 &2
> \end{bmatrix}
> $$
> 
> das Argument für die Softmax-Aktivierungsfunktion $\mathbf{\phi}(\mathbf{z})$
> zur multinomiellen Klassifikation ($y \in \{1,\ldots,K\}$).
> 
> - Um wieviele Klassen handelt es sich hier? $K = \ldots$
> - Die Beobachtung $\mathbf{x} = [2~4]^\intercal$ wird durch $\mathbf{\phi}$
>   in die Klasse ... eingeteilt mit Wahrscheinlichkeit ...
> 
> **Hinweis**: Sollte die Entscheidung nicht eindeutig sein, nehmen Sie die erste
> Instanz.

In [1]:
import numpy as np
np.set_printoptions(precision=4, suppress=True)

W = np.array([[1,  5, -2],
              [3,  0,  2],
              [2,  1,  0],
              [-1, 3,  2]])
W = W / 10
x = np.array([2, 4])

## Anzahl Klassen

$\mathbf{W}$ hat 4 Zeilen $\Rightarrow$ 4 Klassen $\Rightarrow K=4$

## Berechnung Zuordnung und WK

$$
\text{Soft-Max:}~\mathbf{\phi}(\mathbf{z}) =
    \begin{bmatrix} \phi_1(z_1) \\ \vdots \\ \phi_K(z_K) \end{bmatrix}
    ~:~ \mathbb{R}^k \mapsto [0,1]^k \newline
\text{mit}~\phi_i = \frac{\operatorname{e}^{z_i}}{\sum_{j=1}^K e^{z_j}},~
    i = 1,\ldots,K \ge 2
$$

In [2]:
def softmax(z):
    K = z.shape[0]
    val = np.ones(K)
    
    denominator = np.sum(np.exp(z))
    
    for i in range(K):
        val[i] = np.exp(z[i]) / denominator
    
    return val

In [3]:
z = W @ np.hstack([np.ones(1), x])
print(z)

[0.3 1.1 0.4 1.3]


In [4]:
sm_z = softmax(z)
print(f'softmax(z) = {sm_z}')

class_idx = np.argmax(sm_z)
print(f'Zuordnung zu Klasse {class_idx + 1} mit WK {sm_z[class_idx]:.4f}')

softmax(z) = [0.1419 0.3157 0.1568 0.3856]
Zuordnung zu Klasse 4 mit WK 0.3856
