# Softmax Function
이 노트북은 Softmax 함수의 정의, 수식, 그리고 시각적 직관을 정리한 것입니다.

Softmax는 다중 클래스 분류 문제에서 출력 확률을 생성할 때 자주 사용됩니다.
수식은 다음과 같습니다:

$$
\text{softmax}(z_i) = \frac{e^{z_i}}{\sum_{j} e^{z_j}}
$$

In [None]:
import numpy as np
import matplotlib.pyplot as plt

def softmax(x):
    e_x = np.exp(x - np.max(x))
    return e_x / e_x.sum()

x = np.linspace(-2, 2, 100)
x_matrix = np.vstack([x, x + 0.5, x - 0.5])
y = np.apply_along_axis(softmax, 0, x_matrix)

plt.figure(figsize=(8, 4))
for i in range(y.shape[0]):
    plt.plot(x, y[i], label=f'Class {i+1}')
plt.title("Softmax Outputs Over Input Range")
plt.xlabel("Input value")
plt.ylabel("Probability")
plt.legend()
plt.grid(True)
plt.show()

### 해석
- softmax는 입력 벡터를 정규화하여 총합이 1이 되는 확률 분포로 바꿔줍니다.
- `np.exp(x - np.max(x))` 는 overflow 방지를 위한 안정화 기법입니다.
- 위 그래프는 여러 클래스 입력에 대해 softmax가 어떻게 반응하는지를 보여줍니다.

> 참고: softmax의 gradient는 cross entropy loss와 함께 사용할 때 간단한 형태로 미분이 됩니다.