라이브러리

In [2]:
import numpy as np

1. 기계학습 문제 구분
    - 분류 (Classification) | 데이터가 어떤 클래스에 속하는지를 예측
    - 회귀 (Regression) | 연속적인 수치를 예측

2. 항등 함수와 소프트맥스 함수 구현
    - 소프트맥스 함수 수식 : $y_k = \frac{e^{a_k}}{\sum_{i=1}^{n} e^{a_i}}$
        - 입력 벡터 a를 받아, 출력이 0과 1 사이의 값으로 정규화된다.
        - 출력 벡터의 총합은 항상 1이 된다 (확률처럼 해석 가능).

- 2.1 소프트맥스 함수 코드

In [None]:
def softmax(a):
    c = np.max(a)  # 오버플로 방지용 상수
    exp_a = np.exp(a - c)
    sum_exp_a = np.sum(exp_a)
    y = exp_a / sum_exp_a
    return y


3. 소프트맥스 함수 구현 시 주의점
    - 소프트맥스는 지수 함수(exp)를 사용하기 때문에, 입력값이 커지면 오버플로(overflow) 문제가 발생할 수 있다.

- 3.1 오버플로가 발생하는 경우

In [None]:
print(softmax(np.array([1010, 1000, 990])))

[9.99954600e-01 4.53978686e-05 2.06106005e-09]


    - 오버플로 방지를 적용하지 않으면 nan이 출력될 수 있다.

- 3.2 오버플로 방지 기법
    - 입력값 $a$에서 최댓값을 빼준다.
    - $𝑒^{𝑎𝑖−𝑐}$ 형태로 계산하면, 상대적 차이는 유지되면서 값의 크기만 안정화된다.

4. 소프트맥스 함수의 특징

- 4.1 소프트맥스 결과 확인

In [4]:
a = np.array([0.3, 2.9, 4.0])
y = softmax(a)

print(y)          # [0.01821127 0.24519181 0.73659691]
print(np.sum(y))  # 1.0


[0.01821127 0.24519181 0.73659691]
1.0


- 4.2 특징 정리
    - 출력 범위	| (0, 1) 사이
    - 출력 합 | 항상 1
    - 확률 해석 | 각 출력값을 확률처럼 해석 가능
    - 순서 보존 | 입력값의 대소 관계는 유지된다