라이브러리

In [1]:
import numpy as np

1. 손실 함수란?
    - 손실 함수(Loss Function)는 신경망 성능의 '나쁨'을 나타내는 지표이다.
        - 손실 값이 작을수록 신경망의 성능이 좋다.
        - 주로 사용하는 손실 함수
            - 평균 제곱 오차 (Mean Squared Error, MSE)
            - 교차 엔트로피 오차 (Cross Entropy Error)

2. 평균 제곱 오차 (MSE)

- 2.1 공식
    - $E = \frac{1}{2} \sum_k (y_k - t_k)^2$
        - $y_k$ : 신경망의 출력값
        - $t_k$ : 정답 레이블값
        - $k$ : 데이터의 차원 수


- 2.2 코드 구현

In [2]:
def mean_squared_error(y, t):
    return 0.5 * np.sum((y - t) ** 2)

- 2.3 예시

In [3]:
# 정답은 '2'
t = [0, 0, 1, 0, 0, 0, 0, 0, 0, 0]

# 예측1: '2'를 가장 높게 추정 (0.6)
y = [0.1, 0.05, 0.6, 0.0, 0.05, 0.1, 0.0, 0.1, 0.0, 0.0]
mse = mean_squared_error(np.array(y), np.array(t))
print(mse)  # 0.0975

# 예측2: '7'을 가장 높게 추정 (0.6)
y = [0.1, 0.05, 0.1, 0.0, 0.05, 0.1, 0.0, 0.6, 0.0, 0.0]
mse = mean_squared_error(np.array(y), np.array(t))
print(mse)  # 0.5975


0.09750000000000003
0.5975


3. 교차 엔트로피 오차 (Cross Entropy Error)

- 3.1 공식
    - $E = -\sum_k t_k \log(y_k)$
        - $y_k$ : 신경망 출력 확률값 (softmax 출력)
        - $t_k$ : 정답 레이블 (one-hot 인코딩)
        - $log$ : 자연로그
            - 실질적으로는 정답 클래스에 해당하는 확률의 로그를 취하는 셈이다.

- 3.2 코드 구현
    - $delta = 1e-7$을 추가하여 log(0) 발생을 방지한다.
    - $t$는 one-hot 형태라고 가정하고 계산한다.

In [None]:
def cross_entropy_error(y, t):
    delta = 1e-7  # log(0) 방지용 작은 값
    return -np.sum(t * np.log(y + delta))

- 3.3 예시

In [5]:
# 정답은 '2'
t = [0, 0, 1, 0, 0, 0, 0, 0, 0, 0]

# 예측1: '2'를 가장 높게 추정
y = [0.1, 0.05, 0.6, 0.0, 0.05, 0.1, 0.0, 0.1, 0.0, 0.0]
cee = cross_entropy_error(np.array(y), np.array(t))
print(cee)  # 0.510825457099

# 예측2: '7'을 가장 높게 추정
y = [0.1, 0.05, 0.1, 0.0, 0.05, 0.1, 0.0, 0.6, 0.0, 0.0]
cee = cross_entropy_error(np.array(y), np.array(t))
print(cee)  # 2.30258409299


0.510825457099338
2.302584092994546
