# 4.2 손실 함수
- 손실 함수는 신경망 성능의 '나쁨'을 나타내는 지표로, 현재의 신경망이 훈련 데이터를 얼마나 잘 처리하지 '못'하느냐를 나타낸다.

## 4.2.1 오차제곱합
$$E = \frac{1}{2}\sum_{k} (y_k-t_k)^2$$
$y_k$ : 신경망의 출력(신경망이 추정한 값)  
$t_k$ : 정답 레이블  
$k$ : 데이터의 차원 수

In [6]:
import numpy as np
def sum_squares_error(y, t):
    return 0.5 * np.sum((y-t)**2)

# 정답은 '2'
t = [0, 0, 1, 0, 0, 0, 0, 0, 0, 0]

# 예1 : '2'일 확률이 가장 높다고 추정함 (0.6)
y1 = [0.1, 0.05, 0.6, 0.0, 0.05, 0.1, 0.0, 0.1, 0.0, 0.0]
print(sum_squares_error(np.array(y1), np.array(t)))

# 예2: '7'일 확률이 가장 높다고 추정함 (0.6)
y2 = [0.1, 0.05, 0.1, 0.0, 0.05, 0.1, 0.0, 0.6, 0.0, 0.0]
print(sum_squares_error(np.array(y2), np.array(t)))

# 결과 값이 예1이 예2보다 낮으므로 예1의 추정 결과가 정답에 더 가깝다고 판단가능함.

0.09750000000000003
0.5975


## 4.2.2 교차 엔트로피 오차
$$E = -\sum_{k} t_klny_k$$
$y_k$ : 신경망의 출력(신경망이 추정한 값)  
$t_k$ : 정답 레이블 - 원핫인코딩 되어 있음.  
$k$ : 데이터의 차원 수

In [8]:
def cross_entropy_error(y,t):
    delta = 1e-7
    return -np.sum(t*np.log(y + delta))  # delta : np.log(0) -> -무한대가 되므로 아주 작은 값을 더해 방지한다.
t = [0, 0, 1, 0, 0, 0, 0, 0, 0, 0]

# 예1 : '2'일 확률이 가장 높다고 추정함 (0.6)
y1 = [0.1, 0.05, 0.6, 0.0, 0.05, 0.1, 0.0, 0.1, 0.0, 0.0]
print(cross_entropy_error(np.array(y1), np.array(t)))

# 예2: '7'일 확률이 가장 높다고 추정함 (0.6)
y2 = [0.1, 0.05, 0.1, 0.0, 0.05, 0.1, 0.0, 0.6, 0.0, 0.0]
print(cross_entropy_error(np.array(y2), np.array(t)))

# 결과(오차 값)가 더 작은 첫 번째 추정이 정답일 가능성이 높다고 판단.

0.510825457099338
2.302584092994546
