# chapter 4. 신경망 학습
- **학습**: 훈련 데이터로부터 가중치 매개변수의 최적값을 자동으로 획득하는 것
- **손실 함수**(loss function): 신경망이 학습할 수 있도록 해주는 지표
- 경사법: 손실 함수의 값을 가급적 작게 만드는 기법, 함수의 기울기를 활용

### 4-2. 손실 함수

---



#### 4-2-1. 오차제곱합
- 가장 많이 쓰이는 손실 함수
- **원-핫 인코딩**: 한 원소만 1로 하고 그 외는 0으로 나타내는 표기법

In [None]:
y = [0.1, 0.05, 0.6, 0.0, 0.05, 0.1, 0.0, 0.1, 0.0, 0.0]
t = [0, 0, 1, 0, 0, 0, 0, 0, 0, 0]

In [None]:
# 오차제곱합 파이썬으로 구현

def sum_squares_error(y, t):
    return 0.5 * np.sum((y-t)**2)

In [None]:
# 정답은 '2'

t = [0, 0, 1, 0, 0, 0, 0, 0, 0, 0]

In [None]:
# 예1) '2'일 확률이 가장 높다고 추정함 (0.6)
import numpy as np

y = [0.1, 0.05, 0.6, 0.0, 0.05, 0.1, 0.0, 0.1, 0.0, 0.0]
sum_squares_error(np.array(y), np.array(t))

# 출력 숫자가 책보다 짧음

0.09750000000000003

In [None]:
# 예2) '7'일 확률이 가장 높다고 추정함 (0.6)

y = [0.1, 0.05, 0.1, 0.0, 0.05, 0.1, 0.0, 0.6, 0.0, 0.0]
sum_squares_error(np.array(y), np.array(t))

0.5975

#### 4-2-2. 교차 엔트로피 오차

In [None]:
def cross_entropy_error(y, t):
    delta = 1e-7
    return -np.sum(t * np.log(y + delta))

In [None]:
t = [0, 0, 1, 0, 0, 0, 0, 0, 0, 0]
y = [0.1, 0.05, 0.6, 0.0, 0.05, 0.1, 0.0, 0.6, 0.0, 0.0]
cross_entropy_error(np.array(y), np.array(t))

0.510825457099338

In [None]:
y = [0.1, 0.05, 0.1, 0.0, 0.05, 0.1, 0.0, 0.6, 0.0, 0.0]
cross_entropy_error(np.array(y), np.array(t))

2.302584092994546

#### 4-2-3. 미니배치 학습
- 빅데이터 수준의 많은 데이터가 있는 경우, 일부를 추려 전체의 '근사치'로 이용

In [None]:
import sys, os
sys.path.append(os.pardir)
import numpy as np
from dataset.mnist import load_mnist

(x_train, t_train), (x_test, t_test) = \
    load_mnist(normalize=True, one_hot_label=True)

print(x_train.shape)
print(t_train.shape)

ModuleNotFoundError: ignored