# 4.2 손실 함수

In [1]:
import numpy as np

In [2]:
# 오차제곱합 함수 만들기
def sum_squares_error(y, t):
    return 0.5 * np.sum((y-t)**2)

In [3]:
# 교차 엔트로피 오차 함수 만들기
def cross_entropy_error(y, t):
    delta = 1e-7
    return -np.sum(t * np.log(y + delta))

In [4]:
# MNIST data 불러오기
import sys, os
sys.path.append(os.pardir)
from dataset.mnist import load_mnist

In [5]:
(x_train, t_train), (x_test, t_test) = \
    load_mnist(normalize=True, one_hot_label=True)

print(x_train.shape)
print(t_train.shape)

(60000, 784)
(60000, 10)


In [6]:
train_size = x_train.shape[0]
batch_size = 10
batch_mask = np.random.choice(train_size, batch_size)
x_batch = x_train[batch_mask]
t_batch = t_train[batch_mask]

In [7]:
# 교차 엔트로피 오차 함수 미니배치에 맞게 바꾸기
def cross_entropy_error(y, t):
    if y.ndim == 1:
        t = t.reshape(1, t.size)
        y = y.reshape(1, y.size)
    
    batch_size = y.shape[0]
    return -np.sum(t * np.log(y + 1e-7)) / batch_size

# 4.3 수치 미분

**수치 미분**: 아주 작은 `차분`으로 근사치로 계산하는 미분 방법

`차분`: 임의의 두 점에서 함수 값의 차이  
cf) 해석적 미분은 오차를 포함하지 않는 '진정한 미분' 값을 구해 준다. 가령  
$y = x^2$의 미분 값은 $\frac{dy}{dx}=2x$

In [2]:
# 중심 차분/ 중앙 차분을 이용한 수치 미분 구현
def numerical_diff(f, x):
    h = 10e-4 # 무작정 작은 값은 반올림 오차로 제대로 계산되지 않는다.
    return (f(x+h)-f(x-h))/(2*h)

# 4.4 기울기

In [1]:
def numerical_gradient(f, x):
    h = 1e-4
    grad = np.zeros_like(x)

    for idx in range(x.size):
        tmp_val = x[idx]
        x[idx] = tmp_val + h
        fxh1 = f(x)

        x[idx] = tmp_val - h
        fxh2 = f(x)

        grad[idx] = (fxh1 - fxh2) / (2 * h)
        x[idx] = tmp_val
    return grad