In [4]:
import numpy as np
import matplotlib.pyplot as plt

plt.style.use('classic')

In [8]:
y = np.array([0.1, 0.05, 0.6, 0.0, 0.05, 0.1, 0.0, 0.1, 0.0, 0.0])
t = np.array([0,0,1,0,0,0,0,0,0,0])

In [9]:
# 오차제곱합 (sum of squares for error. SSE)
def sum_squares_error(y, t) :
    return 0.5 * np.sum((y-t)**2)

In [10]:
sum_squares_error(y,t)

0.09750000000000003

In [11]:
# 교차 엔트로피 오차(cross entoropy error, CEE)
def cross_entropy_error(y,t) :
    # log 에 0이 들어가 값이 무한대가 되는 것을 방지
    delta = 1e-7
    return -np.sum(t * np.log(y + delta))

In [12]:
cross_entropy_error(y,t)

0.510825457099338

## 미니배치 학습
### 데이터 중 샘플을 뽑아 손실 함수를 계산하는 것을 미니배치 학습이라 한다.

In [19]:
import sys, os
sys.path.append(os.pardir)
from dataset.mnist import load_mnist

(X_train, y_train), (X_test, y_test) = load_mnist(normalize=True, one_hot_label=True)

In [66]:
def cross_entropy_error(y, t) :
    if y.ndim == 1 :
        t = t.reshape(1, -1)
        y = y.reshape(1, -1)
        
    batch_size = y.shape[0]
    return -np.sum(t * np.log(y + 1e-7)) / batch_size

# 미분

### 수치미분을 통한 편미분

In [67]:
def numerical_diff(f, x) :
    # 너무 적은 수로 두면 rounding error 가 발생할 수 있다.
    h = 1e-4
    # 정방 차분보다 중앙 차분이 근사로 인한 오차를 줄인다.
    return (f(x+h) - f(x-h)) / (2*h)

### 기울기

In [121]:
def numerical_gradient(f, x) :
    h = 1e-4
    grad = np.zeros_like(x)
    
    for idx in range(x.size) :
        tmp_val = x[idx]
        
        # numpy 배열에 값을 할당할 경우 자료형을 주의하자
        x[idx] = tmp_val + h
        fxh1 = f(x)
    
        x[idx] = tmp_val - h
        fxh2 = f(x)
        
        grad[idx] = (fxh1 - fxh2) / (2*h)
        x[idx] = tmp_val
        
    return grad

In [123]:
def function(x) :
    return x[0]**2 + x[1]**2

# numpy 는 자료형이 있는 배열이므로 값을 할당할 때 자료형이 다르면 형변환을 거친다.
# numpy 끼리 연산 시에는 numpy 가 자동으로 형변환을 고려하므로 이는 놓치기 쉽다.
# 따라서 기울기 연산과 같은 실수 연산 시에는 numpy를 float 으로 할당하는 것이 좋다.

x = np.array([3.0,4.0])
print(numerical_gradient(function, x))

[6. 8.]


In [125]:
l1 = np.array([3,4])
l1/2

array([1.5, 2. ])