# 4. 신경망 학습

In [1]:
import numpy as np
import sys,os
from dataset.mnist import load_mnist
sys.path.append(os.pardir)

### 오차제곱합(Sum of Squares for error,SSE)

In [2]:
def sum_squares_error(y,t):
    return 0.5 * np.sum((y-t)**2)

In [3]:
t = [0,0,1,0,0,0,0,0,0,0] # 2 원-핫 인코딩

y = [0.1,0.05,0.6,.0,.05,.1,.0,.1,.0,.0]

sum_squares_error(np.array(y),np.array(t))


0.09750000000000003

In [4]:
y = [.1,.05,.1,.0,.05,.1,.0,.6,.0,.0] # 신경망의 출력값이 7이 가장 높은 경우 
sum_squares_error(np.array(y),np.array(t))


0.5975

### 교차 엔트로피 오차(Cross Entropy Error,CEE)

In [5]:
def cross_entropy_error(y,t):
    delta = 1e-7 # 로그 수식 안 값이 0이 되지 않게 하기 위함
    return -np.sum(t*np.log(y+delta))

In [6]:
t = [0,0,1,0,0,0,0,0,0,0] # 2 원-핫 인코딩

y = [0.1,0.05,0.6,.0,.05,.1,.0,.1,.0,.0]

cross_entropy_error(np.array(y),np.array(t))

0.510825457099338

In [7]:
y = [.1,.05,.1,.0,.05,.1,.0,.6,.0,.0] # 신경망의 출력값이 7이 가장 높은 경우 

cross_entropy_error(np.array(y),np.array(t))


2.302584092994546

### 미니배치(mini-batch)

In [8]:
(x_train,y_train),(x_test,y_test) = load_mnist(normalize=True,one_hot_label=True)
print(x_train.shape)
print(y_train.shape)

(60000, 784)
(60000, 10)


In [9]:
train_size = x_train.shape[0]
batch_size = 10
batch_mask = np.random.choice(train_size,batch_size) # 지정한 범위의 수 중에서 무작위로 원하는 갯수만 꺼낼 수 있음 
x_batch = x_train[batch_mask]
y_batch = y_train[batch_mask]

### (배치용) 교차 엔트로피 오차 구현

In [10]:
def cross_entropy_error(y,t):
    if y.ndim == 1:
        t = t.reshape(1,t.size)
        y = y.reshape(1,y.size)
    
    batch_size = y.shape[0]
    return -np.sum(t*np.log(y+1e-7)) / batch_size

In [11]:
def cross_entropy_error(y,t):
    if y.ndim == 1:
        t = t.reshape(1,t.size)
        y = y.reshape(1,y.size)

    batch_size = y.shape[0]
    return -np.sum(np.log(y[np.arange(batch_size),t]+1e-7)) / batch_size