In [1]:
import numpy as np
import matplotlib.pyplot as plt
import pandas as pd
import seaborn as sns

In [2]:
# 오차제곱합 정의
def sum_squares_error(y, t):
    return 0.5 * np.sum((y-t)**2)

In [3]:
t = [0, 0, 1, 0, 0, 0, 0, 0, 0, 0]

y = [0.1, 0.05, 0.6, 0.0, 0.05, 0.1, 0.0, 0.1, 0.0, 0.0]    # '2'일 확률이 가장 높다고 추정한 경우(0.6)
print(sum_squares_error(np.array(y), np.array(t)))

y = [0.1, 0.05, 0.1, 0.0, 0.05, 0.1, 0.0, 0.6, 0.0, 0.0]    # '7'일 확률이 가장 높다고 추정한 경우(0.6)
print(sum_squares_error(np.array(y), np.array(t)))

0.09750000000000003
0.5975


In [4]:
# 교차 엔트로피 오차 정의
def cross_entropy_error(y, t):
    delta = 1e-7
    return -np.sum(t * np.log(y + delta))   # np.log = 0이 되지 않도록 아주 작은 값(delta) 더함

In [5]:
t = [0, 0, 1, 0, 0, 0, 0, 0, 0, 0]
y = [0.1, 0.05, 0.6, 0.0, 0.05, 0.1, 0.0, 0.1, 0.0, 0.0]    # '2'일 확률이 가장 높다고 추정한 경우(0.6)
print(cross_entropy_error(np.array(y), np.array(t)))

y = [0.1, 0.05, 0.1, 0.0, 0.05, 0.1, 0.0, 0.6, 0.0, 0.0]    # '7'일 확률이 가장 높다고 추정한 경우(0.6)
print(cross_entropy_error(np.array(y), np.array(t)))

0.510825457099338
2.302584092994546


In [6]:
# 미니배치 학습
import sys, os
from dataset.mnist import load_mnist

(x_train, y_train), (x_test, y_test) = load_mnist(normalize=True, one_hot_label=True)

print(x_train.shape)
print(y_train.shape)

(60000, 784)
(60000, 10)


In [7]:
# 무작위로 10장만 빼내기
train_size = x_train.shape[0]
batch_size = 10
batch_mask = np.random.choice(train_size, batch_size)
x_batch = x_train[batch_mask]
y_batch = y_train[batch_mask]

In [20]:
# 교차 엔트로피 오차 구현
def cross_entropy_error(y, t):
    if y.ndim == 1:     # 1차원 배열은 reshape로 형상 변환
        t = t.reshape(1, t.size)
        y = y.reshape(1, y.size)

    batch_size = y.shape[0]
    return -np.sum(t * np.log(y + 1e-7)) / batch_size