# **Chapter 04. 신경망 학습**

In [1]:
import numpy as np

In [2]:
y = [0.1, 0.05, 0.6, 0.0, 0.05, 0.1, 0.0, 0.1, 0.0, 0.0] # y는 소프트맥스 함수의 출력임. (소프트맥스 함수는 확률로 해석 가능, 리스트 내 원소를 확률로 표현)
t = [0, 0, 1, 0, 0, 0, 0, 0, 0, 0] # 정답을 가리키는 위치의 원소는 1로, 그 외에는 0으로 표기.

# 오차제곱합 함수 구현
# 인수 y, t는 넘파이 배열
def sum_squares_error(y, t):
    return 0.5 * np.sum((y - t)**2)

# 예시1 : '2'일 확률이 가장 높다고 추정 (0.6)
print(sum_squares_error(np.array(y), np.array(t)))

# 예시2 : '7'일 확률이 가장 높다고 추정 (0.6)
y = [0.1, 0.05, 0.1, 0.0, 0.05, 0.1, 0.0, 0.6, 0.0, 0.0]
print(sum_squares_error(np.array(y), np.array(t)))

0.09750000000000003
0.5975


In [3]:
# 교차 엔트로피 오차 함수 구현
def cross_entropy_error(y, t):
    delta = 1e-7
    return -np.sum(t * np.log(y + delta))

t = [0, 0, 1, 0, 0, 0, 0, 0, 0, 0]
y = [0.1, 0.05, 0.6, 0.0, 0.05, 0.1, 0.0, 0.1, 0.0, 0.0]
print(cross_entropy_error(np.array(y), np.array(t)))

y = [0.1, 0.05, 0.1, 0.0, 0.05, 0.1, 0.0, 0.6, 0.0, 0.0]
print(cross_entropy_error(np.array(y), np.array(t)))

0.510825457099338
2.302584092994546


## 미니 배치 학습

In [4]:
from google.colab import drive
drive.mount('/content/gdrive')

Mounted at /content/gdrive


In [5]:
import sys, os
sys.path.append("/content/gdrive/My Drive/Colab Notebooks/DL/deep-learning-from-scratch")
from dataset.mnist import load_mnist

(x_train, t_train), (x_test, t_test) = load_mnist(normalize=True, one_hot_label=True)

print(x_train.shape)
print(t_train.shape)

# 훈련 데이터에서 무작위로 10장 추출
train_size = x_train.shape[0]
batch_size = 10
batch_mask = np.random.choice(train_size, batch_size)
x_batch = x_train[batch_mask]
t_batch = t_train[batch_mask]
print(np.random.choice(60000, 10))

(60000, 784)
(60000, 10)
[53292 28593 24705 32269  2545 57756 37653 48018 14408 50199]


In [6]:
# 4.2.4 (배치용) 교차 엔트로피 오차 구현하기
# y : 신경망의 출력
# t : 정답 레이블
def cross_entropy_error(y, t):
    if y.ndim == 1:
        t = t.reshape(1, t.size)
        y = y.reshape(1, y.size)

    batch_size = y.shape[0]
    return -np.sum(t * np.log(y + 1e-7)) / batch_size

In [7]:
# 정답 레이블이 원-핫 인코딩이 아닌 숫자 레이블로 주어졌을 때
# 교차 엔트로피 오차 구현하기
def cross_entropy_error(y, t):
    if y.ndim == 1:
        t = t.reshape(1, t.size)
        y = y.reshape(1, y.size)

    batch_size = y.shape[0]
    return -np.sum(np.log(y[np.arange(batch_size), t] + 1e-7)) / batch_size