## 4.2　損失関数

In [15]:
import os
import sys
import pickle
import numpy as np
import pandas as pd

### 4.2.1　2 乗和誤差

In [8]:
def sum_squared_error(y, t):
    return 0.5 * np.sum((y-t)**2)

In [10]:
t = [0, 0, 1, 0, 0, 0, 0, 0, 0, 0]
y = [[0.1, 0.05, 0.6, 0.0, 0.05, 0.1, 0.0, 0.1, 0.0, 0.0]]

sum_squared_error(np.array(y), np.array(t))

0.09750000000000003

In [11]:
y = [0.1, 0.05, 0.1, 0.0, 0.05, 0.1, 0.0, 0.6, 0.0, 0.0]

sum_squared_error(np.array(y), np.array(t))

0.5975

### 4.2.2　交差エントロピー誤差

In [12]:
def cross_entropy_error(y, t):
    delta = 1e-7
    return -np.sum(t * np.log(y + delta))

np.log(0) はマイナス無限大となってしまうので、それを防ぐために delta を足している。

In [13]:
t = [0, 0, 1, 0, 0, 0, 0, 0, 0, 0]
y = [[0.1, 0.05, 0.6, 0.0, 0.05, 0.1, 0.0, 0.1, 0.0, 0.0]]

cross_entropy_error(np.array(y), np.array(t))

0.510825457099338

In [31]:
y = [0.1, 0.05, 0.1, 0.0, 0.05, 0.1, 0.0, 0.6, 0.0, 0.0]

cross_entropy_error(np.array(y), np.array(t))

2.9957302735559908

### 4.2.3　ミニバッチ学習

データの中から一部を選び出し、その一部のデータを全体の「近似」として利用することを、ミニバッチ学習と言う。

In [16]:
os.chdir('/Users/yuta.shimizu/Downloads/ML/deep-learning-from-scratch-master/ch01')
os.getcwd()
sys.path.append(os.pardir)

In [18]:
from dataset.mnist import load_mnist

(x_train, t_train), (x_test, t_test) = load_mnist(flatten=True, one_hot_label=True)

print(x_train.shape)
print(t_train.shape)
print(x_test.shape)
print(t_test.shape)

(60000, 784)
(60000, 10)
(10000, 784)
(10000, 10)


In [21]:
train_size = x_train.shape[0]
batch_size = 10
batch_mask = np.random.choice(train_size, batch_size)
x_batch = x_train[batch_mask]
t_batch = t_train[batch_mask]

print(x_batch.shape)
print(t_batch.shape)

(10, 784)
(10, 10)


In [22]:
np.random.choice(60000, 10)

array([12875, 37340, 34307, 58248,  1850, 59069, 59810, 13859, 42070,
       48030])

### 4.2.4　交差エントロピー誤差の実装（バッチ対応版）

In [27]:
def cross_entropy_error(y, t):
    if y.ndim == 1:
        t = t.reshape(1, t.size)
        y = y.reshape(1, y.size)
        
    batch_size = y.shape[0]
    return -np.sum(t * np.log(y + 1e-7)) / batch_size

In [28]:
def cross_entropy_error(y, t):
    if y.ndim == 1:
        t = t.reshape(1, t.size)
        y = y.reshape(1, y.size)
        
    batch_size = y.shape[0]
    return -np.sum(t * np.log(y[np.arange(batch_size), t] + 1e-7)) / batch_size

y[np.arange(batch_size), t] は、各データの正解ラベルに対応するニューラルネットワークの出力を抽出している。

In [38]:
y = np.array([[0.2, 0.8], [0.6, 0.4]])
print(y)
print(y[1, 0])

[[0.2 0.8]
 [0.6 0.4]]
0.6
