# データから学習する

## 2乗和誤差

In [1]:
import numpy as np

def mean_squared_error(y, t):
    return 0.5 * np.sum((y-t)**2)

In [2]:
# 2番目を正解とする
t = [0, 0 , 1, 0, 0, 0, 0, 0, 0, 0]

In [3]:
# 例1として、2番目の数字が最も大きい例
y = [0.1, 0.05, 0.6, 0.0, 0.05, 0.1, 0.0, 0.1, 0.0, 0.0]

# 例1を計算してみる。
example1 = mean_squared_error(np.array(y), np.array(t))
example1

0.09750000000000003

In [4]:
# 例2として、7番目の数字が最も大きい例
y = [0.1, 0.05, 0.1, 0.0, 0.05, 0.1, 0.0, 0.6, 0.0, 0.0]
example2 = mean_squared_error(np.array(y), np.array(t))
example2

0.5975

In [5]:
judge_list = [example1, example2]

# 小さい数字を表示
min(judge_list)

0.09750000000000003

## 交差エントロピー誤差

In [6]:
def cross_entropy_error(y, t):
    delta = 1e-7
    return -np.sum(t * np.log(y + delta))

In [7]:
# 2番目を正解とする
t = [0, 0 , 1, 0, 0, 0, 0, 0, 0, 0]

In [8]:
# 例1として、2番目の数字が最も大きい例
y = [0.1, 0.05, 0.6, 0.0, 0.05, 0.1, 0.0, 0.1, 0.0, 0.0]

example1_cr = cross_entropy_error(np.array(y), np.array(t))
example1_cr

0.510825457099338

In [9]:
# 例2として、7番目の数字が最も大きい例
y = [0.1, 0.05, 0.1, 0.0, 0.05, 0.1, 0.0, 0.6, 0.0, 0.0]
example2_cr = cross_entropy_error(np.array(y), np.array(t))
example2_cr

2.302584092994546

In [10]:
judge_list = [example1_cr, example2_cr]

# 小さい数字を表示
min(judge_list)

0.510825457099338

## ミニバッチ学習

In [11]:
# データの呼び出し
import sys, os
sys.path.append(os.pardir)

In [12]:
import numpy as np

In [13]:
from dataset.mnist import load_mnist

In [14]:
(x_train, t_train), (x_test, t_test) = load_mnist(normalize=True, one_hot_label=True)

In [15]:
x_train.shape

(60000, 784)

In [16]:
t_train.shape

(60000, 10)

In [17]:
# ランダムで呼び出し
train_size = x_train.shape[0]
batch_size = 10
batch_mask = np.random.choice(train_size, batch_size)
x_batch = x_train[batch_mask]
t_batch = t_train[batch_mask]

In [18]:
np.random.choice(60000, 10)

array([53449, 20086, 32759, 20424,  8704,  9421, 59142, 52780, 49899,
       19625])

In [19]:
def cross_entropy_error(y, t):
    if y.ndim == 1:
        t = t.reshape(1, t.size)
        y = y.reshape(1, y.size)
    batch_size = y.shape[0]
    return -np.sum(t * np.log(y) / batch_size)