# ミニバッチ学習

- 訓練データの学習とは、「訓練データに対する損失関数を求め、その値をできるだけ小さくするようなパラメータを探し出す」ということ
    - 訓練データが100個あれば、その100個の損失関数の和を指標とする

### (訓練データすべての交差エントロピー誤差)

$\displaystyle
E = -\frac{1}{N}\sum_n\sum_{k}t_nk\log y_{nk}
$

- 単一データの交差エントロピー誤差をN個分に拡張
- 最後にNで割って正規化
    - 1個あたりの「平均の損失関数」を求める

ミニバッチ学習とは
---

- すべての訓練データから学習するのではなく、データの中から一部を選び出し、その一部のデータを全体の「近似」として利用する学習方法
    - 例えば、60000枚の訓練データから無作為に100枚を選び出して、その100枚を使って学習を行う

mnistの画像をランダムで抽出する
---

In [1]:
import sys, os
sys.path.append('./deep-learning-from-scratch-master/')

from dataset.mnist import load_mnist
from PIL import Image

import numpy as np
import pickle

In [2]:
(x_train, t_train), (x_test, t_test) = load_mnist(normalize=True, one_hot_label=True)

print(x_train.shape)
print(t_train.shape)

(60000, 784)
(60000, 10)


In [17]:
train_size = x_train.shape[0]
batch_size = 10
# 指定された数字の中からランダムに数字を抽出するにはNumpyのnp.random.choiceを使用する
batch_mask = np.random.choice(train_size, batch_size)
x_batch = x_train[batch_mask]
t_batch = t_train[batch_mask]
print(x_batch.shape)
print(t_batch.shape)

60000
(10, 784)
(10, 10)


In [11]:
# バッチ処理に対応したクロスエントロピー誤差
def cross_entropy_error(y, t):
    if y.ndim == 1:
        t = t.reshape(1, t.size)
        y = y.reshape(1, y.size)
    batch_size = y.shape[0]
    return -np.sum(t * np.log(y)) / batch_size

In [14]:
cross_entropy_error(x_batch, t_batch)

  import sys


ValueError: operands could not be broadcast together with shapes (10,10) (10,784) 