# 4.2.3 ミニバッチ学習

## 今まではひとつデータの損失関数を考えていた。

- 交差エントロピーならこれ

$$
E = -\sum_k{t_k\log{y_k}}
$$



## 訓練データすべての損失関数の和を求めたいとすると

- 交差エントロピーならこれ

$$
E = -\frac{1}{N}\sum_n\sum_k{t_{nk}\log{y_{nk}}}
$$

- "$ \frac{1}{N} $"の意味は？
  - 正規化が目的
  - １個あたりの「平均の損失関数」を求めることになる
  - 平均化すれば、訓練データの数に関係なく、いつでも統一した指標が得られる。
  
- 復習：正規化とは？
  - データをある決まった範囲に変換する処理を「正規化」(normalization)と言う
    - P.77 3.6 手書き数字認識 参照


## ミニバッチ学習とは
- たとえば、60,000枚の訓練データの中から100枚を無作為に選び出して、その100枚を使って学習を行う。
- このような学習手法をミニバッチ学習と言う。

In [5]:
import sys,os

sys.path.append(os.pardir)  # 親ディレクトリのファイルをインポートするための設定

from dataset.mnist import load_mnist

(x_train, t_train), (x_test, t_test) = \
    load_mnist(normalize=True, one_hot_label=True)

import numpy as np

In [6]:
# それぞれのデータの形状を出力
print(x_train.shape)
print(t_train.shape)

(60000, 784)
(60000, 10)


In [7]:
# 訓練データの中からランダムに10枚だけ抜き出す
train_size = x_train.shape[0]
batch_size = 10
batch_mask = np.random.choice(train_size, batch_size)
x_batch = x_train[batch_mask]
t_batch = x_train[batch_mask]

In [8]:
np.random.choice(60000,10)

array([44507, 42436, 23201,  7914,  1808,  3242, 19087, 27120, 52382, 14554])

### カラスマークによれば
- ミニバッチの損失関数は「テレビの視聴率」のようなもの