## [バッチ対応版]交差エントロピー誤差の実装

In [19]:
import sys, os
sys.path.append(os.pardir)
import numpy as np
from dataset.mnist import load_mnist

(x_train, t_train), (x_test, t_test) = \
    load_mnist(normalize = True, one_hot_label = True)

print(x_train.shape)
print(t_train.shape)

(60000, 784)
(60000, 10)


In [20]:
# numpyのnp.random.choice()を用いて無作為に選ぶ
train_size = x_train.shape[0]   # 60000
batch_size = 10

# 0からtrain_size(= 60000)未満の数字の中からランダムにbatch_size(= 10)個の数字を選び出す
batch_mask = np.random.choice(train_size, batch_size)

x_batch = x_train[batch_mask]   # x_batchにx_trainのbatch_mask番目の要素（＝784個の配列データ）を代入
t_batch = t_train[batch_mask]   # t_batchにt_trainのbatch_mask番目の要素を代入

In [None]:
# データが一つの場合
def cross_entropy_error_1(y, t):
    if y.ndim == 1: # yの次元数が1の場合、つまりデータ一つあたりの交差エントロピー誤差を求める場合となる。
        
        # yの次元数が1のときだと、ただの配列になってしまい、`return`で処理する際の`batch_size`が`1`ではなく、`y`の配列数（ニューロンの数）で割ることになり、誤差の計算が正しい値よりも小さく計算されてしまう。
        # そのような場合（yが一次元のとき）は、次のようにyとtを二次元行列に整形する。
        t = t.reshape(1, t.size)    # データの形状を1×(t.size)テンソルに、元のNumPy配列の要素は変えずに整形。`t.size`とは`t`の要素数の総計。
        y = y.reshape(1, y.size)
    
    batch_size = y.shape[0] # batch_sizeにyの形状の0番目の要素（つまり、1次元目に配置されている「まとまり」の個数）を代入（例：y.shape ---- (10, 2) -> y.shape[0] --- 10）
    return -np.sum(t * np.log(y + 1e-7)) / batch_size   # 交差エントロピー誤差の計算

In [None]:
# 教師データ`t`がラベルとして与えられたとき（one-hot表現ではなく、「2」や「7」といったラベルとして与えられたとき）

def cross_entropy_error_2(y, t):
    if y.ndim == 1:
        t = t.reshape(1, t.size)
        y = y.reshape(1, y.size)
    
    batch_size = y.shape[0]

    return -np.sum(np.log(y[np.arange(batch_size), t] + 1e-7)) / batch_size # y[np.arange(batch_size), t]によって、出力結果の「0番目から(batch_size-1)番目のデータにおける、t番目のニューロン（＝正解ノード）の数値（＝確率）」をまとめて出力することができる。
    # np.arange(a)で、[0, 1, ..., a-1]という一次元配列を作ることができる。