## 損失関数 loss function
### 2乗和誤差 sum of squared error
$E = \frac{1}{2} \sum_{k} (y_{k} - t_{k})^2$\
ここで$y_{k}$がニューラルネットワークの出力、$t_{k}$を教師データを表す。$k$はデータの次元数。\
手書き文字認識では、ニューラルネットワークの出力は確率として解釈し、$t_{k}$は教師データの正負としている。\
正解ラベルを1、それ以外を0とする表現をone=hot表現と呼ぶ。\


In [None]:
import numpy as np

def sum_squared_error(y, t):
    return 0.5 * np.sum((y-t)**2)

#### 交差エントロピー誤差 cross entropy error
$E = - \sum_{k} t_{k}\log y_{k}$\
正解ラベルとなる$t_{k}$はone-hot表現とする。

In [None]:
def cross_entropy_error(y, t):
    '''
    引数y, tはnumpy配列とする。
    np.logの計算時、微小な値であるdeltaを足す
    np.log(0)の場合-infとなるのでそれを防止する
    '''
    delta = 1e-7
    return -np.sum(t * np.log(y+ delta))

#### ミニバッチ学習
機械学習は訓練データに対する損失関数を求め、その値を小さくするパラメーターを探す\
損失関数はすべての訓練データの損失関数の和を指標とする\
訓練データ数が多い場合はデータの一部を取り出し、データの全体の近似として利用する\
このような学習法をミニバッチ学習という。

In [None]:
import sys
import os
#sys.path.append(os.pardir)
import numpy as np
from mnist import load_mnist

(x_train, t_train), (x_test, t_test) = \
    load_mnist(normalize=True, one_hot_label=True)
    
print(x_train.shape)
print(x_test.shape)

train_size = x_train.shape[0]
batch_size = 10
# 指定された数字の中からランダムに数を取り出すことができる
batch_mask = np.random.choice(train_size, batch_size)
x_batch = x_train[batch_mask]
t_batch = t_train[batch_mask]