## ニューラルネットワーク
### 損失関数
ニューラルネットワークは「一つの指標」を手がかりに最適なパラメータを模索する
この関数には二乗和誤差や交差エントロピー誤差などが用いられる
ニューラルネットワークの性能の悪さ
損失関数をマイナスすると「どれだけ性能が悪くないか」を示すことになる

### 二乗和誤差
\begin{equation}
E = \frac {1}{2}\sum_{k} (y_k - t_k)^2
\end{equation}

In [44]:
import numpy as np
y = [0.1,0.05,0.6]
t = [0,0,1]
def mean_squared_error(y, t):
    return 0.5 * np.sum((y - t)**2)
a = mean_squared_error(np.array(y), np.array(t))
print(a)

# y,tの各要素の差→それぞれを2乗、結果を合計し、1/2する
b = 0.1**2
c = 0.05**2
d = (-0.4)**2
e = (b + c + d )*0.5
print(e)

0.08625000000000002
[ 0.01    0.0025  0.16  ]
0.1725
0.08625


### 交差エントロピー誤差
\begin{equation}
E = - \sum_{k} t_k log y_k
\end{equation}


In [46]:
import numpy as np
y = [0.1,0.05,0.6]
t = [0,1,0]
def cross_entropy_error(y, t):
    # np.log(0) は　-inf となってしまうため、微小な値を追加
    delta = 1e-7
    return - np.sum(t* np.log(y + delta))

a = cross_entropy_error(np.array(y), np.array((t)))
print(a)

2.99573027356


### 交差エントロピー誤差 ミニバッチ化
\begin{equation}
E = -\frac {1}{N} \sum_{n} \sum_{k} t_{nk} \log y_{nk}
\end{equation}

In [6]:
import sys, os
sys.path.append(os.pardir)  # 親ディレクトリのファイルをインポートするための設定
import numpy as np
from dataset.mnist import load_mnist
from PIL import Image

# (訓練画像、訓練ラベル)、（テスト画像、テストラベル）
(x_train, t_train), (x_test, t_test) = load_mnist(normalize=False, one_hot_label=True)

train_size = x_train.shape[0]
batch_size = 10
batch_mask = np.random.choice(train_size, batch_size)
x_batch = x_train[batch_mask]
t_batch = t_train[batch_mask]


#教師データがラベルとして与えられる one-hot表現ではなく、2や7が来る場合
# t* np.log(y + delta) →　np.log(y[np.arange(batch_size), t] + delta)とできる

def cross_entropy_error(y, t):
    if y.ndmi == 1:
        t = t.reshape(1, t.size)
        y = y.reshape(1, y.size)
    batch_size = y.shape[0]
    # np.log(0) は　-inf となってしまうため、微小な値を追加
    delta = 1e-7
    return - np.sum(np.log(y[np.arange(batch_size), t] + delta)) /batch_size

# np.arange
# 0 から batch_size -1 までの配列を生成

(10, 784)


なぜ損失関数を設定するのか？
認識精度を指標にしてはいけない
パラメータの微分が0になってしまうから
ステップ関数の傾きは殆どの場所で0
シグモイド関数の傾き（接線）は0にならない

### 数値微分

#### 微分
\begin{equation}
\frac {df(x)}{dx} = \lim_{h \to 0} \frac{f(x+h)-f(x)}{h} \\
\end{equation}



