# ニューラルネットワークの学習
## この章で学べること
- 活性化関数に値が滑らかに変化するシグモイド関数と急に変化するステップ関数を使用する違い

## 輪読会メモ
ポイント：データから汎化することが大事  
- なぜ損失関数なのか、正答率ではないのか？
  - 正答率で計算すると値が飛び飛びになり、微分と相性が悪い
- 教科書の2乗和誤差の英語表記に誤り。
- 交差エントロピーの良さは、勾配降下法と相性がいいから
- 微分
  - 数値微分

Q.汎化はどこまですべき？　▶　やりたいことに対してどれだけ失敗が許されるところまで調整していく  

## 前提知識
### 正規化と標準化の違い
正規化：データを0〜1の範囲にスケーリング  
標準化：データを平均を0にし、標準偏差を1にスケーリング

機械学習の目標：汎化能力の獲得  
汎化能力：まだ見ぬデータに対しての能力

## 機械学習とニューラルネットワークの違い
- 機械学習
  - アルゴリズムは機械が見つけ出し、特徴量を人間の手で設定
- ニューラルネットワーク
  - 特徴量までも機械が学習し、人がほぼ手を加えない
  - メリット：解く問題に関係なく生データのまま学習できる

## 損失関数
### 2乗和誤差
$$ E = \frac{1}{2} \sum_{i=1}^{N} (y_i - t_i)^2 $$

( N ) はデータの総数  
( y_i ) は予測値  
( t_i ) は実際の値  

In [2]:
import numpy as np

# 2乗和誤差関数
def sum_squared_error(y, t):
    return 0.5*np.sum((y-t)**2)

In [3]:
# 予測値と実際の値のサンプルデータ
y = np.array([0.1, 0.2, 0.7])
t = np.array([0, 0, 1])

# 2乗和誤差関数を試す
error = sum_squared_error(y, t)
print(f"2乗和誤差: {error}")

2乗和誤差: 0.07000000000000002


### 交差エントロピー誤差
勾配降下法と相性がいい

$$ E = - \sum_{i=1}^{N} t_i \log y_i $$


In [5]:
def cross_entropy_error(y, t):
    delta = 1e-7
    return -np.sum(t*np.log(y + delta))

In [6]:
error = cross_entropy_error(y, t)
print(f'クロスエントロピー誤差: {error}')

クロスエントロピー誤差: 0.3566748010815999


### ミニバッチ学習
統計学でいう、母集団から標本を抽出するようなもの


In [8]:
import sys, os
sys.path.append(os.pardir)  # 親ディレクトリのファイルをインポートするための設定
import numpy as np
import pickle
from dataset.mnist import load_mnist
from common.functions import sigmoid, softmax


(x_train, t_train), (x_test, t_test) = load_mnist(normalize=True, one_hot_label=True)

print(x_train.shape)
print(t_train.shape)


(60000, 784)
(60000, 10)


In [14]:
train_size = x_train.shape[0]
batch_size = 10
batch_mask = np.random.choice(train_size, batch_size)
print(f'batch_mask: {batch_mask}')

x_batch = x_train[batch_mask]
t_batch = t_train[batch_mask]
# print(f't_batch: {t_batch}')

batch_mask: [40266 56233 36347 37273  5733 40720 52976 19608 32587  4244]


In [20]:
array = np.array([0, 12, 5, 7, 8, 43, 47])
print(f'array[[2, 5, 1]]: {array[[2, 5, 1]]}')

array[[2, 5, 1]]: [ 5 43 12]


### ミニバッチに対応した交差エントロピー誤差を実装
