## 3.ニューラルネットワークの実装

重み、バイアスを行列にして扱う  

(例)　中間層が2層のネットワークを実装する

In [6]:
import numpy as np

def sigmoid(x):
    return 1 / (1 + np.exp(-x))

def init_network():
    network = {}
    network['W1'] = np.array([[0.1, 0.3, 0.5],  [0.2, 0.4, 0.6]])
    network['b1'] = np.array([0.1, 0.2, 0.3])
    network['W2'] = np.array([[0.1, 0.4],  [0.2, 0.5], [0.3, 0.6]])
    network['b2'] = np.array([0.1, 0.2])
    network['W3'] = np.array([[0.1, 0.3],  [0.2, 0.4]])
    network['b3'] = np.array([0.1, 0.2])
    
    return network

def forward(network, x):
    W1, W2, W3 = network['W1'], network['W2'], network['W3']
    b1, b2, b3 = network['b1'], network['b2'], network['b3']
    
    a1 = np.dot(x, W1) + b1
    z1 = sigmoid(a1)
    a2 = np.dot(z1, W2) + b2
    z2 = sigmoid(a2)
    a3 = np.dot(z2, W3) + b3
    y = a3
    
    return y

network = init_network()
x = np.array([1.0, 0.5])
y= forward(network, x)
print y

[0.31682708 0.69627909]


### 出力層の設計
分類問題か回帰問題かで出力する関数を分ける必要がある

#### 分類問題
データがどのクラスに属するか (男性 or 女性 etc)  
=> 恒等関数

#### 回帰問題
株価予想など  
=> ソフトマックス関数


## 4.ニューラルネットワークの学習

### 訓練データとテストデータ
機械学習の問題では、訓練データとテストデータ（教師データ）の二つのデータに分けて学習を行う  
- モデルの汎化能力を正しく評価したいため  
- 汎化能力とはまだ見ぬデータ（訓練データに含まれないデータ）  

### 損失関数
ニューラルネットワークの学習で用いられる指標  
- ニューラルネットワークでは指標を手がかりに最適なパラメータを探索する  
- 一般的に2乗和誤差や交差エントロピー誤差などが用いられる
- 損失関数は性能の悪さを示す指標。この値が小さいほど正解に近い状態となる

### 2乗和誤差

In [None]:
# yは出力結果、tは正解ラベル
def mean_squared_error(y, t):
    return 0.5 * np.sum((y - t)**2)

### 交差エントロピー誤差
正解ラベル（one-hot表現）が1に対応する出力の自然対数を計算する

In [None]:
# yは出力結果、tは正解ラベル
def cross_entropy_error(y, t):
    delta = 1e-7
    return -np.sum(t * np.log(y + delta))