# 単層ニューラルネットワークの実装（順伝播）
![%E3%82%B9%E3%82%B1%E3%83%83%E3%83%81.png](attachment:%E3%82%B9%E3%82%B1%E3%83%83%E3%83%81.png)

In [140]:
import pickle #mnistデータセット読み出し用
import numpy as np
from numpy.random import *

#MNISTデータセットを読み込む為の関数
def get_mnist_data():
    with open('/Users/takuya.teramoto/Documents/dataset/processed_mnist.pkl', 'rb') as f:
        dataset = pickle.load(f)
    return dataset['train_img'], dataset['train_label'], dataset['test_img'], dataset['test_label']

#ソフトマックス関数。xはarrayで入力
def softmax(x):
    return np.exp(x - np.max(x)) / np.sum(np.exp(x - np.max(x)))

#ミニバッチに対応した交差エントロピー誤差を計算する関数（出力は平均値)
#pred, ansはそれぞれ学習後の予測値と正解ラベル
#入力はarray。行方向がサンプル数（バッチ数)に対応している。
def cross_entropy_error(pred, ans):
    #1次元配列の場合は1行n列の2次元に変換する
    if pred.ndim ==1:
        pred = pred.reshape(1, pred.size)
        ans = pred.reshape(1, ans.size)
    #行数を取得（行数＝データサイズ＝バッチサイズ） 
    batch_size = pred.shape[0]
    return -np.sum(ans * np.log(pred + 1e-7)) / batch_size

#入力した関数の勾配を求める（関数をベクトルで偏微分）。f:関数, x:ベクトル(array)
def num_grad(f, x):
    h = 1e-4 # 0.0001
    grad = np.zeros_like(x)
    
    it = np.nditer(x, flags=['multi_index'], op_flags=['readwrite'])
    while not it.finished:
        idx = it.multi_index
        tmp_val = x[idx].copy()
        x[idx] = float(tmp_val) + h
        fxh1 = f(x) # f(x+h)
        
        x[idx] = tmp_val - h 
        fxh2 = f(x) # f(x-h)
        grad[idx] = (fxh1 - fxh2) / (2*h)
        
        x[idx] = tmp_val # 値を元に戻す
        it.iternext()   
        
    return grad

In [141]:
#炭層ニューラルネットクラスの定義

class simple_net:
    #initializerの定義
    def __init__(self):
        seed(0)
        #ガウス分布で初期化した行列を生成
        self.W = np.random.randn(2, 3)
        
    #入力ベクトルと重みのドット積を求める関数(今回はバイアスは無視)
    def predict(self, input_x):
        return np.dot(input_x, self.W)
    
    #損失を計算する関数
    def loss(self, input_x, ans):
        a = self.predict(input_x)
        z = softmax(a)
        loss = cross_entropy_error(z, ans)
        return loss
    

In [142]:
#クラス生成。ここでinit関数が動く
net = simple_net()
print(net.W)

[[ 1.76405235  0.40015721  0.97873798]
 [ 2.2408932   1.86755799 -0.97727788]]


In [143]:
#入力値の設定（仮）
input_x = np.array([[0.6, 0.9], [-0.5, 1.2]])

#入力値と重みのドット積
predict = net.predict(input_x)
print("predict: {}".format(predict))

#予測値の中でもっとも確率の高いindexの取得
np.argmax(predict)

#正解ラベルの設定（仮）
ans = np.array([[1, 0, 0], [0, 1, 0]])

#入力値と正解ラベルから損失を計算
loss = net.loss(input_x, ans)
print("loss: {}".format(loss))

predict: [[ 3.07523529  1.92089652 -0.2923073 ]
 [ 1.80704567  2.04099098 -1.66210245]]
loss: 1.2079350018085357


In [144]:
#重みパラメータを微小変化させた際の損失の変化量(=損失を重みで偏微分)を求める

# def f(W):
#     return net.loss(input_x, ans)

#lambda形式でも記述することができる
f = lambda w: net.loss(input_x, ans)

dW = num_grad(f, net.W)
print("dW: {}".format(dW))

#勾配法により重みパラメータの更新
learn_rate = 0.1
net.W -= dW * learn_rate
print("new net.W: {}".format(net.W))

dW: [[-0.0697985   0.25571924  0.00817083]
 [ 0.1702501  -0.24400326  0.0208191 ]]
new net.W: [[ 1.7710322   0.37458528  0.9779209 ]
 [ 2.22386819  1.89195832 -0.97935979]]
