# 2層ニューラルネットワークでMNISTを解く

In [None]:
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
from common.activations import softmax, sigmoid
from common.grad import numerical_gradient
from common.loss import cross_entropy_error

## 2層ニューラルネットワーククラスに識別精度を求める関数を追加

### [演習]
* 2層ニューラルネットワーククラスに識別精度を求める関数を追加しましょう

In [None]:
# ヒント
y = np.array([[0.1, 0.9],
                       [0.8, 0.2],
                       [0.3, 0.7]])
t = np.array([[0, 1],
                       [0, 1],
                       [1, 0]])

y = np.argmax(y, axis=1)
print("argmax(y)=", y)

t = np.argmax(t, axis=1)
print("argmax(t)=", t)

print(np.sum(y==t))

In [None]:
class TwoLayerNet():
    def __init__(self, input_size, hidden_size, output_size):
        
        # 重みの初期化
        self.params = {}
        init_std=0.01
        np.random.seed(1234)
        self.params["W1"] = init_std * np.random.randn(input_size, hidden_size)
        self.params["b1"] = np.zeros(hidden_size)
        self.params["W2"] = init_std * np.random.randn(hidden_size, output_size)
        self.params["b2"] = np.zeros(output_size)
                
    def predict(self, x):
        """
        x : 入力データ
        """
        W1, W2 = self.params["W1"], self.params["W2"]
        b1, b2 = self.params["b1"], self.params["b2"]
        
        h1 = np.dot(x, W1) + b1
        z1 = sigmoid(h1)
        h2 = np.dot(z1, W2) + b2
        y = softmax(h2)
        return y
    
    def loss(self, x, t):
        """
        x : 入力データ
        t : 正解データ
        """
        y = self.predict(x)
        loss = cross_entropy_error(y, t)
        return loss
    
    def gradient(self, x, t):
        def f(W):
            return self.loss(x,t)
        grads={}
        grads["W1"] = numerical_gradient(f, self.params["W1"])
        grads["b1"] = numerical_gradient(f, self.params["b1"])
        grads["W2"] = numerical_gradient(f, self.params["W2"])
        grads["b2"] = numerical_gradient(f, self.params["b2"])
        return grads
    
    def accuracy(self, x, t):
        """
        識別精度を算出する関数
        """
        y = 
        t =
        
        return 

## MNISTデータの読み込み

In [None]:
# Load the MNIST dataset
from tensorflow.examples.tutorials.mnist import input_data
mnist = input_data.read_data_sets("../../mnist_data/", one_hot=True) #パスは適宜変更する
train = mnist.train.images
test = mnist.test.images
train_labels = mnist.train.labels
test_labels = mnist.test.labels

## ミニバッチ学習

### [演習]
* 以下のミニバッチ学習を完成させましょう。
* 計算の進行と共に損失が小さくなっていくことを確認する場合は、以下の条件を変更する必要があります。ただし、変更すると計算に時間がかかるようになるので、変更後の計算はご自宅で試してみてください。  

    ```
    x = train[:9,:]  
    t = train_labels[:9,:]  
    ecpochs = 10  
    batch_size = 3  
    ``` 　

In [None]:
x = train[:9,:]
t = train_labels[:9,:]

ecpochs = 10
batch_size = 3
lr = 0.01

# 繰り返し回数
xsize = x.shape[0]
iter_num = np.ceil(xsize / batch_size).astype(np.int)

# 2層NNのオブジェクト生成
tnet = TwoLayerNet(input_size=28*28, hidden_size=100, output_size=10)

train_loss = []
test_loss = []
train_accuracy = []
test_accuracy = []
for epoch in range(ecpochs):
    print("epoch=%s"%epoch)
    
    # シャッフル
    idx = np.arange(xsize)
    np.random.shuffle(idx)

    for it in range(iter_num):
        """
        ランダムなミニバッチを順番に取り出す
        """
        mask = 
    
        # ミニバッチの生成
        x_train = x[mask]
        t_train = t[mask]
        
        # 勾配の計算
        grads = tnet.gradient()

        # パラメータの更新
        for key in tnet.params.keys():
    #         print(key)
            tnet.params[key] -= 

    ## 学習経過の記録
    
    # 訓練データにおけるloss
    train_loss.append(tnet.loss( ))
    
    # テストデータにおけるloss
    test_loss.append(tnet.loss( ))
    
    # 訓練データにて精度を確認
    train_accuracy.append(tnet.accuracy( ))

    # テストデータにて精度を算出
    test_accuracy.append(tnet.accuracy( ))

In [None]:
# lossのグラフ化
df_log = pd.DataFrame({"train_loss":train_loss,
             "test_loss":test_loss,
             "train_accuracy":train_accuracy,
             "test_accuracy":test_accuracy})
df_log.plot()
plt.ylabel("loss")
plt.xlabel("epochs")
plt.show()