# 2層ニューラルネットワークで単純な回帰問題を解く

In [None]:
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
from common.activations import softmax, sigmoid
from common.grad import numerical_gradient
from common.loss import mean_squared_error

## 2層ニューラルネットワーククラスの改良

### [演習]
* 2層ニューラルネットワーククラスを回帰問題用に改良しましょう

In [None]:
class TwoLayerNet():
    def __init__(self, input_size, hidden_size, output_size):
        
        # 重みの初期化
        self.params = {}
        init_std=0.01
        np.random.seed(1234)
        self.params["W1"] = init_std * np.random.randn(input_size, hidden_size)
        self.params["b1"] = np.zeros(hidden_size)
        self.params["W2"] = init_std * np.random.randn(hidden_size, output_size)
        self.params["b2"] = np.zeros(output_size)
                
    def predict(self, x):
        """
        x : 入力データ
        """
        W1, W2 = self.params["W1"], self.params["W2"]
        b1, b2 = self.params["b1"], self.params["b2"]
        
        h1 = np.dot(x, W1) + b1
        z1 = h1
        h2 = np.dot(z1, W2) + b2
        y = h2
        return y
    
    def loss(self, x, t):
        """
        x : 入力データ
        t : 正解データ
        """
        y = self.predict(x)
        loss = 
        return loss
    
    def gradient(self, x, t):
        def f(W):
            return self.loss(x,t)
        grads={}
        grads["W1"] = numerical_gradient(f, self.params["W1"])
        grads["b1"] = numerical_gradient(f, self.params["b1"])
        grads["W2"] = numerical_gradient(f, self.params["W2"])
        grads["b2"] = numerical_gradient(f, self.params["b2"])
        return grads

### [演習]
* 2層ニューラルネットワークを計算するクラスを実装しましょう

## データの生成

In [None]:
a = 5
b = 1
x = np.arange(0, 1, 0.01).reshape(1,-1)
error = np.random.rand(x.size) * 0.5
y = a * x + b + error
plt.scatter(x, y)
plt.xlabel("x")
plt.ylabel("y")
plt.show()

## バッチ学習

### [演習]
* 以下のNNにおける重み更新演算を完成させましょう

In [None]:
x = x.reshape(-1, 1)
t = y.reshape(-1, 1)

iters_num = 10000
lr = 0.01

tnet = TwoLayerNet(input_size=1, hidden_size=1, output_size=1)

li_loss = []
for i in range(iters_num):
    # 勾配の計算
    grads = tnet.gradient( )

    # パラメータの更新
    for key in tnet.params.keys():
#         print(key)
        tnet.params[key] -= 
        
    # 学習経過の記録
    loss = tnet.loss( )
    li_loss.append(loss)

In [None]:
# lossのグラフ化
pd.DataFrame(li_loss).plot()
plt.ylabel("loss")
plt.xlabel("iters_num")
plt.show()

In [None]:
# 最終重みの確認
print("W1=", tnet.params["W1"].round(2))
print("b1=", tnet.params["b1"].round(2))
print("W2=", tnet.params["W2"].round(2))
print("b2=", tnet.params["b2"].round(2))

# 訓練精度の確認
y_pred = tnet.predict(x)
print("mse=",mean_squared_error(y_pred, t))

# 学習データと予測データの比較
plt.scatter(y, y_pred)
plt.xlabel("y")
plt.ylabel("y_pred")
plt.show()

## ミニバッチ学習

### [演習]
* 以下のミニバッチ学習を完成させましょう

In [None]:
# ヒント
batch_size = 30
xsize = 100

# 繰り返し回数
iter_num = np.ceil(xsize / batch_size).astype(np.int)

# シャッフル
idx = np.arange(xsize)
np.random.shuffle(idx)

for i in range(iter_num):
    """
    ランダムなミニバッチを順番に取り出す
    """
    mask = idx[batch_size*i:batch_size*(i+1)]
    print(mask)
    x[mask]
    

In [None]:
x = x.reshape(-1, 1)
t = y.reshape(-1, 1)

epochs = 1000
batch_size = 20
lr = 0.01

# 繰り返し回数
xsize = x.shape[0]
iter_num = np.ceil(xsize / batch_size).astype(np.int)

# 2層NNのオブジェクト生成
tnet = TwoLayerNet(input_size=1, hidden_size=1, output_size=1)

li_loss = []
for epoch in range(epochs):
    
    # シャッフル
    idx = np.arange(xsize)
    np.random.shuffle(idx)

    for it in range(iter_num):
        """
        ランダムなミニバッチを順番に取り出す
        """
        mask = 
    
        # ミニバッチの生成
        x_train = x[mask]
        t_train = t[mask]
        
        # 勾配の計算
        grads = tnet.gradient( )

        # パラメータの更新
        for key in tnet.params.keys():
    #         print(key)
            tnet.params[key] -=

    # 学習経過の記録
    loss = tnet.loss( )
    li_loss.append(loss)

In [None]:
# lossのグラフ化
pd.DataFrame(li_loss).plot()
plt.ylabel("loss")
plt.xlabel("epochs")
plt.show()

In [None]:
# 最終重みの確認
print("W1=", tnet.params["W1"].round(2))
print("b1=", tnet.params["b1"].round(2))
print("W2=", tnet.params["W2"].round(2))
print("b2=", tnet.params["b2"].round(2))

# 訓練精度の確認
y_pred = tnet.predict(x)
print("mse=",mean_squared_error(y_pred, t))

# 学習データと予測データの比較
plt.scatter(y, y_pred)
plt.xlabel("y")
plt.ylabel("y_pred")
plt.show()

### [演習]
* バッチ学習の結果とミニバッチ学習の結果を比較してみましょう
* 中間層に活性化関数を設定した場合としない場合を比較してみましょう