In [2]:
import sys, os
sys.path.append(os.pardir)
import numpy as np
import matplotlib.pyplot as plt
import time # 処理時間の計測用
from dataset.mnist import load_mnist
from two_layer_net import TwoLayerNet

(x_train, t_train), (x_test, t_test) = load_mnist(normalize=True, one_hot_label=True)

train_loss_list = []

# 試行回数を指定
iters_num = 600
# 6万枚の画像データ
train_size = x_train.shape[0]
batch_size = 100
learning_rate = 0.1

# エポックとは学習において訓練データを全て使い切ったときの回数に対応する
# 6万個のデータセットに対して100のバッチサイズがあるなら、1エポックに対して600の試行回数
network = TwoLayerNet(input_size=784, hidden_size=50, output_size=10)

for i in range(iters_num):
    # 開始時間を記録
    start_time = time.time()
    # ミニバッチの取得
    batch_mask = np.random.choice(train_size, batch_size)
    x_batch = x_train[batch_mask]
    t_batch = t_train[batch_mask]
    
    # 勾配の計算
    grad = network.numerical_gradient(x_batch, t_batch)
    
    # パラメータの更新
    for key in ('W1', 'b1', 'W2', 'b2'):
        network.params[key] -= learning_rate * grad[key]
    
    # 学習経過の更新
    loss = network.loss(x_batch, t_batch)
    train_loss_list.append(loss)

    # 途中経過を表示
    print(
        'iter ' + str(i + 1) + ' (' + str(np.round((i + 1) / iters_num * 100, 1)) + '%) : '  + # 繰り返し回数
        str(np.round(time.time() - start_time, 1)) + '[s]' # 処理時間
    )

    

iter 1 (0.2%) : 36.3[s]
iter 2 (0.3%) : 31.8[s]
iter 3 (0.5%) : 31.9[s]
iter 4 (0.7%) : 34.5[s]
iter 5 (0.8%) : 32.3[s]
iter 6 (1.0%) : 32.6[s]
iter 7 (1.2%) : 32.8[s]
iter 8 (1.3%) : 33.9[s]
iter 9 (1.5%) : 33.9[s]
iter 10 (1.7%) : 31.9[s]
iter 11 (1.8%) : 31.8[s]
iter 12 (2.0%) : 34.9[s]
iter 13 (2.2%) : 31.6[s]
iter 14 (2.3%) : 31.9[s]
iter 15 (2.5%) : 31.7[s]
iter 16 (2.7%) : 32.5[s]
iter 17 (2.8%) : 30.9[s]
iter 18 (3.0%) : 35.1[s]
iter 19 (3.2%) : 32.5[s]


KeyboardInterrupt: 

In [None]:
# 3エポック分の学習を行う
iters_num = 600*3

# バッチサイズを指定
batch_size = 100

# データサイズ(総データ数)を取得
train_size = x_train.shape[0]

# 1エポックに達する回数を計算
iter_per_epoch = max(train_size / batch_size, 1)
print(iter_per_epoch)

# 学習率を指定
learning_rate = 0.1

In [None]:
# インスタンスを作成
network = TwoLayerNet(input_size=784, hidden_size=50, output_size=10)

# 損失の記録用のリストを作成
train_loss_list = []

# 精度の記録用のリストを作成
train_acc_list = [network.accuracy(x_train, t_train)] # 訓練データに対する初期値
test_acc_list = [network.accuracy(x_test, t_test)] # テストデータに対する初期値

# ミニバッチ学習
for i in range(iters_num):
    # 開始時間を記録
    start_time = time.time()
    
    # ミニバッチデータを取得
    batch_mask = np.random.choice(train_size, size=batch_size, replace=False)
    x_batch = x_train[batch_mask] # 入力データ
    t_batch = t_train[batch_mask] # 教師データ
    
    # 勾配を計算
    grad = network.numerical_gradient(x_batch, t_batch)
    
    # パラメータを更新
    for key in ('W1', 'b1', 'W2', 'b2'):
        # 勾配降下法により値を更新:式(4.7)
        network.params[key] -= learning_rate * grad[key]
    
    # 損失を計算
    loss = network.loss(x_batch, t_batch)
    train_loss_list.append(loss) # 値を記録
        
    # 途中経過を表示
    print(
        'iter ' + str(i + 1) + ' (' + str(np.round((i + 1) / iters_num * 100, 1)) + '%) : ' +  # 繰り返し
        str(np.round(time.time() - start_time, 1)) + '[s]' # 処理時間
    )
    print('loss : ' + str(loss))
    
    # 1エポックごとの処理
    if (i + 1) % iter_per_epoch == 0:
        # 認識精度を計算
        train_acc = network.accuracy(x_train, t_train) # 訓練データ
        test_acc = network.accuracy(x_test, t_test) # テストデータ
        
        # 値を記録
        train_acc_list.append(train_acc) # 訓練データ
        test_acc_list.append(test_acc) # テストデータ
        
        # 途中経過を表示
        print('train acc : ' + str(train_acc))
        print('test acc : ' + str(test_acc))
        
    