# 2.7 学習と検証の実施

- 本ファイルでは、SSDの学習と検証の実施を行います。手元のマシンで動作を確認後、AWSのGPUマシンで計算します。
- p2.xlargeで約6時間かかります。


# 学習目標

1.	SSDの学習を実装できるようになる

# 事前準備

- AWS EC2 のGPUインスタンスを使用します
- フォルダ「utils」のssd_model.pyをします

In [19]:
# パッケージのimport
import os.path as osp
import random
import time

import cv2
import numpy as np
import pandas as pd
import torch
import torch.nn as nn
import torch.nn.init as init
import torch.optim as optim
import torch.utils.data as data

In [20]:
# 乱数のシードを設定
torch.manual_seed(1234)
np.random.seed(1234)
random.seed(1234)

In [21]:
device = torch.device("cuda:0" if torch.cuda.is_available() else "cpu")
print("使用デバイス：", device)

使用デバイス： cpu


# DatasetとDataLoaderを作成する

In [22]:
from utils.ssd_model import make_datapath_list, VOCDataset, DataTransform, Anno_xml2list, od_collate_fn


# ファイルパスのリストを取得
rootpath = "./data/VOCdevkit/VOC2012/"
train_img_list, train_anno_list, val_img_list, val_anno_list = make_datapath_list(
    rootpath)

# Datasetを作成
voc_classes = ['aeroplane', 'bicycle', 'bird', 'boat',
               'bottle', 'bus', 'car', 'cat', 'chair',
               'cow', 'diningtable', 'dog', 'horse',
               'motorbike', 'person', 'pottedplant',
               'sheep', 'sofa', 'train', 'tvmonitor']
color_mean = (104, 117, 123)  # (BGR)の色の平均値
input_size = 300  # 画像のinputサイズを300×300にする

train_dataset = VOCDataset(train_img_list, train_anno_list, phase="train", transform=DataTransform(
    input_size, color_mean), transform_anno=Anno_xml2list(voc_classes))

val_dataset = VOCDataset(val_img_list, val_anno_list, phase="val", transform=DataTransform(
    input_size, color_mean), transform_anno=Anno_xml2list(voc_classes))


# DataLoaderを作成する
batch_size = 32

train_dataloader = data.DataLoader(
    train_dataset, batch_size=batch_size, shuffle=True, collate_fn=od_collate_fn)

val_dataloader = data.DataLoader(
    val_dataset, batch_size=batch_size, shuffle=False, collate_fn=od_collate_fn)

# 辞書オブジェクトにまとめる
dataloaders_dict = {"train": train_dataloader, "val": val_dataloader}


# ネットワークモデルの作成する

In [23]:
from utils.ssd_model import SSD

# SSD300の設定
ssd_cfg = {
    'num_classes': 21,  # 背景クラスを含めた合計クラス数
    'input_size': 300,  # 画像の入力サイズ
    'bbox_aspect_num': [4, 6, 6, 6, 4, 4],  # 出力するDBoxのアスペクト比の種類
    'feature_maps': [38, 19, 10, 5, 3, 1],  # 各sourceの画像サイズ
    'steps': [8, 16, 32, 64, 100, 300],  # DBOXの大きさを決める
    'min_sizes': [30, 60, 111, 162, 213, 264],  # DBOXの大きさを決める
    'max_sizes': [60, 111, 162, 213, 264, 315],  # DBOXの大きさを決める
    'aspect_ratios': [[2], [2, 3], [2, 3], [2, 3], [2], [2]],
}

# SSDネットワークモデル
net = SSD(phase="train", cfg=ssd_cfg)

# SSDの初期の重みを設定
# ssdのvgg部分に重みをロードする
vgg_weights = torch.load('./weights/vgg16_reducedfc.pth')
net.vgg.load_state_dict(vgg_weights)

# ssdのその他のネットワークの重みはHeの初期値で初期化


def weights_init(m):
    if isinstance(m, nn.Conv2d):
        init.kaiming_normal_(m.weight.data)
        if m.bias is not None:  # バイアス項がある場合
            nn.init.constant_(m.bias, 0.0)


# Heの初期値を適用
net.extras.apply(weights_init)
net.loc.apply(weights_init)
net.conf.apply(weights_init)

# GPUが使えるかを確認
device = torch.device("cuda:0" if torch.cuda.is_available() else "cpu")
print("使用デバイス：", device)

print('ネットワーク設定完了：学習済みの重みをロードしました')


使用デバイス： cpu
ネットワーク設定完了：学習済みの重みをロードしました


# 損失関数と最適化手法を定義する

In [24]:
from utils.ssd_model import MultiBoxLoss

# 損失関数の設定
criterion = MultiBoxLoss(jaccard_thresh=0.5, neg_pos=3, device=device)

# 最適化手法の設定
optimizer = optim.SGD(net.parameters(), lr=1e-3,
                      momentum=0.9, weight_decay=5e-4)


# 学習・検証を実施する

In [25]:
# モデルを学習させる関数を作成


def train_model(net, dataloaders_dict, criterion, optimizer, num_epochs):

    # GPUが使えるかを確認
    device = torch.device("cuda:0" if torch.cuda.is_available() else "cpu")
    print("使用デバイス：", device)

    # ネットワークをGPUへ
    net.to(device)

    # ネットワークがある程度固定であれば、高速化させる
    torch.backends.cudnn.benchmark = True

    # イテレーションカウンタをセット
    iteration = 1
    epoch_train_loss = 0.0  # epochの損失和
    epoch_val_loss = 0.0  # epochの損失和
    logs = []

    # epochのループ
    for epoch in range(num_epochs+1):

        # 開始時刻を保存
        t_epoch_start = time.time()
        t_iter_start = time.time()

        print('-------------')
        print('Epoch {}/{}'.format(epoch+1, num_epochs))
        print('-------------')

        # epochごとの訓練と検証のループ
        for phase in ['train', 'val']:
            if phase == 'train':
                net.train()  # モデルを訓練モードに
                print('（train）')
            else:
                if((epoch+1) % 10 == 0):
                    net.eval()   # モデルを検証モードに
                    print('-------------')
                    print('（val）')
                else:
                    # 検証は10回に1回だけ行う
                    continue

            # データローダーからminibatchずつ取り出すループ
            for images, targets in dataloaders_dict[phase]:

                # GPUが使えるならGPUにデータを送る
                images = images.to(device)
                targets = [ann.to(device)
                           for ann in targets]  # リストの各要素のテンソルをGPUへ

                # optimizerを初期化
                optimizer.zero_grad()

                # 順伝搬（forward）計算
                with torch.set_grad_enabled(phase == 'train'):
                    # 順伝搬（forward）計算
                    outputs = net(images)

                    # 損失の計算
                    loss_l, loss_c = criterion(outputs, targets)
                    loss = loss_l + loss_c

                    # 訓練時はバックプロパゲーション
                    if phase == 'train':
                        loss.backward()  # 勾配の計算

                        # 勾配が大きくなりすぎると計算が不安定になるので、clipで最大でも勾配2.0に留める
                        nn.utils.clip_grad_value_(
                            net.parameters(), clip_value=2.0)

                        optimizer.step()  # パラメータ更新

                        if (iteration % 10 == 0):  # 10iterに1度、lossを表示
                            t_iter_finish = time.time()
                            duration = t_iter_finish - t_iter_start
                            print('イテレーション {} || Loss: {:.4f} || 10iter: {:.4f} sec.'.format(
                                iteration, loss.item(), duration))
                            t_iter_start = time.time()

                        epoch_train_loss += loss.item()
                        iteration += 1

                    # 検証時
                    else:
                        epoch_val_loss += loss.item()

        # epochのphaseごとのloss （Issue158での誤植修正）
        t_epoch_finish = time.time()
        print('-------------')
        print('epoch {} || Epoch_TRAIN_Loss:{:.4f} ||Epoch_VAL_Loss:{:.4f}'.format(
            epoch+1, epoch_train_loss, epoch_val_loss))
        print('timer:  {:.4f} sec.'.format(t_epoch_finish - t_epoch_start))
        t_epoch_start = time.time()

        # ログを保存
        log_epoch = {'epoch': epoch+1,
                     'train_loss': epoch_train_loss, 'val_loss': epoch_val_loss}
        logs.append(log_epoch)
        df = pd.DataFrame(logs)
        df.to_csv("log_output.csv")

        epoch_train_loss = 0.0  # epochの損失和
        epoch_val_loss = 0.0  # epochの損失和

        # ネットワークを保存する
        if ((epoch+1) % 10 == 0):
            torch.save(net.state_dict(), 'weights/ssd300_' +
                       str(epoch+1) + '.pth')


In [26]:
# 学習・検証を実行する
num_epochs= 50  
train_model(net, dataloaders_dict, criterion, optimizer, num_epochs=num_epochs)

使用デバイス： cpu
-------------
Epoch 1/50
-------------
（train）
イテレーション 10 || Loss: 16.5946 || 10iter: 238.6400 sec.
イテレーション 20 || Loss: 12.9359 || 10iter: 229.9261 sec.
イテレーション 30 || Loss: 10.3333 || 10iter: 216.5402 sec.
イテレーション 40 || Loss: 8.8764 || 10iter: 216.8771 sec.
イテレーション 50 || Loss: 8.0001 || 10iter: 215.1483 sec.
イテレーション 60 || Loss: 7.9889 || 10iter: 217.0604 sec.
イテレーション 70 || Loss: 8.2060 || 10iter: 215.9383 sec.
イテレーション 80 || Loss: 7.4541 || 10iter: 215.9049 sec.
イテレーション 90 || Loss: 7.9851 || 10iter: 215.8946 sec.
イテレーション 100 || Loss: 7.6231 || 10iter: 215.6451 sec.
イテレーション 110 || Loss: 7.6616 || 10iter: 216.2955 sec.
イテレーション 120 || Loss: 7.1604 || 10iter: 215.0701 sec.
イテレーション 130 || Loss: 7.6439 || 10iter: 214.8962 sec.
イテレーション 140 || Loss: 7.5633 || 10iter: 215.6857 sec.
イテレーション 150 || Loss: 7.2468 || 10iter: 215.2398 sec.
イテレーション 160 || Loss: 7.6056 || 10iter: 215.6271 sec.
イテレーション 170 || Loss: 7.1819 || 10iter: 217.3203 sec.
-------------
epoch 1 || Epoch_TRAIN_Loss:1625

  mode = random.choice(self.sample_options)


イテレーション 180 || Loss: 7.4451 || 10iter: 21.8092 sec.
イテレーション 190 || Loss: 7.2548 || 10iter: 216.0269 sec.
イテレーション 200 || Loss: 7.0377 || 10iter: 215.0914 sec.
イテレーション 210 || Loss: 6.6003 || 10iter: 215.8473 sec.
イテレーション 220 || Loss: 6.9190 || 10iter: 215.1952 sec.
イテレーション 230 || Loss: 7.1063 || 10iter: 215.8553 sec.
イテレーション 240 || Loss: 7.0255 || 10iter: 215.1076 sec.
イテレーション 250 || Loss: 7.0571 || 10iter: 216.2073 sec.
イテレーション 260 || Loss: 6.8714 || 10iter: 216.0279 sec.
イテレーション 270 || Loss: 7.1949 || 10iter: 214.8178 sec.
イテレーション 280 || Loss: 6.6342 || 10iter: 215.1923 sec.
イテレーション 290 || Loss: 6.5217 || 10iter: 214.3552 sec.
イテレーション 300 || Loss: 6.2998 || 10iter: 214.8561 sec.
イテレーション 310 || Loss: 6.8146 || 10iter: 213.5292 sec.
イテレーション 320 || Loss: 6.6065 || 10iter: 215.2885 sec.
イテレーション 330 || Loss: 7.0427 || 10iter: 215.4124 sec.
イテレーション 340 || Loss: 6.3437 || 10iter: 216.7173 sec.
イテレーション 350 || Loss: 6.8867 || 10iter: 214.2997 sec.
-------------
epoch 2 || Epoch_TRAIN_Loss:1248.

  mode = random.choice(self.sample_options)


イテレーション 360 || Loss: 6.6364 || 10iter: 42.7014 sec.
イテレーション 370 || Loss: 6.5726 || 10iter: 213.5779 sec.
イテレーション 380 || Loss: 6.5111 || 10iter: 215.1523 sec.
イテレーション 390 || Loss: 6.6028 || 10iter: 215.5877 sec.
イテレーション 400 || Loss: 7.5662 || 10iter: 215.3996 sec.
イテレーション 410 || Loss: 6.5893 || 10iter: 214.2125 sec.
イテレーション 420 || Loss: 6.5986 || 10iter: 214.4445 sec.
イテレーション 430 || Loss: 6.4346 || 10iter: 215.3139 sec.
イテレーション 440 || Loss: 6.7460 || 10iter: 215.2642 sec.
イテレーション 450 || Loss: 6.6850 || 10iter: 215.0733 sec.
イテレーション 460 || Loss: 6.4776 || 10iter: 214.8917 sec.
イテレーション 470 || Loss: 6.5756 || 10iter: 215.5516 sec.
イテレーション 480 || Loss: 6.4453 || 10iter: 214.4369 sec.
イテレーション 490 || Loss: 6.6973 || 10iter: 214.9562 sec.
イテレーション 500 || Loss: 6.3156 || 10iter: 215.4299 sec.
イテレーション 510 || Loss: 6.2098 || 10iter: 216.7683 sec.
イテレーション 520 || Loss: 6.5111 || 10iter: 214.0202 sec.
イテレーション 530 || Loss: 6.3186 || 10iter: 214.7340 sec.
-------------
epoch 3 || Epoch_TRAIN_Loss:1173.

  mode = random.choice(self.sample_options)


イテレーション 540 || Loss: 6.1099 || 10iter: 64.2022 sec.
イテレーション 550 || Loss: 6.7054 || 10iter: 215.2001 sec.
イテレーション 560 || Loss: 6.7061 || 10iter: 214.6401 sec.
イテレーション 570 || Loss: 6.0778 || 10iter: 215.6910 sec.
イテレーション 580 || Loss: 6.4680 || 10iter: 215.1765 sec.
イテレーション 590 || Loss: 6.1907 || 10iter: 218.1282 sec.
イテレーション 600 || Loss: 6.6295 || 10iter: 217.2360 sec.
イテレーション 610 || Loss: 6.7159 || 10iter: 216.5836 sec.
イテレーション 620 || Loss: 5.9282 || 10iter: 215.8446 sec.
イテレーション 630 || Loss: 6.4060 || 10iter: 215.5684 sec.
イテレーション 640 || Loss: 6.2201 || 10iter: 215.2138 sec.
イテレーション 650 || Loss: 5.8965 || 10iter: 214.9760 sec.
イテレーション 660 || Loss: 6.1709 || 10iter: 215.6052 sec.
イテレーション 670 || Loss: 6.5009 || 10iter: 215.8631 sec.
イテレーション 680 || Loss: 6.3304 || 10iter: 216.2448 sec.
イテレーション 690 || Loss: 6.0322 || 10iter: 213.9849 sec.
イテレーション 700 || Loss: 6.2938 || 10iter: 213.9251 sec.
イテレーション 710 || Loss: 6.7468 || 10iter: 215.0612 sec.
-------------
epoch 4 || Epoch_TRAIN_Loss:1119.

  mode = random.choice(self.sample_options)


イテレーション 720 || Loss: 6.1112 || 10iter: 86.3042 sec.
イテレーション 730 || Loss: 5.9601 || 10iter: 214.1208 sec.
イテレーション 740 || Loss: 6.6615 || 10iter: 214.5000 sec.
イテレーション 750 || Loss: 5.6234 || 10iter: 214.2674 sec.
イテレーション 760 || Loss: 5.9773 || 10iter: 216.8764 sec.
イテレーション 770 || Loss: 5.8021 || 10iter: 214.4936 sec.
イテレーション 780 || Loss: 5.7368 || 10iter: 215.1338 sec.
イテレーション 790 || Loss: 6.3134 || 10iter: 215.0521 sec.
イテレーション 800 || Loss: 6.1228 || 10iter: 215.4985 sec.
イテレーション 810 || Loss: 6.3915 || 10iter: 215.5909 sec.
イテレーション 820 || Loss: 6.3487 || 10iter: 215.6176 sec.
イテレーション 830 || Loss: 5.7825 || 10iter: 215.4004 sec.
イテレーション 840 || Loss: 5.8818 || 10iter: 217.9162 sec.
イテレーション 850 || Loss: 5.9969 || 10iter: 215.6858 sec.
イテレーション 860 || Loss: 5.8750 || 10iter: 215.6548 sec.
イテレーション 870 || Loss: 6.0507 || 10iter: 215.6990 sec.
イテレーション 880 || Loss: 6.0257 || 10iter: 216.4612 sec.
イテレーション 890 || Loss: 6.3109 || 10iter: 216.5461 sec.
-------------
epoch 5 || Epoch_TRAIN_Loss:1078.

  mode = random.choice(self.sample_options)


イテレーション 900 || Loss: 5.9707 || 10iter: 108.6911 sec.
イテレーション 910 || Loss: 5.8503 || 10iter: 216.8366 sec.
イテレーション 920 || Loss: 5.6606 || 10iter: 215.2537 sec.
イテレーション 930 || Loss: 5.8018 || 10iter: 216.4092 sec.
イテレーション 940 || Loss: 5.4508 || 10iter: 215.4078 sec.
イテレーション 950 || Loss: 6.0326 || 10iter: 216.6498 sec.
イテレーション 960 || Loss: 6.1346 || 10iter: 215.1427 sec.
イテレーション 970 || Loss: 6.1081 || 10iter: 216.5487 sec.
イテレーション 980 || Loss: 5.9032 || 10iter: 216.0463 sec.
イテレーション 990 || Loss: 5.2367 || 10iter: 216.5128 sec.
イテレーション 1000 || Loss: 5.8533 || 10iter: 216.6742 sec.
イテレーション 1010 || Loss: 5.7971 || 10iter: 218.2052 sec.
イテレーション 1020 || Loss: 5.7625 || 10iter: 214.9737 sec.
イテレーション 1030 || Loss: 5.9010 || 10iter: 214.4318 sec.
イテレーション 1040 || Loss: 5.4638 || 10iter: 215.2508 sec.
イテレーション 1050 || Loss: 5.6871 || 10iter: 214.9111 sec.
イテレーション 1060 || Loss: 5.5380 || 10iter: 215.5755 sec.
イテレーション 1070 || Loss: 5.8101 || 10iter: 214.9396 sec.
-------------
epoch 6 || Epoch_TRAIN_L

  mode = random.choice(self.sample_options)


イテレーション 1080 || Loss: 5.6756 || 10iter: 129.4393 sec.
イテレーション 1090 || Loss: 5.3743 || 10iter: 215.8624 sec.
イテレーション 1100 || Loss: 5.9287 || 10iter: 215.5560 sec.
イテレーション 1110 || Loss: 5.1530 || 10iter: 215.5161 sec.
イテレーション 1120 || Loss: 5.3297 || 10iter: 215.8862 sec.
イテレーション 1130 || Loss: 5.4154 || 10iter: 216.3410 sec.
イテレーション 1140 || Loss: 5.5255 || 10iter: 214.7113 sec.
イテレーション 1150 || Loss: 5.6380 || 10iter: 214.2881 sec.
イテレーション 1160 || Loss: 5.5095 || 10iter: 215.0716 sec.
イテレーション 1170 || Loss: 4.8615 || 10iter: 215.1999 sec.
イテレーション 1180 || Loss: 6.0056 || 10iter: 215.9044 sec.
イテレーション 1190 || Loss: 5.8842 || 10iter: 214.4919 sec.
イテレーション 1200 || Loss: 5.3901 || 10iter: 215.6950 sec.
イテレーション 1210 || Loss: 5.9412 || 10iter: 214.6272 sec.
イテレーション 1220 || Loss: 5.5886 || 10iter: 212.9429 sec.
イテレーション 1230 || Loss: 6.0708 || 10iter: 213.2140 sec.
イテレーション 1240 || Loss: 5.5347 || 10iter: 212.8586 sec.
イテレーション 1250 || Loss: 5.7889 || 10iter: 213.2493 sec.
-------------
epoch 7 || Epo

  mode = random.choice(self.sample_options)


イテレーション 1260 || Loss: 5.4709 || 10iter: 151.4659 sec.
イテレーション 1270 || Loss: 5.9279 || 10iter: 214.7614 sec.
イテレーション 1280 || Loss: 5.3829 || 10iter: 213.2988 sec.
イテレーション 1290 || Loss: 5.3238 || 10iter: 214.1509 sec.
イテレーション 1300 || Loss: 5.4994 || 10iter: 213.3563 sec.
イテレーション 1310 || Loss: 5.2997 || 10iter: 213.3843 sec.
イテレーション 1320 || Loss: 5.2451 || 10iter: 214.4221 sec.
イテレーション 1330 || Loss: 5.5875 || 10iter: 213.2484 sec.
イテレーション 1340 || Loss: 5.3049 || 10iter: 214.3623 sec.
イテレーション 1350 || Loss: 5.7668 || 10iter: 216.4290 sec.
イテレーション 1360 || Loss: 5.5956 || 10iter: 213.6861 sec.
イテレーション 1370 || Loss: 5.0313 || 10iter: 213.2459 sec.
イテレーション 1380 || Loss: 5.4365 || 10iter: 213.3872 sec.
イテレーション 1390 || Loss: 5.4366 || 10iter: 214.3327 sec.
イテレーション 1400 || Loss: 5.1547 || 10iter: 214.3572 sec.
イテレーション 1410 || Loss: 5.9205 || 10iter: 214.3867 sec.
イテレーション 1420 || Loss: 5.1969 || 10iter: 213.3368 sec.
イテレーション 1430 || Loss: 5.6347 || 10iter: 217.0170 sec.
-------------
epoch 8 || Epo

  mode = random.choice(self.sample_options)


イテレーション 1440 || Loss: 5.5713 || 10iter: 171.1314 sec.
イテレーション 1450 || Loss: 5.2923 || 10iter: 214.9565 sec.
イテレーション 1460 || Loss: 5.3468 || 10iter: 215.4265 sec.
イテレーション 1470 || Loss: 5.5468 || 10iter: 214.9771 sec.
イテレーション 1480 || Loss: 5.4974 || 10iter: 214.9469 sec.
イテレーション 1490 || Loss: 4.9402 || 10iter: 214.8934 sec.
イテレーション 1500 || Loss: 5.5895 || 10iter: 214.8479 sec.
イテレーション 1510 || Loss: 5.2040 || 10iter: 215.6989 sec.
イテレーション 1520 || Loss: 5.1355 || 10iter: 215.9055 sec.
イテレーション 1530 || Loss: 5.4075 || 10iter: 215.4739 sec.
イテレーション 1540 || Loss: 5.5022 || 10iter: 215.0113 sec.
イテレーション 1550 || Loss: 5.1965 || 10iter: 215.2376 sec.
イテレーション 1560 || Loss: 5.4826 || 10iter: 215.2012 sec.
イテレーション 1570 || Loss: 5.8018 || 10iter: 215.7488 sec.
イテレーション 1580 || Loss: 5.3679 || 10iter: 214.8273 sec.
イテレーション 1590 || Loss: 5.1407 || 10iter: 215.1352 sec.
イテレーション 1600 || Loss: 5.1371 || 10iter: 215.6262 sec.
イテレーション 1610 || Loss: 5.5149 || 10iter: 214.5803 sec.
-------------
epoch 9 || Epo

  mode = random.choice(self.sample_options)


イテレーション 1620 || Loss: 5.5229 || 10iter: 193.8986 sec.
イテレーション 1630 || Loss: 5.1680 || 10iter: 214.6765 sec.
イテレーション 1640 || Loss: 5.5571 || 10iter: 214.7158 sec.
イテレーション 1650 || Loss: 5.2325 || 10iter: 214.6484 sec.
イテレーション 1660 || Loss: 5.2923 || 10iter: 215.2963 sec.
イテレーション 1670 || Loss: 5.4565 || 10iter: 216.6383 sec.
イテレーション 1680 || Loss: 5.3616 || 10iter: 216.5838 sec.
イテレーション 1690 || Loss: 5.2591 || 10iter: 213.5074 sec.
イテレーション 1700 || Loss: 5.0713 || 10iter: 211.8473 sec.
イテレーション 1710 || Loss: 5.0397 || 10iter: 211.7026 sec.
イテレーション 1720 || Loss: 4.5812 || 10iter: 211.2701 sec.
イテレーション 1730 || Loss: 5.3289 || 10iter: 210.9493 sec.
イテレーション 1740 || Loss: 5.5889 || 10iter: 234.2982 sec.
イテレーション 1750 || Loss: 5.1611 || 10iter: 237.9036 sec.
イテレーション 1760 || Loss: 5.6562 || 10iter: 233.1985 sec.
イテレーション 1770 || Loss: 5.2292 || 10iter: 231.5594 sec.
イテレーション 1780 || Loss: 4.8117 || 10iter: 229.4375 sec.
イテレーション 1790 || Loss: 5.0050 || 10iter: 225.1627 sec.
-------------
（val）
--------

  mode = random.choice(self.sample_options)


イテレーション 1800 || Loss: 4.5148 || 10iter: 225.7544 sec.
イテレーション 1810 || Loss: 5.1542 || 10iter: 223.0408 sec.
イテレーション 1820 || Loss: 5.2313 || 10iter: 218.3191 sec.
イテレーション 1830 || Loss: 5.2597 || 10iter: 212.9581 sec.
イテレーション 1840 || Loss: 5.4109 || 10iter: 212.6392 sec.
イテレーション 1850 || Loss: 4.6553 || 10iter: 225.0844 sec.
イテレーション 1860 || Loss: 4.6337 || 10iter: 237.3106 sec.
イテレーション 1870 || Loss: 5.2947 || 10iter: 234.7673 sec.
イテレーション 1880 || Loss: 4.6620 || 10iter: 245.5181 sec.
イテレーション 1890 || Loss: 4.6565 || 10iter: 233.5928 sec.
イテレーション 1900 || Loss: 4.8456 || 10iter: 239.0654 sec.
イテレーション 1910 || Loss: 4.7053 || 10iter: 243.0461 sec.
イテレーション 1920 || Loss: 5.0820 || 10iter: 237.7376 sec.
イテレーション 1930 || Loss: 5.0329 || 10iter: 243.6958 sec.
イテレーション 1940 || Loss: 4.6764 || 10iter: 238.1778 sec.
イテレーション 1950 || Loss: 5.2031 || 10iter: 233.4302 sec.
イテレーション 1960 || Loss: 4.8201 || 10iter: 236.0049 sec.
-------------
epoch 11 || Epoch_TRAIN_Loss:910.9503 ||Epoch_VAL_Loss:0.0000
timer:

  mode = random.choice(self.sample_options)


イテレーション 1970 || Loss: 4.9527 || 10iter: 24.0573 sec.
イテレーション 1980 || Loss: 4.8824 || 10iter: 238.6246 sec.
イテレーション 1990 || Loss: 5.5789 || 10iter: 243.8909 sec.
イテレーション 2000 || Loss: 4.7801 || 10iter: 239.4121 sec.
イテレーション 2010 || Loss: 4.4671 || 10iter: 240.4602 sec.
イテレーション 2020 || Loss: 4.8593 || 10iter: 241.4589 sec.
イテレーション 2030 || Loss: 4.5725 || 10iter: 249.1694 sec.
イテレーション 2040 || Loss: 4.9169 || 10iter: 240.1667 sec.
イテレーション 2050 || Loss: 5.5488 || 10iter: 243.2979 sec.
イテレーション 2060 || Loss: 5.0947 || 10iter: 245.1662 sec.
イテレーション 2070 || Loss: 5.1847 || 10iter: 225.9420 sec.
イテレーション 2080 || Loss: 4.8062 || 10iter: 221.7605 sec.
イテレーション 2090 || Loss: 4.4033 || 10iter: 223.1805 sec.
イテレーション 2100 || Loss: 5.0718 || 10iter: 219.0428 sec.
イテレーション 2110 || Loss: 5.0305 || 10iter: 219.3323 sec.
イテレーション 2120 || Loss: 4.5975 || 10iter: 213.0967 sec.
イテレーション 2130 || Loss: 5.2876 || 10iter: 210.9174 sec.
イテレーション 2140 || Loss: 5.0092 || 10iter: 211.0032 sec.
-------------
epoch 12 || Epo

  mode = random.choice(self.sample_options)


イテレーション 2150 || Loss: 5.3523 || 10iter: 42.2877 sec.
イテレーション 2160 || Loss: 4.9652 || 10iter: 211.2404 sec.
イテレーション 2170 || Loss: 4.7366 || 10iter: 211.2707 sec.
イテレーション 2180 || Loss: 5.3659 || 10iter: 210.8972 sec.
イテレーション 2190 || Loss: 5.3126 || 10iter: 212.0569 sec.
イテレーション 2200 || Loss: 4.6161 || 10iter: 210.7938 sec.
イテレーション 2210 || Loss: 4.6564 || 10iter: 211.3430 sec.
イテレーション 2220 || Loss: 5.3526 || 10iter: 211.3889 sec.
イテレーション 2230 || Loss: 4.3684 || 10iter: 211.0658 sec.
イテレーション 2240 || Loss: 5.0806 || 10iter: 211.1259 sec.
イテレーション 2250 || Loss: 5.1168 || 10iter: 211.6088 sec.
イテレーション 2260 || Loss: 4.8400 || 10iter: 211.2461 sec.
イテレーション 2270 || Loss: 5.2291 || 10iter: 210.9380 sec.
イテレーション 2280 || Loss: 5.0015 || 10iter: 210.9207 sec.
イテレーション 2290 || Loss: 4.9957 || 10iter: 211.3274 sec.
イテレーション 2300 || Loss: 4.8223 || 10iter: 211.1317 sec.
イテレーション 2310 || Loss: 4.7493 || 10iter: 211.0896 sec.
イテレーション 2320 || Loss: 4.8810 || 10iter: 210.8864 sec.
-------------
epoch 13 || Epo

  mode = random.choice(self.sample_options)


イテレーション 2330 || Loss: 5.0467 || 10iter: 63.3145 sec.
イテレーション 2340 || Loss: 4.8154 || 10iter: 211.3026 sec.
イテレーション 2350 || Loss: 4.4694 || 10iter: 211.1566 sec.
イテレーション 2360 || Loss: 4.9494 || 10iter: 211.7487 sec.
イテレーション 2370 || Loss: 4.8043 || 10iter: 210.9713 sec.
イテレーション 2380 || Loss: 4.7183 || 10iter: 211.1769 sec.
イテレーション 2390 || Loss: 5.0157 || 10iter: 211.1886 sec.
イテレーション 2400 || Loss: 4.4644 || 10iter: 211.4689 sec.
イテレーション 2410 || Loss: 4.5362 || 10iter: 211.2332 sec.
イテレーション 2420 || Loss: 5.0234 || 10iter: 212.3508 sec.
イテレーション 2430 || Loss: 5.1444 || 10iter: 212.8439 sec.
イテレーション 2440 || Loss: 5.3556 || 10iter: 212.5175 sec.
イテレーション 2450 || Loss: 4.7310 || 10iter: 212.6666 sec.
イテレーション 2460 || Loss: 4.7371 || 10iter: 215.1173 sec.
イテレーション 2470 || Loss: 5.1366 || 10iter: 218.9670 sec.
イテレーション 2480 || Loss: 4.5135 || 10iter: 222.8905 sec.
イテレーション 2490 || Loss: 4.7197 || 10iter: 212.6716 sec.
イテレーション 2500 || Loss: 5.2012 || 10iter: 212.5160 sec.
-------------
epoch 14 || Epo

  mode = random.choice(self.sample_options)


イテレーション 2510 || Loss: 4.0525 || 10iter: 92.0791 sec.
イテレーション 2520 || Loss: 4.5141 || 10iter: 236.2658 sec.
イテレーション 2530 || Loss: 5.2554 || 10iter: 234.2589 sec.
イテレーション 2540 || Loss: 5.1461 || 10iter: 232.5716 sec.
イテレーション 2550 || Loss: 4.5904 || 10iter: 238.8594 sec.
イテレーション 2560 || Loss: 4.5299 || 10iter: 229.2331 sec.
イテレーション 2570 || Loss: 4.1441 || 10iter: 226.5229 sec.
イテレーション 2580 || Loss: 4.9994 || 10iter: 249.6842 sec.
イテレーション 2590 || Loss: 4.4424 || 10iter: 238.4475 sec.
イテレーション 2600 || Loss: 4.1194 || 10iter: 232.7175 sec.
イテレーション 2610 || Loss: 4.8793 || 10iter: 239.9348 sec.
イテレーション 2620 || Loss: 4.9963 || 10iter: 234.2479 sec.
イテレーション 2630 || Loss: 4.9602 || 10iter: 219.8666 sec.
イテレーション 2640 || Loss: 4.2944 || 10iter: 214.3247 sec.
イテレーション 2650 || Loss: 4.4037 || 10iter: 212.6956 sec.
イテレーション 2660 || Loss: 4.1916 || 10iter: 212.8117 sec.
イテレーション 2670 || Loss: 4.5882 || 10iter: 212.8966 sec.
イテレーション 2680 || Loss: 4.7072 || 10iter: 212.7610 sec.
-------------
epoch 15 || Epo

  mode = random.choice(self.sample_options)


イテレーション 2690 || Loss: 4.7359 || 10iter: 108.0674 sec.
イテレーション 2700 || Loss: 5.2184 || 10iter: 213.5580 sec.
イテレーション 2710 || Loss: 4.2949 || 10iter: 212.6564 sec.
イテレーション 2720 || Loss: 4.4164 || 10iter: 212.8641 sec.
イテレーション 2730 || Loss: 4.8294 || 10iter: 212.8943 sec.
イテレーション 2740 || Loss: 4.3884 || 10iter: 212.9931 sec.
イテレーション 2750 || Loss: 4.4783 || 10iter: 213.3616 sec.
イテレーション 2760 || Loss: 4.8638 || 10iter: 212.7738 sec.
イテレーション 2770 || Loss: 5.5408 || 10iter: 230.8474 sec.
イテレーション 2780 || Loss: 4.8313 || 10iter: 220.7719 sec.
イテレーション 2790 || Loss: 4.6256 || 10iter: 214.6065 sec.
イテレーション 2800 || Loss: 4.4432 || 10iter: 231.4739 sec.
イテレーション 2810 || Loss: 4.4393 || 10iter: 232.7577 sec.
イテレーション 2820 || Loss: 4.9158 || 10iter: 219.8017 sec.
イテレーション 2830 || Loss: 4.8103 || 10iter: 226.1374 sec.
イテレーション 2840 || Loss: 4.5506 || 10iter: 230.5787 sec.
イテレーション 2850 || Loss: 5.1544 || 10iter: 239.7861 sec.
イテレーション 2860 || Loss: 4.3809 || 10iter: 229.9512 sec.
-------------
epoch 16 || Ep

  mode = random.choice(self.sample_options)


イテレーション 2870 || Loss: 4.7590 || 10iter: 138.7133 sec.
イテレーション 2880 || Loss: 4.6898 || 10iter: 227.2483 sec.
イテレーション 2890 || Loss: 4.3457 || 10iter: 225.0287 sec.
イテレーション 2900 || Loss: 4.5397 || 10iter: 215.9531 sec.
イテレーション 2910 || Loss: 4.4417 || 10iter: 215.6854 sec.
イテレーション 2920 || Loss: 4.4076 || 10iter: 223.9559 sec.
イテレーション 2930 || Loss: 4.3535 || 10iter: 216.3601 sec.
イテレーション 2940 || Loss: 4.5616 || 10iter: 215.4821 sec.
イテレーション 2950 || Loss: 4.6238 || 10iter: 218.3934 sec.
イテレーション 2960 || Loss: 5.0497 || 10iter: 213.0430 sec.
イテレーション 2970 || Loss: 4.4168 || 10iter: 215.0185 sec.
イテレーション 2980 || Loss: 4.7344 || 10iter: 212.4882 sec.
イテレーション 2990 || Loss: 4.7298 || 10iter: 212.3794 sec.
イテレーション 3000 || Loss: 4.5118 || 10iter: 212.6536 sec.
イテレーション 3010 || Loss: 4.7594 || 10iter: 212.9143 sec.
イテレーション 3020 || Loss: 4.7468 || 10iter: 213.8496 sec.
イテレーション 3030 || Loss: 4.7117 || 10iter: 212.8452 sec.
イテレーション 3040 || Loss: 4.4977 || 10iter: 213.0324 sec.
-------------
epoch 17 || Ep

  mode = random.choice(self.sample_options)


イテレーション 3050 || Loss: 4.0294 || 10iter: 150.1710 sec.
イテレーション 3060 || Loss: 4.6647 || 10iter: 214.6690 sec.
イテレーション 3070 || Loss: 4.6153 || 10iter: 213.1029 sec.
イテレーション 3080 || Loss: 4.3959 || 10iter: 212.4732 sec.
イテレーション 3090 || Loss: 4.8897 || 10iter: 212.9054 sec.
イテレーション 3100 || Loss: 4.6793 || 10iter: 212.5021 sec.
イテレーション 3110 || Loss: 3.9761 || 10iter: 213.2154 sec.
イテレーション 3120 || Loss: 4.9317 || 10iter: 212.7779 sec.
イテレーション 3130 || Loss: 4.4118 || 10iter: 212.5845 sec.
イテレーション 3140 || Loss: 4.9594 || 10iter: 216.0600 sec.
イテレーション 3150 || Loss: 4.6450 || 10iter: 212.5044 sec.
イテレーション 3160 || Loss: 4.2942 || 10iter: 230.9631 sec.
イテレーション 3170 || Loss: 5.1850 || 10iter: 228.5765 sec.
イテレーション 3180 || Loss: 4.6021 || 10iter: 234.3765 sec.
イテレーション 3190 || Loss: 4.4396 || 10iter: 222.8322 sec.
イテレーション 3200 || Loss: 4.4706 || 10iter: 225.9576 sec.
イテレーション 3210 || Loss: 4.5859 || 10iter: 230.6247 sec.
イテレーション 3220 || Loss: 4.3540 || 10iter: 225.9765 sec.
-------------
epoch 18 || Ep

  mode = random.choice(self.sample_options)


イテレーション 3230 || Loss: 4.2279 || 10iter: 179.6365 sec.
イテレーション 3240 || Loss: 4.0767 || 10iter: 222.4386 sec.
イテレーション 3250 || Loss: 4.6060 || 10iter: 221.7786 sec.
イテレーション 3260 || Loss: 4.1811 || 10iter: 236.4171 sec.
イテレーション 3270 || Loss: 4.3967 || 10iter: 237.9147 sec.
イテレーション 3280 || Loss: 4.5125 || 10iter: 220.7788 sec.
イテレーション 3290 || Loss: 4.2316 || 10iter: 226.4430 sec.
イテレーション 3300 || Loss: 4.8699 || 10iter: 216.8205 sec.
イテレーション 3310 || Loss: 4.6037 || 10iter: 215.3679 sec.
イテレーション 3320 || Loss: 4.6456 || 10iter: 215.4122 sec.
イテレーション 3330 || Loss: 3.7827 || 10iter: 213.0359 sec.
イテレーション 3340 || Loss: 4.5761 || 10iter: 211.0557 sec.
イテレーション 3350 || Loss: 4.9560 || 10iter: 213.0929 sec.
イテレーション 3360 || Loss: 4.3570 || 10iter: 213.4968 sec.
イテレーション 3370 || Loss: 3.7871 || 10iter: 212.8679 sec.
イテレーション 3380 || Loss: 4.2252 || 10iter: 216.2275 sec.
イテレーション 3390 || Loss: 4.2542 || 10iter: 212.3776 sec.
イテレーション 3400 || Loss: 4.6654 || 10iter: 212.3638 sec.
-------------
epoch 19 || Ep

  mode = random.choice(self.sample_options)


イテレーション 3410 || Loss: 4.4441 || 10iter: 190.9428 sec.
イテレーション 3420 || Loss: 4.4974 || 10iter: 212.5516 sec.
イテレーション 3430 || Loss: 4.0508 || 10iter: 211.4168 sec.
イテレーション 3440 || Loss: 4.3461 || 10iter: 230.9340 sec.
イテレーション 3450 || Loss: 4.1018 || 10iter: 230.0077 sec.
イテレーション 3460 || Loss: 4.2959 || 10iter: 219.9004 sec.
イテレーション 3470 || Loss: 4.5836 || 10iter: 220.0517 sec.
イテレーション 3480 || Loss: 4.9729 || 10iter: 217.4121 sec.
イテレーション 3490 || Loss: 4.3946 || 10iter: 214.8045 sec.
イテレーション 3500 || Loss: 4.6895 || 10iter: 235.7880 sec.
イテレーション 3510 || Loss: 4.8740 || 10iter: 238.4052 sec.
イテレーション 3520 || Loss: 4.0771 || 10iter: 233.7517 sec.
イテレーション 3530 || Loss: 4.1755 || 10iter: 214.1058 sec.
イテレーション 3540 || Loss: 4.6049 || 10iter: 213.5697 sec.
イテレーション 3550 || Loss: 4.7765 || 10iter: 221.4950 sec.
イテレーション 3560 || Loss: 3.9749 || 10iter: 229.8259 sec.
イテレーション 3570 || Loss: 4.6201 || 10iter: 231.6271 sec.
イテレーション 3580 || Loss: 4.6185 || 10iter: 233.2474 sec.
-------------
（val）
--------

  mode = random.choice(self.sample_options)


イテレーション 3590 || Loss: 4.5889 || 10iter: 267.3543 sec.


以上