In [1]:
import torch

device = torch.device('cuda' if torch.cuda.is_available() else 'cpu')
print('使用されるデバイス:', device)

使用されるデバイス: cuda


In [2]:
import sys

In [3]:
import torch.utils.data as data

from voc import make_filepath_list, GetBBoxAndLabel, DataTransform, PreprocessVOC2012, multiobject_collate_fn

rootpath = '/home/komuro/Documents/ssdbook/data/VOCdevkit/VOC2012/'
train_img_list, train_anno_list, val_img_list, val_anno_list = make_filepath_list(rootpath)

voc_classes = [
    'aeroplane', 'bicycle', 'bird', 'boat', 'bottle',
    'bus', 'car', 'cat', 'chair', 'cow',
    'diningtable', 'dog', 'horse', 'motorbike',
    'person', 'pottedplant', 'sheep', 'sofa', 'train',
    'tvmonitor'
]

In [4]:
color_mean = (104, 117, 123)
input_size = 300

train_dataset = PreprocessVOC2012(
    train_img_list,
    train_anno_list,
    phase='train',
    transform=DataTransform(input_size, color_mean),
    get_bbox_label=GetBBoxAndLabel(voc_classes)
)

val_dataset = PreprocessVOC2012(
    val_img_list,
    val_anno_list,
    phase='val',
    transform=DataTransform(input_size, color_mean),
    get_bbox_label=GetBBoxAndLabel(voc_classes)
)

In [5]:
batch_size = 32

train_dataloader = data.DataLoader(
    train_dataset,
    batch_size=batch_size,
    shuffle=True,
    collate_fn=multiobject_collate_fn
)
val_dataloader = data.DataLoader(
    val_dataset,
    batch_size=batch_size,
    shuffle=False,
    collate_fn=multiobject_collate_fn
)

dataloaders_dict = {'train': train_dataloader, 'val': val_dataloader}

In [6]:
import torch.nn as nn
import torch.nn.init as init
from ssd import SSD
from torchinfo import summary

ssd_cfg = {
    'classes_num': 21,
    'input_size': 300,
    'dbox_num': [4, 6, 6, 6, 4, 4],
    'feature_maps': [38, 19, 10, 5, 3, 1],
    'steps': [8, 16, 32, 64, 100, 300],
    'min_sizes': [30, 60, 111, 162, 213, 264],
    'max_sizes': [60, 111, 162, 213, 264, 315],
    'aspect_ratios': [[2], [2, 3], [2, 3], [2, 3], [2], [2]],
}

net = SSD(phase='train', cfg=ssd_cfg)

vgg_weights = torch.load('/home/komuro/Documents/ssdbook/weights/vgg16_redecedfc.pth')
net.vgg.load_state_dict(vgg_weights)

def weights_init(m):
    if isinstance(m, nn.Conv2d):
        init.kaiming_normal_(m.weight.data)
        if m.bias is not None:
            nn.init.constant_(m.bias, 0.0)

net.extras.apply(weights_init)
net.loc.apply(weights_init)
net.conf.apply(weights_init)

summary(
    net,
    input_size=(batch_size, 3, 300, 300),
    col_names=['input_size', 'output_size', 'num_params']
)

Layer (type:depth-idx)                   Input Shape               Output Shape              Param #
SSD                                      [32, 3, 300, 300]         [32, 8732, 4]             --
├─ModuleList: 1-3                        --                        --                        (recursive)
│    └─Conv2d: 2-1                       [32, 3, 300, 300]         [32, 64, 300, 300]        1,792
│    └─ReLU: 2-2                         [32, 64, 300, 300]        [32, 64, 300, 300]        --
│    └─Conv2d: 2-3                       [32, 64, 300, 300]        [32, 64, 300, 300]        36,928
│    └─ReLU: 2-4                         [32, 64, 300, 300]        [32, 64, 300, 300]        --
│    └─MaxPool2d: 2-5                    [32, 64, 300, 300]        [32, 64, 150, 150]        --
│    └─Conv2d: 2-6                       [32, 64, 150, 150]        [32, 128, 150, 150]       73,856
│    └─ReLU: 2-7                         [32, 128, 150, 150]       [32, 128, 150, 150]       --
│    └─Conv2d: 

In [7]:
import torch.optim as optim
from ssd import MultiBoxLoss

criterion = MultiBoxLoss(
    jaccard_thresh=0.5,
    neg_pos=3,
    device=device
)

optimizer = optim.SGD(
    net.parameters(),
    lr=1e-3,
    momentum=0.9,
    weight_decay=5e-4
)

In [8]:
import time
import pandas as pd

def train(net, dataloaders_dict, criterion, optimizer, num_epochs):
    net.to(device)
    torch.backends.cudnn.benchmark = True

    iteration = 1
    epoch_train_loss = 0.0
    epoch_val_loss = 0.0
    logs=[]

    for epoch in range(num_epochs):
        t_epoch_start = time.time()
        t_iter_start = time.time()

        print('--------------------------')
        print('Epoch {}/{}'.format(epoch+1, num_epochs))
        print('--------------------------')

        for phase in ['train', 'val']:
            if phase == 'train':
                net.train()
            else:
                if ((epoch+1) % 10 == 0):
                    net.eval()
                    print('--------------------------')
                    print('validation')
                else:
                    continue

            
            for images, targets in dataloaders_dict[phase]:
                images = images.to(device)

                targets = [ann.to(device) for ann in targets]

                optimizer.zero_grad()

                with torch.set_grad_enabled(phase == 'train'):
                    outputs = net(images)

                    loss_l, loss_c = criterion(outputs, targets)
                    loss = loss_l + loss_c

                    if phase == 'train':
                        loss.backward()
                        nn.utils.clip_grad_value_(net.parameters(),
                                                  clip_value=2.0)
                        optimizer.step()

                        if (iteration % 10 == 0):
                            t_iter_finish = time.time()
                            duration = t_iter_finish - t_iter_start

                            print('ステップ( {} )  loss: {:.4f} -- time: {:.4f} sec.'.format(
                                iteration, loss.item(), duration
                            ))
                            t_iter_start = time.time()
                        
                        epoch_train_loss += loss.item()
                        iteration += 1
                    else:
                        epoch_val_loss += loss.item()
        t_epoch_finish = time.time()
        print('--------------------------')
        print('train_loss: {:.4f} - val_loss: {:.4f}'.format(
            epoch_train_loss, epoch_val_loss
        ))

        print('time: {:.4f} sec.'.format(t_epoch_finish - t_epoch_start))
        t_epoch_start = time.time()

        log_epoch = {'epoch': epoch+1,
                    'train_loss': epoch_train_loss,
                    'val_loss': epoch_val_loss}
        
        logs.append(log_epoch)
        df = pd.DataFrame(logs)

        df.to_csv('/home/komuro/Documents/ssdbook/epoch_loss.csv')

        epoch_train_loss = 0.0
        epoch_val_loss = 0.0

        if ((epoch+1) % 10 == 0):
            torch.save(
                net.state_dict(),
                '/home/komuro/Documents/ssdbook/weights/ssd_weights' + str(epoch+1) + '.pth'
            )
            print('--saved weights--')







In [9]:
num_epochs = 50

train(net,
      dataloaders_dict,
      criterion,
      optimizer,
      num_epochs=num_epochs)

--------------------------
Epoch 1/50
--------------------------


  mode = random.choice(self.sample_options)


ステップ( 10 )  loss: 15.8207 -- time: 6.4324 sec.
ステップ( 20 )  loss: 12.6182 -- time: 4.6073 sec.
ステップ( 30 )  loss: 9.8878 -- time: 4.6484 sec.
ステップ( 40 )  loss: 9.4278 -- time: 4.7017 sec.
ステップ( 50 )  loss: 8.5319 -- time: 4.7253 sec.
ステップ( 60 )  loss: 8.4758 -- time: 4.4742 sec.
ステップ( 70 )  loss: 8.3710 -- time: 4.4527 sec.
ステップ( 80 )  loss: 7.7531 -- time: 4.5065 sec.
ステップ( 90 )  loss: 8.0502 -- time: 4.6091 sec.
ステップ( 100 )  loss: 7.8935 -- time: 4.4937 sec.
ステップ( 110 )  loss: 7.8302 -- time: 4.5122 sec.
ステップ( 120 )  loss: 8.2258 -- time: 4.5580 sec.
ステップ( 130 )  loss: 8.2113 -- time: 4.4918 sec.
ステップ( 140 )  loss: 7.8454 -- time: 4.6508 sec.
ステップ( 150 )  loss: 7.7811 -- time: 4.5301 sec.
ステップ( 160 )  loss: 7.2341 -- time: 4.6821 sec.
ステップ( 170 )  loss: 7.6702 -- time: 4.4561 sec.
--------------------------
train_loss: 1665.5530 - val_loss: 0.0000
time: 88.2907 sec.
--------------------------
Epoch 2/50
--------------------------


  mode = random.choice(self.sample_options)


ステップ( 180 )  loss: 7.7894 -- time: 0.3452 sec.
ステップ( 190 )  loss: 7.3454 -- time: 4.6500 sec.
ステップ( 200 )  loss: 7.1523 -- time: 4.6307 sec.
ステップ( 210 )  loss: 7.3136 -- time: 4.5940 sec.
ステップ( 220 )  loss: 7.0639 -- time: 4.5658 sec.
ステップ( 230 )  loss: 7.0955 -- time: 4.7195 sec.
ステップ( 240 )  loss: 6.9649 -- time: 4.6064 sec.
ステップ( 250 )  loss: 7.4294 -- time: 4.5286 sec.
ステップ( 260 )  loss: 6.8294 -- time: 4.3894 sec.
ステップ( 270 )  loss: 7.5333 -- time: 4.4188 sec.
ステップ( 280 )  loss: 7.4206 -- time: 4.5589 sec.
ステップ( 290 )  loss: 6.7496 -- time: 4.5786 sec.
ステップ( 300 )  loss: 6.5092 -- time: 4.6229 sec.
ステップ( 310 )  loss: 6.9015 -- time: 4.5527 sec.
ステップ( 320 )  loss: 7.3971 -- time: 4.3534 sec.
ステップ( 330 )  loss: 7.3733 -- time: 4.5246 sec.
ステップ( 340 )  loss: 6.7835 -- time: 4.5278 sec.
ステップ( 350 )  loss: 7.1444 -- time: 4.5727 sec.
--------------------------
train_loss: 1271.2633 - val_loss: 0.0000
time: 84.0322 sec.
--------------------------
Epoch 3/50
--------------------------


  mode = random.choice(self.sample_options)


ステップ( 360 )  loss: 6.5274 -- time: 0.8208 sec.
ステップ( 370 )  loss: 6.8736 -- time: 4.5702 sec.
ステップ( 380 )  loss: 6.7032 -- time: 4.5794 sec.
ステップ( 390 )  loss: 6.3432 -- time: 4.4033 sec.
ステップ( 400 )  loss: 7.1223 -- time: 4.6190 sec.
ステップ( 410 )  loss: 6.8494 -- time: 4.5759 sec.
ステップ( 420 )  loss: 6.4671 -- time: 4.5964 sec.
ステップ( 430 )  loss: 6.5904 -- time: 4.8007 sec.
ステップ( 440 )  loss: 6.2792 -- time: 4.6771 sec.
ステップ( 450 )  loss: 6.9436 -- time: 4.5788 sec.
ステップ( 460 )  loss: 6.1063 -- time: 4.7269 sec.
ステップ( 470 )  loss: 6.4830 -- time: 4.6983 sec.
ステップ( 480 )  loss: 6.2037 -- time: 4.5484 sec.
ステップ( 490 )  loss: 6.5453 -- time: 4.5566 sec.
ステップ( 500 )  loss: 7.0541 -- time: 4.6538 sec.
ステップ( 510 )  loss: 6.8630 -- time: 4.4515 sec.
ステップ( 520 )  loss: 6.9070 -- time: 4.5398 sec.
ステップ( 530 )  loss: 6.3727 -- time: 4.6380 sec.
--------------------------
train_loss: 1190.3649 - val_loss: 0.0000
time: 84.9360 sec.
--------------------------
Epoch 4/50
--------------------------


  mode = random.choice(self.sample_options)


ステップ( 540 )  loss: 6.8040 -- time: 1.3254 sec.
ステップ( 550 )  loss: 6.1986 -- time: 4.6674 sec.
ステップ( 560 )  loss: 6.2540 -- time: 4.5269 sec.
ステップ( 570 )  loss: 6.3735 -- time: 4.6612 sec.
ステップ( 580 )  loss: 6.1213 -- time: 4.5765 sec.
ステップ( 590 )  loss: 7.1055 -- time: 4.6590 sec.
ステップ( 600 )  loss: 6.3113 -- time: 4.5664 sec.
ステップ( 610 )  loss: 6.6519 -- time: 4.5586 sec.
ステップ( 620 )  loss: 6.1905 -- time: 4.4836 sec.
ステップ( 630 )  loss: 6.6144 -- time: 4.5551 sec.
ステップ( 640 )  loss: 6.6022 -- time: 4.5505 sec.
ステップ( 650 )  loss: 6.4089 -- time: 4.6345 sec.
ステップ( 660 )  loss: 5.4070 -- time: 4.6985 sec.
ステップ( 670 )  loss: 6.1401 -- time: 4.6091 sec.
ステップ( 680 )  loss: 5.5709 -- time: 4.5618 sec.
ステップ( 690 )  loss: 5.9240 -- time: 4.5151 sec.
ステップ( 700 )  loss: 6.2463 -- time: 4.6030 sec.
ステップ( 710 )  loss: 6.1419 -- time: 4.6162 sec.
--------------------------
train_loss: 1131.1593 - val_loss: 0.0000
time: 84.8441 sec.
--------------------------
Epoch 5/50
--------------------------


  mode = random.choice(self.sample_options)


ステップ( 720 )  loss: 6.1245 -- time: 1.7288 sec.
ステップ( 730 )  loss: 6.2086 -- time: 4.7294 sec.
ステップ( 740 )  loss: 5.7312 -- time: 4.4856 sec.
ステップ( 750 )  loss: 5.6946 -- time: 4.4085 sec.
ステップ( 760 )  loss: 6.2473 -- time: 4.5973 sec.
ステップ( 770 )  loss: 5.9749 -- time: 4.5780 sec.
ステップ( 780 )  loss: 6.6197 -- time: 4.5007 sec.
ステップ( 790 )  loss: 5.9787 -- time: 4.5687 sec.
ステップ( 800 )  loss: 5.9975 -- time: 4.5836 sec.
ステップ( 810 )  loss: 5.7125 -- time: 4.6860 sec.
ステップ( 820 )  loss: 6.5223 -- time: 4.5836 sec.
ステップ( 830 )  loss: 6.0182 -- time: 4.6291 sec.
ステップ( 840 )  loss: 6.0278 -- time: 4.6112 sec.
ステップ( 850 )  loss: 5.7465 -- time: 4.6826 sec.
ステップ( 860 )  loss: 6.2097 -- time: 4.4741 sec.
ステップ( 870 )  loss: 6.2256 -- time: 4.5327 sec.
ステップ( 880 )  loss: 5.9165 -- time: 4.5748 sec.
ステップ( 890 )  loss: 6.2126 -- time: 4.5946 sec.
--------------------------
train_loss: 1080.9892 - val_loss: 0.0000
time: 84.5303 sec.
--------------------------
Epoch 6/50
--------------------------


  mode = random.choice(self.sample_options)


ステップ( 900 )  loss: 6.0143 -- time: 2.1961 sec.
ステップ( 910 )  loss: 5.8030 -- time: 4.5045 sec.
ステップ( 920 )  loss: 6.0682 -- time: 4.5112 sec.
ステップ( 930 )  loss: 6.0281 -- time: 4.5869 sec.
ステップ( 940 )  loss: 6.2251 -- time: 4.6919 sec.
ステップ( 950 )  loss: 5.5664 -- time: 4.5174 sec.
ステップ( 960 )  loss: 5.7490 -- time: 4.6757 sec.
ステップ( 970 )  loss: 6.2315 -- time: 4.6455 sec.
ステップ( 980 )  loss: 5.5670 -- time: 4.6098 sec.
ステップ( 990 )  loss: 5.8584 -- time: 4.5725 sec.
ステップ( 1000 )  loss: 5.3023 -- time: 4.6906 sec.
ステップ( 1010 )  loss: 5.0324 -- time: 4.6158 sec.
ステップ( 1020 )  loss: 5.3705 -- time: 4.6441 sec.
ステップ( 1030 )  loss: 5.7017 -- time: 4.6325 sec.
ステップ( 1040 )  loss: 5.9285 -- time: 4.5291 sec.
ステップ( 1050 )  loss: 5.9960 -- time: 4.5221 sec.
ステップ( 1060 )  loss: 6.0061 -- time: 4.6214 sec.
ステップ( 1070 )  loss: 5.7631 -- time: 4.4406 sec.
--------------------------
train_loss: 1043.7151 - val_loss: 0.0000
time: 84.7210 sec.
--------------------------
Epoch 7/50
---------------------

  mode = random.choice(self.sample_options)


ステップ( 1080 )  loss: 5.2961 -- time: 2.6508 sec.
ステップ( 1090 )  loss: 6.0773 -- time: 4.6505 sec.
ステップ( 1100 )  loss: 5.4032 -- time: 4.6872 sec.
ステップ( 1110 )  loss: 5.3815 -- time: 4.5752 sec.
ステップ( 1120 )  loss: 5.9478 -- time: 4.5017 sec.
ステップ( 1130 )  loss: 5.6662 -- time: 4.5208 sec.
ステップ( 1140 )  loss: 5.3039 -- time: 4.7183 sec.
ステップ( 1150 )  loss: 5.4878 -- time: 4.5799 sec.
ステップ( 1160 )  loss: 5.5884 -- time: 4.6912 sec.
ステップ( 1170 )  loss: 5.7525 -- time: 4.6112 sec.
ステップ( 1180 )  loss: 5.6662 -- time: 4.5743 sec.
ステップ( 1190 )  loss: 5.6584 -- time: 4.6746 sec.
ステップ( 1200 )  loss: 5.6745 -- time: 4.6751 sec.
ステップ( 1210 )  loss: 5.4147 -- time: 4.6766 sec.
ステップ( 1220 )  loss: 5.5013 -- time: 4.5744 sec.
ステップ( 1230 )  loss: 5.9019 -- time: 4.6902 sec.
ステップ( 1240 )  loss: 5.5643 -- time: 4.5804 sec.
ステップ( 1250 )  loss: 6.0551 -- time: 4.5994 sec.
--------------------------
train_loss: 1012.7062 - val_loss: 0.0000
time: 85.2300 sec.
--------------------------
Epoch 8/50
-----------

  mode = random.choice(self.sample_options)


ステップ( 1260 )  loss: 5.5441 -- time: 3.2546 sec.
ステップ( 1270 )  loss: 5.3848 -- time: 4.6139 sec.
ステップ( 1280 )  loss: 5.8123 -- time: 4.7716 sec.
ステップ( 1290 )  loss: 5.0056 -- time: 4.5541 sec.
ステップ( 1300 )  loss: 5.7182 -- time: 4.5614 sec.
ステップ( 1310 )  loss: 5.3651 -- time: 4.6992 sec.
ステップ( 1320 )  loss: 5.7503 -- time: 4.4546 sec.
ステップ( 1330 )  loss: 5.7959 -- time: 4.6311 sec.
ステップ( 1340 )  loss: 5.1259 -- time: 4.4321 sec.
ステップ( 1350 )  loss: 5.8922 -- time: 4.5945 sec.
ステップ( 1360 )  loss: 5.7227 -- time: 4.5120 sec.
ステップ( 1370 )  loss: 5.7571 -- time: 4.6293 sec.
ステップ( 1380 )  loss: 5.8421 -- time: 4.7010 sec.
ステップ( 1390 )  loss: 5.7256 -- time: 4.5360 sec.
ステップ( 1400 )  loss: 5.4493 -- time: 4.5104 sec.
ステップ( 1410 )  loss: 5.8636 -- time: 4.5299 sec.
ステップ( 1420 )  loss: 5.8528 -- time: 4.6781 sec.
ステップ( 1430 )  loss: 4.9957 -- time: 4.5856 sec.
--------------------------
train_loss: 982.3829 - val_loss: 0.0000
time: 84.8358 sec.
--------------------------
Epoch 9/50
------------

  mode = random.choice(self.sample_options)


ステップ( 1440 )  loss: 5.3738 -- time: 3.7302 sec.
ステップ( 1450 )  loss: 5.2394 -- time: 4.4288 sec.
ステップ( 1460 )  loss: 5.1442 -- time: 4.6729 sec.
ステップ( 1470 )  loss: 5.1710 -- time: 4.5694 sec.
ステップ( 1480 )  loss: 5.5451 -- time: 4.7154 sec.
ステップ( 1490 )  loss: 5.6188 -- time: 4.7532 sec.
ステップ( 1500 )  loss: 4.8610 -- time: 4.5803 sec.
ステップ( 1510 )  loss: 5.2255 -- time: 4.6408 sec.
ステップ( 1520 )  loss: 5.1125 -- time: 4.6009 sec.
ステップ( 1530 )  loss: 5.2437 -- time: 4.5952 sec.
ステップ( 1540 )  loss: 5.7391 -- time: 4.5308 sec.
ステップ( 1550 )  loss: 5.2469 -- time: 4.6581 sec.
ステップ( 1560 )  loss: 6.0123 -- time: 4.6513 sec.
ステップ( 1570 )  loss: 5.1956 -- time: 4.6181 sec.
ステップ( 1580 )  loss: 5.2161 -- time: 4.5500 sec.
ステップ( 1590 )  loss: 4.9718 -- time: 4.6424 sec.
ステップ( 1600 )  loss: 5.3166 -- time: 4.5301 sec.
ステップ( 1610 )  loss: 5.4465 -- time: 4.6285 sec.
--------------------------
train_loss: 963.3507 - val_loss: 0.0000
time: 85.1818 sec.
--------------------------
Epoch 10/50
-----------

  mode = random.choice(self.sample_options)


ステップ( 1620 )  loss: 5.2949 -- time: 4.1548 sec.
ステップ( 1630 )  loss: 5.5235 -- time: 4.5725 sec.
ステップ( 1640 )  loss: 5.6282 -- time: 4.5287 sec.
ステップ( 1650 )  loss: 4.9579 -- time: 4.5985 sec.
ステップ( 1660 )  loss: 5.0801 -- time: 4.7094 sec.
ステップ( 1670 )  loss: 4.7383 -- time: 4.5863 sec.
ステップ( 1680 )  loss: 5.0561 -- time: 4.5201 sec.
ステップ( 1690 )  loss: 4.8364 -- time: 4.6285 sec.
ステップ( 1700 )  loss: 5.3456 -- time: 4.7752 sec.
ステップ( 1710 )  loss: 4.9080 -- time: 4.5293 sec.
ステップ( 1720 )  loss: 5.7433 -- time: 4.6135 sec.
ステップ( 1730 )  loss: 4.9034 -- time: 4.7283 sec.
ステップ( 1740 )  loss: 5.0545 -- time: 4.5962 sec.
ステップ( 1750 )  loss: 4.8574 -- time: 4.6391 sec.
ステップ( 1760 )  loss: 5.6510 -- time: 4.5614 sec.
ステップ( 1770 )  loss: 5.1682 -- time: 4.5740 sec.
ステップ( 1780 )  loss: 5.7898 -- time: 4.5432 sec.
ステップ( 1790 )  loss: 4.6723 -- time: 4.4362 sec.
--------------------------
validation
--------------------------
train_loss: 930.9293 - val_loss: 949.7343
time: 120.5834 sec.
--saved w

  mode = random.choice(self.sample_options)


ステップ( 1800 )  loss: 5.2516 -- time: 4.4730 sec.
ステップ( 1810 )  loss: 4.9066 -- time: 4.6233 sec.
ステップ( 1820 )  loss: 4.8641 -- time: 4.6784 sec.
ステップ( 1830 )  loss: 4.1805 -- time: 4.4948 sec.
ステップ( 1840 )  loss: 5.4683 -- time: 4.6993 sec.
ステップ( 1850 )  loss: 5.6192 -- time: 4.6210 sec.
ステップ( 1860 )  loss: 4.8560 -- time: 4.6504 sec.
ステップ( 1870 )  loss: 5.3550 -- time: 4.7026 sec.
ステップ( 1880 )  loss: 5.3414 -- time: 4.7177 sec.
ステップ( 1890 )  loss: 4.9828 -- time: 4.5082 sec.
ステップ( 1900 )  loss: 5.3897 -- time: 4.5663 sec.
ステップ( 1910 )  loss: 4.6778 -- time: 4.4996 sec.
ステップ( 1920 )  loss: 4.7339 -- time: 4.7054 sec.
ステップ( 1930 )  loss: 5.0191 -- time: 4.7430 sec.
ステップ( 1940 )  loss: 4.1187 -- time: 4.6233 sec.
ステップ( 1950 )  loss: 4.4674 -- time: 4.4853 sec.
ステップ( 1960 )  loss: 4.7916 -- time: 4.4830 sec.
--------------------------
train_loss: 913.7088 - val_loss: 0.0000
time: 85.0420 sec.
--------------------------
Epoch 12/50
--------------------------


  mode = random.choice(self.sample_options)


ステップ( 1970 )  loss: 4.9624 -- time: 0.3572 sec.
ステップ( 1980 )  loss: 5.4724 -- time: 4.6052 sec.
ステップ( 1990 )  loss: 5.1357 -- time: 4.6927 sec.
ステップ( 2000 )  loss: 5.1922 -- time: 4.5548 sec.
ステップ( 2010 )  loss: 4.8774 -- time: 4.4467 sec.
ステップ( 2020 )  loss: 4.6121 -- time: 4.4409 sec.
ステップ( 2030 )  loss: 5.4138 -- time: 4.5225 sec.
ステップ( 2040 )  loss: 5.0614 -- time: 4.6039 sec.
ステップ( 2050 )  loss: 4.9500 -- time: 4.6343 sec.
ステップ( 2060 )  loss: 4.6027 -- time: 4.6617 sec.
ステップ( 2070 )  loss: 4.8862 -- time: 4.6085 sec.
ステップ( 2080 )  loss: 4.8558 -- time: 4.6744 sec.
ステップ( 2090 )  loss: 5.1048 -- time: 4.6005 sec.
ステップ( 2100 )  loss: 4.7023 -- time: 4.6311 sec.
ステップ( 2110 )  loss: 5.0081 -- time: 4.7630 sec.
ステップ( 2120 )  loss: 5.0827 -- time: 4.5106 sec.
ステップ( 2130 )  loss: 4.8518 -- time: 4.6246 sec.
ステップ( 2140 )  loss: 4.7013 -- time: 4.5896 sec.
--------------------------
train_loss: 893.2742 - val_loss: 0.0000
time: 84.9041 sec.
--------------------------
Epoch 13/50
-----------

  mode = random.choice(self.sample_options)


ステップ( 2150 )  loss: 5.3619 -- time: 0.7979 sec.
ステップ( 2160 )  loss: 4.9745 -- time: 4.5923 sec.
ステップ( 2170 )  loss: 4.7619 -- time: 4.7669 sec.
ステップ( 2180 )  loss: 4.6886 -- time: 4.6193 sec.
ステップ( 2190 )  loss: 4.8608 -- time: 4.5081 sec.
ステップ( 2200 )  loss: 4.9503 -- time: 4.5515 sec.
ステップ( 2210 )  loss: 5.1078 -- time: 4.7128 sec.
ステップ( 2220 )  loss: 5.0822 -- time: 4.4657 sec.
ステップ( 2230 )  loss: 4.9331 -- time: 4.4296 sec.
ステップ( 2240 )  loss: 4.8894 -- time: 4.6411 sec.
ステップ( 2250 )  loss: 4.8472 -- time: 4.5969 sec.
ステップ( 2260 )  loss: 4.7859 -- time: 4.6627 sec.
ステップ( 2270 )  loss: 5.1535 -- time: 4.4590 sec.
ステップ( 2280 )  loss: 4.7126 -- time: 4.5515 sec.
ステップ( 2290 )  loss: 4.9428 -- time: 4.6827 sec.
ステップ( 2300 )  loss: 4.9374 -- time: 4.4871 sec.
ステップ( 2310 )  loss: 5.5030 -- time: 4.5738 sec.
ステップ( 2320 )  loss: 4.5114 -- time: 4.4766 sec.
--------------------------
train_loss: 881.4125 - val_loss: 0.0000
time: 84.4317 sec.
--------------------------
Epoch 14/50
-----------

  mode = random.choice(self.sample_options)


ステップ( 2330 )  loss: 5.2515 -- time: 1.3047 sec.
ステップ( 2340 )  loss: 4.2709 -- time: 4.5935 sec.
ステップ( 2350 )  loss: 4.6320 -- time: 4.4274 sec.
ステップ( 2360 )  loss: 4.8541 -- time: 4.4916 sec.
ステップ( 2370 )  loss: 5.0137 -- time: 4.5535 sec.
ステップ( 2380 )  loss: 4.7963 -- time: 4.5287 sec.
ステップ( 2390 )  loss: 5.0571 -- time: 4.5314 sec.
ステップ( 2400 )  loss: 4.7243 -- time: 4.6145 sec.
ステップ( 2410 )  loss: 5.2128 -- time: 4.5967 sec.
ステップ( 2420 )  loss: 4.7747 -- time: 4.6498 sec.
ステップ( 2430 )  loss: 4.9505 -- time: 4.5291 sec.
ステップ( 2440 )  loss: 4.8305 -- time: 4.6532 sec.
ステップ( 2450 )  loss: 5.2183 -- time: 4.5544 sec.
ステップ( 2460 )  loss: 4.6489 -- time: 4.5422 sec.
ステップ( 2470 )  loss: 4.4283 -- time: 4.6435 sec.
ステップ( 2480 )  loss: 4.5649 -- time: 4.6829 sec.
ステップ( 2490 )  loss: 5.1655 -- time: 4.5407 sec.
ステップ( 2500 )  loss: 4.6470 -- time: 4.6294 sec.
--------------------------
train_loss: 863.4566 - val_loss: 0.0000
time: 84.5388 sec.
--------------------------
Epoch 15/50
-----------

  mode = random.choice(self.sample_options)


ステップ( 2510 )  loss: 4.6531 -- time: 1.7497 sec.
ステップ( 2520 )  loss: 4.8170 -- time: 4.5362 sec.
ステップ( 2530 )  loss: 4.7804 -- time: 4.5675 sec.
ステップ( 2540 )  loss: 4.5349 -- time: 4.7160 sec.
ステップ( 2550 )  loss: 4.8432 -- time: 4.6050 sec.
ステップ( 2560 )  loss: 4.7045 -- time: 4.5829 sec.
ステップ( 2570 )  loss: 4.9616 -- time: 4.5787 sec.
ステップ( 2580 )  loss: 4.1192 -- time: 4.5612 sec.
ステップ( 2590 )  loss: 4.4894 -- time: 4.5038 sec.
ステップ( 2600 )  loss: 4.9522 -- time: 4.6207 sec.
ステップ( 2610 )  loss: 4.6557 -- time: 4.7089 sec.
ステップ( 2620 )  loss: 5.1352 -- time: 4.5965 sec.
ステップ( 2630 )  loss: 4.8824 -- time: 4.6658 sec.
ステップ( 2640 )  loss: 4.4273 -- time: 4.6184 sec.
ステップ( 2650 )  loss: 5.1457 -- time: 4.4485 sec.
ステップ( 2660 )  loss: 5.1521 -- time: 4.6034 sec.
ステップ( 2670 )  loss: 5.0209 -- time: 4.4561 sec.
ステップ( 2680 )  loss: 4.7733 -- time: 4.5800 sec.
--------------------------
train_loss: 851.7550 - val_loss: 0.0000
time: 84.7299 sec.
--------------------------
Epoch 16/50
-----------

  mode = random.choice(self.sample_options)


ステップ( 2690 )  loss: 4.4631 -- time: 2.2640 sec.
ステップ( 2700 )  loss: 4.5718 -- time: 4.6232 sec.
ステップ( 2710 )  loss: 4.7040 -- time: 4.6745 sec.
ステップ( 2720 )  loss: 4.8488 -- time: 4.6523 sec.
ステップ( 2730 )  loss: 5.0956 -- time: 4.5990 sec.
ステップ( 2740 )  loss: 4.5005 -- time: 4.5909 sec.
ステップ( 2750 )  loss: 4.8053 -- time: 4.4530 sec.
ステップ( 2760 )  loss: 4.4608 -- time: 4.5729 sec.
ステップ( 2770 )  loss: 4.9372 -- time: 4.6539 sec.
ステップ( 2780 )  loss: 4.9214 -- time: 4.5590 sec.
ステップ( 2790 )  loss: 4.6404 -- time: 4.5409 sec.
ステップ( 2800 )  loss: 4.9284 -- time: 4.6003 sec.
ステップ( 2810 )  loss: 4.7721 -- time: 4.3768 sec.
ステップ( 2820 )  loss: 4.1989 -- time: 4.5838 sec.
ステップ( 2830 )  loss: 5.1078 -- time: 4.6153 sec.
ステップ( 2840 )  loss: 4.4502 -- time: 4.5673 sec.
ステップ( 2850 )  loss: 4.5796 -- time: 4.6199 sec.
ステップ( 2860 )  loss: 4.9167 -- time: 4.4853 sec.
--------------------------
train_loss: 835.5944 - val_loss: 0.0000
time: 84.4868 sec.
--------------------------
Epoch 17/50
-----------

  mode = random.choice(self.sample_options)


ステップ( 2870 )  loss: 5.3559 -- time: 2.8152 sec.
ステップ( 2880 )  loss: 4.8463 -- time: 4.6535 sec.
ステップ( 2890 )  loss: 4.4784 -- time: 4.6724 sec.
ステップ( 2900 )  loss: 4.3350 -- time: 4.5895 sec.
ステップ( 2910 )  loss: 4.9394 -- time: 4.7613 sec.
ステップ( 2920 )  loss: 4.1692 -- time: 4.6039 sec.
ステップ( 2930 )  loss: 5.0531 -- time: 4.6696 sec.
ステップ( 2940 )  loss: 4.5530 -- time: 4.6081 sec.
ステップ( 2950 )  loss: 4.5104 -- time: 4.5306 sec.
ステップ( 2960 )  loss: 5.0828 -- time: 4.5145 sec.
ステップ( 2970 )  loss: 4.7755 -- time: 4.7168 sec.
ステップ( 2980 )  loss: 5.0843 -- time: 4.4456 sec.
ステップ( 2990 )  loss: 4.7791 -- time: 4.5021 sec.
ステップ( 3000 )  loss: 4.8083 -- time: 4.6157 sec.
ステップ( 3010 )  loss: 4.7432 -- time: 4.5933 sec.
ステップ( 3020 )  loss: 4.9728 -- time: 4.6394 sec.
ステップ( 3030 )  loss: 4.5783 -- time: 4.5170 sec.
ステップ( 3040 )  loss: 4.4582 -- time: 4.5559 sec.
--------------------------
train_loss: 819.4527 - val_loss: 0.0000
time: 85.0511 sec.
--------------------------
Epoch 18/50
-----------

  mode = random.choice(self.sample_options)


ステップ( 3050 )  loss: 4.7012 -- time: 3.1061 sec.
ステップ( 3060 )  loss: 4.7676 -- time: 4.6530 sec.
ステップ( 3070 )  loss: 4.0323 -- time: 4.7160 sec.
ステップ( 3080 )  loss: 4.7278 -- time: 4.5928 sec.
ステップ( 3090 )  loss: 4.4848 -- time: 4.5426 sec.
ステップ( 3100 )  loss: 3.8017 -- time: 4.7722 sec.
ステップ( 3110 )  loss: 4.3468 -- time: 4.5533 sec.
ステップ( 3120 )  loss: 5.1862 -- time: 4.6858 sec.
ステップ( 3130 )  loss: 4.8666 -- time: 4.6930 sec.
ステップ( 3140 )  loss: 4.1126 -- time: 4.5594 sec.
ステップ( 3150 )  loss: 4.2853 -- time: 4.6590 sec.
ステップ( 3160 )  loss: 4.5301 -- time: 4.5764 sec.
ステップ( 3170 )  loss: 4.0071 -- time: 4.6816 sec.
ステップ( 3180 )  loss: 4.5599 -- time: 4.6298 sec.
ステップ( 3190 )  loss: 4.6384 -- time: 4.5428 sec.
ステップ( 3200 )  loss: 4.3508 -- time: 4.6782 sec.
ステップ( 3210 )  loss: 5.0542 -- time: 4.6458 sec.
ステップ( 3220 )  loss: 4.3100 -- time: 4.6629 sec.
--------------------------
train_loss: 811.5956 - val_loss: 0.0000
time: 85.5338 sec.
--------------------------
Epoch 19/50
-----------

  mode = random.choice(self.sample_options)


ステップ( 3230 )  loss: 4.1650 -- time: 3.6359 sec.
ステップ( 3240 )  loss: 4.5581 -- time: 4.6406 sec.
ステップ( 3250 )  loss: 4.6084 -- time: 4.5979 sec.
ステップ( 3260 )  loss: 4.2312 -- time: 4.6694 sec.
ステップ( 3270 )  loss: 4.4148 -- time: 4.5592 sec.
ステップ( 3280 )  loss: 5.0618 -- time: 4.5820 sec.
ステップ( 3290 )  loss: 4.1986 -- time: 4.5816 sec.
ステップ( 3300 )  loss: 4.8234 -- time: 4.6046 sec.
ステップ( 3310 )  loss: 4.5420 -- time: 4.5989 sec.
ステップ( 3320 )  loss: 4.4090 -- time: 4.6133 sec.
ステップ( 3330 )  loss: 4.4478 -- time: 4.5007 sec.
ステップ( 3340 )  loss: 4.2149 -- time: 4.5715 sec.
ステップ( 3350 )  loss: 3.7784 -- time: 4.6048 sec.
ステップ( 3360 )  loss: 4.4246 -- time: 4.6226 sec.
ステップ( 3370 )  loss: 4.7627 -- time: 4.6646 sec.
ステップ( 3380 )  loss: 4.7710 -- time: 4.6214 sec.
ステップ( 3390 )  loss: 4.5443 -- time: 4.5762 sec.
ステップ( 3400 )  loss: 4.6274 -- time: 4.6215 sec.
--------------------------
train_loss: 797.0756 - val_loss: 0.0000
time: 84.9347 sec.
--------------------------
Epoch 20/50
-----------

  mode = random.choice(self.sample_options)


ステップ( 3410 )  loss: 4.5933 -- time: 4.0981 sec.
ステップ( 3420 )  loss: 4.8417 -- time: 4.4896 sec.
ステップ( 3430 )  loss: 4.7097 -- time: 4.7197 sec.
ステップ( 3440 )  loss: 4.2146 -- time: 4.5847 sec.
ステップ( 3450 )  loss: 3.4667 -- time: 4.5894 sec.
ステップ( 3460 )  loss: 4.4984 -- time: 4.7020 sec.
ステップ( 3470 )  loss: 4.3904 -- time: 4.6163 sec.
ステップ( 3480 )  loss: 4.1722 -- time: 4.4731 sec.
ステップ( 3490 )  loss: 4.2281 -- time: 4.5709 sec.
ステップ( 3500 )  loss: 4.3091 -- time: 4.6759 sec.
ステップ( 3510 )  loss: 4.2551 -- time: 4.7062 sec.
ステップ( 3520 )  loss: 4.7185 -- time: 4.5857 sec.
ステップ( 3530 )  loss: 4.6281 -- time: 4.6858 sec.
ステップ( 3540 )  loss: 4.8526 -- time: 4.6815 sec.
ステップ( 3550 )  loss: 4.3485 -- time: 4.5540 sec.
ステップ( 3560 )  loss: 4.1475 -- time: 4.5451 sec.
ステップ( 3570 )  loss: 4.3007 -- time: 4.5796 sec.
ステップ( 3580 )  loss: 4.2229 -- time: 4.4790 sec.
--------------------------
validation
--------------------------
train_loss: 781.0389 - val_loss: 831.7384
time: 119.2451 sec.
--saved w

  mode = random.choice(self.sample_options)


ステップ( 3590 )  loss: 5.0688 -- time: 4.6918 sec.
ステップ( 3600 )  loss: 4.9849 -- time: 4.7626 sec.
ステップ( 3610 )  loss: 4.3707 -- time: 4.5959 sec.
ステップ( 3620 )  loss: 4.7106 -- time: 4.6782 sec.
ステップ( 3630 )  loss: 4.2034 -- time: 4.6483 sec.
ステップ( 3640 )  loss: 3.9693 -- time: 4.8342 sec.
ステップ( 3650 )  loss: 4.2064 -- time: 4.6916 sec.
ステップ( 3660 )  loss: 4.6253 -- time: 4.5839 sec.
ステップ( 3670 )  loss: 4.8955 -- time: 4.6119 sec.
ステップ( 3680 )  loss: 4.4168 -- time: 4.6236 sec.
ステップ( 3690 )  loss: 4.3124 -- time: 4.5410 sec.
ステップ( 3700 )  loss: 4.7481 -- time: 4.7469 sec.
ステップ( 3710 )  loss: 3.7952 -- time: 4.5836 sec.
ステップ( 3720 )  loss: 4.4274 -- time: 4.5305 sec.
ステップ( 3730 )  loss: 4.6250 -- time: 4.5570 sec.
ステップ( 3740 )  loss: 4.1841 -- time: 4.4113 sec.
ステップ( 3750 )  loss: 4.5301 -- time: 4.6085 sec.
--------------------------
train_loss: 783.9062 - val_loss: 0.0000
time: 85.4812 sec.
--------------------------
Epoch 22/50
--------------------------


  mode = random.choice(self.sample_options)


ステップ( 3760 )  loss: 4.1813 -- time: 0.2847 sec.
ステップ( 3770 )  loss: 4.4514 -- time: 4.6811 sec.
ステップ( 3780 )  loss: 3.7812 -- time: 4.5346 sec.
ステップ( 3790 )  loss: 3.9916 -- time: 4.6229 sec.
ステップ( 3800 )  loss: 4.3168 -- time: 4.6248 sec.
ステップ( 3810 )  loss: 4.4416 -- time: 4.6983 sec.
ステップ( 3820 )  loss: 4.5916 -- time: 4.5657 sec.
ステップ( 3830 )  loss: 4.7660 -- time: 4.5933 sec.
ステップ( 3840 )  loss: 4.3957 -- time: 4.5986 sec.
ステップ( 3850 )  loss: 4.0334 -- time: 4.7925 sec.
ステップ( 3860 )  loss: 3.8566 -- time: 4.6816 sec.
ステップ( 3870 )  loss: 4.2815 -- time: 4.6307 sec.
ステップ( 3880 )  loss: 4.2519 -- time: 4.6189 sec.
ステップ( 3890 )  loss: 3.3995 -- time: 4.6720 sec.
ステップ( 3900 )  loss: 4.3525 -- time: 4.5091 sec.
ステップ( 3910 )  loss: 4.1707 -- time: 4.8980 sec.
ステップ( 3920 )  loss: 3.8842 -- time: 4.6032 sec.
ステップ( 3930 )  loss: 4.2947 -- time: 4.8434 sec.
--------------------------
train_loss: 768.9110 - val_loss: 0.0000
time: 85.8731 sec.
--------------------------
Epoch 23/50
-----------

  mode = random.choice(self.sample_options)


ステップ( 3940 )  loss: 4.2462 -- time: 0.7895 sec.
ステップ( 3950 )  loss: 4.3987 -- time: 4.5650 sec.
ステップ( 3960 )  loss: 4.3480 -- time: 4.5166 sec.
ステップ( 3970 )  loss: 4.6994 -- time: 4.5974 sec.
ステップ( 3980 )  loss: 4.3038 -- time: 4.5166 sec.
ステップ( 3990 )  loss: 4.5750 -- time: 4.6546 sec.
ステップ( 4000 )  loss: 5.0548 -- time: 4.5658 sec.
ステップ( 4010 )  loss: 4.1634 -- time: 4.5545 sec.
ステップ( 4020 )  loss: 4.2419 -- time: 4.4774 sec.
ステップ( 4030 )  loss: 3.9989 -- time: 4.4845 sec.
ステップ( 4040 )  loss: 4.3949 -- time: 4.5923 sec.
ステップ( 4050 )  loss: 3.9452 -- time: 4.5076 sec.
ステップ( 4060 )  loss: 4.6656 -- time: 4.5196 sec.
ステップ( 4070 )  loss: 3.8466 -- time: 4.5933 sec.
ステップ( 4080 )  loss: 3.6885 -- time: 4.5802 sec.
ステップ( 4090 )  loss: 4.3361 -- time: 4.5487 sec.
ステップ( 4100 )  loss: 4.1776 -- time: 4.5138 sec.
ステップ( 4110 )  loss: 4.0946 -- time: 4.7494 sec.
--------------------------
train_loss: 759.3863 - val_loss: 0.0000
time: 84.1494 sec.
--------------------------
Epoch 24/50
-----------

  mode = random.choice(self.sample_options)


ステップ( 4120 )  loss: 4.3883 -- time: 1.3037 sec.
ステップ( 4130 )  loss: 4.0639 -- time: 4.6139 sec.
ステップ( 4140 )  loss: 4.2895 -- time: 4.6182 sec.
ステップ( 4150 )  loss: 4.3305 -- time: 4.5180 sec.
ステップ( 4160 )  loss: 4.5425 -- time: 4.4560 sec.
ステップ( 4170 )  loss: 3.8619 -- time: 4.4753 sec.
ステップ( 4180 )  loss: 4.3352 -- time: 4.5861 sec.
ステップ( 4190 )  loss: 3.6966 -- time: 4.5914 sec.
ステップ( 4200 )  loss: 4.2345 -- time: 4.3900 sec.
ステップ( 4210 )  loss: 4.7157 -- time: 4.5211 sec.
ステップ( 4220 )  loss: 3.9037 -- time: 4.6171 sec.
ステップ( 4230 )  loss: 3.9871 -- time: 4.5606 sec.
ステップ( 4240 )  loss: 4.1025 -- time: 4.5061 sec.
ステップ( 4250 )  loss: 3.5834 -- time: 4.6641 sec.
ステップ( 4260 )  loss: 4.4892 -- time: 4.6640 sec.
ステップ( 4270 )  loss: 4.5696 -- time: 4.4426 sec.
ステップ( 4280 )  loss: 4.0942 -- time: 4.4508 sec.
ステップ( 4290 )  loss: 3.4576 -- time: 4.6356 sec.
--------------------------
train_loss: 747.5231 - val_loss: 0.0000
time: 84.1101 sec.
--------------------------
Epoch 25/50
-----------

  mode = random.choice(self.sample_options)


ステップ( 4300 )  loss: 4.5278 -- time: 1.7615 sec.
ステップ( 4310 )  loss: 3.8689 -- time: 4.4724 sec.
ステップ( 4320 )  loss: 3.9681 -- time: 4.5434 sec.
ステップ( 4330 )  loss: 4.2237 -- time: 4.6382 sec.
ステップ( 4340 )  loss: 4.1742 -- time: 4.6049 sec.
ステップ( 4350 )  loss: 3.9307 -- time: 4.5560 sec.
ステップ( 4360 )  loss: 4.5235 -- time: 4.5881 sec.
ステップ( 4370 )  loss: 3.8988 -- time: 4.5580 sec.
ステップ( 4380 )  loss: 4.4341 -- time: 4.5352 sec.
ステップ( 4390 )  loss: 4.2727 -- time: 4.5784 sec.
ステップ( 4400 )  loss: 4.4697 -- time: 4.6007 sec.
ステップ( 4410 )  loss: 3.6985 -- time: 4.5989 sec.
ステップ( 4420 )  loss: 3.8445 -- time: 4.6260 sec.
ステップ( 4430 )  loss: 4.8690 -- time: 4.5947 sec.
ステップ( 4440 )  loss: 4.3979 -- time: 4.6197 sec.
ステップ( 4450 )  loss: 4.1415 -- time: 4.6188 sec.
ステップ( 4460 )  loss: 3.9369 -- time: 4.6063 sec.
ステップ( 4470 )  loss: 4.3324 -- time: 4.7468 sec.
--------------------------
train_loss: 735.4299 - val_loss: 0.0000
time: 84.8422 sec.
--------------------------
Epoch 26/50
-----------

  mode = random.choice(self.sample_options)


ステップ( 4480 )  loss: 4.4810 -- time: 2.2601 sec.
ステップ( 4490 )  loss: 4.5269 -- time: 4.6796 sec.
ステップ( 4500 )  loss: 4.2380 -- time: 4.5010 sec.
ステップ( 4510 )  loss: 3.6113 -- time: 4.5791 sec.
ステップ( 4520 )  loss: 3.8268 -- time: 4.5037 sec.
ステップ( 4530 )  loss: 3.9113 -- time: 4.5311 sec.
ステップ( 4540 )  loss: 3.7721 -- time: 4.6188 sec.
ステップ( 4550 )  loss: 3.8053 -- time: 4.5484 sec.
ステップ( 4560 )  loss: 4.0943 -- time: 4.6588 sec.
ステップ( 4570 )  loss: 4.0814 -- time: 4.6707 sec.
ステップ( 4580 )  loss: 4.3282 -- time: 4.6925 sec.
ステップ( 4590 )  loss: 3.7222 -- time: 4.6090 sec.
ステップ( 4600 )  loss: 3.8040 -- time: 4.7213 sec.
ステップ( 4610 )  loss: 4.2226 -- time: 4.5561 sec.
ステップ( 4620 )  loss: 3.7330 -- time: 4.5892 sec.
ステップ( 4630 )  loss: 3.9593 -- time: 4.5758 sec.
ステップ( 4640 )  loss: 4.1725 -- time: 4.4200 sec.
ステップ( 4650 )  loss: 4.7040 -- time: 4.5587 sec.
--------------------------
train_loss: 734.1572 - val_loss: 0.0000
time: 84.8413 sec.
--------------------------
Epoch 27/50
-----------

  mode = random.choice(self.sample_options)


ステップ( 4660 )  loss: 4.3766 -- time: 2.6665 sec.
ステップ( 4670 )  loss: 4.2168 -- time: 4.7433 sec.
ステップ( 4680 )  loss: 3.5189 -- time: 4.5389 sec.
ステップ( 4690 )  loss: 3.7437 -- time: 4.6429 sec.
ステップ( 4700 )  loss: 3.9542 -- time: 4.5506 sec.
ステップ( 4710 )  loss: 3.7196 -- time: 4.5470 sec.
ステップ( 4720 )  loss: 3.9767 -- time: 4.4827 sec.
ステップ( 4730 )  loss: 3.8862 -- time: 4.6468 sec.
ステップ( 4740 )  loss: 4.1014 -- time: 4.6268 sec.
ステップ( 4750 )  loss: 3.8729 -- time: 4.5898 sec.
ステップ( 4760 )  loss: 4.2084 -- time: 4.5784 sec.
ステップ( 4770 )  loss: 3.9199 -- time: 4.5773 sec.
ステップ( 4780 )  loss: 4.3649 -- time: 4.5539 sec.
ステップ( 4790 )  loss: 4.3164 -- time: 4.6367 sec.
ステップ( 4800 )  loss: 4.1235 -- time: 4.4635 sec.
ステップ( 4810 )  loss: 4.2329 -- time: 4.5040 sec.
ステップ( 4820 )  loss: 4.0288 -- time: 4.4652 sec.
ステップ( 4830 )  loss: 4.4437 -- time: 4.5682 sec.
--------------------------
train_loss: 724.0248 - val_loss: 0.0000
time: 84.3932 sec.
--------------------------
Epoch 28/50
-----------

  mode = random.choice(self.sample_options)


ステップ( 4840 )  loss: 3.9180 -- time: 3.0598 sec.
ステップ( 4850 )  loss: 3.4465 -- time: 4.5104 sec.
ステップ( 4860 )  loss: 3.8938 -- time: 4.4767 sec.
ステップ( 4870 )  loss: 3.6087 -- time: 4.5505 sec.
ステップ( 4880 )  loss: 3.9600 -- time: 4.5098 sec.
ステップ( 4890 )  loss: 3.9606 -- time: 4.5144 sec.
ステップ( 4900 )  loss: 4.1415 -- time: 4.6402 sec.
ステップ( 4910 )  loss: 3.7046 -- time: 4.5759 sec.
ステップ( 4920 )  loss: 4.0227 -- time: 4.5152 sec.
ステップ( 4930 )  loss: 4.1852 -- time: 4.5271 sec.
ステップ( 4940 )  loss: 3.9803 -- time: 4.6780 sec.
ステップ( 4950 )  loss: 3.9570 -- time: 4.5141 sec.
ステップ( 4960 )  loss: 3.7225 -- time: 4.6274 sec.
ステップ( 4970 )  loss: 4.1974 -- time: 4.5667 sec.
ステップ( 4980 )  loss: 4.5487 -- time: 4.6769 sec.
ステップ( 4990 )  loss: 3.6008 -- time: 4.5777 sec.
ステップ( 5000 )  loss: 4.1257 -- time: 4.6148 sec.
ステップ( 5010 )  loss: 4.2187 -- time: 4.6719 sec.
--------------------------
train_loss: 716.1751 - val_loss: 0.0000
time: 84.2780 sec.
--------------------------
Epoch 29/50
-----------

  mode = random.choice(self.sample_options)


ステップ( 5020 )  loss: 4.5429 -- time: 3.4760 sec.
ステップ( 5030 )  loss: 3.7487 -- time: 4.5704 sec.
ステップ( 5040 )  loss: 4.2036 -- time: 4.5157 sec.
ステップ( 5050 )  loss: 3.6167 -- time: 4.5440 sec.
ステップ( 5060 )  loss: 4.1546 -- time: 4.5801 sec.
ステップ( 5070 )  loss: 4.0362 -- time: 4.6289 sec.
ステップ( 5080 )  loss: 4.2355 -- time: 4.6609 sec.
ステップ( 5090 )  loss: 4.3505 -- time: 4.5887 sec.
ステップ( 5100 )  loss: 4.3511 -- time: 4.5344 sec.
ステップ( 5110 )  loss: 4.3647 -- time: 4.6301 sec.
ステップ( 5120 )  loss: 3.9846 -- time: 4.4804 sec.
ステップ( 5130 )  loss: 4.2853 -- time: 4.6449 sec.
ステップ( 5140 )  loss: 3.5128 -- time: 4.5075 sec.
ステップ( 5150 )  loss: 4.2489 -- time: 4.7552 sec.
ステップ( 5160 )  loss: 3.8636 -- time: 4.6484 sec.
ステップ( 5170 )  loss: 4.1255 -- time: 4.6482 sec.
ステップ( 5180 )  loss: 4.2025 -- time: 4.6492 sec.
ステップ( 5190 )  loss: 4.1375 -- time: 4.5563 sec.
--------------------------
train_loss: 723.3342 - val_loss: 0.0000
time: 84.6821 sec.
--------------------------
Epoch 30/50
-----------

  mode = random.choice(self.sample_options)


ステップ( 5200 )  loss: 3.9652 -- time: 4.2570 sec.
ステップ( 5210 )  loss: 4.2174 -- time: 4.6070 sec.
ステップ( 5220 )  loss: 4.1243 -- time: 4.6453 sec.
ステップ( 5230 )  loss: 3.4363 -- time: 4.6216 sec.
ステップ( 5240 )  loss: 3.5891 -- time: 4.7105 sec.
ステップ( 5250 )  loss: 3.9638 -- time: 4.7278 sec.
ステップ( 5260 )  loss: 4.3290 -- time: 4.5653 sec.
ステップ( 5270 )  loss: 4.5206 -- time: 4.7007 sec.
ステップ( 5280 )  loss: 3.4754 -- time: 4.5851 sec.
ステップ( 5290 )  loss: 4.0219 -- time: 4.5025 sec.
ステップ( 5300 )  loss: 4.4303 -- time: 4.4995 sec.
ステップ( 5310 )  loss: 3.8560 -- time: 4.6780 sec.
ステップ( 5320 )  loss: 3.7709 -- time: 4.5439 sec.
ステップ( 5330 )  loss: 3.5472 -- time: 4.5274 sec.
ステップ( 5340 )  loss: 3.7228 -- time: 4.5643 sec.
ステップ( 5350 )  loss: 4.3052 -- time: 4.6813 sec.
ステップ( 5360 )  loss: 3.4233 -- time: 4.5763 sec.
ステップ( 5370 )  loss: 3.7374 -- time: 4.4855 sec.
--------------------------
validation
--------------------------
train_loss: 704.3084 - val_loss: 750.3317
time: 119.4032 sec.
--saved w

  mode = random.choice(self.sample_options)


ステップ( 5380 )  loss: 4.0021 -- time: 4.5349 sec.
ステップ( 5390 )  loss: 4.4056 -- time: 4.5485 sec.
ステップ( 5400 )  loss: 3.5344 -- time: 4.7161 sec.
ステップ( 5410 )  loss: 3.8601 -- time: 4.7645 sec.
ステップ( 5420 )  loss: 3.1611 -- time: 4.5385 sec.
ステップ( 5430 )  loss: 3.4736 -- time: 4.6510 sec.
ステップ( 5440 )  loss: 3.6197 -- time: 4.6017 sec.
ステップ( 5450 )  loss: 3.9686 -- time: 4.6970 sec.
ステップ( 5460 )  loss: 3.5121 -- time: 4.5802 sec.
ステップ( 5470 )  loss: 3.6192 -- time: 4.7088 sec.
ステップ( 5480 )  loss: 4.4221 -- time: 4.6591 sec.
ステップ( 5490 )  loss: 3.6413 -- time: 4.5595 sec.
ステップ( 5500 )  loss: 3.9566 -- time: 4.7741 sec.
ステップ( 5510 )  loss: 3.8416 -- time: 4.6065 sec.
ステップ( 5520 )  loss: 4.1126 -- time: 4.5956 sec.
ステップ( 5530 )  loss: 3.8692 -- time: 4.7020 sec.
ステップ( 5540 )  loss: 3.9907 -- time: 4.5246 sec.
--------------------------
train_loss: 698.9579 - val_loss: 0.0000
time: 85.5200 sec.
--------------------------
Epoch 32/50
--------------------------


  mode = random.choice(self.sample_options)


ステップ( 5550 )  loss: 3.4401 -- time: 0.3355 sec.
ステップ( 5560 )  loss: 3.8024 -- time: 4.5533 sec.
ステップ( 5570 )  loss: 3.2443 -- time: 4.4886 sec.
ステップ( 5580 )  loss: 3.4798 -- time: 4.5924 sec.
ステップ( 5590 )  loss: 4.2677 -- time: 4.4993 sec.
ステップ( 5600 )  loss: 3.9863 -- time: 4.6962 sec.
ステップ( 5610 )  loss: 3.7818 -- time: 4.6722 sec.
ステップ( 5620 )  loss: 3.7282 -- time: 4.6104 sec.
ステップ( 5630 )  loss: 4.3734 -- time: 4.6292 sec.
ステップ( 5640 )  loss: 4.0610 -- time: 4.6060 sec.
ステップ( 5650 )  loss: 3.5746 -- time: 4.7668 sec.
ステップ( 5660 )  loss: 3.4150 -- time: 4.5974 sec.
ステップ( 5670 )  loss: 3.4925 -- time: 4.4919 sec.
ステップ( 5680 )  loss: 3.3650 -- time: 4.6301 sec.
ステップ( 5690 )  loss: 3.9053 -- time: 4.5702 sec.
ステップ( 5700 )  loss: 4.0243 -- time: 4.5800 sec.
ステップ( 5710 )  loss: 4.3522 -- time: 4.7172 sec.
ステップ( 5720 )  loss: 3.6805 -- time: 4.5295 sec.
--------------------------
train_loss: 688.5529 - val_loss: 0.0000
time: 84.9976 sec.
--------------------------
Epoch 33/50
-----------

  mode = random.choice(self.sample_options)


ステップ( 5730 )  loss: 4.0547 -- time: 0.8091 sec.
ステップ( 5740 )  loss: 4.3741 -- time: 4.5665 sec.
ステップ( 5750 )  loss: 3.6787 -- time: 4.6232 sec.
ステップ( 5760 )  loss: 4.1608 -- time: 4.5150 sec.
ステップ( 5770 )  loss: 4.1357 -- time: 4.5905 sec.
ステップ( 5780 )  loss: 4.1770 -- time: 4.6748 sec.
ステップ( 5790 )  loss: 3.6939 -- time: 4.5333 sec.
ステップ( 5800 )  loss: 3.9044 -- time: 4.6337 sec.
ステップ( 5810 )  loss: 3.7322 -- time: 4.7545 sec.
ステップ( 5820 )  loss: 3.4819 -- time: 4.5321 sec.
ステップ( 5830 )  loss: 3.3269 -- time: 4.5704 sec.
ステップ( 5840 )  loss: 3.9520 -- time: 4.6244 sec.
ステップ( 5850 )  loss: 3.7672 -- time: 4.5513 sec.
ステップ( 5860 )  loss: 3.5440 -- time: 4.5611 sec.
ステップ( 5870 )  loss: 4.2783 -- time: 4.5295 sec.
ステップ( 5880 )  loss: 3.9719 -- time: 4.4456 sec.
ステップ( 5890 )  loss: 4.1218 -- time: 4.7007 sec.
ステップ( 5900 )  loss: 4.2827 -- time: 4.6351 sec.
--------------------------
train_loss: 694.5821 - val_loss: 0.0000
time: 84.7935 sec.
--------------------------
Epoch 34/50
-----------

  mode = random.choice(self.sample_options)


ステップ( 5910 )  loss: 3.7947 -- time: 1.2414 sec.
ステップ( 5920 )  loss: 3.9730 -- time: 4.5599 sec.
ステップ( 5930 )  loss: 3.5893 -- time: 4.6835 sec.
ステップ( 5940 )  loss: 3.4964 -- time: 4.5658 sec.
ステップ( 5950 )  loss: 3.4799 -- time: 4.5409 sec.
ステップ( 5960 )  loss: 3.8708 -- time: 4.5040 sec.
ステップ( 5970 )  loss: 3.3832 -- time: 4.5670 sec.
ステップ( 5980 )  loss: 3.9003 -- time: 4.5796 sec.
ステップ( 5990 )  loss: 3.9154 -- time: 4.6059 sec.
ステップ( 6000 )  loss: 3.5408 -- time: 4.6152 sec.
ステップ( 6010 )  loss: 4.0635 -- time: 4.6885 sec.
ステップ( 6020 )  loss: 3.6264 -- time: 4.5486 sec.
ステップ( 6030 )  loss: 3.9281 -- time: 4.5444 sec.
ステップ( 6040 )  loss: 3.5906 -- time: 4.5572 sec.
ステップ( 6050 )  loss: 4.1386 -- time: 4.6622 sec.
ステップ( 6060 )  loss: 3.8671 -- time: 4.5698 sec.
ステップ( 6070 )  loss: 3.7172 -- time: 4.5000 sec.
ステップ( 6080 )  loss: 3.8563 -- time: 4.6957 sec.
--------------------------
train_loss: 681.8528 - val_loss: 0.0000
time: 84.7057 sec.
--------------------------
Epoch 35/50
-----------

  mode = random.choice(self.sample_options)


ステップ( 6090 )  loss: 3.5119 -- time: 1.7992 sec.
ステップ( 6100 )  loss: 4.0213 -- time: 4.6664 sec.
ステップ( 6110 )  loss: 3.7444 -- time: 4.4663 sec.
ステップ( 6120 )  loss: 3.6966 -- time: 4.5490 sec.
ステップ( 6130 )  loss: 3.9950 -- time: 4.4637 sec.
ステップ( 6140 )  loss: 3.8738 -- time: 4.4499 sec.
ステップ( 6150 )  loss: 3.2883 -- time: 4.4975 sec.
ステップ( 6160 )  loss: 3.6130 -- time: 4.6746 sec.
ステップ( 6170 )  loss: 4.2373 -- time: 4.6145 sec.
ステップ( 6180 )  loss: 3.4932 -- time: 4.5304 sec.
ステップ( 6190 )  loss: 3.7544 -- time: 4.5948 sec.
ステップ( 6200 )  loss: 4.2941 -- time: 4.6783 sec.
ステップ( 6210 )  loss: 4.1193 -- time: 4.5224 sec.
ステップ( 6220 )  loss: 4.4547 -- time: 4.5595 sec.
ステップ( 6230 )  loss: 3.6971 -- time: 4.5474 sec.
ステップ( 6240 )  loss: 3.8696 -- time: 4.6468 sec.
ステップ( 6250 )  loss: 4.6396 -- time: 4.3733 sec.
ステップ( 6260 )  loss: 3.8860 -- time: 4.6424 sec.
--------------------------
train_loss: 672.7810 - val_loss: 0.0000
time: 84.2760 sec.
--------------------------
Epoch 36/50
-----------

  mode = random.choice(self.sample_options)


ステップ( 6270 )  loss: 4.0826 -- time: 2.1849 sec.
ステップ( 6280 )  loss: 4.0242 -- time: 4.6156 sec.
ステップ( 6290 )  loss: 3.5877 -- time: 4.6099 sec.
ステップ( 6300 )  loss: 3.3948 -- time: 4.4622 sec.
ステップ( 6310 )  loss: 3.8196 -- time: 4.7334 sec.
ステップ( 6320 )  loss: 4.5280 -- time: 4.5002 sec.
ステップ( 6330 )  loss: 3.3218 -- time: 4.4825 sec.
ステップ( 6340 )  loss: 4.1856 -- time: 4.5247 sec.
ステップ( 6350 )  loss: 4.0252 -- time: 4.6460 sec.
ステップ( 6360 )  loss: 3.3979 -- time: 4.6228 sec.
ステップ( 6370 )  loss: 4.1243 -- time: 4.4663 sec.
ステップ( 6380 )  loss: 4.0132 -- time: 4.5411 sec.
ステップ( 6390 )  loss: 3.7607 -- time: 4.5913 sec.
ステップ( 6400 )  loss: 3.6419 -- time: 4.4395 sec.
ステップ( 6410 )  loss: 3.9267 -- time: 4.7885 sec.
ステップ( 6420 )  loss: 3.6996 -- time: 4.5384 sec.
ステップ( 6430 )  loss: 3.4440 -- time: 4.6213 sec.
ステップ( 6440 )  loss: 3.2106 -- time: 4.6729 sec.
--------------------------
train_loss: 670.5767 - val_loss: 0.0000
time: 84.5639 sec.
--------------------------
Epoch 37/50
-----------

  mode = random.choice(self.sample_options)


ステップ( 6450 )  loss: 4.0123 -- time: 2.6669 sec.
ステップ( 6460 )  loss: 3.6071 -- time: 4.6884 sec.
ステップ( 6470 )  loss: 3.4384 -- time: 4.6966 sec.
ステップ( 6480 )  loss: 4.0620 -- time: 4.6398 sec.
ステップ( 6490 )  loss: 3.3377 -- time: 4.5382 sec.
ステップ( 6500 )  loss: 4.0394 -- time: 4.5732 sec.
ステップ( 6510 )  loss: 3.7356 -- time: 4.5067 sec.
ステップ( 6520 )  loss: 4.1449 -- time: 4.6625 sec.
ステップ( 6530 )  loss: 3.4882 -- time: 4.5409 sec.
ステップ( 6540 )  loss: 4.1158 -- time: 4.7398 sec.
ステップ( 6550 )  loss: 3.6442 -- time: 4.4752 sec.
ステップ( 6560 )  loss: 3.0275 -- time: 4.5447 sec.
ステップ( 6570 )  loss: 4.2695 -- time: 4.6548 sec.
ステップ( 6580 )  loss: 3.6975 -- time: 4.6378 sec.
ステップ( 6590 )  loss: 3.7206 -- time: 4.5907 sec.
ステップ( 6600 )  loss: 3.8567 -- time: 4.6629 sec.
ステップ( 6610 )  loss: 3.9490 -- time: 4.5393 sec.
ステップ( 6620 )  loss: 3.6413 -- time: 4.4962 sec.
--------------------------
train_loss: 670.3894 - val_loss: 0.0000
time: 84.8959 sec.
--------------------------
Epoch 38/50
-----------

  mode = random.choice(self.sample_options)


ステップ( 6630 )  loss: 3.4579 -- time: 3.0273 sec.
ステップ( 6640 )  loss: 3.3864 -- time: 4.4439 sec.
ステップ( 6650 )  loss: 3.5680 -- time: 4.5726 sec.
ステップ( 6660 )  loss: 3.0887 -- time: 4.6103 sec.
ステップ( 6670 )  loss: 3.4781 -- time: 4.4727 sec.
ステップ( 6680 )  loss: 3.6711 -- time: 4.5002 sec.
ステップ( 6690 )  loss: 3.3883 -- time: 4.4897 sec.
ステップ( 6700 )  loss: 3.9978 -- time: 4.5949 sec.
ステップ( 6710 )  loss: 3.7721 -- time: 4.4314 sec.
ステップ( 6720 )  loss: 3.5797 -- time: 4.7201 sec.
ステップ( 6730 )  loss: 4.2778 -- time: 4.5676 sec.
ステップ( 6740 )  loss: 3.6169 -- time: 4.5485 sec.
ステップ( 6750 )  loss: 3.4184 -- time: 4.5361 sec.
ステップ( 6760 )  loss: 3.7346 -- time: 4.6066 sec.
ステップ( 6770 )  loss: 3.3329 -- time: 4.4808 sec.
ステップ( 6780 )  loss: 3.7993 -- time: 4.4148 sec.
ステップ( 6790 )  loss: 3.8351 -- time: 4.6222 sec.
ステップ( 6800 )  loss: 3.5836 -- time: 4.5801 sec.
--------------------------
train_loss: 657.0411 - val_loss: 0.0000
time: 83.7781 sec.
--------------------------
Epoch 39/50
-----------

  mode = random.choice(self.sample_options)


ステップ( 6810 )  loss: 3.4300 -- time: 3.6505 sec.
ステップ( 6820 )  loss: 3.1071 -- time: 4.5786 sec.
ステップ( 6830 )  loss: 3.8833 -- time: 4.4120 sec.
ステップ( 6840 )  loss: 4.0477 -- time: 4.5450 sec.
ステップ( 6850 )  loss: 3.9688 -- time: 4.5743 sec.
ステップ( 6860 )  loss: 3.9486 -- time: 4.6688 sec.
ステップ( 6870 )  loss: 4.0161 -- time: 4.4814 sec.
ステップ( 6880 )  loss: 3.4740 -- time: 4.5848 sec.
ステップ( 6890 )  loss: 3.6832 -- time: 4.6686 sec.
ステップ( 6900 )  loss: 3.5284 -- time: 4.6116 sec.
ステップ( 6910 )  loss: 3.8216 -- time: 4.6045 sec.
ステップ( 6920 )  loss: 3.9615 -- time: 4.5826 sec.
ステップ( 6930 )  loss: 4.2697 -- time: 4.6031 sec.
ステップ( 6940 )  loss: 3.9731 -- time: 4.5460 sec.
ステップ( 6950 )  loss: 3.2612 -- time: 4.5157 sec.
ステップ( 6960 )  loss: 4.2361 -- time: 4.5985 sec.
ステップ( 6970 )  loss: 3.2636 -- time: 4.5891 sec.
ステップ( 6980 )  loss: 3.4581 -- time: 4.5550 sec.
--------------------------
train_loss: 658.0869 - val_loss: 0.0000
time: 84.4398 sec.
--------------------------
Epoch 40/50
-----------

  mode = random.choice(self.sample_options)


ステップ( 6990 )  loss: 3.3703 -- time: 4.2290 sec.
ステップ( 7000 )  loss: 3.5247 -- time: 4.5468 sec.
ステップ( 7010 )  loss: 3.5830 -- time: 4.5845 sec.
ステップ( 7020 )  loss: 3.9175 -- time: 4.6045 sec.
ステップ( 7030 )  loss: 3.8466 -- time: 4.4882 sec.
ステップ( 7040 )  loss: 3.5046 -- time: 4.7232 sec.
ステップ( 7050 )  loss: 3.2045 -- time: 4.4585 sec.
ステップ( 7060 )  loss: 3.2877 -- time: 4.5028 sec.
ステップ( 7070 )  loss: 3.4222 -- time: 4.5216 sec.
ステップ( 7080 )  loss: 3.6754 -- time: 4.6157 sec.
ステップ( 7090 )  loss: 3.6750 -- time: 4.5306 sec.
ステップ( 7100 )  loss: 3.6563 -- time: 4.5048 sec.
ステップ( 7110 )  loss: 4.2608 -- time: 4.4923 sec.
ステップ( 7120 )  loss: 3.1699 -- time: 4.5483 sec.
ステップ( 7130 )  loss: 3.5429 -- time: 4.5637 sec.
ステップ( 7140 )  loss: 4.0641 -- time: 4.5065 sec.
ステップ( 7150 )  loss: 3.8736 -- time: 4.4120 sec.
ステップ( 7160 )  loss: 3.6658 -- time: 4.4602 sec.
--------------------------
validation
--------------------------
train_loss: 652.4686 - val_loss: 703.8986
time: 117.6564 sec.
--saved w

  mode = random.choice(self.sample_options)


ステップ( 7170 )  loss: 3.1365 -- time: 4.5898 sec.
ステップ( 7180 )  loss: 3.6796 -- time: 4.5127 sec.
ステップ( 7190 )  loss: 3.6502 -- time: 4.5381 sec.
ステップ( 7200 )  loss: 4.2660 -- time: 4.6504 sec.
ステップ( 7210 )  loss: 3.3172 -- time: 4.5702 sec.
ステップ( 7220 )  loss: 3.5849 -- time: 4.5177 sec.
ステップ( 7230 )  loss: 3.4020 -- time: 4.6385 sec.
ステップ( 7240 )  loss: 3.5575 -- time: 4.4814 sec.
ステップ( 7250 )  loss: 4.0013 -- time: 4.5863 sec.
ステップ( 7260 )  loss: 3.5191 -- time: 4.6660 sec.
ステップ( 7270 )  loss: 3.5238 -- time: 4.4910 sec.
ステップ( 7280 )  loss: 3.3915 -- time: 4.6149 sec.
ステップ( 7290 )  loss: 3.7929 -- time: 4.7225 sec.
ステップ( 7300 )  loss: 3.5743 -- time: 4.5163 sec.
ステップ( 7310 )  loss: 4.0652 -- time: 4.4995 sec.
ステップ( 7320 )  loss: 3.8469 -- time: 4.4903 sec.
ステップ( 7330 )  loss: 4.1166 -- time: 4.5037 sec.
--------------------------
train_loss: 647.8669 - val_loss: 0.0000
time: 84.3799 sec.
--------------------------
Epoch 42/50
--------------------------


  mode = random.choice(self.sample_options)


ステップ( 7340 )  loss: 4.1443 -- time: 0.3144 sec.
ステップ( 7350 )  loss: 4.0333 -- time: 4.6128 sec.
ステップ( 7360 )  loss: 3.3656 -- time: 4.4315 sec.
ステップ( 7370 )  loss: 3.1419 -- time: 4.5568 sec.
ステップ( 7380 )  loss: 3.4717 -- time: 4.6211 sec.
ステップ( 7390 )  loss: 3.5934 -- time: 4.5443 sec.
ステップ( 7400 )  loss: 4.1511 -- time: 4.6872 sec.
ステップ( 7410 )  loss: 3.7977 -- time: 4.4853 sec.
ステップ( 7420 )  loss: 3.4722 -- time: 4.5293 sec.
ステップ( 7430 )  loss: 3.4390 -- time: 4.5329 sec.
ステップ( 7440 )  loss: 3.2941 -- time: 4.5881 sec.
ステップ( 7450 )  loss: 3.3215 -- time: 4.5612 sec.
ステップ( 7460 )  loss: 4.1159 -- time: 4.6681 sec.
ステップ( 7470 )  loss: 3.9323 -- time: 4.5560 sec.
ステップ( 7480 )  loss: 3.4914 -- time: 4.4822 sec.
ステップ( 7490 )  loss: 4.1271 -- time: 4.6165 sec.
ステップ( 7500 )  loss: 3.3239 -- time: 4.3558 sec.
ステップ( 7510 )  loss: 3.4644 -- time: 4.5947 sec.
--------------------------
train_loss: 638.9175 - val_loss: 0.0000
time: 84.1909 sec.
--------------------------
Epoch 43/50
-----------

  mode = random.choice(self.sample_options)


ステップ( 7520 )  loss: 3.5480 -- time: 0.8070 sec.
ステップ( 7530 )  loss: 3.8924 -- time: 4.7348 sec.
ステップ( 7540 )  loss: 3.3686 -- time: 4.4699 sec.
ステップ( 7550 )  loss: 3.4935 -- time: 4.5699 sec.
ステップ( 7560 )  loss: 3.8470 -- time: 4.5352 sec.
ステップ( 7570 )  loss: 3.3836 -- time: 4.6110 sec.
ステップ( 7580 )  loss: 3.8305 -- time: 4.7220 sec.
ステップ( 7590 )  loss: 4.0612 -- time: 4.5034 sec.
ステップ( 7600 )  loss: 3.3899 -- time: 4.4578 sec.
ステップ( 7610 )  loss: 3.4023 -- time: 4.5521 sec.
ステップ( 7620 )  loss: 3.6134 -- time: 4.5453 sec.
ステップ( 7630 )  loss: 3.7867 -- time: 4.6234 sec.
ステップ( 7640 )  loss: 3.2676 -- time: 4.5589 sec.
ステップ( 7650 )  loss: 3.7403 -- time: 4.6186 sec.
ステップ( 7660 )  loss: 3.4918 -- time: 4.6244 sec.
ステップ( 7670 )  loss: 3.6940 -- time: 4.7237 sec.
ステップ( 7680 )  loss: 3.4226 -- time: 4.6070 sec.
ステップ( 7690 )  loss: 3.1781 -- time: 4.4504 sec.
--------------------------
train_loss: 640.8934 - val_loss: 0.0000
time: 84.6205 sec.
--------------------------
Epoch 44/50
-----------

  mode = random.choice(self.sample_options)


ステップ( 7700 )  loss: 3.4610 -- time: 1.2561 sec.
ステップ( 7710 )  loss: 3.3722 -- time: 4.6332 sec.
ステップ( 7720 )  loss: 3.7885 -- time: 4.5564 sec.
ステップ( 7730 )  loss: 3.1228 -- time: 4.6215 sec.
ステップ( 7740 )  loss: 2.9217 -- time: 4.5168 sec.
ステップ( 7750 )  loss: 4.2216 -- time: 4.7243 sec.
ステップ( 7760 )  loss: 2.9706 -- time: 4.5025 sec.
ステップ( 7770 )  loss: 3.7562 -- time: 4.6738 sec.
ステップ( 7780 )  loss: 3.3446 -- time: 4.6355 sec.
ステップ( 7790 )  loss: 3.6063 -- time: 4.5116 sec.
ステップ( 7800 )  loss: 3.4964 -- time: 4.6980 sec.
ステップ( 7810 )  loss: 3.2626 -- time: 4.5855 sec.
ステップ( 7820 )  loss: 3.8746 -- time: 4.7143 sec.
ステップ( 7830 )  loss: 3.5855 -- time: 4.6009 sec.
ステップ( 7840 )  loss: 3.9464 -- time: 4.5435 sec.
ステップ( 7850 )  loss: 3.5938 -- time: 4.5650 sec.
ステップ( 7860 )  loss: 3.4158 -- time: 4.5821 sec.
ステップ( 7870 )  loss: 3.8375 -- time: 4.7101 sec.
--------------------------
train_loss: 635.6615 - val_loss: 0.0000
time: 85.1885 sec.
--------------------------
Epoch 45/50
-----------

  mode = random.choice(self.sample_options)


ステップ( 7880 )  loss: 3.1238 -- time: 1.7325 sec.
ステップ( 7890 )  loss: 3.4039 -- time: 4.6187 sec.
ステップ( 7900 )  loss: 3.4232 -- time: 4.6226 sec.
ステップ( 7910 )  loss: 3.8503 -- time: 4.7075 sec.
ステップ( 7920 )  loss: 3.5078 -- time: 4.6436 sec.
ステップ( 7930 )  loss: 3.5725 -- time: 4.6915 sec.
ステップ( 7940 )  loss: 2.9451 -- time: 4.5641 sec.
ステップ( 7950 )  loss: 3.4211 -- time: 4.7302 sec.
ステップ( 7960 )  loss: 3.4710 -- time: 4.5494 sec.
ステップ( 7970 )  loss: 3.3790 -- time: 4.5952 sec.
ステップ( 7980 )  loss: 4.0029 -- time: 4.6781 sec.
ステップ( 7990 )  loss: 3.6249 -- time: 4.5498 sec.
ステップ( 8000 )  loss: 3.8154 -- time: 4.6613 sec.
ステップ( 8010 )  loss: 3.9630 -- time: 4.6907 sec.
ステップ( 8020 )  loss: 3.2635 -- time: 4.5314 sec.
ステップ( 8030 )  loss: 3.4160 -- time: 4.6457 sec.
ステップ( 8040 )  loss: 3.5376 -- time: 4.4606 sec.
ステップ( 8050 )  loss: 3.1171 -- time: 4.5964 sec.
--------------------------
train_loss: 631.0396 - val_loss: 0.0000
time: 85.2816 sec.
--------------------------
Epoch 46/50
-----------

  mode = random.choice(self.sample_options)


ステップ( 8060 )  loss: 3.6807 -- time: 2.2340 sec.
ステップ( 8070 )  loss: 3.0839 -- time: 4.5657 sec.
ステップ( 8080 )  loss: 3.3683 -- time: 4.5049 sec.
ステップ( 8090 )  loss: 3.7701 -- time: 4.5490 sec.
ステップ( 8100 )  loss: 3.5194 -- time: 4.4010 sec.
ステップ( 8110 )  loss: 3.5576 -- time: 4.7881 sec.
ステップ( 8120 )  loss: 3.8921 -- time: 4.5667 sec.
ステップ( 8130 )  loss: 3.2274 -- time: 4.7494 sec.
ステップ( 8140 )  loss: 3.5556 -- time: 4.5100 sec.
ステップ( 8150 )  loss: 3.2592 -- time: 4.5117 sec.
ステップ( 8160 )  loss: 2.7283 -- time: 4.7014 sec.
ステップ( 8170 )  loss: 4.0428 -- time: 4.6812 sec.
ステップ( 8180 )  loss: 3.0128 -- time: 4.6603 sec.
ステップ( 8190 )  loss: 4.3132 -- time: 4.7229 sec.
ステップ( 8200 )  loss: 3.2764 -- time: 4.8225 sec.
ステップ( 8210 )  loss: 3.7075 -- time: 4.5003 sec.
ステップ( 8220 )  loss: 3.3880 -- time: 4.6846 sec.
ステップ( 8230 )  loss: 3.7233 -- time: 4.5057 sec.
--------------------------
train_loss: 627.0202 - val_loss: 0.0000
time: 85.0650 sec.
--------------------------
Epoch 47/50
-----------

  mode = random.choice(self.sample_options)


ステップ( 8240 )  loss: 4.0603 -- time: 2.6220 sec.
ステップ( 8250 )  loss: 3.5088 -- time: 4.5167 sec.
ステップ( 8260 )  loss: 3.3910 -- time: 4.5755 sec.
ステップ( 8270 )  loss: 3.8180 -- time: 4.5671 sec.
ステップ( 8280 )  loss: 4.0303 -- time: 4.6079 sec.
ステップ( 8290 )  loss: 3.6798 -- time: 4.5698 sec.
ステップ( 8300 )  loss: 3.0087 -- time: 4.5554 sec.
ステップ( 8310 )  loss: 3.4740 -- time: 4.6090 sec.
ステップ( 8320 )  loss: 3.4275 -- time: 4.5295 sec.
ステップ( 8330 )  loss: 3.2526 -- time: 4.5244 sec.
ステップ( 8340 )  loss: 3.7771 -- time: 4.5150 sec.
ステップ( 8350 )  loss: 3.7641 -- time: 4.6147 sec.
ステップ( 8360 )  loss: 2.8403 -- time: 4.4918 sec.
ステップ( 8370 )  loss: 3.7382 -- time: 4.5728 sec.
ステップ( 8380 )  loss: 3.8491 -- time: 4.5087 sec.
ステップ( 8390 )  loss: 4.2736 -- time: 4.6152 sec.
ステップ( 8400 )  loss: 3.3823 -- time: 4.5687 sec.
ステップ( 8410 )  loss: 3.6125 -- time: 4.5772 sec.
--------------------------
train_loss: 626.9340 - val_loss: 0.0000
time: 84.1468 sec.
--------------------------
Epoch 48/50
-----------

  mode = random.choice(self.sample_options)


ステップ( 8420 )  loss: 3.8871 -- time: 3.1763 sec.
ステップ( 8430 )  loss: 2.9303 -- time: 4.5552 sec.
ステップ( 8440 )  loss: 3.4763 -- time: 4.5672 sec.
ステップ( 8450 )  loss: 3.3689 -- time: 4.6029 sec.
ステップ( 8460 )  loss: 2.9827 -- time: 4.6354 sec.
ステップ( 8470 )  loss: 3.6471 -- time: 4.6796 sec.
ステップ( 8480 )  loss: 2.8849 -- time: 4.6313 sec.
ステップ( 8490 )  loss: 3.9585 -- time: 4.5058 sec.
ステップ( 8500 )  loss: 3.9513 -- time: 4.6413 sec.
ステップ( 8510 )  loss: 3.5657 -- time: 4.5842 sec.
ステップ( 8520 )  loss: 3.1375 -- time: 4.5903 sec.
ステップ( 8530 )  loss: 3.9060 -- time: 4.5449 sec.
ステップ( 8540 )  loss: 3.4508 -- time: 4.7895 sec.
ステップ( 8550 )  loss: 3.4370 -- time: 4.7173 sec.
ステップ( 8560 )  loss: 4.0058 -- time: 4.6027 sec.
ステップ( 8570 )  loss: 3.7914 -- time: 4.5939 sec.
ステップ( 8580 )  loss: 3.8810 -- time: 4.6725 sec.
ステップ( 8590 )  loss: 3.8545 -- time: 4.6022 sec.
--------------------------
train_loss: 618.2093 - val_loss: 0.0000
time: 85.2271 sec.
--------------------------
Epoch 49/50
-----------

  mode = random.choice(self.sample_options)


ステップ( 8600 )  loss: 3.5562 -- time: 3.5431 sec.
ステップ( 8610 )  loss: 3.4854 -- time: 4.5997 sec.
ステップ( 8620 )  loss: 3.6750 -- time: 4.5551 sec.
ステップ( 8630 )  loss: 3.6721 -- time: 4.6024 sec.
ステップ( 8640 )  loss: 3.7106 -- time: 4.5798 sec.
ステップ( 8650 )  loss: 3.8157 -- time: 4.7815 sec.
ステップ( 8660 )  loss: 3.5406 -- time: 4.5222 sec.
ステップ( 8670 )  loss: 3.2045 -- time: 4.6735 sec.
ステップ( 8680 )  loss: 3.4038 -- time: 4.6219 sec.
ステップ( 8690 )  loss: 2.9972 -- time: 4.6025 sec.
ステップ( 8700 )  loss: 3.3221 -- time: 4.5387 sec.
ステップ( 8710 )  loss: 3.4139 -- time: 4.6200 sec.
ステップ( 8720 )  loss: 3.2163 -- time: 4.6784 sec.
ステップ( 8730 )  loss: 3.5807 -- time: 4.5700 sec.
ステップ( 8740 )  loss: 3.5082 -- time: 4.6163 sec.
ステップ( 8750 )  loss: 3.3746 -- time: 4.5308 sec.
ステップ( 8760 )  loss: 3.7508 -- time: 4.5185 sec.
ステップ( 8770 )  loss: 3.6274 -- time: 4.5865 sec.
--------------------------
train_loss: 618.5308 - val_loss: 0.0000
time: 84.8126 sec.
--------------------------
Epoch 50/50
-----------

  mode = random.choice(self.sample_options)


ステップ( 8780 )  loss: 3.0061 -- time: 4.0536 sec.
ステップ( 8790 )  loss: 3.2130 -- time: 4.5674 sec.
ステップ( 8800 )  loss: 3.1602 -- time: 4.5560 sec.
ステップ( 8810 )  loss: 3.7752 -- time: 4.4853 sec.
ステップ( 8820 )  loss: 2.9803 -- time: 4.5440 sec.
ステップ( 8830 )  loss: 3.6303 -- time: 4.4915 sec.
ステップ( 8840 )  loss: 3.8253 -- time: 4.5299 sec.
ステップ( 8850 )  loss: 2.8480 -- time: 4.5682 sec.
ステップ( 8860 )  loss: 3.8794 -- time: 4.5535 sec.
ステップ( 8870 )  loss: 3.0537 -- time: 4.6792 sec.
ステップ( 8880 )  loss: 2.9956 -- time: 4.6507 sec.
ステップ( 8890 )  loss: 3.0756 -- time: 4.5316 sec.
ステップ( 8900 )  loss: 2.8362 -- time: 4.4318 sec.
ステップ( 8910 )  loss: 3.5260 -- time: 4.5330 sec.
ステップ( 8920 )  loss: 3.2934 -- time: 4.5755 sec.
ステップ( 8930 )  loss: 3.3709 -- time: 4.5573 sec.
ステップ( 8940 )  loss: 3.6246 -- time: 4.6817 sec.
ステップ( 8950 )  loss: 3.2931 -- time: 4.4537 sec.
--------------------------
validation
--------------------------
train_loss: 607.2673 - val_loss: 696.2233
time: 117.9840 sec.
--saved w